php使用正则表达式_PHP教程
一 正则规范
1.常用的正则规范
\w 表示字母、数字、下划线
\W 表示非字母、数字、下划线
\d 表示数字
\D 表示非数字
\s 表示所有空白字符(换行、空格等)
\S 表示所有非空白字符
^ 行的开头(用于定界)
$ 行的结尾(用于定界)
. 匹配除换行之外的任意字符
[abc] 字符a,b,c
[^abc] 除了a,b,c之外的任意字符
[a-zA-Z0-9] 表示由字母、数字组成
\n 表示换行
\\ 表示反斜杠
2.数量表示(X表示一组规范)
X? 可以出现0次或1次
X+ 可以出现1次或多次
X* 可以出现0次、1次或多次
X{n} 必须出现n次
X{n,} 必须出现n次以上
X{n,m} 必须出现n至m次
3.逻辑运算符(X、Y表示一组规范)
XY X规范后跟着Y规范
(X) 作为一个捕获组规范(子表达式)
X|Y X规范或Y规范
二 php中怎样使用正则
1.使用正则表达式查找固定格式的字符
php提供了preg_match()和preg_match_all()两个方法供我们使用,使用这两个方法可以做字符串格式校验和查找
(1) 取出字符串里的所有四位数
使用之前要注意,php里规定我们把正则规范写在P的位置上 ‘/P/i’,先就取四位数这个举例,代码如下
echo "取出字符串里的所有四位数
"; $str1="abcd1034yu3029"; preg_match_all('/\d{4}/i', $str1,$arr1); foreach ($arr1[0] as $val){ echo "$val"."
"; }
要说明的是$arr1,这个是一个二维数组,php把匹配上的所有的字符放在这个数组里
(2)取出类似1111、3333这种格式的字符串
这种情况就要使用字表达式了,代码如下
echo "下面是两段代码的运行效果取出字符串里的4位数要求每位数字都相同,例如1111、4444、5555、6666
"; $str2="abcd1034yu3029sd3333"; preg_match_all('/(\d)\1{3}/i', $str2,$arr2); foreach ($arr2[0] as $val){ echo "$val"."
"; }
(3)取出类似1111-2222-3333这种格式的字符串
echo "取出类似1111-2222-3333这种格式的字符串
"; $str3="ab3333-5555-6666cd1034yu3029sd3333"; preg_match_all('/(\d)\1{3}-(\d)\2{3}-(\d)\3{3}/i', $str3,$arr3); foreach ($arr3[0] as $val){ echo "$val"."
"; }
有兴趣可以使用print_r()打印下这个$arr3,里面有2个数组,第一个是匹配出来的字符串,第二个是字表达式的值
(4)来一个稍微复杂点的,取出类似1111-232-3333、1111-575-3333这种格式的字符串的最后4个数字
echo "取出类似1111-232-3333、1111-575-3333这种格式的字符串的最后4个数字
"; $str4="ab3333-575-6666cd10348888-464-9999"; preg_match_all('/(\d)\1{3}-(\d)\d\2-(\d)\3{3}/i', $str4,$arr4); foreach ($arr4[0] as $val){ $nums=explode("-", $val); echo "$nums[2]"."
"; }
(5)过滤重复字符喎?http://www.Bkjia.com/kf/ware/vc/" target="_blank" class="keylink">vcD4KPHA+PHByZSBjbGFzcz0="brush:java;">echo "
过滤重复的字符
"; $repeatstr="我爱爱和和平"; preg_match_all('/(\w)\1*/iu', $repeatstr,$arr); $finalStr=""; foreach ($arr[1] as $val){ $finalStr.=$val; }/i后面的u表示一种规范,表示匹配UTF-8的字符,还有其他几种大家可以查看php开发文档
2.还有一种比较复杂的匹配叫环视匹配
表达式 |
说明 |
(? |
逆序肯定环视,表示所在位置左侧能够匹配Expression |
(? |
逆序否定环视,表示所在位置左侧不能匹配Expression |
(?=Expression) |
顺序肯定环视,表示所在位置右侧能够匹配Expression |
(?!Expression) |
顺序否定环视,表示所在位置右侧不能匹配Expression |
这个部分理解起来有点复杂,可以参考下下面这篇文章,里面有个剥取
中间内容的例子讲的还不错http://blog.csdn.net/lxcnn/article/details/4304754
下面把我写的这一整个php页面贴出来
过滤重复的字符"; $repeatstr="我爱爱和和平"; preg_match_all('/(\w)\1*/iu', $repeatstr,$arr); $finalStr=""; foreach ($arr[1] as $val){ $finalStr.=$val; } echo $finalStr; echo "取出字符串里的所有四位数
"; $str1="abcd1034yu3029"; preg_match_all('/\d{4}/i', $str1,$arr1); foreach ($arr1[0] as $val){ echo "$val"."
"; } echo "取出字符串里的4位数要求每位数字都相同,例如1111、4444、5555、6666
"; $str2="abcd1034yu3029sd3333"; preg_match_all('/(\d)\1{3}/i', $str2,$arr2); foreach ($arr2[0] as $val){ echo "$val"."
"; } echo "取出类似1111-2222-3333这种格式的字符串
"; $str3="ab3333-5555-6666cd1034yu3029sd3333"; preg_match_all('/(\d)\1{3}-(\d)\2{3}-(\d)\3{3}/i', $str3,$arr3); foreach ($arr3[0] as $val){ echo "$val"."
"; } echo "取出类似1111-232-3333、1111-575-3333这种格式的字符串的最后4个数字
"; $str4="ab3333-575-6666cd10348888-464-9999"; preg_match_all('/(\d)\1{3}-(\d)\d\2-(\d)\3{3}/i', $str4,$arr4); foreach ($arr4[0] as $val){ $nums=explode("-", $val); echo "$nums[2]"."
"; } echo "验证是否是电子邮件
"; $email="chen@163.com"; preg_match_all('/^\w+@\w+\.\w+$/i', $email,$earr); if(count($earr[0])>0){ echo "$email"."是合法的电子邮件"; }else{ echo "$email"."是非法的电子邮件"; } ?>