正则匹配的贪婪原则
程序员文章站
2022-06-09 07:51:27
...
问题:写了一个正则匹配,为什么每次只匹配一个中文,我写的是+,按照贪婪原则应该尽可能多的匹配。
// $str 是个抓取到的html ,根据规则获取中文
$str = '...匹配中文字符...';
preg_match('//u', $str, $match);
var_dump($match[1]);
// 想要结果:匹配中文字符
// 输出结果: 字
求大神指点
大神指点迷津之后:
做了修改,如下即可,尽可能的让前面的贪婪到固定的结束为止。 done
// $str 是个抓取到的html ,根据规则获取中文
$str = '...匹配中文字符...';
preg_match('//u', $str, $match);
var_dump($match[1]);
// 想要结果:匹配中文字符
// 输出结果: 匹配中文字符
回复内容:
问题:写了一个正则匹配,为什么每次只匹配一个中文,我写的是+,按照贪婪原则应该尽可能多的匹配。
// $str 是个抓取到的html ,根据规则获取中文
$str = '...匹配中文字符...';
preg_match('//u', $str, $match);
var_dump($match[1]);
// 想要结果:匹配中文字符
// 输出结果: 字
求大神指点
大神指点迷津之后:
做了修改,如下即可,尽可能的让前面的贪婪到固定的结束为止。 done
// $str 是个抓取到的html ,根据规则获取中文
$str = '...匹配中文字符...';
preg_match('//u', $str, $match);
var_dump($match[1]);
// 想要结果:匹配中文字符
// 输出结果: 匹配中文字符
因为前面的.+先贪婪了,它贪完了才轮到你想要的匹配组。而且后面还有个.+,所以你的匹配组还要给它留一个字。
结果就是前面贪婪匹配了一堆,后面匹配最后一个汉字。留给你的匹配组的就是倒数第二个汉字了。
上一篇: 李勉一生经历许多坎坷,最后结局如何?
下一篇: curl和libcurl的区别简介