欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

贪婪模式正则匹配的问题

程序员文章站 2022-06-06 18:31:27
...
正文:
$content = 'http://www.taobao.com  http://mai.taobao.com http://xx.uz.taobao.com http://yy.uz.taobao.com ';

期望得到:

[0] => http://xx.uz.taobao.com 
[1] => http://yy.uz.taobao.com

方法一:

$pat = '/http:\/\/(.*)\.uz\.taobao\.com/is';

结果:

[0] => http://www.taobao.com  http://mai.taobao.com http://xx.uz.taobao.com http://yy.uz.taobao.com 

方法二:

$pat = '/http:\/\/(.*)\.uz\.taobao\.com/iUs';

结果:

[0] => http://www.taobao.com  http://mai.taobao.com http://xx.uz.taobao.com 
[1]=>http://yy.uz.taobao.com 

请问想得到我期望的值应该怎么写呢?

回复内容:

正文:

$content = 'http://www.taobao.com  http://mai.taobao.com http://xx.uz.taobao.com http://yy.uz.taobao.com ';

期望得到:

[0] => http://xx.uz.taobao.com 
[1] => http://yy.uz.taobao.com

方法一:

$pat = '/http:\/\/(.*)\.uz\.taobao\.com/is';

结果:

[0] => http://www.taobao.com  http://mai.taobao.com http://xx.uz.taobao.com http://yy.uz.taobao.com 

方法二:

$pat = '/http:\/\/(.*)\.uz\.taobao\.com/iUs';

结果:

[0] => http://www.taobao.com  http://mai.taobao.com http://xx.uz.taobao.com 
[1]=>http://yy.uz.taobao.com 

请问想得到我期望的值应该怎么写呢?

$content = 'http://www.taobao.com  http://mai.taobao.com http://xx.uz.taobao.com http://yy.uz.taobao.com ';

preg_match_all('/(https?:\/\/[^.]+\.uz\.taobao\.com)/i', $content, $match);
print_r($match[1]);

so easy.


  array(2) {
    [0] =>
    string(23) "http://xx.uz.taobao.com"
    [1] =>
    string(23) "http://yy.uz.taobao.com"
  }
}

$content = ' sdfasdfasfas sdfsfasf http://mai.taobao.com http://xx.uz.taobao.com http://yy.uz.taobao.com ';
$urls = explode('http://', $content);
array_shift($urls);
$res = [];
foreach($urls as &$url) {
    $item = explode('taobao.com', $url);
    $url = "http://{$item[0]}taobao.com";
    if(preg_match('/uz\.taobao\.com/', $url))
        $res[] = $url;
}
print_r($res);
//Array ( [0] => http://xx.uz.taobao.com [1] => http://yy.uz.taobao.com )
$content = ' sdfasdfasfas sdfsfasf http://mai.taobao.com http://xx.uz.taobao.com http://yy.uz.taobao.com ';
preg_match_all('/(http[^taobao]*?uz\.taobao\.com)/i', $content, $match);
print_r($match[1]);
//Array ( [0] => http://xx.uz.taobao.com [1] => http://yy.uz.taobao.com )

另有一个小建议是:一步分成两步,先把URL分拆,再对每个URL做匹配。这样可以增强语义的直观性。

相关标签: php