欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

网上一段简单的preg_match替换 不明

程序员文章站 2022-05-31 17:26:21
...
php 正则
$string = "Is is the cost of of gasoline going up up"; 	$pattern = "/\b([a-z]+) \\1\b/i"; 	if(preg_match($pattern, $string,$arr)){		print_r($arr);		echo preg_replace($pattern, '$1', $string);	}

输出
Array(    [0] => Is is    [1] => Is)Is the cost of gasoline going up


我理解的preg_match($pattern,$repalce,$subject)是用pattern从subject匹配到各个分组,然后用replace规定的显示方式,重新输出
$pattern = "/\b([a-z]+) \\1\b/i" 匹配到的只有Is is 和Is
重新输出怎么会输出一整句话 Is the cost of gasoline going up
还有什么时候用$1 什么时候用\\1 获取子模式匹配的内容 在双引号和单引号里又有什么要求?

回复讨论(解决方案)

preg_match 匹配一次,


mixed preg_replace ( mixed $pattern , mixed $replacement , mixed $subject [, int $limit = -1 [, int &$count ]] )
第三个参数未指定时,默认是 -1(无限)。

$1 与 \1 的区别:
\1 可以同时使用在模式和替换字符串中
$1 只能用于替换字符串中

preg_match只匹配第一个符合的,要全部匹配要用preg_match_all
replace是符合的都替换(符合的部分与preg_match_all相同)
$与\只是习惯问题,一般同一个正则内用\,\的写法较接近perl
单双引号注意原文\\这种情况就基本可以了,其他的无歧义就按原文

哦,说错了。
mixed preg_replace ( mixed $pattern , mixed $replacement , mixed $subject [, int $limit = -1 [, int &$count ]] )
第 四个参数未指定时,默认是 -1(无限)。

谢谢楼上两位朋友,明朗了,preg_match只匹配一次

$subject="example: ";	$pattern="|]+>(.*)[^>]+>|";	preg_match_all ($pattern, $subject, $out, PREG_PATTERN_ORDER);	print_r($out);

再问一下 为啥$pattern 不是用 “/......./”的形式 而是要用 "|.........|"的形式
两斜杠变成两竖杠是为什么?如果去掉两竖杠就老报错:Warning: preg_match_all(): Unknown modifier ']' 这是为啥?

$pattern="|]+>(.*)[^>]+>|";
$pattern="/]+>(.*)]+>/";
是一样的
如果分界符是 / ,那么规则串中的 / 就需要转义
幸好 php 提供了自定义分界符,可以使规则串看起来舒服点
要是 js 的话,就没有那么幸运了