php常用正则函数实例分析

程序员文章站 2022-04-24 13:56:04

...

这篇文章主要介绍了php常用正则函数,结合实例形式总结分析了php正则表达式常用函数,包括preg_replace、preg_match及preg_match_all函数的功能、使用方法与相关注意事项,需要的朋友可以参考下

本文实例总结了php常用正则函数。分享给大家供大家参考，具体如下：

1. mixed preg_replace(mixed pattern, mixed replacement, mixed subject, [, int limit])

函数功能：用于正则表达式的搜索和替换。

pattern：正则表达式。
replacement：替换的内容。
subject：需要匹配替换的对象。
limit：可选，指定替换的个数，如果省略 limit 或者其值为 -1，则所有的匹配项都会被替换。

补充说明

① replacement 可以包含 \\n 形式或 $n 形式的逆向引用，首选使用后者。每个此种引用将被替换为与第 n 个被捕获的括号内的子模式所匹配的文本。n 可以从 0 到 99，其中 \\0 或 $0 指的是被整个模式所匹配的文本。对左圆括号从左到右计数（从 1 开始）以取得子模式的数目。

② 对替换模式在一个逆向引用后面紧接着一个数字时（如 \\11），不能使用 \\ 符号来表示逆向引用。因为这样将会使 preg_replace() 搞不清楚是想要一个 \\1 的逆向引用后面跟着一个数字 1 还是一个 \\11 的逆向引用。解决方法是使用 \${1}1。这会形成一个隔离的 $1 逆向引用，而使另一个 1 只是单纯的文字。

③ 上述参数除 limit 外都可以是一个数组。如果 pattern 和 replacement 都是数组，将以其键名在数组中出现的顺序来进行处理，这不一定和索引的数字顺序相同。如果使用索引来标识哪个 pattern 将被哪个 replacement 来替换，应该在调用 preg_replace() 之前用 ksort() 函数对数组进行排序。

例子 1 ：

<?php
$str = "The quick brown fox jumped over the lazy dog.";
$str = preg_replace('/\s/','-',$str);
echo $str;
?>

输出结果为：

The-quick-brown-fox-jumped-over-the-lazy-dog.

例子 2 ，使用数组：

<?php
$str = "The quick brown fox jumped over the lazy dog.";
$patterns[0] = "/quick/";
$patterns[1] = "/brown/";
$patterns[2] = "/fox/";
$replacements[2] = "bear";
$replacements[1] = "black";
$replacements[0] = "slow";
print preg_replace($patterns, $replacements, $str);
/*输出：
The bear black slow jumped over the lazy dog.
*/
ksort($replacements);
print preg_replace($patterns, $replacements, $str);
/*输出：
The slow black bear jumped over the lazy dog.
*/
?>

例子 3 ，使用逆向引用：

<?php
$str = '<a href="http://www.baidu.com/">baidu</a>其他字符<a href="http://www.sohu.com/">sohu</a>';
$pattern = "/<a\s([\s\S]*?)>([\s\S]*?)<\/a>/i";
print preg_replace($pattern, '\\2', $str);
?>

输出结果为：

baidu其他字符sohu

该例子演示了将文本中所有的 <a></a> 标签去掉。

2. int preg_match(string $pattern, string $subject [,array &$matches [, int $flags=0 [ ,int $offset=0]]])

函数功能：搜索subject与pattern给定的正则表达式的一个匹配。

pattern：要搜索的模式，字符串类型。
subject：输入字符串。
matches：如果提供了参数matches，它将被填充为搜索结果，$matches[0]将包含完整模式匹配到文本，$matches[1]将包含第一捕获子组匹配到的文本。
flags：可以设置为PREG_OFFSET_CAPTURE,如果传递了这个标记，对于每一个出现的匹配返回时会附加字符串偏移量（相对于目标字符串的）。
注意：这会改变填充到matches数组，使其每个元素成为一个由第0个元素是匹配到的字符串，第1个元素是该匹配字符串在目标字符串subject中的偏移量。
offset：通常，搜索从目标字符串的开始，可选参数offset用于指定从目标字符串的某个未知开始搜索（单位是字节）。

3. int preg_match_all(string $pattern, string $subject [, array &$matches [, int $flags=PREG_PATTERN_ORDER [, int $offset=0]]])

函数功能：搜索subject中所有匹配pattern给定正则表达式的匹配结果并且将它们以flag指定顺序输出到matches中。

在第一个匹配找到后，子序列继续从最后一次匹配位置搜索。

pattern：要搜索的模式，字符串形式。
subject：输入字符串。
matches：多维数组，作为输出参数输出后所有匹配结果，数组排序通过flags指定。
flags：可以结合下面标记使用(注意不能同时使用PREG_PATTERN_ORDER和PREG_SET_ORDER):

PREG_PATTERN_ORDER

结果排序为$matches[0]保存完整模式的所有匹配,$matches[1] 保存第一个子组的所有匹配, 以此类推.

<?php
preg_match_all("|<[^>]+>(.*)</[^>]+>|U",
  "<b>example: </b><p align=left>this is a test</p>",
  $out, PREG_PATTERN_ORDER);
echo $out[0][0] . ", " . $out[0][1] . "\n";
echo $out[1][0] . ", " . $out[1][1] . "\n";
?>

以上例程会输出：

example: , this is a test
example: , this is a test

因此, $out[0]是包含匹配完整模式的字符串的数组,$out[1]是包含闭合标签内的字符串的数组.

PREG_SET_ORDER

结果排序为$matches[0]包含第一次匹配得到的所有匹配(包含子组),$matches[1]是包含第二次匹配到的所有匹配(包含子组)的数组, 以此类推.

<?php
preg_match_all("|<[^>]+>(.*)</[^>]+>|U",
  "<b>example: </b><p align=\"left\">this is a test</p>",
  $out, PREG_SET_ORDER);
echo $out[0][0] . ", " . $out[0][1] . "\n";
echo $out[1][0] . ", " . $out[1][1] . "\n";
?>

以上例程会输出：

example: , example:
this is a test, this is a test

PREG_OFFSET_CAPTURE

如果这个标记被传递, 每个发现的匹配返回时会增加它相对目标字符串的偏移量. 注意这会改变matches中的每一个匹配结果字符串元素, 使其成为一个第0个元素为匹配结果字符串, 第1个元素为匹配结果字符串在subject中的偏移量.

如果没有给定排序标记, 假定设置为PREG_PATTERN_ORDER.

offset：通常，查找时从目标字符串的开始位置开始，可选参数offset用于从目标字符串中指定位置开始搜索（单位是字节）。

以上就是本文的全部内容，希望对大家的学习有所帮助。