欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

PHP中的正则表达式函数介绍

程序员文章站 2022-05-14 12:52:35
正则表达式(regular expression) 正则表达式系统:   1.posix   2.perl php中使用的regex是pcre:   note:pcre(p...
正则表达式(regular expression)

正则表达式系统:
  1.posix
  2.perl

php中使用的regex是pcre:
  note:pcre(perl兼容正则表达式,perl compatible regular expressions)

pcre语法:
  1.定界符
    必须成对出现,可以使用除0-9a-za-z\以外的任何字符
  2.原子
    1.正则需要匹配的可见和不可见字符都是原子
    2.一个正则表达式最少含有一个原子
    3.当需要匹配诸如"("、"["、"^"等含有语义的符号时需要用"\"反斜线进行转义

    原子字符:
      \f 匹配换页符
      \n 匹配换行符
      \r 匹配回车符
      \t 匹配制表符
      \v 匹配垂直制表符

  3.元字符
    \ 转义字符
    ^ 匹配字符串起始处
    $ 匹配字符串末尾
    . 匹配除"\n"之外的任何单个字符

    * 匹配前面的子表达式0或多次
    + 匹配前面的子表达式1次或多次
    ? 匹配前面的子表达式0次或1次

    {n} 匹配n次
    {n,} 匹配n次或n次以上
    {n,m} 最少匹配n次至多匹配m次,(n<=m)

    [] 中括号代表原子表,中间的原子地位都是相等。在匹配的时候,匹配表中的任意一个字符
    [^] 抑扬符,排除后面的原子表所包含的字符。

    (pattern) 匹配pattern并获取这一匹配。
    \num 对获取的第num个匹配的引用。


    (?:pattern) 匹配pattern但不获取这一匹配

    (?=pattern) 正向肯定预查,非获取匹配,例如:windows(?=xp|7)能匹配windowsxp中的windows不能匹配windows98中的windows
    (?!=pattern) 正向否定欲查非获取匹配,例如:windows(?!98|2000),能匹配windowsxp中的windows,不能匹配windows98中的windows
    (?<=pattern) 反向肯定预查,非获取匹配。例如:(?<=my|postgre)sql能匹配mysql中的sql,不能匹配mssql中的sql
    (?<!pattern) 反向否定预查,非获取匹配。例如:(?<!my|postgre)sql能匹配mssql中的sql,不能匹配mysql中的sql

    \b 匹配单词边界
    \b 匹配除单词边界以外的字符
    
    \d 匹配任何一个数字。等价于[0-9]
    \d 匹配任何一个非数字以外的字符。等价于[^0-9]

    \s 匹配任何一个空白字符(包括空格、制表符、换页符等)。等价于[\f\n\r\t\v]
    \s 匹配任何一个非空白字符。等价于[^\f\n\r\t\v]
    
    \w 匹配任何一个数字、字母或下划线。等价于[0-9a-za-z]
    \w 匹配任何一个非数字、字母或下划线的字符。等价于[^0-9a-za-z]

4.模式修正符
  i 不区分大小写
  m 此模式中如果有回车或换行,^和$将匹配每行的行首和行尾
  s 让.能匹配\n
  x 忽略空白
  u 取消贪婪,相当于(.*?)
  a 与^效果一样
  d 结尾处不忽略回车 ,在结束处有$符的时候,在匹配的字符串后面加上回车,$依然能够匹配它成功。但是加上d之后,结尾的回车,不再匹配

  note:正则表达式是从左向右进行匹配的


  相关函数:
    preg_filter — 执行一个正则表达式搜索和替换
    preg_grep — 返回匹配模式的数组条目
    preg_last_error — 返回最后一个pcre正则执行产生的错误代码
    preg_match_all — 执行一个全局正则表达式匹配
    preg_match — 执行一个正则表达式匹配
    preg_quote — 转义正则表达式字符
    preg_replace_callback — 执行一个正则表达式搜索并且使用一个回调进行替换
    preg_replace — 执行一个正则表达式的搜索和替换
    preg_split — 通过一个正则表达式分隔字符串