欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Linux正则表达式特性详解及BRE与ERE的异同点

程序员文章站 2022-11-05 18:07:27
 linux正则表达式(regular expression)主要遵从posix bre或者posix ere标准。什么是posix呢,posix portable ope...

 linux正则表达式(regular expression)主要遵从posix bre或者posix ere标准。什么是posix呢,posix portable operating system interface 可移植操作系统接口ere是bre的扩展版本,具体更强的处理能力,并增加了一些元字符(metacharactor)。

  bre主要的能力集有:

  1) 普通字符(literal text),如a,b,c等

  2)非打印字符,包括tab,回车,换行,回车换行(windows)

  3)任意字符.

  4)字符集,包括单词型字符([[:alnum:]]),非单词型字符([^[:alnum:]]),数字([[:digit:]]),非数字([^[:alnum:]]),空格、tab、换行等空白字符([[:space:]])以及非空白字符([^[:space:]])

  5)边缘匹配符,不管是bre还是ere,都只支持匹配行首或行尾,不像perl,还可以匹配单词首和单词尾

  6)匹配重复次数(quantifier/repetition)

  7)分组及后向引用

  8)多项匹配(alteration),使用元字符|,该特性只ere支持,bre没有此功能

  bre与ere似乎对ascii和unicode是否都支持尚待确认;

  正前向查找和负前向查找不支持;

  正后向查找和负后向查找不支持;

  bre与ere在能力上区别仅在多项匹配的能力上,其他方面没有大的差别,主要的区别体现在元字符上。

  bre只定义了4组元字符:

  []      用于在多个字符中选定一个字符进行匹配,[]内可以有-以示范围,但-本身不是元字符

  .        用于匹配任意字符

  ^      用于匹配时表示“非”的含义,还有一个用法是匹配行首

  $      用于匹配行尾

  ere在此基础上增加了3组元字符的定义:

  {}      用于表示重复匹配的次数。bre中只将{}当作普通字符对待,要使用此功能必须加\进行转义,即“\{\}”

  ()      用于分组。bre中只将()当作普通字符对待,要使用此功能必须加\进行转义,即“\(\)”

  |      完全为ere新增的多项匹配能力定义的,bre无多项匹配能力,只将|作普通字符对待

以上内容是小编给大家介绍的linux正则表达式特性详解及bre与ere的不同,希望大家喜欢。