正则表达式的使用规则
正则表达式
正则表达式,又称规则表达式。(英语:regular expression,在代码中常简写为regex、regexp或re),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。
许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成“regex”,单数有regexp、regex,复数有regexps、regexes、regexen。
下面给大家介绍正则表达式的使用规则,具体内容如下所示:
\d | 匹配0-9中的任意一个数字,等效于[0-9]
\d | 匹配非数字字符,等效于[^0-9]
\w | 匹配任意一个字母、数字或下划线,等效于[^a-za-z0-9_]
\w | 与任何非字母、数字或下划线字符匹配,等效于[^a-za-z0-9_]
\s | 匹配任何空白字符,包括空格、制表符、换页符,等效于 ?[\f\n\r\t\v]
\s | 匹配任何非空白字符,等效于[^\f\n\r\t\v]
\n | 匹配换行符
\r | 匹配一个回车符
\t | 匹配制表符
\v | 匹配垂直制表符
\f | 匹配换页符
这些字符在正则表达式中表示特殊的含义,比如:*,+,?,\,
\ | 转义字符,将下一个字符标记为一个特殊字符
^ | 匹配字符串开始的位置
$ | 匹配字符串结尾的位置
* | 零次或多次匹配前面的字符或子表达式
+ | 一次或多次匹配前面的字符或子表达式
? | 零次或一次匹配前面的字符或子表达式
. | “点” 匹配除“\r\n”之外的任何单个字符
| | 或
[ ] | 字符集合
( ) | 分组,要匹配圆括号字符,请使用 “(” ?或 “)”
限定字符又叫量词,是用于表示匹配的字符数量的。
* | 零次或多次匹配前面的字符或子表达式
+ | 一次或多次匹配前面的字符或子表达式
? | 零次或一次匹配前面的字符或子表达式
{n} | n是一个非负整数,匹配确定的n次
{n,} | n是非负整数,至少匹配n次
{n,m} | n和m是非负整数,其中n<=m;匹配至少n次,至多m次
定位字符也叫字符边界,标记匹配的不是字符而是符合某种条件的位置,所以定位字符是“零宽的”。
^ | 匹配字符串开始的位置,表示开始
$ | 匹配字符串结尾的位置,表示结尾
\b | 匹配一个单词边界
总结
以上所述是小编给大家介绍的正则表达式的使用规则,希望对大家有所帮助