欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

正则表达式的使用规则

程序员文章站 2022-06-15 16:11:11
正则表达式 正则表达式,又称规则表达式。(英语:regular expression,在代码中常简写为regex、regexp或re),计算机科学的一个概念。正则表达式通...

正则表达式

正则表达式,又称规则表达式。(英语:regular expression,在代码中常简写为regex、regexp或re),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。

许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成“regex”,单数有regexp、regex,复数有regexps、regexes、regexen。

下面给大家介绍正则表达式的使用规则,具体内容如下所示:

\d    | 匹配0-9中的任意一个数字,等效于[0-9]
\d    | 匹配非数字字符,等效于[^0-9]
\w    | 匹配任意一个字母、数字或下划线,等效于[^a-za-z0-9_]
\w   | 与任何非字母、数字或下划线字符匹配,等效于[^a-za-z0-9_]
\s     | 匹配任何空白字符,包括空格、制表符、换页符,等效于 ?[\f\n\r\t\v]
\s    | 匹配任何非空白字符,等效于[^\f\n\r\t\v]
\n    | 匹配换行符
\r     | 匹配一个回车符
\t     | 匹配制表符
\v    | 匹配垂直制表符
\f     | 匹配换页符

这些字符在正则表达式中表示特殊的含义,比如:*,+,?,\,

\      | 转义字符,将下一个字符标记为一个特殊字符
^     | 匹配字符串开始的位置
$     | 匹配字符串结尾的位置
*      | 零次或多次匹配前面的字符或子表达式
+     | 一次或多次匹配前面的字符或子表达式
?     | 零次或一次匹配前面的字符或子表达式
.      | “点” 匹配除“\r\n”之外的任何单个字符
|      | 或
[ ]    | 字符集合
( )    | 分组,要匹配圆括号字符,请使用 “(” ?或 “)”

限定字符又叫量词,是用于表示匹配的字符数量的。

  *     | 零次或多次匹配前面的字符或子表达式
  +     | 一次或多次匹配前面的字符或子表达式
  ?     | 零次或一次匹配前面的字符或子表达式
{n}     | n是一个非负整数,匹配确定的n次
{n,}    | n是非负整数,至少匹配n次
{n,m} | n和m是非负整数,其中n<=m;匹配至少n次,至多m次

定位字符也叫字符边界,标记匹配的不是字符而是符合某种条件的位置,所以定位字符是“零宽的”。

^      | 匹配字符串开始的位置,表示开始
$      | 匹配字符串结尾的位置,表示结尾
\b    | 匹配一个单词边界

总结

以上所述是小编给大家介绍的正则表达式的使用规则,希望对大家有所帮助