正则表达式知识整理

程序员文章站 2022-04-04 15:33:27

注：本文所有的例子都来自于《正则表达式必知必会（修订版）》。正则表达式的作用是用来检索文本或替换文本。如：（绝大多数正则表达式引擎的默认行为是返回第1个匹配结果。）正则表达式中一个非常重要的概念就是元字符，你可以不用去理什么限定符、定位符之类，只要记住它们都是元字符就行。基本元字符基本元字 ......

注：本文所有的例子都来自于《正则表达式必知必会（修订版）》。

正则表达式的作用是用来检索文本或替换文本。如：

正则表达式知识整理

（绝大多数正则表达式引擎的默认行为是返回第1个匹配结果。）

正则表达式中一个非常重要的概念就是元字符，你可以不用去理什么限定符、定位符之类，只要记住它们都是元字符就行。

基本元字符

元字符	说明
\|	逻辑或操作符
\	转义符
.	匹配单个任意字符。如果想匹配多个，就用多个.
[]	字符区间。如[0123456789]，则匹配0或1或2或3或4...
[ - ]	连字符。如[0-9]等价于[0123456789]。
[^ ]	取非。取非字符区间，如[^0-9]，则匹配非数字。

基本元字符（\）

正则表达式知识整理

基本元字符（.）

正则表达式知识整理

基本元字符（[]）

正则表达式知识整理

基本元字符（[ - ]）

正则表达式知识整理

基本元字符（[^ ]）

正则表达式知识整理

数量元字符

元字符	说明
？	匹配前一个字符0次或1次
*	匹配前一个字符0次或多次
+	匹配前一个字符1次或多次
{n}	匹配前一个字符n次
{n,m}	匹配前一个字符至少n次至多m次
{n,}	匹配前一个字符至少n次

数量元字符（?）

正则表达式知识整理

数量元字符（*）

正则表达式知识整理

数量元字符（+）

正则表达式知识整理

数量元字符（{n}）

正则表达式知识整理

数量元字符（{n,m}）

正则表达式知识整理

数量元字符（{n,}）

正则表达式知识整理

贪婪型

正则表达式中的元字符有一些是贪婪型的，它会从文本的开头一直匹配到文本的结尾，忽略中间的匹配。看一个例子或许你就会明白：

正则表达式知识整理

上面的匹配结果肯定不是我们所期望的。

贪婪型元字符	懒惰型元字符
*	*?
+	+?
{n,}	{n,}?

正则表达式知识整理

位置元字符

元字符	说明
^	匹配字符串的开头
$	匹配字符串的结尾
\b	匹配单词边界（开头和结尾）
\b	匹配非单词边界

位置元字符（^）

正则表达式知识整理

位置元字符（$）

正则表达式知识整理

位置元字符（\b）

正则表达式知识整理

位置元字符（\b）

正则表达式知识整理

特殊元字符

空白元字符

元字符	说明
[\b]	回退并删除一个字符
\f	匹配换页符
\n	匹配换行符
\r	匹配回车符
\t	匹配制表符
\v	匹配垂直制表符

正则表达式知识整理

数字元字符

元字符	说明
\d	匹配任何一个数字，等价于[0-9]
\d	匹配任何一个非数字字符，等价于[^0-9]

正则表达式知识整理

字母数字元字符

元字符	说明
\w	匹配任何一个数字字符或下划线，等价于[a-za-z0-9_]
\w	匹配任何一个非数字或非下划线字符，等价于[^a-za-z0-9_]

正则表达式知识整理

空白字符元字符

元字符	说明
\s	匹配任何一个空白字符，等价于[\f\n\r\t\v]
\s	匹配任何一个非空白字符，等价于[^\f\n\r\t\v]

大小写转换元字符

元字符	说明
\l	把下一个字符转换为小写
\u	把下一个字符转换为大写
\l	把\l到\e之间的字符全部转换为小写
\u	把\u到\e之间的字符全部转换为大写
\e	结束\l或\u转换