欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Python—re模块

程序员文章站 2022-04-12 19:35:01
re模块 正则表达式就是字符串的匹配规则,在多数编程语言里都有相应的支持,python里对应的模块是re 常用的表达式规则 ......

re模块

正则表达式就是字符串的匹配规则,在多数编程语言里都有相应的支持,python里对应的模块是re

常用的表达式规则

 1 '.'     默认匹配除\n之外的任意一个字符,若指定flag dotall,则匹配任意字符,包括换行
 2 '^'     匹配字符开头,若指定flags multiline,这种也可以匹配上(r"^a","\nabc\neee",flags=re.multiline)
 3 '$'     匹配字符结尾, 若指定flags multiline ,re.search('foo.$','foo1\nfoo2\n',re.multiline).group() 会匹配到foo1
 4 '*'     匹配*号前的字符0次或多次, re.search('a*','aaaabac')  结果'aaaa'
 5 '+'     匹配前一个字符1次或多次,re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb']
 6 '?'     匹配前一个字符1次或0次 ,re.search('b?','alex').group() 匹配b 0次
 7 '{m}'   匹配前一个字符m次 ,re.search('b{3}','alexbbbs').group()  匹配到'bbb'
 8 '{n,m}' 匹配前一个字符n到m次,re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb']
 9 '|'     匹配|左或|右的字符,re.search("abc|abc","abcbabccd").group() 结果'abc'
10 '(...)' 分组匹配, re.search("(abc){2}a(123|45)", "abcabca456c").group() 结果为'abcabca45'
11 
12 
13 '\a'    只从字符开头匹配,re.search("\aabc","alexabc") 是匹配不到的,相当于re.match('abc',"alexabc") 或^
14 '\z'    匹配字符结尾,同$ 
15 '\d'    匹配数字0-9
16 '\d'    匹配非数字
17 '\w'    匹配[a-za-z0-9]
18 '\w'    匹配非[a-za-z0-9]
19 's'     匹配空白字符、\t、\n、\r , re.search("\s+","ab\tc1\n3").group() 结果 '\t'