欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

学习python的第二十三天(re模块)

程序员文章站 2022-06-29 08:14:29
6.13自我总结 1.re模块 1.re.findall() 1.基本用法 2.正则匹配常用格式 1.^ 类似字符串内置方法里面的startswith 2.a|b 3.[a,b] 4.a$ 类似字符串内置方法里面的endswith 5. 6.{n} 7.\ 8.\+ 9.a? 10.\模式 一个\接 ......

6.13自我总结

1.re模块

1.re.findall()

1.基本用法

re.findall(正则匹配的格式,匹配的对象)

2.正则匹配常用格式

1.^只匹配开头在多行模式中匹配每一行的开头

类似字符串内置方法里面的startswith

import re
s = '''aaaa,123213123,____,杨aaaaa'''
print(re.findall('^aaaa',s))
#['aaaa']

2.a|b匹配的格式a或者b

import re
s = '''aaaa,123213123,____,杨aaaaa'''
print(re.findall('123|aaaaa',s))
#['123', '123', 'aaaaa']

3.[a,b]匹配的格式a或者b如果ab为多个值他会把里面的东西打散

import re
s = '''aaaa,123213123,____,杨aaaaa'''
print(re.findall('[123,aaaaa]',s))
#['a', 'a', 'a', 'a', ',', '1', '2', '3', '2', '1', '3', '1', '2', '3', ',', ',', 'a', 'a', 'a', 'a', 'a']

4.a$匹配已a 结尾的

类似字符串内置方法里面的endswith

import re
s = '''aaaa,123213123,____,杨aaaaa'''
print(re.findall('杨$',s))
#[]
print(re.findall('杨aaaaa$',s))

5..代表任意字符

import re
s = '''aaaa,123213123,____,杨aaaaa'''
print(re.findall('杨...',s))
#   ['杨aaa']

6.{n}代表大括号前字符n个

import re
s = '''aaaa,123213123,____,杨aaaaa'''
print(re.findall('a{5}',s)) #等效于'aaaaa'
#['aaaaa']

7.*代表前面字符0-无穷大个

import re
s = '''aaaa,123213123,____,杨aaaaa'''
print(re.findall('a*',s))  #取到一个a后他不会停止会接着往后找,a为0个他也取
['aaaa', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', 'aaaaa', '']

8.+代表前面字符1-无穷大个

import re
s = '''aaaa,123213123,____,杨aaaaa'''
print(re.findall('a+',s))  #取到一个a后他不会停止会接着往后找   
['aaaa', 'aaaaa']

9.a?代表a字符0-1个

import re
s = '''aaaa,123213123,____,杨aaaaa'''
print(re.findall('aaa',s))
print(re.findall('aaa?',s))
['aaa', 'aaa']
['aaa', 'aaa', 'aa']

10.\模式

一个\接某个类型代表一个字符

  • \d匹配数组
  • \d除了数字都匹配到了
  • \s,空
  • \s,非空
  • \w,字母,数字,下划线
  • \w,非字母,数字,下划线

11.?a,前面值是+或者*的时候?匹配内容a结束

import re
s = '''aaaa,123213123,____,杨aaaaa'''
print(re.findall('aa+?a',s))
['aaa', 'aaa']

12.(),括号里面什么到时候取什么

3.re.findall(正则匹配的格式,匹配的对象,re.s)

re.s的作用:

不使用re.s时,则只在每一行内进行匹配,如果存在一行没有,就换下一行重新开始,使用re.s参数以后,正则表达式会将这个字符串看做整体,在整体中进行匹配

import re
a = """sdhellolsdlfsdfiooe:
yy988989pythonafsf"""
b = re.findall('hello(.*?)python',a)
c = re.findall('hello(.*?)python',a,re.s)
print (b)
print(c)
输出结果:
b:[]
c:['lsdlfsdfiooe:\nyy988989']

2.re.match和re.search

# match 和 search的区别,mathch从开头开始匹配找一个,search搜索所有找第一个

3.re.compile

定义某种搜索格式
res1 = re.compile('\d+')
res1.findall(查找对象)等同于re.findall('\d+',查找对象)

4.re.split()

就是字符串的split方法,区别是可以使用正则表达式去替换

5.re.sub和re.subu

就是字符串的replace方法,区别是可以使用正则表达式去替换

import re

s = '猪八戒的媳妇是1高翠兰,孙悟空的媳妇是2白骨精,唐僧的媳妇是3女儿国王,沙悟净6没有媳妇(py9的学生们)'

print(re.sub('\d','',s))

print(re.subn('\d','',s))  # 除了会修改内容,还会返回修改了多少次
猪八戒的媳妇是高翠兰,孙悟空的媳妇是白骨精,唐僧的媳妇是女儿国王,沙悟净没有媳妇(py的学生们)
('猪八戒的媳妇是高翠兰,孙悟空的媳妇是白骨精,唐僧的媳妇是女儿国王,沙悟净没有媳妇(py的学生们)', 5)