正则表达式-常用元字符的基本使用

程序员文章站 2022-07-10 21:02:21

常用元字符有：[] ^ $ \ * + ? {} .python中使用正则表达式需要导入re模块下面介绍用法[] 指定一个字符集，[ABC]表示ABC的字符集，[^ABC] 取反，除了ABC的字符集。>>> import re>>> r = r"ABC[ABC]" #定义一个正则>>>>>> re.... ......

常用元字符有：

[] ^ $ \ * + ? {} .

python中使用正则表达式需要导入re模块

下面介绍用法

[] 指定一个字符集，[abc]表示abc的字符集，[^abc] 取反，除了abc的字符集。

>>> import re
>>> r = r"abc[abc]" #定义一个正则
>>>
>>> re.findall(r,'abca') #使用findall进行匹配
['abca']
>>> re.findall(r,'abcb')
['abcb']
>>> re.findall(r,'abcd')
[]
>>> r = r"abc[^abc]" #取反
>>> re.findall(r,'abcd')
['abcd']
>>> re.findall(r,'abca')
[]
>>>

^ 匹配行首 ^h 如果行首是h，则返回h，如果不是h则返回空

>>> r = r"^h"
>>> re.findall(r,'hello')
['h']
>>> re.findall(r,'ehllo')
[]
>>>

$ 匹配行尾，和^是反着来的，不难理解，匹配末尾

>>> r = r"h$"
>>> re.findall(r,'hello')
[]
>>> re.findall(r,'olleh')
['h']
>>>

\ 转义字符

反斜杠后面加不同的字符以表示不同的特殊含义

\d 匹配任何十进制数 相当于[0-9]
\d 匹配任何非数字字符，相当于[^0-9]
\s 匹配任何空白字符，相当于[\t\n\r\f\v]
\s 匹配任何非空白字符，相当于[^\t\n\r\f\v]
\w 匹配任何字母数字字符，相当于[a-za-z0-9]
\w 匹配任何非字母数字字符，相当于[^a-za-z0-9]

>>> r1 = r"day=\d"
>>> r2 = r"day=\d"
>>> st = 'day=1 day=2 day=3 day=a day=b day=c'
>>> re.findall(r1,st)
['day=1', 'day=2', 'day=3']
>>> re.findall(r2,st)
['day=a', 'day=b', 'day=c']
>>>

>>> r3 = r"enter=\s"
>>> r4 = r"enter=\s"
>>>
>>> st = '''
enter=
enter=1 enter=  enter=3 enter=
enter=
'''
>>> re.findall(r3,st)
['enter=\n', 'enter= ', 'enter=\n', 'enter=\n']
>>> re.findall(r4,st)
['enter=1', 'enter=3']
>>>

>>> r5 = r"\w"
>>> r6 = r"\w"
>>> st = 'abcdefg1234567!@#$%^&'
>>> re.findall(r5,st)
['a', 'b', 'c', 'd', 'e', 'f', 'g', '1', '2', '3', '4', '5', '6', '7']
>>> re.findall(r6,st)
['!', '@', '#', '$', '%', '^', '&']
>>>

* + ？都是重复的意思

*重复0次或多次、+重复1次或多次、？重复0次或1次

>>> r1 = r"ab*"
>>> re.findall(r1,'a')
['a']
>>> re.findall(r1,'ab')
['ab']
>>> re.findall(r1,'abbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb')
['abbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb']
>>>

>>> r2 = r"ab+"
>>> re.findall(r2,'ab')
['ab']
>>> re.findall(r2,'a')
[]
>>> re.findall(r2,'abbbbbbbbbbbbbbbbbbbbbbbbbbbbb')
['abbbbbbbbbbbbbbbbbbbbbbbbbbbbb']
>>>

>>> r3 = r"ab?"
>>> re.findall(r3,'a')
['a']
>>> re.findall(r3,'ab')
['ab']
>>> re.findall(r3,'abb')
['ab']
>>> re.findall(r3,'abbbbbbbbbb')
['ab']
>>>

{}表示重复的范围，{m,n}最少重复m次，最多重复n次

举个成绩的例子吧，最少1位，最多2位。

>>> r1 = r"\d{1,3}"
>>> re.findall(r1,'100')
['100']
>>> re.findall(r1,'1')
['1']
>>> re.findall(r1,'')
[]
>>> re.findall(r1,'1000')
['100', '0']
>>> re.findall(r1,'1001')
['100', '1']
>>>

它会把多余的位扔到列表的后面元素中。

.的用法就是匹配所有，看下面例子即可

.*是匹配0次或多次，.+是1次或多次，一般用+

>>> r1 = r"src=.*"
>>> re.findall(r1,'src=img http qwerqwer')
['src=img http qwerqwer']
>>> re.findall(r1,'src=img http hello')
['src=img http hello']
>>>

>>> r1 = r".*.com"
>>> re.findall(r1,'www.com')
['www.com']
>>> re.findall(r1,'hello.com')
['hello.com']
>>>

读书和健身总有一个在路上

上一篇： 90%的人不知道这16个Python技巧

下一篇：爬取斗鱼LOL主播人气数据，并显示排行榜 [网络爬虫] [应用案例][请求头][模块]

正则表达式-常用元字符的基本使用

awk命令的基本使用

vue router的基本使用和配置教程

python3解析库lxml的安装与基本使用

ae中常用的表达式有哪些?怎么使用?

JavaScript函数使用的基本教程

Linux系统下telnet服务的基本使用方法简介

收集的一些常用java正则表达式

js输入框使用正则表达式校验输入内容的实例

WinForm使用正则表达式提取内容的方法示例

jsp 常用标签的使用