python基础学习14----正则表达式

程序员文章站 2022-03-06 10:35:39

正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。在python中正则表达式被封装到了re模块，通过引入re模块来使用正则表达式 re模块中有很多正则表达式处理函数，首先用find ......

正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。

在python中正则表达式被封装到了re模块，通过引入re模块来使用正则表达式

re模块中有很多正则表达式处理函数，首先用findall函数介绍基本基本字符的含义

元字符有：. \ * + ? ^ $ | {} [] ()

findall函数

遍历匹配，可以获取字符串中所有匹配的字符串，返回一个列表

. 匹配任意除换行符"\n"外的字符

import re

temp=re.findall("a.c","abcdefagch")
print(temp)#['abc', 'agc']

* 匹配前一个字符0或多次

temp=re.findall("a*b","abcaaaaabcdefb")
print(temp)#['ab', 'aaaaab', 'b']

+ 匹配前一个字符1次或无限次

temp=re.findall("a+b","abcaaaaabcdefb")
print(temp)#['ab', 'aaaaab']

? 匹配前一个字符0次或1次

temp=re.findall("a?b","abcaaaaabcdefb")
print(temp)#['ab', 'ab', 'b']

^ 匹配字符串开头。在多行模式中匹配每一行的开头

temp=re.findall("^ab","abcaaaaabcdefb")
print(temp)#['ab']

$ 匹配字符串末尾，在多行模式中匹配每一行的末尾

temp=re.findall("ab$","abcaaaaabcdefab")
print(temp)#['ab']

| 或。匹配|左右表达式任意一个，从左到右匹配，如果|没有包括在()中，则它的范围是整个正则表达式

temp=re.findall("abc|def","abcdef")
print(temp)#['abc', 'def']

{} {m}匹配前一个字符m次，{m,n}匹配前一个字符m至n次，若省略n，则匹配m至无限次

temp=re.findall("a{3}","aabaaacaaaad")
print(temp)#['aaa', 'aaa']
temp=re.findall("a{3,5}","aaabaaaabaaaaabaaaaaa")
print(temp)#['aaa', 'aaaa', 'aaaaa', 'aaaaa']在获取了3个a后，若下一个还是a，并不会得到aaa，而是算下一个a

[] 字符集。对应的位置可以是字符集中任意字符。字符集中的字符可以逐个列出，也可以给出范围，如[abc]或[a-c]。[^abc]表示取反，即非abc，所有特殊字符在字符集中都失去其原有的特殊含义。用\反斜杠转义恢复特殊字符的特殊含义。

temp=re.findall("a[bcd]e","abcdefagch")
print(temp)#[]此时bcd为b或c或d
temp=re.findall("a[a-z]c","abcdefagch")
print(temp)#['abc', 'agc']
temp=re.findall("[^a]","aaaaabcdefagch")
print(temp)#['b', 'c', 'd', 'e', 'f', 'g', 'c', 'h']
temp=re.findall("[^ab]","aaaaabcdefagch")
print(temp)#['c', 'd', 'e', 'f', 'g', 'c', 'h']a和b都不会被匹配

() 被括起来的表达式将作为分组，从表达式左边开始每遇到一个分组的左括号“（”，编号+1.分组表达式作为一个整体，可以后接数量词。表达式中的|仅在该组中有效。

temp=re.findall("(abc){2}a(123|456)c","abcabca456c")
print(temp)#[('abc', '456')]
temp=re.findall("(abc){2}a(123|456)c","abcabca456cbbabcabca456c")
print(temp)#[('abc', '456'), ('abc', '456')]
#这里有()的情况中，findall会将该规则的每个()中匹配到的字符创放到一个元组中

要想看到被完全匹配的内容，我们可以使用一个新的函数search函数

search函数

在字符串内查找模式匹配,只要找到第一个匹配然后返回，如果字符串没有匹配，则返回none

temp=re.search("(abc){2}a(123|456)c","abcabca456c")
print(temp)#<re.match object; span=(0, 11), match='abcabca456c'>
print(temp.group())#abcabca456c

\ 转义字符，使后一个字符改变原来的意思

反斜杠后边跟元字符去除特殊功能；（即将特殊字符转义成普通字符）

temp=re.search("a\$","abcabca456ca$")
print(temp)#<<re.match object; span=(11, 13), match='a$'>
print(temp.group())#a$

引用序号对应的字组所匹配的字符串。

即下面的\2为前边第二个括号中的内容，2代表第几个，从1开始

a=re.search(r'(tina)(fei)haha\2','tinafeihahafei tinafeihahatina').group()
print(a)#tinafeihahafei

反斜杠后边跟普通字符实现特殊功能；（即预定义字符）　　

预定义字符有：\d \d \s \s \w \w \a \z \b \b

预定义字符在字符集中仍有作用

\d 数字:[0-9]

未完

上一篇： Dijkstra贪心算法求单源最短路径

下一篇：美术和程序吵架，原来是资源序列化格式设置不统一

python基础学习14----正则表达式

从0基础学习Python

零基础写python爬虫之神器正则表达式

python基础学习16----模块

简明 Python 基础学习教程

Python学习笔记（一）(基础入门之环境搭建)

Python函数基础学习（定义、函数参数、递归函数）

Python学习笔记（二）基础语法

python_0基础学习_day03

python基础语法学习大纲总结

python基础入门学习笔记（Python环境搭建）