欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

为什么要学正则表达式 - 2

程序员文章站 2022-04-18 20:51:57
...

除了前面介绍的"^“和”$"之外,表达式里还有还有许多元字符,今天我们就继续来看看这些元字符所代表的意思。
前言
在处理正字符串的时候,经常会有一些复杂规则的字符串需求,
正则表表达式就是描述这些规则的公工具。
换句话说
正则表达式就是记录文本规则的代码。

行定位符部分请参考:
为什么要学正则表达式 - 1

元字符

\n匹配换行符。
\t匹配制表符。
\w匹配字母、数字、下划线。
\W匹配除了字母、数字、下划线的字符串。字母大写相当于非(个人总结)
\d匹配十进制数字
\D匹配除了十进制数字的字符串
\s匹配空白字符
\S匹配非空白字符
\b匹配单词的开始或结束,单词的分界通常是空格、标点符号或者换行

接下来我们来看一组\b的实例

def match_str(string):
    regex_str = "\\bapple\\b"  #匹配规则
    match_regex = re.match(regex_str, string)

    if match_regex:
        print('match!')
    else:
        print('not match')

if __name__ == '__main__':
    match_str('apple')  #进行匹配的字符串
#match

上面这组表达式有什么含义呢?
\b匹配apple开头的单词,最后是单词结尾(\b)。
注意\b匹配的是位置,而不是任意字符,匹配的是单词的边界。

接下来我们再看一看\s的具体含义。请看以下实例

def match_str(string):
    regex_str = 'six\s*students'  #匹配规则
    match_regex = re.match(regex_str, string)

    if match_regex:
        print('match!')
    else:
        print('not match')

if __name__ == '__main__':
    match_str('six         students')  #进行匹配的字符串
#match

上面这组表达式有什么含义呢?
使用\s去匹配空白字符,如果含有多个空白字符的话需要使用使用\s*匹配。

刚才演示了一下\s的意思。接下来我们再看一看\S的具体含义。请看以下实例

String = 'six+-*/students'
regex_str = 'six\S*students'
match_str = re.match(regex_str, String)

if match_str:
    print('match!')
else:
    print('Not match!')
#match

这个表达式的意思很简单,除了空格之外的所有都可以匹配得到。
好了,今天分享到此结束。明天咱们继续!

相关标签: python实战