欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

python正则分组的应用

程序员文章站 2022-04-06 14:53:37
复制代码 代码如下:import retext='v101_renow.android.2.2.normal.1.alpha.apk?imsi=46002935381397...

复制代码 代码如下:

import re
text='v101_renow.android.2.2.normal.1.alpha.apk?imsi=460029353813976&mobile=&old_version=renow.android.2.1.normal.1.alpha&channelid=3'
m = re.search(r"\w+_(renow.*)\.(apk|vir|ipa)\?imsi=(\d+)&mobile=&old_version=(.*)&channelid=(.*)", text)
if m:
    print m.group(0), '\n', m.group(1),'\n', m.group(2),'\n', m.group(3),'\n', m.group(4),'\n', m.group(5)
else:
    print 'not match'


以下是补充:

组是通过 "(" 和 ")" 元字符来标识的。 "(" 和 ")" 有很多在数学表达式中相同的意思;它们一起把在它们里面的表达式组成一组。举个例子,你可以用重复限制符,象 *, +, ?, 和 {m,n},来重复组里的内容,比如说(ab)* 将匹配零或更多个重复的 "ab"。

例子:如果不引入括号,增个表达式作为一个组,是group(0)

>>> import re
>>> p=re.compile('\d-\d-\d')
>>> m=p.match('2-3-1')
>>> m.groups()
()
>>> m.group()
'2-3-1'
>>> m.group(1)
traceback (most recent call last):
  file "<stdin>", line 1, in <module>
indexerror: no such group

如果引入括号,可以将上面的表达式分成3组,如下

>>> p=re.compile('(\d)-(\d)-(\d)')
>>> m=p.match('1-2-3')
>>> m.group()
'1-2-3'
>>> m.group(1)
'1'
>>> m.group(0,2,1)
('2-3-1', '2', '1')

也可以给各个组取名字,例如,给第一个数组取名叫first


>>> p=re.compile('(?p<first>\d)-(\d)-(\d)')
>>> m=p.match('1-2-3')
>>> m.group(1)
'1'
>>> m.group('first')

'1'