欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  web前端

怎么用正则把字符串分组

程序员文章站 2022-03-19 09:42:09
...
这次给大家带来怎么用正则把字符串分组,用正则把字符串分组的注意事项有哪些,下面就是实战案例,一起来看一下。

前言

最近工作中遇到一个问题,需求是碰到'122333<<<<'这种字符串,要将其连贯的部分取出,得出['1', '22', '333', '<<<<']这样的列表,能想到的常规办法,遍历字符串,后一个与前一个逐个比较,这样真的很麻烦!又想到了另外两种方法,话不多说了,来一起看看详细的示例代码:

一、实际上可以借助itertools模块的groupby()方法来处理:

import itertools 
 
Str = '122333<<<<' 
Lst = [] 
for key,group in itertools.groupby(s): 
 Lst.append(list(group)) 
 
print map(lambda x: ''.join(x), Lst)

上面的处理,还是比较有技巧,也能得到想要的输出结果

['1', '22', '333', '<<<<']

二、但更酷点,更技巧处理方式是用正则表达式来处理:

import re 
 
Str = '122333<<<<' 
Lst = [] 
 
Pat = re.compile(r'((.)\2*)') 
Rst = [x[0] for x in re.findall(Pat, Str)] 
 
print Rst

备注:

1. (.) # .匹配任意字符;(.)做分组,方便后面反向引用

2. \2* # \2对里面括号的反向引用;*代表是0个到多个;

3. ((.)\2*) # 连起来就是任意一个或多个字符组成的分组;

4. (.)\1* # 这种方式则可以取出唯一的值['1', '2', '3', '<'];同样非常方便

相信看了本文案例你已经掌握了方法,更多精彩请关注其它相关文章!

推荐阅读:

实现日期正则表达式详解

Replace中的正则表达式使用详解

以上就是怎么用正则把字符串分组的详细内容,更多请关注其它相关文章!