欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

python如何针对不定分隔符切割提取字符串?

程序员文章站 2022-06-30 12:09:46
问题:我们需要在散沙一般的数据中提取出字符,分隔符不止一个,而且还有不少空格,比如: 原字符串如下: 'asd ff gg; asd , foo| og...

问题:我们需要在散沙一般的数据中提取出字符,分隔符不止一个,而且还有不少空格,比如:

原字符串如下:

'asd  ff gg; asd , foo|     og '

我们需要删除上面的,;|分隔符和多余空格,提取出:

['asd', 'ff', 'gg', 'asd', 'foo', 'og']

这种一般用于处理日志或者网页数据提取,一般而言,这种数据中需要的数据分布规律性不是太强,而且比较散。

处理结果如下:

import re
line = 'asd  ff gg; asd , foo|     og '
data = re.split(r'[;,|\s]\s*',line)
for i in data:
    if i == '':
        data.remove(i)
print(data)