python正则表达式中的中文匹配例子

程序员文章站 2023-12-24 11:44:39

...

#coding=utf-8 
import re 
from urllib2 import urlopen 
webpage = urlopen('http://www.baidu.com')       #获取百度页面的信息
text = webpage.read()                           #读取为文本
tmp = text.decode('utf8')                       #对原文本进行utf8转码, 此处要跟代码的编码格式一致
pat = '<title>(.*)?([\u4e00-\u9fa5]*)?</title>' #对中文进行匹配
re.escape(pat)                                  #对匹配模式中需要转义的符号进行转义
pat = re.compile(pat)                           #compile一下
m = re.search(pat,tmp) 
title = m.group(1) 
print title 
webpage.close()

相关标签：正则表达式 python 中文 python正则表达式中的中文匹配例子

python正则表达式中的中文匹配例子

python正则表达式中的中文匹配例子

使用Python编写提取日志中的中文的脚本的方法

C#匹配中文字符串的4种正则表达式分享

Python利用正则表达式匹配并截取指定子串及去重的方法

iOS App开发中Objective-C使用正则表达式进行匹配的方法

解决python中画图时x,y轴名称出现中文乱码的问题

Python利用正则表达式匹配并截取指定子串及去重的方法

iOS App开发中Objective-C使用正则表达式进行匹配的方法

python处理json数据中的中文

Python2.x版本中基本的中文编码问题解决