欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

一个小脚本遇到的问题之python查看网站编码 博客分类: Python python网页编码

程序员文章站 2024-03-25 22:19:34
...

    那个脚本的样子
    第一个问题是编码问题,这里是以2.7.10为例,3.0以后的编码有很大的变化。
    不过这里因为正好躲过,所以没有多做研究。不过大家可以参考这里。介绍了一个查看网站编码的方法。个人没有验证,等用到的时候在做详细的记录。里面介绍了两个方法,摘录靠谱的那个如下:


# 原文网址:http://www.pythontab.com/html/2013/pythonhexinbiancheng_0114/129.html
#如果你的python没有安装chardet模块,你需要首先安装一下chardet判断编码的模块

import chardet
import urllib
#先获取网页内容
data = urllib.urlopen('http://www.pythontab.com').read()
#用chardet进行内容分析
chardit = chardet.detect(data)
  
data1 = urllib.urlopen('http://www.baidu.com').read()
  
chardit1 = chardet.detect(data1)
  
print chardit['encoding'] # pythontab
  
print chardit1['encoding'] # baidu




相关标签: python 网页编码