欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Python3网络爬虫:利用urllib进行简单的网页抓取(一)

程序员文章站 2022-05-04 11:42:24
...

Python3网络爬虫:利用urllib进行简单的网页抓取(一)

import urllib.request   #导入urllib包下的request类
response = urllib.request.urlopen("https://www.csdn.net/")  #请求获取网站资源,并赋值给一个变量
zhyxh = response.read()     #读取获取的资源
zhyxh = zhyxh.decode("utf-8")       #查看被爬取网站的编码格式为url-8,所以在这里需要用utf-8进行解码
print(zhyxh)        #输出爬去的内容