Python3网络爬虫:利用urllib进行简单的网页抓取(一)
程序员文章站
2022-05-04 11:42:24
...
Python3网络爬虫:利用urllib进行简单的网页抓取(一)
import urllib.request #导入urllib包下的request类
response = urllib.request.urlopen("https://www.csdn.net/") #请求获取网站资源,并赋值给一个变量
zhyxh = response.read() #读取获取的资源
zhyxh = zhyxh.decode("utf-8") #查看被爬取网站的编码格式为url-8,所以在这里需要用utf-8进行解码
print(zhyxh) #输出爬去的内容