python爬虫入门----用urllib抓取整个网页

程序员文章站 2022-03-02 20:35:08

...

#不能用print(file.read())查看函数结果，会影响函数值，使函数值变为空值（@[email protected]之前犯了这个错误）;想要输出，要先把函数值赋值给变量，用变量输出

from urllib import *
import urllib.request as re
file= re.urlopen('http://www.baidu.com')
data=file.read()
dataline=file.readline()
datalines=file.readlines()

#1.html要先创建，不方便

fhandle=open("D:/DB/1.html","wb")

#把baidu的html代码copy下来，无图片
fhandle.write(data)

fhandle.close()

上一篇： php数组合并怎么不去重复

下一篇： Android Studio自带图标库和开源图标库怎么使用?

python爬虫入门----用urllib抓取整个网页

零基础写python爬虫之使用urllib2组件抓取网页内容

零基础写python爬虫之使用urllib2组件抓取网页内容

怎么用Python写爬虫抓取网页数据

[Python]网络爬虫（二）：利用urllib2通过指定的URL抓取网页内容

鱼c笔记——Python爬虫（一）：利用urllib进行简单的网页抓取

python爬虫学习-利用urllib进行简单的网页抓取

Python3网络爬虫：利用urllib进行简单的网页抓取（一）

Python2.7爬虫之urllib与urllib2抓取网页

[Python3.x]网络爬虫（一）：利用urllib通过指定的URL抓取网页内容

[Python3.x]网络爬虫（一）：利用urllib通过指定的URL抓取网页内容