欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

爬取搜狗首页的页面数据

程序员文章站 2022-05-02 22:13:35
...

1 需求

爬取搜狗首页的页面数据,并将页面数据持久化存储。

2 实现代码

"""爬取搜狗首页的页面数据"""
import requests


# 指定url
url = 'https://www.sogou.com/'
# 发起请求,get方法会返回一个响应对象
response = requests.get(url=url)
# 获取响应数据,text返回的是字符串形式的响应数据
page_text = response.text
print(page_text)
# 持久化存储
with open('./sougou.html', 'w', encoding='utf-8') as fp:
    fp.write(page_text)
print('爬取数据结束!')