欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

爬虫学习笔记——requests第一血

程序员文章站 2022-05-02 20:43:18
...

requests第一血

requests模块
- requests模块
- urllib模块

requests模块:python中原生的一款基于网络请求的模块,功能非常强大,简单便捷,效率极高
作用:模拟浏览器发请求

如何使用: (requests模块的编码流程)
- 指定url
- 发起请求
- 获取响应数据
- 持久化存储

环境安装:
pip install requests

实战编码:
- 需求:爬取搜狗首页的页面数据


import requests
if __name__=="__main__":
    #step1:指定url
    url = "https://www.sogou.com/"
    #step2:发起请求
    #get方法会返回一个响应对象
    response = requests.get(url=url)
    #step3:获取响应数据,text返回的是字符串形式的响应数据
    page_text = response.text
    print(page_text)
    #step4:持久化存储
    with open("./sogou.html",'w',encoding='utf-8') as fp:
        fp.write(page_text)
    print("爬取数据结束")