day03爬虫--豆瓣

程序员文章站 2022-05-03 08:21:53

...

import requests
from lxml import html
import pandas as pd
import json

# url=""
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.190 Safari/537.36"}
tv_list = []
for i in range(0, 300, 20):
    url = "https://movie.douban.com/j/search_subjects?type=tv&tag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=20&page_start={}".format(i)

    response = requests.get(url, headers=headers)
    print(response.status_code)
    data = response.text
    print(data)
    data = json.loads(data)
    data_list = data["subjects"]
    print(type(data))
    for tv in data_list:
        title = tv['title']
        url = tv['url']
        rate = tv['rate']
        tv_list.append({
            "title": title,
            "url": url,
            "rate": rate
        })
pd.DataFrame(tv_list).to_csv("tv.csv", index="False")

day03爬虫--豆瓣

如何准确判断请求是搜索引擎爬虫（蜘蛛）发出的请求

Python网络爬虫项目：内容提取器的定义

如何用Python做爬虫

python解决网站的反爬虫策略总结

python实现简单爬虫功能的示例

php使用phpquery爬虫速度太慢怎么解决

python制作爬虫爬取京东商品评论教程

天气后报数据爬虫pythont

教你如何编写简单的网络爬虫

《精通Python网络爬虫》第18章　博客类爬虫项目代码

day03爬虫--豆瓣

如何准确判断请求是搜索引擎爬虫（蜘蛛）发出的请求

Python网络爬虫项目：内容提取器的定义

如何用Python做爬虫

python解决网站的反爬虫策略总结

python实现简单爬虫功能的示例

php使用phpquery爬虫速度太慢怎么解决

python制作爬虫爬取京东商品评论教程

天气后报数据爬虫pythont

教你如何编写简单的网络爬虫

《精通Python网络爬虫》第18章 博客类爬虫项目代码

《精通Python网络爬虫》第18章　博客类爬虫项目代码