python爬虫爬取网站小说

程序员文章站 2022-06-05 18:46:41

...

#加载模块
import requests
from bs4 import BeautifulSoup

# 定义所有章节和链接函数
def get_novel_chapters():
    url = "https://www.89wxw.com/read/1037/"
    r = requests.get(url)
    main_page = BeautifulSoup(r.text, "html.parser")
    list1 = []
    for dd in (main_page.find_all("dd")):
        link = dd.find("a")
        if not link:
            continue
        list1.append(("https://www.89wxw.com" + (link["href"]), (link.get_text())))
    return list1

# 定义获取所有章节内容
def get_chapters_content(url):
    r = requests.get(url)
    main_page = BeautifulSoup(r.text, "html.parser")
    data = main_page.find("div", id="content").get_text()
    return data

#循环调用两个自定义函数将鸟啼和内容写入文本文档
j = 0
f = open("都市超级医圣.txt", "w")
alist = get_novel_chapters()
for i in alist:
    j+=1
    url,title=i
    print("循环爬取第{}次，写入文本文档，标题是：{}".format(j,title))
    f.write(title+"\n"+get_chapters_content(url))
f.close()

相关标签：网络爬虫 python 爬虫

上一篇： C#类型成员：方法

下一篇：等白菜500块一斤的时候

python爬虫爬取网站小说

利用python爬虫爬取斗鱼图片(简单详细)

Python制作爬虫采集小说

python scrapy框架爬取80s保存mysql

几行Python代码爬取3000+上市公司的信息

XPath 结合 requests 爬取网站存储格式可选有json、csv、txt

c#爬虫爬取京东的商品信息

基于Python的Post请求数据爬取的方法详解

Python实现爬取马云的微博功能示例

python爬取内容存入Excel实例

Python爬取国外天气预报网站的方法

python爬虫爬取网站小说

利用python爬虫爬取斗鱼图片(简单详细)

Python制作爬虫采集小说

python scrapy框架爬取80s保存mysql

几行Python代码爬取3000+上市公司的信息

XPath 结合 requests 爬取网站 存储格式可选 有json、csv、txt

c#爬虫爬取京东的商品信息

基于Python的Post请求数据爬取的方法详解

Python实现爬取马云的微博功能示例

python爬取内容存入Excel实例

Python爬取国外天气预报网站的方法

XPath 结合 requests 爬取网站存储格式可选有json、csv、txt