欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

【scrapy】【五】scrapy项目二

程序员文章站 2024-03-17 15:59:58
...

1、多个url

在之前的基础上,添加多个url进行爬取,

第一种是将需要爬取的网站都列出来,在start_urls中

#在basic.py中
start_urls={
'网址1',
'网址2',
'网址3',

}

 第二种是如下写法:

start_urls=[i.strip() for i in open('todo.urls.txt').readlines()]

 

2、双向爬取(水平、垂直爬取)

水平爬取就是next page或者多个url进行爬取

垂直爬取是某个网页下某个目标的爬取

示例:

首先复制一下之前写的爬虫文件,basic.py

cp basic.py manual.py

【未完待续】