python入门之Scrapy shell的使用

程序员文章站 2022-03-02 14:56:25

前言：我们想要在爬虫中使用xpath、beautifulsoup、正则表达式，css选择器等来提取想要的数据，但是因为scrapy是一个比较重的框架，每次运行都要等到一段时间，因此要去验证我们提取规则...

前言：

我们想要在爬虫中使用xpath、beautifulsoup、正则表达式，css选择器等来提取想要的数据，但是因为scrapy是一个比较重的框架，每次运行都要等到一段时间，因此要去验证我们提取规则是否正确，是一个比较麻烦的事情，因此，scrapy提供了一个shell。用来方便的测试规则，当然也不仅仅局限于这一个功能。

打开scrapy shell：

进入命令行终端，进入到scrapy项目所在的目录，然后进入到scrapy框架所在的虚拟环境中，输入命令 scrapy shell [链接] ，就会进入到scrapy的shell环境中。在这个环境中，你可以跟在爬虫的parse方法中一样使用了。

进入到scrapy项目所在的目录：

cd /volumes/development/python_learn/pycharmprojects/scrapy_demo/bmw_img_demo/

进入到scrapy框架所在的虚拟环境中：

 source /volumes/development/python_learn/pycharmprojects/venv/crawler_evn/bin/activate

输入命令 scrapy shell [链接] :

rapy shell https://car.autohome.com.cn/pic/series/66.html

python入门之Scrapy shell的使用

输入我们需要测试的语句：

       srcs = response.xpath('//div[contains(@class,"uibox-con")]/ul/li/a/img/@src').getall()

python入门之Scrapy shell的使用

到此这篇关于python入门之scrapy shell的使用的文章就介绍到这了,更多相关scrapy shell的使用内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持！

上一篇： python 获取list 长度

下一篇：你会使用python爬虫抓取弹幕吗

python入门之Scrapy shell的使用

Python的爬虫程序编写框架Scrapy入门学习教程

python开发之IDEL(Python GUI)的使用方法图文详解

Python编程入门之Hello World的三种实现方式

零基础写python爬虫之使用Scrapy框架编写爬虫

12步入门Python中的decorator装饰器使用方法

Python之Sklearn使用入门教程

Python3.5基础之函数的定义与使用实例详解【参数、作用域、递归、重载等】

Python程序设计入门(5)类的使用简介

Python程序设计入门(3)数组的使用

Python中处理字符串之endswith()方法的使用简介