Scrapy框架中的xpath选择

程序员文章站 2022-11-07 12:02:30

不同于我们普通爬虫获取xpath,scrapy获得xpath对象获取他的值语法一.xpath对象获取值二.Scrapy框架独有的xpath取值方式利用href配合正则表达式定位利用text结合正则表达式定位 xpath还有对于html元素操作的两个实用的函数（可以用正则表达式代替）——sta ......

不同于我们普通爬虫获取xpath,scrapy获得xpath对象获取他的值语法

一.xpath对象获取值

xpath对象..extract()

二.scrapy框架独有的xpath取值方式

利用href配合正则表达式定位

response.xpath('//a[re:test(@href,"^\/index\.php\?m=news&a=details&id=1&newsid=\d{1,4}")]')

利用text结合正则表达式定位

a=response.xpath('//a[re:test(text(),"\w{4}")]')

xpath还有对于html元素操作的两个实用的函数（可以用正则表达式代替）——starts-with和contains；

a=response.xpath('//a[starts-with(@title,"注册时间")]')  #以什么开头

a=response.xpath('//a[contains(text(),"闻")]')  #包含

上一篇：刘禅说过三句话，让诸葛亮姜维冒冷汗

下一篇：历史上的曹操比刘备更加爱才惜才为什么他没有请诸葛亮出山呢

Scrapy框架中的xpath选择

一.xpath对象获取值

二.scrapy框架独有的xpath取值方式

实例讲解iOS应用开发中UIPickerView滚动选择栏的用法

设计模式中的迭代器模式在Cocoa Touch框架中的使用

详解Python的Flask框架中的signals信号机制

解析ABP框架领域层中的实体类与仓储类

详解ABP框架中Session功能的使用方法

详解PHP的Laravel框架中Eloquent对象关系映射使用

thinkPHP框架中layer.js的封装与使用方法示例

Python的Flask框架中配置多个子域名的方法讲解

Python的Flask框架中SQLAlchemy使用时的乱码问题解决

Flask框架中密码的加盐哈希加密和验证功能的用法详解