python爬虫网页解析之parsel模块
程序员文章站
2022-06-23 23:11:49
08.06自我总结 python爬虫网页解析之parsel模块 一.parsel模块安装 官网链接https://pypi.org/project/parsel/1.0.2/ pip install parsel==1.0.2 二.模块作用 改模块主要用来将请求后的字符串格式解析成re,xpath, ......
08.06自我总结
python爬虫网页解析之parsel模块
一.parsel模块安装
官网链接https://pypi.org/project/parsel/1.0.2/
pip install parsel==1.0.2
二.模块作用
改模块主要用来将请求后的字符串格式解析成re,xpath,css进行内容的匹配
三.使用
import requests import parsel response = requests.get(url) sel = parsel.selector(response.text) #注意这里的s要大写 # re正则 # print(sel.re('正则匹配格式')) # xpath # print(sel.xpath('xpath').getall()) #getall获取所有 # css选择器 # print(sel.css('css选择器 ::text').extract_first())#获取第一个