欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

python爬虫网页解析之parsel模块

程序员文章站 2022-03-21 21:29:49
08.06自我总结 python爬虫网页解析之parsel模块 一.parsel模块安装 官网链接https://pypi.org/project/parsel/1.0.2/ pip install parsel==1.0.2 二.模块作用 改模块主要用来将请求后的字符串格式解析成re,xpath, ......

08.06自我总结

python爬虫网页解析之parsel模块

一.parsel模块安装

官网链接https://pypi.org/project/parsel/1.0.2/

pip install parsel==1.0.2

二.模块作用

改模块主要用来将请求后的字符串格式解析成re,xpath,css进行内容的匹配

三.使用

import requests
import parsel


response = requests.get(url)
sel = parsel.selector(response.text)  #注意这里的s要大写

# re正则
# print(sel.re('正则匹配格式'))

# xpath
# print(sel.xpath('xpath').getall()) #getall获取所有

# css选择器
# print(sel.css('css选择器 ::text').extract_first())#获取第一个