Python爬虫实战之爬取携程评论

程序员文章站 2022-03-13 21:41:00

一、分析数据源这里的数据源是指html网页？还是aajx异步。对于爬虫初学者来说，可能不知道怎么判断，这里辰哥也手把手过一遍。提示：以下操作均不需要登录（当然登录也可以）咱们先在浏览器里面搜索携程，然...

一、分析数据源

这里的数据源是指html网页？还是aajx异步。对于爬虫初学者来说，可能不知道怎么判断，这里辰哥也手把手过一遍。

提示：以下操作均不需要登录（当然登录也可以）

咱们先在浏览器里面搜索携程，然后在携程里面任意搜索一个景点：长隆野生动物世界，这里就以长隆野生动物世界为例，讲解如何去爬取携程评论数据。

Python爬虫实战之爬取携程评论

页面下方则是评论数据

Python爬虫实战之爬取携程评论

从上面两张图可以看出，点击评论下一页，浏览器的链接没有变化，说明数据是ajax异步请求。因此我们就找到了数据是异步加载过来的，这时候需要去network里面是查看数据包。

二、分析数据包

在network中找到下面这个数据包

Python爬虫实战之爬取携程评论

查看preview里面的内容（请求返回内容）

Python爬虫实战之爬取携程评论

可以看到数据已经请求到了，下面看一下数据是否是正确的（和网页内容一致）。

Python爬虫实战之爬取携程评论

ok，没问题之后，下面开始编写python程序去请求数据。

1.请求地址

Python爬虫实战之爬取携程评论

可以获取到请求链接和请求方式。

Python爬虫实战之爬取携程评论

这里请求不用添加请求头header也是可以的。其中posturl是请求链接，data_1是请求参数。

2.请求参数

在network里可以看到请求参数

Python爬虫实战之爬取携程评论

在程序中的构建如下：

Python爬虫实战之爬取携程评论

其中需要关注的是arg中的pageindex（页数），pagesize（每页条数）。

Python爬虫实战之爬取携程评论

最终结果如下：

Python爬虫实战之爬取携程评论

该景点的评论就可以成功爬取下来了。

三、采集全部评论

上面只是采集了第一页的评论数据，通过改变arg中的pageindex（页数），就可以遍历爬取全部的评论。

Python爬虫实战之爬取携程评论

比如这个景点一共是300页。现在把循环给加上

最终的完整代码如下：

Python爬虫实战之爬取携程评论

到此这篇关于python爬虫实战之爬取携程评论的文章就介绍到这了,更多相关python爬取携程评论内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持！

相关标签： Python 爬取携程评论

上一篇：数据结构算法-找出矩形b不覆盖a

下一篇：小鸭生来就很丑

Python爬虫实战之爬取携程评论

一、分析数据源

二、分析数据包

三、采集全部评论

python爬虫项目实战：爬取500px图片

python爬虫爬取微博评论案例详解

Python爬虫实战教程：爬取网易新闻

Python爬虫实战用 BeautifulSoup 爬取电影网站信息

【Python爬虫案例学习】Python爬取淘宝店铺和评论

python网络爬虫之解析网页的XPath(爬取Path职位信息)[三]

Python爬虫之简单的爬取百度贴吧数据

详解用python写网络爬虫-爬取新浪微博评论

Python爬虫之爬取淘女郎照片示例详解

python爬虫实战爬取B站柯南弹幕+梳理主线剧情

Python爬虫实战之爬取携程评论

一、分析数据源

二、分析数据包

三、采集全部评论

python爬虫项目实战：爬取500px图片

python爬虫爬取微博评论案例详解

Python爬虫实战教程：爬取网易新闻

Python爬虫实战用 BeautifulSoup 爬取电影网站信息

【Python爬虫案例学习】Python爬取淘宝店铺和评论

python网络爬虫之解析网页的XPath(爬取Path职位信息)[三]

Python爬虫之简单的爬取百度贴吧数据

详解用python写网络爬虫-爬取新浪微博评论

Python爬虫之爬取淘女郎照片示例详解

python爬虫实战 爬取B站柯南弹幕+梳理主线剧情

python爬虫实战爬取B站柯南弹幕+梳理主线剧情