Python爬虫利器Xpath
程序员文章站
2022-04-26 09:59:36
...
今天小编给大家带来了一个神兵利器,
有了它,就没有你爬取不到的网页数据了!!!
什么神兵利器!!!
这么牛
好了,不买关子了,下面就开始上料
做过爬虫的人都知道,
要从大量的网页数据中取出自己想要的的那一个有用的数据,
目前主流的方法主要有三种,
分 别 为
正 则
xpath
css selector 。
今天小编要分享的这个神兵利器就是一个xpath神器,有了他,你就不必再自己慢慢搜寻某一个元素的xpath了。
问题一:
小编我要怎么获取这个xpath的神兵利器呢?
小编解答
xpath是google浏览器的一个小插件,我们可以直接在google应用商店搜序安装,
安装成功之后在浏览器的右上角就会出现一个这个样的图标,
我们点击之后就可以打开,
也可以直接使用快捷键shift+ctrl+x 直接打开
问题2
我的google浏览器搜索不到google的应用商店,安装不了这个神兵利器,
小编,我该怎么办呢?
小编解答
这个问题不大,因为google的应用商店是需要外网才能访问的,
小编这里已经下载并打包好了,如果无法下载的读者们可以在公众号发送
“Xpath001”即可获取下载链接
问题3
小编,小编,我下载文件之后要怎么安装呢?
小编解答
文件下载成功之后,打开我们的google浏览器,找到扩展程序
在弹出的对话框中,找到对应的按钮加载已解压的扩展程序,
点击之后找到你刚刚下载的文件,将其加载进来就OK了,
然后就可以使用“shift+ctrl+x”直接启动xpath选择器
问题4
哈哈,总算安装好了,小编这个要怎么使用呐?
小编解答
将xpth打开之后默认会在,浏览器的上方出现一个编辑框,
分为左右两边,左边是你的xpath路径,右边是搜索的结果,
打开xpath之后,一直按住“shift”,鼠标放在你想要获取的文字上方,
此时改文字的xpath和文本就会显示到对应的左边框
问题5
不用这些工具有没有什么方法直接获取对应元素的xpath?
小编解答
当然是有的,你可以打开开发者模式,在开发者模式的左上角有一个小箭头,
点击小箭头后就可以点击页面对应的内容,然后就会在开发者模式中显示对应的
html目录结构,然后右击开发者模式下的文本如图4,复制你想要的html路径即可
关注公众号,获得更多干货分享