python反爬之懒加载

程序员文章站 2022-09-14 19:56:41

选取了站长之家作为目标站点右键检查看到的标签实际爬取下来的网页源代码按照这个解析规则，一般就能正确的解析出来需要的内容了。 ......

# 在平时的爬虫中，如果遇到没有局部刷新，没有字体加密，右键检查也能看到清晰的数据，但是按照已经制定好的解析规则进行解析时，会返回空数据,这是为什么呢，这时可以在网页右键查看一下网页源代码，可以发现，在网页上的源代码中有些部分是正确的，有些标签是不正确的，改了名字或者加了数字，或者不是你在网页上检查看到的标签名，所以如果你按照网页上的解析规则去解析， 是解析不到的，这时就要按照网页源代码的解析规则去解析了,这就是典型的网页懒加载。
# 什么是网页懒加载？
＃　网页懒加载是前端为了提高网页访问速度，将页面内没有出现在可视区域内的图片先不做加载，等到手动滑动鼠标滚动到可视区域后再加载。这样对于网页加载性能上会有很大的提升，懒加载的效果就可以提升用户体验。
import requests
from pyquery import pyquery as pq
headers = {
    'user-agent':"mozilla/5.0 (windows; u; windows nt 5.1; en-us; rv:1.9.0.10) gecko/2009042316 firefox/3.0.10",
}
url = 'http://sc.chinaz.com/tupian/fengjingtupian.html'
r = requests.get(url=url,headers = headers)
r.encoding = r.apparent_encoding
demo = r.text
soup = pq(demo)
src = soup('.box.picblock.col3 img')
for i in src:
    i = pq(i)
    i = i.attr('src2')
    print(i)
print(len(src))

　　选取了站长之家作为目标站点

　　右键检查看到的标签

python反爬之懒加载

实际爬取下来的网页源代码

python反爬之懒加载

按照这个解析规则，一般就能正确的解析出来需要的内容了。

上一篇： Python小程序：获取文本文件的所有内容

下一篇： Python3之弹性力学——应力张量2

python反爬之懒加载

如何用python爬取异步加载的网页？以京东商品评论为例。

微博 Qzone 微信当你用Python爬取网站遇到反爬，你应该这样做，轻松解决反爬问题

python爬取企查查企业信息之selenium自动模拟登录企查查

python爬虫学习之爬取169图片网站

Python爬虫之自动爬取某车之家各车销售数据

Python爬虫入门案例之爬取去哪儿旅游景点攻略以及可视化分析

python学习笔记之爬取网页乱码

【Python必学】Python爬虫反爬策略你肯定不会吧？

Python爬虫实战之爬取某宝男装信息

Swift 开发之懒加载的实例详解

python反爬之懒加载

如何用python爬取异步加载的网页？以京东商品评论为例。

微博 Qzone 微信 当你用Python爬取网站遇到反爬，你应该这样做，轻松解决反爬问题

python爬取企查查企业信息之selenium自动模拟登录企查查

python爬虫学习之爬取169图片网站

Python爬虫之自动爬取某车之家各车销售数据

Python爬虫入门案例之爬取去哪儿旅游景点攻略以及可视化分析

python学习笔记之爬取网页乱码

【Python必学】Python爬虫反爬策略你肯定不会吧？

Python爬虫实战之爬取某宝男装信息

Swift 开发之懒加载的实例详解

微博 Qzone 微信当你用Python爬取网站遇到反爬，你应该这样做，轻松解决反爬问题