欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

python教程7--爬取博客访问量

程序员文章站 2022-03-07 21:33:07
...

1.引入需要的库

pip install requests
pip install pyquery

2.观察博客页面,找到目标字段

python教程7--爬取博客访问量

3.代码实现

import requests
from pyquery import PyQuery as pq

def myCsdn():
    print('aaa')
    html = pq('https://blog.csdn.net/weixin_39800144')
    list = html.find(".grade-box dl").items()
    for l in list:
        hanzi = l.find("dt").text()
        if(hanzi == '访问:'):
            print(l.find("dt").text() + l.find("dd").attr.title)
        elif(hanzi == '等级:'):
            dengji = l.find("dd").find("a").attr.title
            dengji2 = dengji.split(',')
            print(l.find("dt").text() + dengji2[0])
        else:
            print(l.find("dt").text() + l.find("dd").text())


myCsdn()

查看结果

aaa
等级:5级
访问:200124
积分:4654
排名:8939
相关标签: 爬虫