爬虫实战--爬取CPU天梯榜单

程序员文章站 2022-01-28 21:53:41

...

网址：

http://itianti.sinaapp.com/index.php/mcpu

最近女票要买电脑，看了几款，于是我就帮她看看这几款的CPU咋样，就找了一个CPU天梯排行榜。一瞅发现，榜上有800+个CPU，一个一个找，得累死。刚好最近了解了python爬虫，于是乎，就写了一个爬虫脚本，把排名和CPU名字爬了并且保存下来了。

代码如下：

import requests        #导入包
from bs4 import BeautifulSoup
res = requests.get("http://itianti.sinaapp.com/index.php/mcpu/")
res.encoding = 'utf-8'        #显示中文
soup = BeautifulSoup(res.text, 'html.parser')      #解析html
table = soup.select('#maintable')[0]        #爬取id为'maintable'的元素
tbody = table.select('tbody')[0]            #爬取tbody标签的元素
f = open("out.txt","w")                    #保存到文件中
f.write("排名  名称")
for i in tbody.select('tr'):        #遍历tr标签
    temp = i.select('td')            #挑选td标签
    rank = temp[0].text
    name = temp[1].text
    #print(rank + "  " + name)
    print("%s  %s" %(rank, name), file = f)

保存成txt文件后，查某个CPU排行，只要ctrl+F就好啦~~~

。。。。

不过后来才知道，原来谷歌上的网页也是可以ctrl+F，进行查找的。。。。。。。。。

涨姿势了。。。

爬虫实战--爬取CPU天梯榜单

Python爬虫实战教程：爬取网易新闻

Python爬虫实战用 BeautifulSoup 爬取电影网站信息

python爬虫实战爬取B站柯南弹幕+梳理主线剧情

scrapy爬虫实战 - 51job爬虫职位爬取

Python3爬虫系列：理论+实验+爬取妹子图实战

Python爬虫实战之Requests+正则表达式爬取猫眼电影Top100

Python爬虫，爬取腾讯漫画实战

Python3 爬虫实战（并发爬取）

Python多线程爬虫实战_爬取糗事百科段子的实例

Python爬虫爬取煎蛋网图片代码实战

爬虫实战--爬取CPU天梯榜单

Python爬虫实战教程：爬取网易新闻

Python爬虫实战用 BeautifulSoup 爬取电影网站信息

python爬虫实战 爬取B站柯南弹幕+梳理主线剧情

scrapy爬虫实战 - 51job爬虫职位爬取

Python3爬虫系列：理论+实验+爬取妹子图实战

Python爬虫实战之Requests+正则表达式爬取猫眼电影Top100

Python爬虫，爬取腾讯漫画实战

Python3 爬虫实战（并发爬取）

Python多线程爬虫实战_爬取糗事百科段子的实例

Python爬虫爬取煎蛋网图片代码实战

python爬虫实战爬取B站柯南弹幕+梳理主线剧情