欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

python2020年中国大学排名定向爬虫

程序员文章站 2024-03-16 14:30:58
...

2020年最新版中国大学排名

import requests
from bs4 import BeautifulSoup
import bs4

r=requests.get('https://www.shanghairanking.cn/rankings/bcur/2020')
r.encoding=r.apparent_encoding

demo=r.text
soup=BeautifulSoup(demo,'html.parser')

ulist=[]

for tr in soup.find('tbody').children:
    if isinstance(tr,bs4.element.Tag):
        tds=tr('td')
        ulist.append([tds[0].contents[0].strip(),tds[1]('a')[0].string,
                      tds[4].contents[0].strip()])
        
print('{0:^4}\t{1:{2}^15}\t{3:^5}'.format('排名','学校名称',chr(12288),'总分')) 
for ls in ulist[:30]:
    print('{0:^4}\t{1:{2}^15}\t{3:^5}'.format(ls[0],ls[1],chr(12288),ls[2]))

效果:

python2020年中国大学排名定向爬虫

相关标签: python杂记 python