同步加载、异步加载、延迟加载

程序员文章站 2022-03-03 12:04:36

项目代码项目特点：【转载】同步加载、异步加载、延迟加载爬取的网站链接 KnewOne 需要下载代码的可以到我的GitHub上下载 https://github.com/FightingBob/-Web-Crawler-training 如果觉得可以，请给我颗star鼓励一下，谢谢！ ......

项目代码

from bs4 import BeautifulSoup
import requests
url_prefix = 'https://knewone.com/discover?page='
infos = []

# 获取单个页面数据
def getAPage(url,data = None):
    web_data = requests.get(url)
    soup = BeautifulSoup(web_data.text,'lxml')
    # print(soup)

    images = soup.select('header > a > img')
    titles = soup.select('section > h4 > a')
    links = soup.select('a.cover-inner')
    likes = soup.select('span.fanciers_count')

    if data == None:
        for image,title,link,like in zip(images,titles,links,likes):
            data = {
                'image':image.get('src'),
                'title':title.get_text(),
                'link':'https://knewone.com' + link.get('href'),
                'like':int(like.get_text())
            }
            print(data)

            infos.append(data)
# 获取多个加载的数据
def getMorePages(start,end):
    for url_suffix in range(start,end):
        getAPage(url_prefix + str(url_suffix))
        print('---------------已经获取{}条数据---------------'.format(len(infos)), sep='\n')
# 获取点赞排名前几的数据
def getInfosByLikes(order,infos =infos):
    infos = sorted(infos,key= lambda info:info['like'],reverse = True)
    for info in infos[:order]:
        print(info['like'],info['title'],info['image'],info['link'])

getMorePages(1,4)


getInfosByLikes(5)

项目特点：

【转载】

爬取的网站链接

需要下载代码的可以到我的GitHub上下载如果觉得可以，请给我颗star鼓励一下，谢谢！

上一篇： ORM系列之Entity FrameWork详解（持续更新）

下一篇： macOS big sur电池百分比显示怎么设置?

同步加载、异步加载、延迟加载

需要下载代码的可以到我的GitHub上下载如果觉得可以，请给我颗star鼓励一下，谢谢！

Yii1.0框架加载phpexcel报错问题

PHP中使用虚代理实现延迟加载技术，php加载

js中页面的重新加载(当前页面/上级页面)及frame或iframe元素引用介绍

【UITextView】修改加载的html片段中的a标签颜色

UITextView加载html文本显示一半问题

Extjs中通过Tree加载右侧TabPanel具体实现_extjs

网站加载速度过慢,主若是图片上加载过慢

js加载之使用DOM方法动态加载Javascript文件_javascript技巧

Android webview加载富文本屏幕简单适配

thinkphp为什么不能加载自定义方法呢

同步加载、异步加载、延迟加载

需要下载代码的可以到我的GitHub上下载 如果觉得可以，请给我颗star鼓励一下，谢谢！

Yii1.0框架加载phpexcel报错问题

PHP中使用虚代理实现延迟加载技术，php加载

js中页面的重新加载(当前页面/上级页面)及frame或iframe元素引用介绍

【UITextView】修改加载的html片段中的a标签颜色

UITextView加载html文本显示一半问题

Extjs中通过Tree加载右侧TabPanel具体实现_extjs

网站加载速度过慢,主若是图片上加载过慢

js加载之使用DOM方法动态加载Javascript文件_javascript技巧

Android webview加载富文本 屏幕简单适配

thinkphp为什么不能加载自定义方法呢

需要下载代码的可以到我的GitHub上下载如果觉得可以，请给我颗star鼓励一下，谢谢！

Android webview加载富文本屏幕简单适配