如何用Python爬取LOL官网全英雄皮肤

程序员文章站 2022-12-19 18:31:17

你没有看错，没错今天小编带你爬取LOL官网全英雄皮肤的图片不要失望，也不要难过接下咱们来讲讲怎么爬取LOL官网本次案例使用到的模块安装模块： 01 获取JS源代码获取英雄的ID 首先让咱们找到每个英雄皮肤的地址，F12打开开发者工具页面选择器，选中图片自动找寻到图片的地址龙的传人李青的 ......

你没有看错，没错今天小编带你爬取LOL官网全英雄皮肤的图片

不要失望，也不要难过

接下咱们来讲讲怎么爬取LOL官网

如何用Python爬取LOL官网全英雄皮肤

本次案例使用到的模块

import requests
import re
import json

安装模块：

pip install requests
#re、json都是自带的不需要安装

获取JS源代码获取英雄的ID

首先让咱们找到每个英雄皮肤的地址，F12打开开发者工具页面选择器，选中图片自动找寻到图片的地址

如何用Python爬取LOL官网全英雄皮肤

龙的传人李青的图片地址：

http://ossweb-img.qq.com/images/lol/web201310/skin/big64003.jpg

神僧李青图片地址：

http://ossweb-img.qq.com/images/lol/web201310/skin/big64011.jpg

不难发现其中的规律：

big64003.jpg

big64011.jpg

很明显 64是英雄的ID地址 003是皮肤顺序

如何用Python爬取LOL官网全英雄皮肤

找到JS源代码，你会发现英雄的ID地址并不是按照顺序排列下来的！

 1 def getLOLImages():
 2     url_js = 'http://lol.qq.com/biz/hero/champion.js'
 3     #获取JS源代码 str bytrs字节
 4     res_js = requests.get(url_js).content
 5     #转码
 6     html_js = res_js.decode()
 7     #正则表达
 8     req = '"keys":(.*?),"data"'
 9     list_js = re.findall(req,html_js)
10     # str → dict
11     dict_js = json.loads(list_js[0])
12     print(dict_js)

如何用Python爬取LOL官网全英雄皮肤

很多不明白这个正则表达式怎么写，这里简单的说明一下：

如何用Python爬取LOL官网全英雄皮肤

前面是 “keys”：后面是，“data” 然后我们需要提取的是中间的部分，那么不管它们是啥，我们就是.?* 通配符全部匹配出来。

后面就不详细讲解了，本篇文章最后，小编会带上详细的视频讲解

拼接URL地址、获取下载图片的地址

    pic_list = []
    for key in dict_js:
        #print(key)
        for i in range(20):
            num = str(i)
            if len(num) == 1:
                hreo_num = "00"+num
            elif len(num) == 2:
                hreo_num = "0"+num
            numstr = key+hreo_num
            url = "http://ossweb-img.qq.com/images/lol/web201310/skin/big"+numstr+".jpg"
            print(url)
            pic_list.append(url)

            list_filepath = []
            path = "图片保存地址"
            #print(dict_js.values())
            for name in dict_js.values():
                for i in range(20):
                    file_path = path + name + str(i) + '.jpg'
                    list_filepath.append(file_path)
                    #print(list_filepath)

下载图片

    n = 0               
    for picurl in pic_list:
        res = requests.get(picurl)
        n+=1

        if res.status_code ==200:

            print("正在下载%s"%list_filepath[n])

            with open(list_filepath[n],'wb') as f:
                f.write(res.content)

详细视频学习地址

如何用Python爬取LOL官网全英雄皮肤

链接：https://pan.baidu.com/s/1TbPuMUsKvuk9bqh3hm6wNQ

密码：ewyk

如何用Python爬取LOL官网全英雄皮肤

上一篇：浅谈JS闭包

下一篇：睢阳之战：唐朝天下得以保全，全仗睢阳坚守10月之久

如何用Python爬取LOL官网全英雄皮肤

如何用Python爬取LOL官网全英雄皮肤

python3.5爬取王者荣耀官网所有英雄的皮肤

20行Python代码爬取LOL全英雄皮肤图片

python 爬取lol英雄联盟全阵容皮肤

如何用Python爬取LOL官网全英雄皮肤