Python爬虫实战JS逆向AES逆向加密爬取

程序员文章站 2022-03-07 23:17:37

目录爬取目标网址：工具使用开发工具：pycharm开发环境：python3.7， windows10使用工具包：requests，aes，json涉及aes对称加密问题需要安装node.js环境使...

爬取目标

网址：

工具使用

开发工具：pycharm

开发环境：python3.7， windows10

使用工具包：requests，aes，json

涉及aes对称加密问题需要安装node.js环境

使用npm install 安装 crypto-js

项目思路解析

确定数据在这个网页可以看到数据是动态返回的但是都是加密的如何确定是我们需要的?

Python爬虫实战JS逆向AES逆向加密爬取

突然想到如果我分页是不是会直接加载第二个页面然后查看相似度找到第一个页面, 我真是太聪明了

Python爬虫实战JS逆向AES逆向加密爬取

数据找到了现在开始寻找加密但是突然发现没有加密的关键字? 那我们通过url 下手试试在all里面全局搜索 query/comp/list(url后面的参数)

Python爬虫实战JS逆向AES逆向加密爬取

找到这个接口鼠标右键可以在源代码查看他

Python爬虫实战JS逆向AES逆向加密爬取

慢慢调试中间调试太多了我就不一一截图出来了跑到这里发现data 里面的参数和我们看到的加密一致

h(t.data) 加密位置

Python爬虫实战JS逆向AES逆向加密爬取

进去h里面 (鼠标光标放到 h上面会显示他的 js地址如果没有显示就是证明你还没有执行到这里需要在前面打上断点刷新页面调试)

Python爬虫实战JS逆向AES逆向加密爬取

发现这个采用aes加密算法使用模型cbc模式采用填充方式为 pkcs7

aes.decrypt() # 参数说明秘钥模式偏移值

f = 'jo8j9wgw%6hbxffn' # 秘钥

m = '0123456789abcdef' # 偏移值

证明数据推导正确在 return r.tostring() 打上断点

Python爬虫实战JS逆向AES逆向加密爬取

r里面数据正常返回

简易源码分享

import requests
from crypto.cipher import aes
import json
url = 'http://jzsc.*rd.gov.cn/api/webapi/dataservice/query/comp/list?pg=2&pgsz=15&total=0'
headers = {
    'user-agent': 'mozilla/5.0 (windows nt 10.0; win64; x64) applewebkit/537.36 (khtml, like gecko) chrome/93.0.4577.63 safari/537.36 edg/93.0.961.38'
}
response = requests.get(url, headers=headers).text
f = 'jo8j9wgw%6hbxffn'  # 秘钥
m = '0123456789abcdef'  # 偏移值
# 转码  utf-8?  字节 16进制
m = bytes(m, encoding='utf-8')
f = bytes(f, encoding='utf-8')
# 创建一个aes算法 秘钥  模式 偏移值
cipher = aes.new(f, aes.mode_cbc, m)
# 解密
decrypt_content = cipher.decrypt(bytes.fromhex(response))
result = str(decrypt_content, encoding='utf-8')
# okcs7 填充
length = len(result) # 字符串长度
unpadding = ord(result[length - 1]) # 得到最后一个字符串的ascii
result = result[0:length - unpadding]
result = json.loads(result)['data']['list'] # dupms json.dumps()  dict  格式 json的
# {"键":"值"}
for i in result:
    print(i)

以上就是python爬虫实战js逆向aes逆向加密爬取的详细内容，更多关于python爬取js逆向aes逆向加密的资料请关注其它相关文章！

Python爬虫实战JS逆向AES逆向加密爬取

目录

爬取目标

工具使用

项目思路解析

简易源码分享

python爬虫爬取有道翻译（破解js加密）