欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Python高级爬虫开发,高难度JS解密教程,绝地求生模拟登陆!

程序员文章站 2022-03-26 14:48:40
前言 这篇文章因为涉及到JS解密部分,所以难度比较高,Python基础比较薄弱的同学可以来看看思路 。 开始 进入到该网站后我们可以看到如下界面,今天要做的内容就是模拟登陆 那么咱们首先抓到登陆的包看看: 登陆的同时总共发送了两次post请求,在登陆前发送了一次,其中需要携带的参数为用户名,还有一个 ......

前言

这篇文章因为涉及到js解密部分,所以难度比较高,python基础比较薄弱的同学可以来看看思路

Python高级爬虫开发,高难度JS解密教程,绝地求生模拟登陆!

开始

进入到该网站后我们可以看到如下界面,今天要做的内容就是模拟登陆

Python高级爬虫开发,高难度JS解密教程,绝地求生模拟登陆!

 

那么咱们首先抓到登陆的包看看:

Python高级爬虫开发,高难度JS解密教程,绝地求生模拟登陆!

 

登陆的同时总共发送了两次post请求,在登陆前发送了一次,其中需要携带的参数为用户名,还有一个donotcache不难猜测出是一个时间戳,但是光靠猜不行,要拿出实际证明。

返回值:

Python高级爬虫开发,高难度JS解密教程,绝地求生模拟登陆!

 

success: true

publickey_mod: xxx

publickey_exp: "010001"

timestamp: "540205950000"

token_gid: "1c51cb6b00061f39"

这些值我们并不知道是用来做什么的,然后我们可以继续看下登陆的包:

Python高级爬虫开发,高难度JS解密教程,绝地求生模拟登陆!

 

很明显,第一眼就可以发现很多问题,cookie与第一次请求必须保持一致,然后第一次请求的返回值timestamp其实就是为了给第二次登陆的包传参,rsatimestamp=timestamp,然后就是这个也有一个类似时间戳的东西donotcache,最关键的就是这个password是加密的!

咱们先解决donotcache是怎么产生的:

Python高级爬虫开发,高难度JS解密教程,绝地求生模拟登陆!

 

没猜错,new date().gettime()本来就是js取时间戳的语法,这个咱们用python编程里的time模块模拟就可了。

最关键的就是password加密的方式了:

Python高级爬虫开发,高难度JS解密教程,绝地求生模拟登陆!

 

这就有意思了

var password = form.elements['password'].value;

password = password.replace(/[^\\x00-\\x7f]/g, ''); // remove non-standard-ascii characters

var encryptedpassword = rsa.encrypt(password, pubkey);

密码经过了两次改动,第一次是替换掉字符串,第二次是rsa加密,而这个加密需要用的pubkey,而

var pubkey = rsa.getpublickey(results.publickey_mod, results.publickey_exp);

所以说我们还需要知道publickey_mod和publickey_exp,这个时候你再好好回想一下,咱们的第一次请求是不是返回值里正好有一个mod和exp?