欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

关于抢火车票的那些事儿(二)

程序员文章站 2024-03-17 22:53:22
...
关于抢火车票的那些事儿(二)

上一节 里面我们已经准备好了Cookie,这一节该准备正式登陆12306了~


有一点要注意
User-Agent
这个内容的设置需要跟之前获取Cookie的浏览器控件所使用的一致,不然容易被服务器发现~

我用的是 
'User-Agent' : 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.2; WOW64; Trident/7.0; .NET4.0C; .NET4.0E)',
来来来,还是打开Fiddler,然后打开浏览器登陆,抓包~

关于抢火车票的那些事儿(二)


抓登陆过程的时候我们会发现浏览器会先给 https://kyfw.12306.cn/passport/captcha/captcha-check
这个看名字就知道是先验证验证码内容的
Post数据数据内容是 answer=30%2C48%2C256%2C130&login_site=E&rand=sjrand

30%2C48%2C256%2C130 被转码了,UTF8 转中文后 内容是 30,48,256,130

其实这个就是你点击验证码的时候点击的坐标,服务器会校验这些个坐标究竟落入了哪个具体的图片,6不6?

那我们如何获取验证码呢?

我们查看浏览器会发现是个JS生成的网址,
关于抢火车票的那些事儿(二)
具有随机性
:https://kyfw.12306.cn/passport/captcha/captcha-image?login_site=E&module=login&rand=sjrand&0.7533216669081391

但是实践证明浏览器的随机并没有跟服务器发生11对应的关系,所以只要写死这个URL即可~
#验证码URL
verificationCodeUrl = 'https://kyfw.12306.cn/passport/captcha/captcha-image?login_site=E&module=login&rand=sjrand&0.46630622142659206'

    def captchaCheck(self):

        captchaErrorCount = 0
        print('正在识别验证码...')
        while True:
            if captchaErrorCount > 5:
                print('验证码失败次数超过限制,登录失败,退出程序')
                sys.exit()
            # 获取验证码
            captchaRes = self.session.get(message.verificationCodeUrl)
            captcha = captchaRes.content
            with open(message.captchaDownloadName, 'wb') as f:
                f.write(captcha)
            #调用打码兔去自动识别验证码
            #captchaStr = damatu.DamatuApi(message.damaUserName,message.damaPassword).decode(message.captchaDownloadName, 287)
            captchaStr = self.getCoordinate()
            print(captchaStr)
            captchaStr = captchaStr.replace('|', ',')
            captchaStr = requests.utils.requote_uri(captchaStr)
            data = {
                'answer': captchaStr,
                'login_site' :'E',
                'rand': 'sjrand'
            }
            #验证验证码
            response = self.session.post(message.verificationCodeCheckUrl, data = data)
            print(response.text)
            result = response.json()
            if result['result_code'] == '4':
                print('识别验证码成功')
                break
            else:
                #print('识别验证码失败')
                captchaErrorCount += 1

虽然url固定,但是每访问一次获取到的验证码图片其实是不一样的,这也应该是服务端可以不跟客户端JS随机算法产生的值一一对应的原因吧~

如果我们post的验证码点击坐标是对的话就会收到这样的回复内容
{"result_message":"验证码校验成功","result_code":"4"}

关于抢火车票的那些事儿(二)
验证码这一部分可以通过打码兔来实现自动识别,但是需要自己注册付费,可以细节可以参考damatu.py
#调用打码兔去自动识别验证码
            captchaStr = damatu.DamatuApi(message.damaUserName,message.damaPassword).decode(message.captchaDownloadName, 287)


接下来我们就可以发送用户名密码来登陆了~

就是给 https://kyfw.12306.cn/passport/web/login 
post :  username=*********.com&password=********&appid=otn
关于抢火车票的那些事儿(二)
这样的数据就行了
回复的同样是Json格式的数据
{'result_message': '登录成功', 'result_code': 0, 'uamtk': 'g-lT6rQ5XVZsZUTOKyohI46jpJR38fma2_IBxdAfyX8-bS6ldq4140'}

欧耶~~





相关标签: 12306