欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

自动验证码识别软件(免费验证码软件)

程序员文章站 2024-03-27 13:53:16
借助于ai工具来实现验证码识别,内含python3示例验证码识别的场景十分常见本文主要讨论作为普通开发者(缺乏/没有ai学术(教育/实践)背景)的前提下,来低成本快速实现验证码识别① 2000多本py...

借助于ai工具来实现验证码识别,内含python3示例
验证码识别的场景十分常见
本文主要讨论作为普通开发者(缺乏/没有ai学术(教育/实践)背景)的前提下,来低成本快速实现验证码识别

① 2000多本python电子书(主流和经典的书籍应该都有了)

② python标准库资料(最全中文版)

③ 项目源码(四五十个有趣且经典的练手项目及源码)

④ python基础入门、爬虫、web开发、大数据分析方面的视频(适合小白学习)

⑤ python学习路线图(告别不入流的学习)

私信小编01即可获取大量python学习资源


本次测试的验证码主要有两种
1. 无干扰的纯数字验证码

自动验证码识别软件(免费验证码软件)


2. 有干扰的数字加字母验证码

自动验证码识别软件(免费验证码软件)


1. 百度ai大脑

https://ai.baidu.com/tech/ocr/general

自动验证码识别软件(免费验证码软件)
自动验证码识别软件(免费验证码软件)


下边我用python3来示例在

https://console.bce.baidu.com/ai/?fromai=1#/ai/ocr/app/list

这里新建应用

自动验证码识别软件(免费验证码软件)


记录appid, apikey, secret key

 复制代码 隐藏代码
import requests 
import base64
import shortuuid
from pprint import pprint

#填上自己的app 信息
appid = ""
key = ""
secret = ""

def token():
    host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id={}&client_secret={}'.format(key, secret)
    response = requests.get(host)
    # if response:
        # pprint(response.json())
    return response.json()['access_token']

token =  token()

request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic"
f = open('./code/code.png', 'rb')
img = base64.b64encode(f.read())
params = {"image":img,"language_type":"chn_eng"}
# access_token = '[调用鉴权接口获取的token]'
request_url = request_url + "?access_token=" + token
headers = {'content-type': 'application/x-www-form-urlencoded'}
response = requests.post(request_url, data=params, headers=headers)
pprint (response.json())


2 腾讯ai

https://ai.qq.com/product/ocr.shtml#common

自动验证码识别软件(免费验证码软件)
自动验证码识别软件(免费验证码软件)


腾讯ocr示例在这里新建应用

https://ai.qq.com/console/application/create-app

自动验证码识别软件(免费验证码软件)
自动验证码识别软件(免费验证码软件)


记录以上app信息 app_id,app_key

 复制代码 隐藏代码
import base64, hashlib, json, random, string, time
from urllib import parse
import requests
from pprint import pprint

# 填写app信息
app_id = ""
app_key = ""

def getaccesstoken(formdata, app_key):
    dic = sorted(formdata.items(), key=lambda d: d[0])
    sign = parse.urlencode(dic) + '&app_key=' + app_key
    m = hashlib.md5()
    m.update(sign.encode('utf8'))
    return m.hexdigest().upper()

def recognisegeneral(app_id, time_stamp, nonce_str, image, app_key):
    host = 'https://api.ai.qq.com/fcgi-bin/ocr/ocr_generalocr'
    formdata = {'app_id': app_id, 'time_stamp': time_stamp, 'nonce_str': nonce_str, 'image': image}
    app_key = app_key
    sign = getaccesstoken(formdata=formdata, app_key=app_key)
    formdata['sign'] = sign
    try:
        r = requests.post(url=host, data=formdata, timeout=20)
    except requests.exceptions.readtimeout:
        r = requests.post(url=host, data=formdata, timeout=20)
    if (r.status_code == 200):
        return r.json()
    else:
        print(r.text)

def recognise(img_path):
    with open(file=img_path, mode='rb') as file:
        base64_data = base64.b64encode(file.read())
    nonce = ''.join(random.sample(string.digits + string.ascii_letters, 32))
    stamp = int(time.time())
    recognise = recognisegeneral(app_id=app_id, time_stamp=stamp, nonce_str=nonce, image=base64_data,
                                 app_key=app_key) 
    # for k, v in recognise.items():
    #     print(k, v)
    return recognise

img_path = "./code/code.png"
response = recognise(img_path)
pprint(response)
code = response['data']['item_list'][0]['itemstring'].replace(" ", "")

print(code)