python识别文字,实现看图说话
现在写文件很多网站都不让复制了,所以每次都是截图然后发到QQ上然后用手机QQ的文字识别再发回电脑。。感觉有点小麻烦了,所以想自己写一个小软件方便方便自己,就有了这篇了:
首先语言是python,要实现的功能主要为文字识别,所以需要调用OCR技术,要做到够方便,所以需要调用系统剪切板,还需要一个小窗口,使用的是pyqt5。
OCR是直接使用的Tesseract-OCR,具体使用可以去搜一下,网上有很多,这里给出下载地址:
Tesseract exe 下载地址:https://digi.bib.uni-mannheim.de/tesseract/
训练data 下载地址:https://github.com/tesseract-ocr/tessdata (chi_sim是简体中文)
识别方法为:
pytesseract.image_to_string(now_image, lang='chi_sim')
调用剪切板用的是:
clipboard = QApplication.clipboard()
##取出剪切板的图片
clipboard.pixmap().save('cut_img.jpg')
##文字存入剪切板
clipboard.setText(str)
整体代码很简单,我就不上了,附上软件地址:
64和32版本:
链接:https://pan.baidu.com/s/129cgx5-hcLFiLhhaCIgHlQ&shfl=sharepset
提取码:2425
单32位版本(在64位系统下也能运行,记得添加信任):
链接:https://pan.baidu.com/s/1JiRBXzG2glr445VoXI1BXA&shfl=sharepset
提取码:l08b
或者:
链接:https://download.csdn.net/download/qq_21189053/11878342
打包之后不知道为啥64位的200多M ,32位只有30M。
由于调用了系统的剪切板,所以可能会被安全软件隔离,解压后添加信任区,并右键以管理员运行。
请放心使用,保证无毒!
附上使用截图:
解压后根据个人系统位数运行:
然后直接微信或QQ截图,可以将缩放比调大一点,准确一些:
然后不用保存,直接点击识别: