python识别文字，实现看图说话

程序员文章站 2022-06-06 20:54:17

...

现在写文件很多网站都不让复制了，所以每次都是截图然后发到QQ上然后用手机QQ的文字识别再发回电脑。。感觉有点小麻烦了，所以想自己写一个小软件方便方便自己，就有了这篇了：

首先语言是python，要实现的功能主要为文字识别，所以需要调用OCR技术，要做到够方便，所以需要调用系统剪切板，还需要一个小窗口，使用的是pyqt5。

OCR是直接使用的Tesseract-OCR，具体使用可以去搜一下，网上有很多，这里给出下载地址：

训练data 下载地址：https://github.com/tesseract-ocr/tessdata (chi_sim是简体中文)

识别方法为：

pytesseract.image_to_string(now_image, lang='chi_sim')

调用剪切板用的是：

clipboard = QApplication.clipboard()
##取出剪切板的图片
clipboard.pixmap().save('cut_img.jpg')

##文字存入剪切板
clipboard.setText(str)

整体代码很简单，我就不上了，附上软件地址：

64和32版本：

单32位版本(在64位系统下也能运行，记得添加信任)：

或者：

打包之后不知道为啥64位的200多M ，32位只有30M。

由于调用了系统的剪切板，所以可能会被安全软件隔离，解压后添加信任区，并右键以管理员运行。

请放心使用，保证无毒！

附上使用截图：

解压后根据个人系统位数运行：

python识别文字，实现看图说话

然后直接微信或QQ截图，可以将缩放比调大一点，准确一些：

python识别文字，实现看图说话

然后不用保存，直接点击识别：

python识别文字，实现看图说话

python下调用pytesseract识别某网站验证码的实现方法