把PDF图片中的文字提取出来变Word文字的两种快速方法
前言:在实际工作中,当需要把图片中的文字抠出来时,如果一个个的看着图敲字,工作量真不是一般的大,今天推荐一篇图片转文字的教程。
法一:用office自带的onenote工具
想把图片转化成文字,首先需要一张含文字的图片(该图片可以是你平常手机照的图片,不过想让计算机能够更好的识别就需照片越清晰越好),下面将以从网上截的“我爱北京*”为列。个人使用的是office2013版,office2003版后都自带有onenote,对于2003版之前的用户可以使用法二。
步骤一 打开office自带的onenote工具。具体如图一所示,打开后界面如图二所示。
图一 打开onenote工具
图二 onenote打开界面
步骤二: 点击图二所指箭头(即新建一分区)
步骤三: 插入你要转化为文字的图片。插入à图片。具体如图三所示,插入后的界面如图四所示
图三 插入图片
图四插入后界面
步骤四:处理(把图片转化为文字)。鼠标选中图片,右键单击à选中复制图片中的文本,然后把鼠标放在空白处,右键单击,保留原格式粘贴即可,处理后的结果如图六所示。
图五 处理方式图
图六处理后的结果
法二:用CAJViewer
工具:CAJViewer。其中文名为CAJ全文阅览器,其与超星阅览器类似,是一种电子图书阅览器,其支持CAJ、PDH等,具体如图一所示
图一 CAJ全文阅览器支持格式图
特点:可把PDF转化为文字,常提取论文中的文字。识别时最好一段一段的识别,方便个人核对与更改
步骤一:下载CAJ软件
链接: https://pan.baidu.com/s/1o80wUKy
密码: x4yg
安装:若电脑中已经安装则跳转至步骤二
(1)右键单击下载好的软件---打开,默认下一步,当出现界面更改路径界面时,点击浏览,根据个人所需更改,具体如图二所示,这里我以放入D盘CAJ文件中为列。
图二 选择安装路径
(2)选择安装类型。一般安装典型即可,具体如图三所示。之后默认下一步即可。
图三 选择安装类型
步骤二:打开一论文或者把图片转化为pdf格式
把图片转化为pdf格式:打开pptà插入图片à另存为pdf格式。如图四所示
图四把图片格式转换为PDF格式
步骤三:用CAJ打开刚另存为的PDF格式的文件。具体如图五所示
图五用CAJ打开要识别的文件
步骤四:处理,点击文字识别按钮à然后框中你要识别的内容,然后把内容复制到剪贴板,然后粘贴至个人想放的地方或者发送到WPS或者word中即可。具体如图六、图七所示
图六 选中文字识别
图七
除了软件外,图片转文字还有很多好用的在线转换工具,比如百度自已的OCR在线工具(https://cloud.baidu.com/product/ocr/general)识别率相当的高。
对大家关心的表格式图片转换成Excel,小编曾试了很多软件,识别率都不太高。免费的软件中,相比汉王OCR软件(百度可以搜到下载地址)转换表格效果还不错,小编一直在用
上一篇: 自己用Word制作简历看到付费的模板可以Copy其创意
下一篇: css选择器温故知新