欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  Office

把PDF图片中的文字提取出来变Word文字的两种快速方法

程序员文章站 2022-06-18 17:08:08
前言:在实际工作中,当需要把图片中的文字抠出来时,如果一个个的看着图敲字,工作量真不是一般的大,今天推荐一篇图片转文字的教程。 法一:用office自带的onen...

前言:在实际工作中,当需要把图片中的文字抠出来时,如果一个个的看着图敲字,工作量真不是一般的大,今天推荐一篇图片转文字的教程。

法一:用office自带的onenote工具

想把图片转化成文字,首先需要一张含文字的图片(该图片可以是你平常手机照的图片,不过想让计算机能够更好的识别就需照片越清晰越好),下面将以从网上截的“我爱北京*”为列。个人使用的是office2013版,office2003版后都自带有onenote,对于2003版之前的用户可以使用法二。

把PDF图片中的文字提取出来变Word文字的两种快速方法

步骤一 打开office自带的onenote工具。具体如图一所示,打开后界面如图二所示。

把PDF图片中的文字提取出来变Word文字的两种快速方法
图一 打开onenote工具

把PDF图片中的文字提取出来变Word文字的两种快速方法
图二 onenote打开界面

步骤二: 点击图二所指箭头(即新建一分区)

步骤三: 插入你要转化为文字的图片。插入à图片。具体如图三所示,插入后的界面如图四所示

把PDF图片中的文字提取出来变Word文字的两种快速方法
图三  插入图片

把PDF图片中的文字提取出来变Word文字的两种快速方法
图四插入后界面

步骤四:处理(把图片转化为文字)。鼠标选中图片,右键单击à选中复制图片中的文本,然后把鼠标放在空白处,右键单击,保留原格式粘贴即可,处理后的结果如图六所示。

把PDF图片中的文字提取出来变Word文字的两种快速方法
图五  处理方式图

把PDF图片中的文字提取出来变Word文字的两种快速方法
图六处理后的结果

法二:用CAJViewer

工具:CAJViewer。其中文名为CAJ全文阅览器,其与超星阅览器类似,是一种电子图书阅览器,其支持CAJ、PDH等,具体如图一所示

把PDF图片中的文字提取出来变Word文字的两种快速方法
图一 CAJ全文阅览器支持格式图

特点:可把PDF转化为文字,常提取论文中的文字。识别时最好一段一段的识别,方便个人核对与更改

步骤一:下载CAJ软件

链接: https://pan.baidu.com/s/1o80wUKy

密码: x4yg

安装:若电脑中已经安装则跳转至步骤二

(1)右键单击下载好的软件---打开,默认下一步,当出现界面更改路径界面时,点击浏览,根据个人所需更改,具体如图二所示,这里我以放入D盘CAJ文件中为列。

        

把PDF图片中的文字提取出来变Word文字的两种快速方法
图二 选择安装路径

(2)选择安装类型。一般安装典型即可,具体如图三所示。之后默认下一步即可。

把PDF图片中的文字提取出来变Word文字的两种快速方法
图三 选择安装类型

步骤二:打开一论文或者把图片转化为pdf格式

把图片转化为pdf格式:打开pptà插入图片à另存为pdf格式。如图四所示

把PDF图片中的文字提取出来变Word文字的两种快速方法
图四把图片格式转换为PDF格式

步骤三:用CAJ打开刚另存为的PDF格式的文件。具体如图五所示

  

把PDF图片中的文字提取出来变Word文字的两种快速方法
图五用CAJ打开要识别的文件

步骤四:处理,点击文字识别按钮à然后框中你要识别的内容,然后把内容复制到剪贴板,然后粘贴至个人想放的地方或者发送到WPS或者word中即可。具体如图六、图七所示

把PDF图片中的文字提取出来变Word文字的两种快速方法
图六  选中文字识别

把PDF图片中的文字提取出来变Word文字的两种快速方法
图七

除了软件外,图片转文字还有很多好用的在线转换工具,比如百度自已的OCR在线工具(https://cloud.baidu.com/product/ocr/general)识别率相当的高。

把PDF图片中的文字提取出来变Word文字的两种快速方法

对大家关心的表格式图片转换成Excel,小编曾试了很多软件,识别率都不太高。免费的软件中,相比汉王OCR软件(百度可以搜到下载地址)转换表格效果还不错,小编一直在用