欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  Office

图片文字转换成word技巧参考

程序员文章站 2022-06-28 18:42:08
一、图片转换成word技巧   这个,我们可能需要利用一些软件来实现了。在Office2003软件里面就已经自带了Document Imaging工具,有了它我们...

一、图片转换成word技巧

  这个,我们可能需要利用一些软件来实现了。在Office2003软件里面就已经自带了Document Imaging工具,有了它我们可以将文字“抠”出来。在“开始”菜单的“Microsoft Office工具”中打开Microsoft Office Document Imaging,在左侧窗口中单击鼠标右键,选择“粘贴页面”,把复制的图片粘贴到Document Imaging中,在“工具”中选择“使用OCR识别文本”,Document Imaging的OCR识别程序就会对图片进行识别,完成后选择“工具”中的“将文本发送到Word”,程序会自动打开Word文档,展现在你面前的就是从图片中“抠”出来的文字。

        提示:一般而言,识别的准确率可以达到95%以上,但对英文和数字的识别不是太好。
        注意:许多朋友第一次使用,好像需要安装,安装的时候插入Office安装盘即可。
        如果安装不行的话,大家可以在网上找找其他的“文字识别系统”,貌似这类软件网上非常的多!

二、如何从图片中提取文字(怎样把JPG图片转换成word文档格式)

        1、把jpg转成tiff格式

        2、用office2003的office工具里面有个,document imagingOCR工具,一弄就ok了,非常方便(还有一个document scanning 工具是扫描完了直接出word的) 前提是office2003要安了那个工具,有的时候需要重新找一下安装文件。
       

三、Word文档页面转为图片(jpg)

最近要处理一项重复性的工作,就是把大量的word的文档转成jpg文件,要求:宽度900像素,清晰度高。首先考虑的是截屏,试了几个软件,但对滚动内容支持不好,大都可自动截取滚动内容,但文档页面两侧的区域也包含在里面,现在是最好只截取页面部分,其它不要。若采取手动截取,滚动就是个问题了,而且截取的区域大小不一。还有一种方法是把word文档先转成pdf,再用Adobe Reader等软件另存为jpg,再批量修改其宽度。摸索再三,我最终采取了以下方法,在效率上要比上种方法好些:

        1.新建word文档,设置页边距(设置成待转doc的页边距);

        2.将待转的doc文件拖入新建的word文档中;

        3.此时已自动生成word图片文件;

        4.点击打印按钮(需要安装一个虚拟打印机驱动程序);

        5.在弹出对话框选择另存为jpg文件;

        6.用FastStone Image Viewer批量转换(可设置宽度为900、增序文件名、图片质量等);

        说明:
        ①虚拟打印我找的是VirtualPrinter破解版;
        ②拖入word文档实际上是操作:插入|对象|由文件创建|待转换的doc文档;
        ③强烈推荐使用FastStone Image Viewer,速度快,效果不错!

如何将pdf格式文件转换成word,如果你有扫描仪的话,就需要一款汉王OCR软件,如6800。如果没有扫描仪的话,需要购进一款汉王6800(或更高的级别的)扫描仪,随机赠送OCR软件。 它能够将扫描的文字直接导入到WORD中进行编辑。

怎样将pdf转换成word

        第一步:先用Adobe Reader打开想转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。

        第二步:运行Microsoft Office Document Imaging,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。

        情况一:如果pdf文档本身就是用pagemaker或word转换而来的(文字非常清晰锐利,很容易识别),那你就方便了。你可以先用acrobat打开,然后点文件——>另存为——>把他保存成rtf文档,这样将把所有的pdf页保存成rtf文档,在用word打开。注意最好保存成rtf文档,要不很有可能产生乱码。

        小技巧:如果你只想识别pdf文件中的其中几页,那你可以现把那几页另存为新的pdf文档,再进行识别。Ny1

        情况二:如果你所得到的pdf文档是用扫描仪扫进去的图片转换的,那么就麻烦了,不过还是比手输入快多了,所以继续往下看。首先你用acrobat把pdf文件打开,然后点文件——>另存为——>把他保存成图片格式*.tiff(这是无压缩图片格式,以便识别),然后到网上下载文字识别软件,建议用尚书六号(现在好像出到七号了,很有名,随处都可以下到),安装好后,打开转换好的tiff图片,点击识别,看,文字出来了吧,尚书系列文字识别软件功能十分强大,你可以在里面把文字都编辑好了,再保存成rtf或txt文件,然后粘贴到word里就可以使用了,注意过滤回车符。