欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  Office

图片、pdf转Word 纯纯的技术都是干货

程序员文章站 2022-07-07 22:14:38
PDF根据内容大概分为两类:一类是扫描件,也就是图片形式的pdf,这种转文字稍微复杂一些;一类是word、excel等发布的pdf,这种很简单,由于保留了文字的属性...

PDF根据内容大概分为两类:一类是扫描件,也就是图片形式的pdf,这种转文字稍微复杂一些;一类是word、excel等发布的pdf,这种很简单,由于保留了文字的属性,通过指定网站就直接转换了。 如何区别这两类pdf? 打开pdf,按着鼠标左键不放去选一些文字,如果文字能被单独选到就说明是第二类情况,请直接到网站去转换即可。99%可以还原,另外的1%我也不知道存在不存在,做事要留余地,不说那么绝对哈! 第二类情况比较简单,先说这个。

具体操作:

1、 打开这个链接:https://smallpdf.com/cn/pdf-to-word将PDF文件拖到指定区域;

图片、pdf转Word 纯纯的技术都是干货

2、静静等待网站自动转换(别问我静静是谁。。);

图片、pdf转Word 纯纯的技术都是干货

3、转换完毕,下载即可。

图片、pdf转Word 纯纯的技术都是干货

说完简单的还是说稍微复杂的第一类情况,图片转文字这里要用到的office工具的ocr识别文本功能具体操作:

1、 复制图片到系统自带的画图工具里面粘贴出来,另存为TIFF格式的图片;

图片、pdf转Word 纯纯的技术都是干货

2、 在开始菜单打开office工具里面的Office Document imaging(找不到这个的我后面说如何处理),打开之前的tiff图片,点击“工具”——使用ocr识别文本,然后再转到word里面就可以了!注意,上面第2步是网上的方式,我用的office 2010,有所不同,也说一下Office 2010我没发现所谓的“Office Document imaging”后来发现可能是更名为“Microsoft OneNote”

图片、pdf转Word 纯纯的技术都是干货

打开OneNote2010,新建一个分区,“插入”——“图片”选择之前的tiff即可

图片、pdf转Word 纯纯的技术都是干货

然后在图片上点鼠标右键,选择“复制图片中的文本”即可!——————推荐粘贴到Word里面,会有一定的分段,如果粘贴导txt的文本里面,所有的字会挨在一起。—————— 如果你的Microsoft Office下既没发现Office Document imaging也没发现Microsoft Office OneNote,那就是安装office是没有完全安装,我们重新加上打开开始菜单,右边有“控制面板”——“程序和功能”——找到“Microsoft Office Professional Edition 2003(注:office2010版本的名字是Microsoft Office Professional plus 2010)”点击(或右键),选择“更改”——“添加功能”

图片、pdf转Word 纯纯的技术都是干货

选择“Microsoft OneNote”前面的小三角,选择“本机运行”

图片、pdf转Word 纯纯的技术都是干货

继续,就开始安装这个工具了安装完重启一下