图片、pdf转Word 纯纯的技术都是干货
PDF根据内容大概分为两类:一类是扫描件,也就是图片形式的pdf,这种转文字稍微复杂一些;一类是word、excel等发布的pdf,这种很简单,由于保留了文字的属性,通过指定网站就直接转换了。 如何区别这两类pdf? 打开pdf,按着鼠标左键不放去选一些文字,如果文字能被单独选到就说明是第二类情况,请直接到网站去转换即可。99%可以还原,另外的1%我也不知道存在不存在,做事要留余地,不说那么绝对哈! 第二类情况比较简单,先说这个。
具体操作:
1、 打开这个链接:https://smallpdf.com/cn/pdf-to-word将PDF文件拖到指定区域;
2、静静等待网站自动转换(别问我静静是谁。。);
3、转换完毕,下载即可。
说完简单的还是说稍微复杂的第一类情况,图片转文字这里要用到的office工具的ocr识别文本功能具体操作:
1、 复制图片到系统自带的画图工具里面粘贴出来,另存为TIFF格式的图片;
2、 在开始菜单打开office工具里面的Office Document imaging(找不到这个的我后面说如何处理),打开之前的tiff图片,点击“工具”——使用ocr识别文本,然后再转到word里面就可以了!注意,上面第2步是网上的方式,我用的office 2010,有所不同,也说一下Office 2010我没发现所谓的“Office Document imaging”后来发现可能是更名为“Microsoft OneNote”
打开OneNote2010,新建一个分区,“插入”——“图片”选择之前的tiff即可
然后在图片上点鼠标右键,选择“复制图片中的文本”即可!——————推荐粘贴到Word里面,会有一定的分段,如果粘贴导txt的文本里面,所有的字会挨在一起。—————— 如果你的Microsoft Office下既没发现Office Document imaging也没发现Microsoft Office OneNote,那就是安装office是没有完全安装,我们重新加上打开开始菜单,右边有“控制面板”——“程序和功能”——找到“Microsoft Office Professional Edition 2003(注:office2010版本的名字是Microsoft Office Professional plus 2010)”点击(或右键),选择“更改”——“添加功能”
选择“Microsoft OneNote”前面的小三角,选择“本机运行”
继续,就开始安装这个工具了安装完重启一下
上一篇: 打造计数器DIY三步曲(中)
下一篇: PHP脚本的10个技巧(5)