欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

PDF 全部转为图片再用百度AI接口识别表格

程序员文章站 2022-03-21 07:57:32
本文实现用Python的方法 把PDF全部转为图片再用百度AI接口识别表格最近工作 实在没有时间做代码,朋友又给了一个项目,提取PDF的表格。之前写过一个可以批量提取标准格式的表格数据,今天遇到一个PDF 用之前的方法怎么也不行,最后想了一个绝招,干脆把PDF全部转为图片,然后调用百度接口识别表格,发现可行,代码量少。最python的方法。第一步:把PDF转为图片import pdfplumberimport pandas as pd path = r'C:\Users\mayn\Desk...

本文实现用Python的方法 把PDF 全部转为图片再用百度AI接口识别表格
最近工作 实在没有时间做代码,朋友又给了一个项目,提取PDF的表格。之前写过一个可以批量提取标准格式的表格数据,今天遇到一个PDF 用之前的方法怎么也不行,最后想了一个绝招,干脆把PDF全部转为图片,然后调用百度接口识别表格,发现可行,代码量少。最python的方法。
第一步:把PDF转为图片

import pdfplumber
import pandas as pd
 
path = r'C:\Users\mayn\Desktop\nianbao\2016.pdf'  #pdf文件名路径
pdf = pdfplumber.open(path)
df = pd.DataFrame()

本文地址:https://blog.csdn.net/hq606/article/details/107171035