浅谈Python处理PDF的方法
程序员文章站
2022-04-10 18:51:40
处理pdf文档
第一、
从文本中提取文本
第二、
创建PDF
两种方法
#使用PdfFileWriter
import PyPDF2...
处理pdf文档
第一、
从文本中提取文本
第二、
创建PDF
两种方法
#使用PdfFileWriter import PyPDF2 pdfFiles = [] for filename in os.listdir('.'): if filename.endswith('.pdf'): pdfFiles.append(filename) print(pdfFiles) pdfWriter = PyPDF2.PdfFileWriter() pdfFileObj = open(pdfFiles[0],'rb') pdfReader = PyPDF2.PdfFileReader(pdfFileObj) # 得到PdfFileReader对象 first,end =map(int,input('从多少页到多少页(用空格隔开):').split()) for pageNum in range(first-1,end): pageObj = pdfReader.getPage(pageNum) pdfWriter.addPage(pageObj) pdfOutput = open ('split_pdf.pdf','wb') pdfWriter.write(pdfOutput) pdfOutput.close()
#使用PdfFileMerger() import PyPDF2 merger = PyPDF2.PdfFileMerger() a = [str(i)+'webbook.pdf'for i in range(0,124)] for i in a: print(i) merger.append(open(i,'rb')) print("合并完成第"+str(i)) with open('combintion.pdf','wb') as f: merger.write(f)
总结
以上就是本文关于浅谈Python处理PDF的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站:python先序遍历二叉树问题、python实现人脸识别代码、python执行使用shell命令方法分享等,有什么问题可以随时留言,小编会及时回复大家的。感谢朋友们对本站的支持!
下一篇: Python实现的单向循环链表功能示例
推荐阅读
-
Pycharm下载pyinstaller报错:You should consider upgrading via the 'python -m pip install --upgrade pip' command的解决方法
-
Python面向对象程序设计中类的定义、实例化、封装及私有变量/方法详解
-
Python利用字典破解WIFI密码的方法
-
python使用phoenixdb操作hbase的方法示例
-
Python中的异常处理try/except/finally/raise用法分析
-
python 对txt中每行内容进行批量替换的方法
-
bat批处理执行python 的几种方式
-
Python 将pdf转成图片的方法
-
python3 遍历删除特定后缀名文件的方法
-
python2 与 python3 实现共存的方法