python之pdf分页
程序员文章站
2024-03-24 22:39:40
...
今天心血来潮,就写了一个pdf分页的函数。想到某些商家分个页还要money。哎,自己动手风衣足食。
1.这是我的输入的文件
2. python代码如下
import os
from PyPDF2 import PdfFileReader, PdfFileWriter
#参数 pdf文件位置 页数大小
def pdfPageingAndSize(filePath,pageSize=1):
fileDir,fileName=os.path.split(filePath)
fileNameExceptSuffix=fileName.split('.')[0]
#创建输出文件夹
outputDir=str(fileNameExceptSuffix)+"_pdf_output_dir"
os.mkdir(os.path.join(fileDir,outputDir))
#输出文件夹的路径
OutputDirFile=os.path.join(fileDir,outputDir)
inputPdf = PdfFileReader(filePath, "rb")
# 获得源PDF文件中页面总数
pageNumber = inputPdf.getNumPages()
print("页数:%d"%pageNumber)
count=0
output = PdfFileWriter()
for index in range(pageNumber):
count+=1
output.addPage(inputPdf.getPage(index))
outPdfName='1-'+str(count)+'.pdf'
#每隔pageSize个页做一个pdf
if(count%pageSize==0):
outPdfName="pages-"+str(count-pageSize+1)+"-"+str(count)+'.pdf'
outputStream = open(os.path.join(OutputDirFile, outPdfName), "wb")
output.write(outputStream)
outputStream.close()
output = PdfFileWriter()
#如果有些pdf不是pageSize的倍数,则需要单独保存
if(pageNumber%pageSize):
number=pageNumber%pageSize
start=pageNumber-number+1
end=pageNumber
outPdfName="pages-"+str(start)
if(start!=end):
outPdfName=outPdfName+"-"+str(end)
outPdfName=outPdfName+'.pdf'
outputStream = open(os.path.join(OutputDirFile, outPdfName), "wb")
output.write(outputStream)
outputStream.close()
filePath=r"C:\Users\xxx\Desktop\pdf\1.pdf"
pdfPageingAndSize(filePath,pageSize=5)
3、输出
结果如下:
代码中还有不少需要修改的地方,有需要的朋友自行修改吧!!!
上一篇文章:python之pdf合并
上一篇: Java面试题总结大全
下一篇: 【转】