欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

python之pdf分页

程序员文章站 2024-03-24 22:39:40
...

今天心血来潮,就写了一个pdf分页的函数。想到某些商家分个页还要money。哎,自己动手风衣足食。

1.这是我的输入的文件

python之pdf分页

2. python代码如下

import os
from PyPDF2 import PdfFileReader, PdfFileWriter



#参数                 pdf文件位置 页数大小
def pdfPageingAndSize(filePath,pageSize=1):
    fileDir,fileName=os.path.split(filePath)
    fileNameExceptSuffix=fileName.split('.')[0]
    
    #创建输出文件夹
    outputDir=str(fileNameExceptSuffix)+"_pdf_output_dir"
    os.mkdir(os.path.join(fileDir,outputDir))
    
    #输出文件夹的路径
    OutputDirFile=os.path.join(fileDir,outputDir)
    
    inputPdf = PdfFileReader(filePath, "rb")
    # 获得源PDF文件中页面总数
    pageNumber = inputPdf.getNumPages()
    print("页数:%d"%pageNumber)
    count=0
    output = PdfFileWriter()
    for index in range(pageNumber):
        count+=1
        output.addPage(inputPdf.getPage(index))
        outPdfName='1-'+str(count)+'.pdf'
        #每隔pageSize个页做一个pdf
        if(count%pageSize==0):
            outPdfName="pages-"+str(count-pageSize+1)+"-"+str(count)+'.pdf'
            outputStream = open(os.path.join(OutputDirFile, outPdfName), "wb")
            output.write(outputStream)
            outputStream.close()
            output = PdfFileWriter()
    #如果有些pdf不是pageSize的倍数,则需要单独保存
    if(pageNumber%pageSize):
        number=pageNumber%pageSize
        start=pageNumber-number+1
        end=pageNumber
        outPdfName="pages-"+str(start)
        if(start!=end):
            outPdfName=outPdfName+"-"+str(end)
        outPdfName=outPdfName+'.pdf'
        outputStream = open(os.path.join(OutputDirFile, outPdfName), "wb")
        output.write(outputStream)
        outputStream.close()


filePath=r"C:\Users\xxx\Desktop\pdf\1.pdf"
pdfPageingAndSize(filePath,pageSize=5)

3、输出

结果如下:
python之pdf分页
python之pdf分页

代码中还有不少需要修改的地方,有需要的朋友自行修改吧!!!
上一篇文章:python之pdf合并

相关标签: python pdf