Python实现批量向PDF文件添加中文水印

程序员文章站 2022-06-09 19:58:09

目录前言实现步骤完整代码前言可以通过设置批量pdf文件所在的路径及需要添加的水印名称可以实现批量添加pdf水印的效果。实现思路是这样的，通过在批量pdf文件路径下面生成一个带有水印的pdf模板。最后，...

前言

可以通过设置批量pdf文件所在的路径及需要添加的水印名称可以实现批量添加pdf水印的效果。

实现思路是这样的，通过在批量pdf文件路径下面生成一个带有水印的pdf模板。最后，将批量文件的每个pdf页面和水印模板进行合并完成批量添加水印的效果。

Python实现批量向PDF文件添加中文水印

需要注意的是批量pdf文件必须和pdf模板水印文件的大小尺寸保持一致，这个可以在代码里面调节一下就成了。

实现步骤

首先将需要添加水印的pdf文件准备好放在一个文件夹下面。

Python实现批量向PDF文件添加中文水印

在代码中设置好pdf批量文件的路径及水印名称。

if __name__ == '__main__':
    main('c:/pdf', '我是一个水印')

内部实现过程都封装在main()函数里面了，这里改一下水印名称和批量pdf文件路径直接执行就好了。

启动以后，出现如下面的结果说明已经执行完成了。

Python实现批量向PDF文件添加中文水印

为了不覆盖原来的pdf文件，合并后的文件都是添加了"已合并"字样的pdf文件。

Python实现批量向PDF文件添加中文水印

说完了怎么操作，看一下主要的代码块部分有哪些吧。

其中用到的第三方库有下面这些，里面我写了相关的注释。

import os  # 应用文件操作

# reportlab是python的一个标准库,可以画图、画表格、编辑文字,最后可以输出pdf格式。
from reportlab.pdfgen import canvas
from reportlab.lib.units import cm
from reportlab.pdfbase import pdfmetrics
from reportlab.pdfbase.ttfonts import ttfont

pdfmetrics.registerfont(ttfont('songti', 'c:/windows/fonts/simsun.ttc'))  # 加载宋体

# pypdf2模块主要的功能是分割或合并pdf文件,裁剪或转换pdf文件中的页面。
from pypdf2 import pdffilewriter, pdffilereader

import logging  # 日志打印库

日志模块的初始化也比较简单，前面的文章中都有过相关的调用。

# 初始化日志设置
logger = logging.getlogger('批量添加水印')
logging.basicconfig(format='%(asctime)s %(levelname)-8s: %(message)s')
logger.setlevel(logging.debug)

日志初始化完成后在后面需要打印日志的地方调用就可以了。

实现过程主要有三个函数来实现的，一个是为了生成水印模板、另一个是使水印模板和批量pdf文件执行合并从而实现添加水印的功能、还有一个就是逐个遍历批量pdf文件使其能够逐个实现水印合并。

水印模板生成函数。

def generate_water_pdf(content):
    '''
    生成带有水印的pdf
    :param content: 水印名称
    :return:
    '''
    cans = canvas.canvas('water_back.pdf', pagesize=(21 * cm, 29.7 * cm))
    cans.translate(10 * cm,
                   12 * cm)  # 移动原点坐标
    cans.setfont('songti', 23)  # 设置字体为宋体、大小为23号
    cans.setfillcolorrgb(0.5, 0.5,
                         0.5)  # 设置字体背景颜色
    cans.rotate(45)  # 设置字体倾斜45度
    cans.drawstring(-7 * cm, 0 * cm, content)
    cans.drawstring(7 * cm, 0 * cm, content)
    cans.drawstring(0 * cm, 7 * cm, content)
    cans.drawstring(0 * cm, -7 * cm, content)
    cans.save()  # 保存水印的pdf文件

水印合成实现函数。

def insert_water_to_pdf(input_pdf, output_pdf, water_pdf):
    '''
    合并水印到pdf文件中
    :param input_pdf: 输入文件路径
    :param output_pdf: 输出文件路径
    :param water_pdf: 水印文件路径
    :return:
    '''
    water = pdffilereader(water_pdf)  # 读取水印pdf
    water_page = water.getpage(0)  # 获取水印pdf的第一页
    pdf = pdffilereader(input_pdf, strict=false)  # 读取需要添加水印的文件
    pdf_writer = pdffilewriter()  # 创建pdf文件写入对象
    for page in range(pdf.getnumpages()):  # 遍历每一页pdf对象
        pdf_page = pdf.getpage(page)  # 获取pdf的当前页对象
        pdf_page.mergepage(water_page)  # 将水印页合并到当前页中
        pdf_writer.addpage(pdf_page)  # 将合并后的pdf对象页添加到pdf写入对象中
    output_file = open(output_pdf, 'wb')  # 打开pdf输出文件
    pdf_writer.write(output_file)  # 将文件写入到输出文件
    output_file.close()  # 关闭写入流

批量pdf文件遍历调用合成函数。

def main(diretory, current):
    if os.path.isdir(diretory):
        logger.info('文件夹[' + diretory + ']校验成功！')
        os.chdir(diretory)
        logger.info('当前路径为[' + os.getcwd() + ']')
        generate_water_pdf(current)
        logger.info('水印pdf文件生成成功！')
        for file_path, dir_names, file_names in os.walk(r'' + os.getcwd()):
            for file_name in file_names:
                try:
                    name = file_name.split('.')[0]
                    if name == 'water_back':
                        continue
                    else:
                        file_name_path = os.path.join(file_path, file_name)
                        output_file_path = file_name_path.split('.')[0] + '_已添加水印.pdf'
                        insert_water_to_pdf(file_name_path, output_file_path, 'water_back.pdf')
                        logger.info('[' + file_name_path + ']完成水印合并！')
                except exception as e:
                    logger.error('[' + file_name_path + ']发生异常，执行下一个！')
                    logger.error('异常信息：' + repr(e))
    else:
        logger.info('文件夹[' + diretory + ']校验失败！')

主要实现过程就是通过上面三个函数来完成的，最后调用后台入口函数将mian()函数调用执行就可以了。

完整代码

# -*- coding:utf-8 -*-
# @author python *
# @date 2022/1/27
# @file test4.py

# done

# 批量向pdf文件添加中文水印

import os  # 应用文件操作

# reportlab是python的一个标准库,可以画图、画表格、编辑文字,最后可以输出pdf格式。
from reportlab.pdfgen import canvas
from reportlab.lib.units import cm
from reportlab.pdfbase import pdfmetrics
from reportlab.pdfbase.ttfonts import ttfont

pdfmetrics.registerfont(ttfont('songti', 'c:/windows/fonts/simsun.ttc'))  # 加载宋体

# pypdf2模块主要的功能是分割或合并pdf文件,裁剪或转换pdf文件中的页面。
from pypdf2 import pdffilewriter, pdffilereader

import logging  # 日志打印库

# 初始化日志设置
logger = logging.getlogger('批量添加水印')
logging.basicconfig(format='%(asctime)s %(levelname)-8s: %(message)s')
logger.setlevel(logging.debug)


def generate_water_pdf(content):
    '''
    生成带有水印的pdf
    :param content: 水印名称
    :return:
    '''
    cans = canvas.canvas('water_back.pdf', pagesize=(21 * cm, 29.7 * cm))
    cans.translate(10 * cm,
                   12 * cm)  # 移动原点坐标
    cans.setfont('songti', 23)  # 设置字体为宋体、大小为23号
    cans.setfillcolorrgb(0.5, 0.5,
                         0.5)  # 设置字体背景颜色
    cans.rotate(45)  # 设置字体倾斜45度
    cans.drawstring(-7 * cm, 0 * cm, content)
    cans.drawstring(7 * cm, 0 * cm, content)
    cans.drawstring(0 * cm, 7 * cm, content)
    cans.drawstring(0 * cm, -7 * cm, content)
    cans.save()  # 保存水印的pdf文件


def insert_water_to_pdf(input_pdf, output_pdf, water_pdf):
    '''
    合并水印到pdf文件中
    :param input_pdf: 输入文件路径
    :param output_pdf: 输出文件路径
    :param water_pdf: 水印文件路径
    :return:
    '''
    water = pdffilereader(water_pdf)  # 读取水印pdf
    water_page = water.getpage(0)  # 获取水印pdf的第一页
    pdf = pdffilereader(input_pdf, strict=false)  # 读取需要添加水印的文件
    pdf_writer = pdffilewriter()  # 创建pdf文件写入对象
    for page in range(pdf.getnumpages()):  # 遍历每一页pdf对象
        pdf_page = pdf.getpage(page)  # 获取pdf的当前页对象
        pdf_page.mergepage(water_page)  # 将水印页合并到当前页中
        pdf_writer.addpage(pdf_page)  # 将合并后的pdf对象页添加到pdf写入对象中
    output_file = open(output_pdf, 'wb')  # 打开pdf输出文件
    pdf_writer.write(output_file)  # 将文件写入到输出文件
    output_file.close()  # 关闭写入流


def main(diretory, current):
    if os.path.isdir(diretory):
        logger.info('文件夹[' + diretory + ']校验成功！')
        os.chdir(diretory)
        logger.info('当前路径为[' + os.getcwd() + ']')
        generate_water_pdf(current)
        logger.info('水印pdf文件生成成功！')
        for file_path, dir_names, file_names in os.walk(r'' + os.getcwd()):
            for file_name in file_names:
                try:
                    name = file_name.split('.')[0]
                    if name == 'water_back':
                        continue
                    else:
                        file_name_path = os.path.join(file_path, file_name)
                        output_file_path = file_name_path.split('.')[0] + '_已添加水印.pdf'
                        insert_water_to_pdf(file_name_path, output_file_path, 'water_back.pdf')
                        logger.info('[' + file_name_path + ']完成水印合并！')
                except exception as e:
                    logger.error('[' + file_name_path + ']发生异常，执行下一个！')
                    logger.error('异常信息：' + repr(e))
    else:
        logger.info('文件夹[' + diretory + ']校验失败！')


if __name__ == '__main__':
    main('c:/pdf', '我是一个水印')

到此这篇关于python实现批量向pdf文件添加中文水印的文章就介绍到这了,更多相关python pdf添加水印内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持！

Python实现批量向PDF文件添加中文水印

目录

前言

实现步骤

完整代码

linux下采用shell脚本实现批量为指定文件夹下图片添加水印的方法

Python批量提取PDF文件中文本的脚本

python批量实现Word文件转换为PDF文件

Python实现对PDF批量添加水印