欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

手把手教你写需求之代码实现pdf转jpg

程序员文章站 2022-09-02 17:56:14
前言同事小姐姐问我,怎么把pdf转成jpg?我想着:这也是问题吗?直接打开pdf,然后截图,更改成jpg格式不就好了吗?但是pdf页数过多就显得不那么优雅了,考虑到市面上流行的软件都需要一点点钱钱,那如何不花钱优雅搞定呢?代码实现:创建一个maven工程pom中引入依赖: org.apache.pdfbox

前言

初入公司,很多朋友如果碰到一些莫名其妙的需求,没有做过就会很慌张。不要慌张,本文通过一个小案例手把手教你写需求。

场景

一个阳光明媚的下午,需求小姐姐向你款款走来,娇滴滴的寻求你帮忙,她需要你把 PDF文件转换成jpg文件。

表面上你不动声色,心里想到:直接打开pdf文件,然后截图,直接更改图片后缀名为jpg不就搞定了?这也算一个需求?

需求小姐姐似乎看出了你的疑惑:这是我的pdf文件《Java核心技术卷Ⅰ》.pdf
一共700多页,似乎在暗示你 截图大法不够合适。

看着小姐姐期许的眼神,你怎么好意思说出买个付费的格式转换软件呢?只好说:稍等,我写个代码帮你搞定!

小姐姐点点头,很满意,咱们接下来开始写代码。

代码实现:

  1. 先熟练的创建一个maven工程,好方便自己管理依赖
  2. 动手写一个main方法,理清自己的逻辑
    public static void main(String[] args) throws IOException {
        //这是jpg文件的输出路径
        String outDirPath = "C:\\Users\\w_rcss\\Desktop\\out";
        // 这是目标文件《Java核心技术卷Ⅰ》.pdf的存放路径
        String filePath = outDirPath + "\\《Java核心技术卷Ⅰ》.pdf";
        //取了个方法名,就叫setup吧,格式转换肯定要把文件作为参数传进去
        setup(filePath, outDirPath);
    }

  1. 接下来就是实现setup方法,可是setup中怎么操作pdf格式的文档呢?

  2. 直接上网调研,发现可以用apache的pdfbox来操作pdf文档

    Apache PDFBox是一个开源Java库,支持PDF文档的开发和转换。 使用此库,可以开发用于创建,转换和操作PDF文档的Java程序。

    附:官方文档链接

  3. pom中直接引入pdfbox依赖:

        <dependency>
           <groupId>org.apache.pdfbox</groupId>
           <artifactId>pdfbox</artifactId>
           <version>2.0.15</version>
       </dependency>
  1. 实现setup方法
   public static void setup(String filePath, String outDirPath) throws IOException {

        //通过文件拿到file对象
        File file = new File(filePath);
        // load()是PDDocument的静态方法,直接加载目标pdf文档
        PDDocument document = PDDocument.load(file);
        // PDFRenderer是一个PDF渲染器,为每个要渲染的页面打开页面,渲染并关闭页面
        PDFRenderer renderer = new PDFRenderer(document);
		// 获取目标pdf的总页数
        int pageTotal = document.getNumberOfPages();
        System.out.println("页数:" + pageTotal);


        File outDir = new File(outDirPath);
       	// 两个校验判定
        if (!outDir.exists()) {
            outDir.mkdirs();
        }
     
        if (!outDir.isDirectory()) {
            System.err.println("请填写正确的输出路径");

            System.exit(0);
        }

        int pageName = 0;
		// for循环 循环将pdf转换成jpg
        for (int pageIndex = 0; pageIndex < pageTotal; pageIndex++) {
            System.out.println("正在转换第 " + pageIndex + " 页");
			// 用RGB方式渲染700DPI
            BufferedImage image = renderer.renderImageWithDPI(pageIndex, 700, ImageType.RGB);
			// private static final boolean isCut = true; 属性isCut是静态常量true
			// private static final List excludePage = Arrays.asList(0);
            if (!isCut && pageIndex != (pageTotal - 1) && !excludePage.contains(pageIndex)) {
           		// fileName是输出名字,此处做了拼接,多张pdf,转换成jpg,pageName++
                String fileName1 = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
                //此处调用了cut方法,cut方法参看第7步
                cut(image, fileName1, 0, 0, image.getWidth() / 2, image.getHeight());

                String fileName2 = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
                cut(image, fileName2, image.getWidth() / 2, 0, image.getWidth() / 2, image.getHeight());

            } else {

                String fileName = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
                ImageIO.write(image, "jpg", new File(fileName));
            }
        }
		// 关闭
        document.close();

    }
  1. setup方法中for循环使用的cut方法
  public final static void cut(BufferedImage bufferedImage, String result,
                                 int x, int y, int width, int height) {
        try {
            // 读取源图像
            // 源图宽度
            int srcWidth = bufferedImage.getWidth();
            // 源图高度
            int srcHeight = bufferedImage.getHeight(); 
            
            if (srcWidth > 0 && srcHeight > 0) {
                Image image = bufferedImage.getScaledInstance(srcWidth, srcHeight,
                        Image.SCALE_DEFAULT);
                // 四个参数分别为图像起点坐标和宽高
                // 即: CropImageFilter(int x,int y,int width,int height)
                ImageFilter cropFilter = new CropImageFilter(x, y, width, height);
                Image img = Toolkit.getDefaultToolkit().createImage(
                        new FilteredImageSource(image.getSource(),
                                cropFilter));
                BufferedImage tag = new BufferedImage(width, height, BufferedImage.TYPE_INT_RGB);
                Graphics g = tag.getGraphics();
                // 绘制切割后的图
                g.drawImage(img, 0, 0, width, height, null); 
                g.dispose();
                // 输出为文件
                ImageIO.write(tag, "jpg", new File(result));
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
  1. 大功告成,开始测试

测试效果: pdf文件每页都被拆成一张jpg。转换效果还是不错的。唯一的问题就是转换效率不高,平均2~3s一张。当然了,这也是没办法的事儿。

  1. 测试没有问题,重新审视一下代码
/**
* @Description
* @Author  rcss_j
* @Date   2020/12/7 16:55
* @Param  
* @Return      
* @Exception   
* 
*/
public class PDFExportImage {


    private static final List excludePage = Arrays.asList(0);
    private static final boolean isCut = true;

    // setup方法,转换的核心方法啦
    public static void setup(String filePath, String outDirPath) throws IOException {

        File file = new File(filePath);
        PDDocument document = PDDocument.load(file);
        PDFRenderer renderer = new PDFRenderer(document);

        int pageTotal = document.getNumberOfPages();
        System.out.println("页数:" + pageTotal);


        File outDir = new File(outDirPath);
        if (!outDir.exists()) {
            outDir.mkdirs();
        }

        if (!outDir.isDirectory()) {
            System.err.println("请填写正确的输出路径");

            System.exit(0);
        }

        int pageName = 0;
        for (int pageIndex = 0; pageIndex < pageTotal; pageIndex++) {
            System.out.println("正在转换第 " + pageIndex + " 页");

            BufferedImage image = renderer.renderImageWithDPI(pageIndex, 700, ImageType.RGB);

            if (!isCut && pageIndex != (pageTotal - 1) && !excludePage.contains(pageIndex)) {
                String fileName1 = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
                cut(image, fileName1, 0, 0, image.getWidth() / 2, image.getHeight());

                String fileName2 = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
                cut(image, fileName2, image.getWidth() / 2, 0, image.getWidth() / 2, image.getHeight());

            } else {

                String fileName = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
                ImageIO.write(image, "jpg", new File(fileName));
            }

        }

        document.close();

    }

    // cut方法,切图片的方法啦
    public final static void cut(BufferedImage bufferedImage, String result,
                                 int x, int y, int width, int height) {
        try {
            // 读取源图像
            int srcWidth = bufferedImage.getWidth(); // 源图宽度
            int srcHeight = bufferedImage.getHeight(); // 源图高度
            if (srcWidth > 0 && srcHeight > 0) {
                Image image = bufferedImage.getScaledInstance(srcWidth, srcHeight,
                        Image.SCALE_DEFAULT);
                // 四个参数分别为图像起点坐标和宽高
                // 即: CropImageFilter(int x,int y,int width,int height)
                ImageFilter cropFilter = new CropImageFilter(x, y, width, height);
                Image img = Toolkit.getDefaultToolkit().createImage(
                        new FilteredImageSource(image.getSource(),
                                cropFilter));
                BufferedImage tag = new BufferedImage(width, height, BufferedImage.TYPE_INT_RGB);
                Graphics g = tag.getGraphics();
                g.drawImage(img, 0, 0, width, height, null); // 绘制切割后的图
                g.dispose();
                // 输出为文件
                ImageIO.write(tag, "jpg", new File(result));
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

    // 这是main方法了
    public static void main(String[] args) throws IOException {
        String outDirPath = "C:\\Users\\w_rcss\\Desktop";
        String filePath = outDirPath + "\\《Java核心技术卷Ⅰ》.pdf";
        setup(filePath, outDirPath);
    }
    
}
  1. 暗赞一声,完美。可以找需求小姐姐交差了,又是开心的一天!

后记

遇到需求不要慌,把大需求化小,小需求化了,问题自然迎难而解。

本文地址:https://blog.csdn.net/w_rcss/article/details/110818189