手把手教你写需求之代码实现pdf转jpg
程序员文章站
2022-09-02 17:56:14
前言同事小姐姐问我,怎么把pdf转成jpg?我想着:这也是问题吗?直接打开pdf,然后截图,更改成jpg格式不就好了吗?但是pdf页数过多就显得不那么优雅了,考虑到市面上流行的软件都需要一点点钱钱,那如何不花钱优雅搞定呢?代码实现:创建一个maven工程pom中引入依赖: org.apache.pdfbox
前言
初入公司,很多朋友如果碰到一些莫名其妙的需求,没有做过就会很慌张。不要慌张,本文通过一个小案例手把手教你写需求。
场景
一个阳光明媚的下午,需求小姐姐向你款款走来,娇滴滴的寻求你帮忙,她需要你把 PDF文件转换成jpg文件。
表面上你不动声色,心里想到:直接打开pdf文件,然后截图,直接更改图片后缀名为jpg不就搞定了?这也算一个需求?
需求小姐姐似乎看出了你的疑惑:这是我的pdf文件《Java核心技术卷Ⅰ》.pdf
一共700多页,似乎在暗示你 截图大法不够合适。
看着小姐姐期许的眼神,你怎么好意思说出买个付费的格式转换软件呢?只好说:稍等,我写个代码帮你搞定!
小姐姐点点头,很满意,咱们接下来开始写代码。
代码实现:
- 先熟练的创建一个maven工程,好方便自己管理依赖
- 动手写一个main方法,理清自己的逻辑
public static void main(String[] args) throws IOException {
//这是jpg文件的输出路径
String outDirPath = "C:\\Users\\w_rcss\\Desktop\\out";
// 这是目标文件《Java核心技术卷Ⅰ》.pdf的存放路径
String filePath = outDirPath + "\\《Java核心技术卷Ⅰ》.pdf";
//取了个方法名,就叫setup吧,格式转换肯定要把文件作为参数传进去
setup(filePath, outDirPath);
}
-
接下来就是实现setup方法,可是setup中怎么操作pdf格式的文档呢?
-
直接上网调研,发现可以用apache的pdfbox来操作pdf文档
Apache PDFBox是一个开源Java库,支持PDF文档的开发和转换。 使用此库,可以开发用于创建,转换和操作PDF文档的Java程序。
附:官方文档链接
-
pom中直接引入pdfbox依赖:
<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>pdfbox</artifactId>
<version>2.0.15</version>
</dependency>
- 实现setup方法
public static void setup(String filePath, String outDirPath) throws IOException {
//通过文件拿到file对象
File file = new File(filePath);
// load()是PDDocument的静态方法,直接加载目标pdf文档
PDDocument document = PDDocument.load(file);
// PDFRenderer是一个PDF渲染器,为每个要渲染的页面打开页面,渲染并关闭页面
PDFRenderer renderer = new PDFRenderer(document);
// 获取目标pdf的总页数
int pageTotal = document.getNumberOfPages();
System.out.println("页数:" + pageTotal);
File outDir = new File(outDirPath);
// 两个校验判定
if (!outDir.exists()) {
outDir.mkdirs();
}
if (!outDir.isDirectory()) {
System.err.println("请填写正确的输出路径");
System.exit(0);
}
int pageName = 0;
// for循环 循环将pdf转换成jpg
for (int pageIndex = 0; pageIndex < pageTotal; pageIndex++) {
System.out.println("正在转换第 " + pageIndex + " 页");
// 用RGB方式渲染700DPI
BufferedImage image = renderer.renderImageWithDPI(pageIndex, 700, ImageType.RGB);
// private static final boolean isCut = true; 属性isCut是静态常量true
// private static final List excludePage = Arrays.asList(0);
if (!isCut && pageIndex != (pageTotal - 1) && !excludePage.contains(pageIndex)) {
// fileName是输出名字,此处做了拼接,多张pdf,转换成jpg,pageName++
String fileName1 = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
//此处调用了cut方法,cut方法参看第7步
cut(image, fileName1, 0, 0, image.getWidth() / 2, image.getHeight());
String fileName2 = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
cut(image, fileName2, image.getWidth() / 2, 0, image.getWidth() / 2, image.getHeight());
} else {
String fileName = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
ImageIO.write(image, "jpg", new File(fileName));
}
}
// 关闭
document.close();
}
- setup方法中for循环使用的cut方法
public final static void cut(BufferedImage bufferedImage, String result,
int x, int y, int width, int height) {
try {
// 读取源图像
// 源图宽度
int srcWidth = bufferedImage.getWidth();
// 源图高度
int srcHeight = bufferedImage.getHeight();
if (srcWidth > 0 && srcHeight > 0) {
Image image = bufferedImage.getScaledInstance(srcWidth, srcHeight,
Image.SCALE_DEFAULT);
// 四个参数分别为图像起点坐标和宽高
// 即: CropImageFilter(int x,int y,int width,int height)
ImageFilter cropFilter = new CropImageFilter(x, y, width, height);
Image img = Toolkit.getDefaultToolkit().createImage(
new FilteredImageSource(image.getSource(),
cropFilter));
BufferedImage tag = new BufferedImage(width, height, BufferedImage.TYPE_INT_RGB);
Graphics g = tag.getGraphics();
// 绘制切割后的图
g.drawImage(img, 0, 0, width, height, null);
g.dispose();
// 输出为文件
ImageIO.write(tag, "jpg", new File(result));
}
} catch (Exception e) {
e.printStackTrace();
}
}
- 大功告成,开始测试
测试效果: pdf文件每页都被拆成一张jpg。转换效果还是不错的。唯一的问题就是转换效率不高,平均2~3s一张。当然了,这也是没办法的事儿。
- 测试没有问题,重新审视一下代码
/**
* @Description
* @Author rcss_j
* @Date 2020/12/7 16:55
* @Param
* @Return
* @Exception
*
*/
public class PDFExportImage {
private static final List excludePage = Arrays.asList(0);
private static final boolean isCut = true;
// setup方法,转换的核心方法啦
public static void setup(String filePath, String outDirPath) throws IOException {
File file = new File(filePath);
PDDocument document = PDDocument.load(file);
PDFRenderer renderer = new PDFRenderer(document);
int pageTotal = document.getNumberOfPages();
System.out.println("页数:" + pageTotal);
File outDir = new File(outDirPath);
if (!outDir.exists()) {
outDir.mkdirs();
}
if (!outDir.isDirectory()) {
System.err.println("请填写正确的输出路径");
System.exit(0);
}
int pageName = 0;
for (int pageIndex = 0; pageIndex < pageTotal; pageIndex++) {
System.out.println("正在转换第 " + pageIndex + " 页");
BufferedImage image = renderer.renderImageWithDPI(pageIndex, 700, ImageType.RGB);
if (!isCut && pageIndex != (pageTotal - 1) && !excludePage.contains(pageIndex)) {
String fileName1 = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
cut(image, fileName1, 0, 0, image.getWidth() / 2, image.getHeight());
String fileName2 = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
cut(image, fileName2, image.getWidth() / 2, 0, image.getWidth() / 2, image.getHeight());
} else {
String fileName = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
ImageIO.write(image, "jpg", new File(fileName));
}
}
document.close();
}
// cut方法,切图片的方法啦
public final static void cut(BufferedImage bufferedImage, String result,
int x, int y, int width, int height) {
try {
// 读取源图像
int srcWidth = bufferedImage.getWidth(); // 源图宽度
int srcHeight = bufferedImage.getHeight(); // 源图高度
if (srcWidth > 0 && srcHeight > 0) {
Image image = bufferedImage.getScaledInstance(srcWidth, srcHeight,
Image.SCALE_DEFAULT);
// 四个参数分别为图像起点坐标和宽高
// 即: CropImageFilter(int x,int y,int width,int height)
ImageFilter cropFilter = new CropImageFilter(x, y, width, height);
Image img = Toolkit.getDefaultToolkit().createImage(
new FilteredImageSource(image.getSource(),
cropFilter));
BufferedImage tag = new BufferedImage(width, height, BufferedImage.TYPE_INT_RGB);
Graphics g = tag.getGraphics();
g.drawImage(img, 0, 0, width, height, null); // 绘制切割后的图
g.dispose();
// 输出为文件
ImageIO.write(tag, "jpg", new File(result));
}
} catch (Exception e) {
e.printStackTrace();
}
}
// 这是main方法了
public static void main(String[] args) throws IOException {
String outDirPath = "C:\\Users\\w_rcss\\Desktop";
String filePath = outDirPath + "\\《Java核心技术卷Ⅰ》.pdf";
setup(filePath, outDirPath);
}
}
- 暗赞一声,完美。可以找需求小姐姐交差了,又是开心的一天!
后记
遇到需求不要慌,把大需求化小,小需求化了,问题自然迎难而解。
本文地址:https://blog.csdn.net/w_rcss/article/details/110818189
上一篇: Android常用控件