java实现pdf文件转word
程序员文章站
2024-03-17 15:26:10
...
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStreamWriter;
import java.io.Writer;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.util.PDFTextStripper;
public class PdfToWord{
public static void main(String[] args){
try{
String pdfFile = "C:/xxxxx.pdf";
PDDocument doc = PDDocument.load(new File(pdfFile));
int pagenumber = doc.getNumberOfPages();
pdfFile = pdfFile.substring(0, pdfFile.lastIndexOf("."));
String fileName = pdfFile + ".doc";
File file = new File(fileName);
if (!file.exists()){
file.createNewFile();
}
FileOutputStream fos = new FileOutputStream(fileName);
Writer writer = new OutputStreamWriter(fos, "UTF-8");
PDFTextStripper stripper = new PDFTextStripper();
stripper.setSortByPosition(true);// 排序
stripper.setStartPage(1);// 设置转换的开始页
stripper.setEndPage(pagenumber);// 设置转换的结束页
stripper.writeText(doc, writer);
writer.close();
doc.close();
System.out.println("pdf转换word成功!");
}
catch (IOException e){
e.printStackTrace();
}
}
}
代码所用到的jar包 pdfbox-1.8.2.jar 另行下载
上一篇: 我的程序action
下一篇: 分蛋糕
推荐阅读
-
java实现pdf文件转word
-
java 实现word文件转pdf文件
-
word 转PDF 文件
-
java word操作 通过字符串生成word文件,读取word内容,word转pdf、html,pdf流输出展示到页面,file转 MultipartFile
-
实现pdf转word
-
Word文件转PDF
-
(转)Outlook 日历时间块布局 html5实现 博客分类: Java Outlook时间块布局html5
-
通过codehaus来实现json写入文件和读取文件成json对象 博客分类: javajson jsonjacksoncodehaus对象java
-
JAVA实现16进制转10进制
-
实现文件加解密java工具类