使用Java读取Word文件的简单例子分享
java读取word文档时,虽然网上介绍了很多插件poi、java2word、jacob、itext等等,poi无法读取格式(新的api估计行好像还在处于研发阶段,不太稳定,做项目不太敢用);java2word、jacob容易报错找不到注册,比较诡异,我曾经在不同的机器上试过,操作方法完全一致,有的机器不报错,有的报错,去他们论坛找高人解决也说不出原因,项目部署用它有点玄;itxt好像写很方便但是我查了好久资料没有见到过关于读的好办法。经过一番选择还是折中点采用rtf最好,毕竟rtf是开源格式,不需要借助任何插件,只需基本io操作外加编码转换即可。rtf格式文件表面看来和doc没啥区别,都可以用word打开,各种格式都可以设定。
----- 实现的功能:读取rtf模板内容(格式和文本内容),替换变化部分,形成新的rtf文档。
----- 实现思路:模板中固定部分手动输入,变化的部分用$info$表示,只需替换$info$即可。
1、采用字节的形式读取rtf模板内容
2、将可变的内容字符串转为rtf编码
3、替换原文中的可变部分,形成新的rtf文档
主要程序如下:
public string bin2hex(string bin) { char[] digital = "0123456789abcdef".tochararray(); stringbuffer sb = new stringbuffer(""); byte[] bs = bin.getbytes(); int bit; for (int i = 0; i < bs.length;i++) { bit = (bs[i] & 0x0f0) >> 4; sb.append("\\'"); sb.append(digital[bit]); bit = bs[i] & 0x0f; sb.append(digital[bit]); } return sb.tostring(); } public string readbytertf(inputstream ins, string path){ string sourcecontent = ""; try{ ins = new fileinputstream(path); byte[] b = new byte[1024]; if (ins == null) { system.out.println("源模板文件不存在"); } int bytesread = 0; while (true) { bytesread = ins.read(b, 0, 1024); // return final read bytes counts if(bytesread == -1) {// end of inputstream system.out.println("读取模板文件结束"); break; } sourcecontent += new string(b, 0, bytesread); // convert to string using bytes } }catch(exception e){ e.printstacktrace(); } return sourcecontent ; }
以上为核心代码,剩余部分就是替换,从新组装java中的string.replace(oldstr,newstr);方法可以实现,在这就不贴了。源代码部分详见附件。
运行源代码前提:
c盘创建yq目录,将附件中"模板.rtf"复制到yq目录之下,运行opreatorrtf.java文件即可,就会在yq目录下生成文件名如:21时15分19秒_cheney_记录.rtf 的文件。
package com; import java.io.file; import java.io.fileinputstream; import java.io.filewriter; import java.io.ioexception; import java.io.inputstream; import java.io.printwriter; import java.text.simpledateformat; import java.util.date; public class operatorrtf { public string strtortf(string content){ char[] digital = "0123456789abcdef".tochararray(); stringbuffer sb = new stringbuffer(""); byte[] bs = content.getbytes(); int bit; for (int i = 0; i < bs.length; i++) { bit = (bs[i] & 0x0f0) >> 4; sb.append("\\'"); sb.append(digital[bit]); bit = bs[i] & 0x0f; sb.append(digital[bit]); } return sb.tostring(); } public string replacertf(string content,string replacecontent,int flag){ string rc = strtortf(replacecontent); string target = ""; if(flag==0){ target = content.replace("$timetop$",rc); } if(flag==1){ target = content.replace("$info$",rc); } if(flag==2){ target = content.replace("$idea$",rc); } if(flag==3){ target = content.replace("$advice$",rc); } if(flag==4){ target = content.replace("$infosend$",rc); } return target; } public string getsavepath() { string path = "c:\\yq"; file fdirecotry = new file(path); if (!fdirecotry.exists()) { fdirecotry.mkdirs(); } return path; } public string tosbc(string input){ char[] c = input.tochararray(); for (int i = 0; i < c.length; i++){ if (c[i] == 32){ c[i] = (char) 12288; continue; } if (c[i] < 127){ c[i] = (char) (c[i] + 65248); } } return new string(c); } public void rgmodel(string username, string content) { // todo auto-generated method stub date current=new date(); simpledateformat sdf=new java.text.simpledateformat("yyyy-mm-dd hh:mm:ss"); string targetname = sdf.format(current).substring(11,13) + "时"; targetname += sdf.format(current).substring(14,16) + "分"; targetname += sdf.format(current).substring(17,19) + "秒"; targetname += "_" + username +"_记录.rtf"; string strpath = getsavepath(); string sourname = strpath+"\\"+"模板.rtf"; string sourcecontent = ""; inputstream ins = null; try{ ins = new fileinputstream(sourname); byte[] b = new byte[1024]; if (ins == null) { system.out.println("源模板文件不存在"); } int bytesread = 0; while (true) { bytesread = ins.read(b, 0, 1024); // return final read bytes counts if(bytesread == -1) {// end of inputstream system.out.println("读取模板文件结束"); break; } sourcecontent += new string(b, 0, bytesread); // convert to string using bytes } }catch(exception e){ e.printstacktrace(); } string targetcontent = ""; string array[] = content.split("~"); for(int i=0;i<array.length;i++){ if(i==0){ targetcontent = replacertf(sourcecontent, array[i], i); }else{ targetcontent = replacertf(targetcontent, array[i], i); } } try { filewriter fw = new filewriter(getsavepath()+"\\" + targetname,true); printwriter out = new printwriter(fw); if(targetcontent.equals("")||targetcontent==""){ out.println(sourcecontent); }else{ out.println(targetcontent); } out.close(); fw.close(); system.out.println(getsavepath()+" 该目录下生成文件" + targetname + " 成功"); } catch (ioexception e) { // todo auto-generated catch block e.printstacktrace(); } } public static void main(string[] args) { // todo auto-generated method stub operatorrtf ortf = new operatorrtf(); string content = "2008年10月12日9时-2008年10月12日6时~我们参照检验药品的方法~我们参照检验药品的方法~我们参照检验药品的方法~我们参照检验药品的方法"; ortf.rgmodel("cheney",content); } }
使用poi读取word文件的表格数据的示例:
<span style="font-size:14px;">package com.poi.world; import java.io.fileinputstream; import org.apache.poi.hwpf.hwpfdocument; import org.apache.poi.hwpf.usermodel.paragraph; import org.apache.poi.hwpf.usermodel.range; import org.apache.poi.hwpf.usermodel.table; import org.apache.poi.hwpf.usermodel.tablecell; import org.apache.poi.hwpf.usermodel.tableiterator; import org.apache.poi.hwpf.usermodel.tablerow; import org.apache.poi.poifs.filesystem.poifsfilesystem; public class poi_word{ public static void main(string[] args){ try { string[] s=new string[20]; fileinputstream in=new fileinputstream("d:\\mayi.doc"); poifsfilesystem pfs=new poifsfilesystem(in); hwpfdocument hwpf=new hwpfdocument(pfs); range range =hwpf.getrange(); tableiterator it=new tableiterator(range); int index=0; while(it.hasnext()){ table tb=(table)it.next(); for(int i=0;i<tb.numrows();i++){ //system.out.println("numrows :"+tb.numrows()); tablerow tr=tb.getrow(i); for(int j=0;j<tr.numcells();j++){ //system.out.println("numcells :"+tr.numcells()); // system.out.println("j :"+j); tablecell td=tr.getcell(j); for(int k=0;k<td.numparagraphs();k++){ //system.out.println("numparagraphs :"+td.numparagraphs()); paragraph para=td.getparagraph(k); s[index]=para.text().trim(); index++; } } } } // system.out.println(s.tostring()); for(int i=0;i<s.length;i++){ system.out.println(s[i]); } } catch (exception e) { e.printstacktrace(); } } }</span>
上一篇: JAVA防止重复提交Web表单的方法
下一篇: sealed在C#中的作用说明