欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

使用Java读取Word文件的简单例子分享

程序员文章站 2024-03-07 11:21:15
java读取word文档时,虽然网上介绍了很多插件poi、java2word、jacob、itext等等,poi无法读取格式(新的api估计行好像还在处于研发阶段,不太稳定...

java读取word文档时,虽然网上介绍了很多插件poi、java2word、jacob、itext等等,poi无法读取格式(新的api估计行好像还在处于研发阶段,不太稳定,做项目不太敢用);java2word、jacob容易报错找不到注册,比较诡异,我曾经在不同的机器上试过,操作方法完全一致,有的机器不报错,有的报错,去他们论坛找高人解决也说不出原因,项目部署用它有点玄;itxt好像写很方便但是我查了好久资料没有见到过关于读的好办法。经过一番选择还是折中点采用rtf最好,毕竟rtf是开源格式,不需要借助任何插件,只需基本io操作外加编码转换即可。rtf格式文件表面看来和doc没啥区别,都可以用word打开,各种格式都可以设定。
 
----- 实现的功能:读取rtf模板内容(格式和文本内容),替换变化部分,形成新的rtf文档。
 
----- 实现思路:模板中固定部分手动输入,变化的部分用$info$表示,只需替换$info$即可。
 
       1、采用字节的形式读取rtf模板内容
       2、将可变的内容字符串转为rtf编码
       3、替换原文中的可变部分,形成新的rtf文档
 
主要程序如下:
 

public string bin2hex(string bin) {
    char[] digital = "0123456789abcdef".tochararray();
    stringbuffer sb = new stringbuffer("");
    byte[] bs = bin.getbytes();
    int bit;
    for (int i = 0; i < bs.length;i++) {
      bit = (bs[i] & 0x0f0) >> 4;
 
      sb.append("\\'");
      sb.append(digital[bit]);
      bit = bs[i] & 0x0f;
      sb.append(digital[bit]);
    }
    return sb.tostring();
  }
 
 
public string readbytertf(inputstream ins, string path){
  string sourcecontent = "";
 try{
  ins = new fileinputstream(path);
  byte[] b = new byte[1024];
     if (ins == null) {
        system.out.println("源模板文件不存在");
     }
     int bytesread = 0;
     while (true) {
       bytesread = ins.read(b, 0, 1024); // return final read bytes counts
       if(bytesread == -1) {// end of inputstream
        system.out.println("读取模板文件结束");
        break;
       }
       sourcecontent += new string(b, 0, bytesread); // convert to string using bytes
      }
 }catch(exception e){
  e.printstacktrace();
 }
 return sourcecontent ;
}

   
      以上为核心代码,剩余部分就是替换,从新组装java中的string.replace(oldstr,newstr);方法可以实现,在这就不贴了。源代码部分详见附件。
运行源代码前提:
c盘创建yq目录,将附件中"模板.rtf"复制到yq目录之下,运行opreatorrtf.java文件即可,就会在yq目录下生成文件名如:21时15分19秒_cheney_记录.rtf 的文件。 
 

package com;
 
import java.io.file;
import java.io.fileinputstream;
import java.io.filewriter;
import java.io.ioexception;
import java.io.inputstream;
import java.io.printwriter;
import java.text.simpledateformat;
import java.util.date;
 
 
public class operatorrtf {
 
    public string strtortf(string content){
 
       char[] digital = "0123456789abcdef".tochararray();
 
    stringbuffer sb = new stringbuffer("");
 
    byte[] bs = content.getbytes();
 
    int bit;
 
    for (int i = 0; i < bs.length; i++) {
 
      bit = (bs[i] & 0x0f0) >> 4;
 
        sb.append("\\'");
 
      sb.append(digital[bit]);
 
      bit = bs[i] & 0x0f;
 
      sb.append(digital[bit]);
 
    }
 
    return sb.tostring();
 
    }
 
    public string replacertf(string content,string replacecontent,int flag){
 
       string rc = strtortf(replacecontent);
 
       string target = "";
 
       
 
       if(flag==0){
 
           target = content.replace("$timetop$",rc);
 
       }
 
       if(flag==1){
 
           target = content.replace("$info$",rc);
 
       }
 
       if(flag==2){
 
           target = content.replace("$idea$",rc);
 
       }
 
       if(flag==3){
 
           target = content.replace("$advice$",rc);
 
       }
 
       if(flag==4){
 
           target = content.replace("$infosend$",rc);
 
       }
 
       return target;
 
    }
 
    public string getsavepath() {
 
       
 
       string path = "c:\\yq";
 
       
 
       file fdirecotry = new file(path);
 
       if (!fdirecotry.exists()) {
 
           fdirecotry.mkdirs();
 
       }
 
       return path;
 
    }
 
    public string tosbc(string input){
 
      char[] c = input.tochararray();
 
      for (int i = 0; i < c.length; i++){
 
        if (c[i] == 32){
 
          c[i] = (char) 12288;
 
          continue;
 
        }
 
        if (c[i] < 127){
 
           c[i] = (char) (c[i] + 65248);
 
        }
 
      }
 
      return new string(c);
 
    }  
 
    public void rgmodel(string username, string content) {
 
       // todo auto-generated method stub
       
       date current=new date();
 
    simpledateformat sdf=new java.text.simpledateformat("yyyy-mm-dd hh:mm:ss");
 
       string targetname = sdf.format(current).substring(11,13) + "时";
 
       targetname += sdf.format(current).substring(14,16) + "分";
 
       targetname += sdf.format(current).substring(17,19) + "秒";
 
       targetname += "_" + username +"_记录.rtf";
 
            
       string strpath = getsavepath();
 
       string sourname = strpath+"\\"+"模板.rtf";
 
       string sourcecontent = "";
 
       inputstream ins = null;
 
       try{
 
           ins = new fileinputstream(sourname);
 
           byte[] b = new byte[1024];
 
        if (ins == null) {
 
           system.out.println("源模板文件不存在");
 
        }
 
        int bytesread = 0;
 
        while (true) {
 
          bytesread = ins.read(b, 0, 1024); // return final read bytes counts
 
          if(bytesread == -1) {// end of inputstream
 
              system.out.println("读取模板文件结束");
 
              break;
 
          }
 
          sourcecontent += new string(b, 0, bytesread); // convert to string using bytes
 
         }
 
       }catch(exception e){
 
           e.printstacktrace();
 
       }      
 
       string targetcontent = "";
       
 
       string array[] = content.split("~");
             
 
       for(int i=0;i<array.length;i++){
 
          
 
           if(i==0){
 
              targetcontent = replacertf(sourcecontent, array[i], i);
 
           }else{
 
              targetcontent = replacertf(targetcontent, array[i], i);
 
           }          
 
       }  
 
       
       try {
 
           filewriter fw = new filewriter(getsavepath()+"\\" + targetname,true);
 
      printwriter out = new printwriter(fw);
 
      if(targetcontent.equals("")||targetcontent==""){
 
          out.println(sourcecontent);
 
      }else{
 
          out.println(targetcontent);
 
      }
 
      out.close();
 
      fw.close();
 
      system.out.println(getsavepath()+" 该目录下生成文件" + targetname + " 成功");
 
       } catch (ioexception e) {
 
           // todo auto-generated catch block
 
           e.printstacktrace();
 
       }
 
    }
 
    public static void main(string[] args) {
 
       // todo auto-generated method stub
 
       operatorrtf ortf = new operatorrtf();
       
       string content = "2008年10月12日9时-2008年10月12日6时~我们参照检验药品的方法~我们参照检验药品的方法~我们参照检验药品的方法~我们参照检验药品的方法";
 
       ortf.rgmodel("cheney",content);
 
    }

}


使用poi读取word文件的表格数据的示例:
使用Java读取Word文件的简单例子分享

<span style="font-size:14px;">package com.poi.world; 
 
import java.io.fileinputstream; 
 
import org.apache.poi.hwpf.hwpfdocument; 
import org.apache.poi.hwpf.usermodel.paragraph; 
import org.apache.poi.hwpf.usermodel.range; 
import org.apache.poi.hwpf.usermodel.table; 
import org.apache.poi.hwpf.usermodel.tablecell; 
import org.apache.poi.hwpf.usermodel.tableiterator; 
import org.apache.poi.hwpf.usermodel.tablerow; 
import org.apache.poi.poifs.filesystem.poifsfilesystem; 
 
public class poi_word{ 
  public static void main(string[] args){ 
    try { 
      string[] s=new string[20]; 
      fileinputstream in=new fileinputstream("d:\\mayi.doc"); 
      poifsfilesystem pfs=new poifsfilesystem(in); 
      hwpfdocument hwpf=new hwpfdocument(pfs); 
      range range =hwpf.getrange(); 
      tableiterator it=new tableiterator(range); 
      int index=0; 
      while(it.hasnext()){ 
        table tb=(table)it.next(); 
        for(int i=0;i<tb.numrows();i++){ 
          //system.out.println("numrows :"+tb.numrows()); 
          tablerow tr=tb.getrow(i); 
          for(int j=0;j<tr.numcells();j++){ 
            //system.out.println("numcells :"+tr.numcells()); 
//           system.out.println("j  :"+j); 
            tablecell td=tr.getcell(j); 
            for(int k=0;k<td.numparagraphs();k++){ 
              //system.out.println("numparagraphs :"+td.numparagraphs()); 
              paragraph para=td.getparagraph(k); 
               s[index]=para.text().trim(); 
               index++; 
            } 
          } 
        } 
      } 
//     system.out.println(s.tostring()); 
      for(int i=0;i<s.length;i++){ 
        system.out.println(s[i]); 
      } 
    } catch (exception e) { 
      e.printstacktrace(); 
    } 
  } 
}</span>