实例讲解Java读取一般文本文件和word文档的方法

程序员文章站 2024-03-12 11:25:44

一般文本文件我们以日志文件.log文件为例： import java.io.bufferedreader; import java.io.file;...

一般文本文件
我们以日志文件.log文件为例：

import java.io.bufferedreader; 
import java.io.file; 
import java.io.fileinputstream; 
import java.io.filenotfoundexception; 
import java.io.filereader; 
import java.io.ioexception; 
 
public class file_test { 
 
 /** 
  * @param args 
  */ 
 public static void main(string[] args) { 
  file file = new file("d:\\logserrormsg.log"); 
  if(file.exists()){ 
   system.out.println("此文件存在"); 
  } else { 
   system.out.println("此文件不存在"); 
  } 
   
  try { 
   filereader fr = new filereader(file); 
   bufferedreader br = new bufferedreader(fr); 
   string s; 
   while((s=br.readline())!=null){ 
    system.out.println(s); 
   } 
   system.out.println("文件大小为（mb）："+new fileinputstream(file).available() / 1024 / 1024 +"m"); 
  } catch (filenotfoundexception e) { 
   e.printstacktrace(); 
  } catch (ioexception e) { 
   e.printstacktrace(); 
  } 
 } 
 
}

.doc文件

这里我们使用wordextractor读取word文档，wordextractor来自于apache的poi类库项目，官方下载地址：https://poi.apache.org/download.html

import java.io.fileinputstream; 
 
import org.textmining.text.extraction.wordextractor; 
 
public class wordtest { 
 public static void main(string args[]) throws exception { 
  new wordtest().readbyother(); 
 } 
 
 public void readbytext() throws exception { 
  fileinputstream in = new fileinputstream("c://test.doc "); 
  wordextractor extractor = new wordextractor(); 
  string str = extractor.extracttext(in); 
  system.out.println(str); 
 } 
}

上一篇： Java精确抽取网页发布时间

下一篇： MyBatis学习教程(五)-实现关联表查询方法详解