实例讲解Java读取一般文本文件和word文档的方法
程序员文章站
2024-03-12 11:25:44
一般文本文件
我们以日志文件.log文件为例:
import java.io.bufferedreader;
import java.io.file;...
一般文本文件
我们以日志文件.log文件为例:
import java.io.bufferedreader; import java.io.file; import java.io.fileinputstream; import java.io.filenotfoundexception; import java.io.filereader; import java.io.ioexception; public class file_test { /** * @param args */ public static void main(string[] args) { file file = new file("d:\\logserrormsg.log"); if(file.exists()){ system.out.println("此文件存在"); } else { system.out.println("此文件不存在"); } try { filereader fr = new filereader(file); bufferedreader br = new bufferedreader(fr); string s; while((s=br.readline())!=null){ system.out.println(s); } system.out.println("文件大小为(mb):"+new fileinputstream(file).available() / 1024 / 1024 +"m"); } catch (filenotfoundexception e) { e.printstacktrace(); } catch (ioexception e) { e.printstacktrace(); } } }
.doc文件
这里我们使用wordextractor读取word文档,wordextractor来自于apache的poi类库项目,官方下载地址:https://poi.apache.org/download.html
import java.io.fileinputstream; import org.textmining.text.extraction.wordextractor; public class wordtest { public static void main(string args[]) throws exception { new wordtest().readbyother(); } public void readbytext() throws exception { fileinputstream in = new fileinputstream("c://test.doc "); wordextractor extractor = new wordextractor(); string str = extractor.extracttext(in); system.out.println(str); } }
上一篇: Java精确抽取网页发布时间