欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

lucene-索引纯文本文档

程序员文章站 2022-05-15 17:44:10
...

1、实现纯文本文档的DocumentHandler接口

2、

public class PlainTextHandler implements DocumentHandler

throws DocumentHandlerException{

String bodyText="";

try{

BufferReader br=new BufferedReader(new InputStreamReader(is));

String line=null;

while ((line==br.readline()!=null)){

bodyText+=line;

}

br.close();

}

catch(IOException e)}{

throw new DocumentHandlerException("cannot read the textdocument",e);

}

if(!bodyText.equals("")){

Documentdoc=new Document();

deoc.add(Field.Unstored("body",bodyText));

return doc;

}

return null;

}

public static void main(String[] args) throwsException{

PlainTextHandler handler=new PlainTextHandler();

Documentdoc=handler.getDocument(new File(args[0]));

System.out.println(doc);

}

}

相关标签: lucene