欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

lucene-语汇单元的位置分析

程序员文章站 2022-05-15 15:57:50
...

以下程序显示出了语汇单元的位置,

Token[] tokens=tokensFromAnalysis(analyzer,text);

int position =0;

for (int i=0;i<tokens.length;i++){

Token token=tokens[i];

 

intincrement=token.getPositionIncrement();//得到当前语汇单元增量位置,增量位置是指本单词与上一个单词的间隙,如果中间空有单词(如停用词),则间隙包括停用词。

 

if (increment>0){

position=position+increment;//由增量位置得到当前语汇单元的实际位置

System.out.println();

System.out.print(position+":");

}

 

System.out.print("["+token.termText()+":"+token.startoffset()

+"- >"+token.endoffset()+":"+token.type()+"]");

}

}

如"the quick brown"使用同义词分析器,则显示的结果是

1:[quick][speedy][fast]

2:[brown]

相关标签: lucene