Apache Lucene 3.5 发布,基于Java的全文检索工具包
程序员文章站
2022-05-17 19:05:00
...
Apache Lucene 3.5 发布了。
Apache Lucene 是一个基于Java的、高性能的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene目前是著名的 Apache Jakarta 家族中的一个开源项目,也是目前最为流行的基于 Java 开源全文检索工具包。
该版本进行了大量优化、改进和Bug修复,包括:
下载地址:http://www.apache.org/dyn/closer.cgi/lucene/java
Apache Lucene 是一个基于Java的、高性能的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene目前是著名的 Apache Jakarta 家族中的一个开源项目,也是目前最为流行的基于 Java 开源全文检索工具包。
该版本进行了大量优化、改进和Bug修复,包括:
- 大大降低了控制开放的IndexReader上的协议索引的RAM占用(3~5倍)。
- 新增IndexSearcher.searchAfter,可在指定ScoreDoc后返回结果(例如之前页面的最后一个文档),以支持deep页用例。
- 新增SearcherManager,以管理共享和重新开始跨多个搜索线程的IndexSearchers。基本的IndexReader实例如果不再进行引用,则会被安全关闭。
- 新增SearcherLifetimeManager,为跨多个请求(例如:paging/drilldown)的索引安全地提供了一个一致的视图。
- 将IndexWriter.optimize重命名为forceMerge,以便去阻止使用这种方法,因为它的使用代价较高,且也不需要使用。
- 新增NGramPhraseQuery,当使用n-gram分析时,可提升30%-50%的短语查询速度。
- 重新开放了一个API(IndexReader.openIfChanged),如果索引没有变化,则返回空值,而不是旧的reader。
- Vector改进:支持更多查询,如通配符和用于产生摘要的边界分析。
- 修复了若干Bug。
下载地址:http://www.apache.org/dyn/closer.cgi/lucene/java