欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Lucene全文检索引擎

程序员文章站 2022-05-15 14:58:38
...

    Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程式接口,能够做全文索引和搜寻。在Java开发环境里Lucene是一个成熟的免费开源工具。就其本身而言,Lucene是当前以及最近几年最受欢迎的免费Java信息检索程序库。人们经常提到信息检索程序库,虽然与搜索引擎有关,但不应该将信息检索程序库与搜索引擎相混淆。

 

下载  luke-5.3.0-luke-release 查看生成检索文件

 

基本操作:

添加文档

删除文档

修改文档

文档域加权

 

高级应用:

对特定项搜索

查询表达式:QueryParser

分页实现

其他查询方式

指定项范围查询 TermRangeQuery ; 指定数字范围查询 NumericRangeQuery ; 指定字符串开头搜索 PrefixQuery ; 组合查询 BooleanQuery ;

 

中文应用:

中文分词 smartcn

检索结果高亮显示实现

 

 

 ================================================

 

源码:

Indexer.java 生成检索文件;

Searcher.java 检索实例;