Ik分词器

程序员文章站 2022-07-09 15:27:27

...

IK Analyzer简介
IK Analyzer 是一个开源的，基于 java 语言开发的轻量级的中文分词工具包。从 2006年 12 月推出 1.0 版开始， IKAnalyzer 已经推出了 4 个大版本。最初，它是以开源项目Luence 为应用主体的，结合词典分词和文法分析算法的中文分词组件。从 3.0 版本开始，IK 发展为面向 Java 的公用分词组件，独立 Lucene 项目，同时提供了对 Lucene 的默认优化实现。在 2012 版本中，IK 实现了简单的分词歧义排除算法，标志着 IK 分词器从单纯的词典分词向模拟语义分词衍化。
IK Analyzer配置
步骤：
1、下载IKAnalyzer for solr5的源码包，然后使用Maven编译，得到一个文件IKAnalyzer-5.0.jar
ik分词下载

2、上传ik jar包到/usr/local/solr/server/solr-webapp/webapp/WEB-INF/lib目录中
3、修改/usr/local/solr/server/solr/collection1/conf/managed-schema，添加fieldType内容：

 <fieldType name="text_ik" class="solr.TextField">
        <analyzer type="index" useSmart="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
        <analyzer type="query" useSmart="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType>

然后，重启solr
选择ik分词
Ik分词器
由此看到配置成功
Query界面简洁:

q：查询关键字：必须的，如果查询所有使用*????
fq：（filter query）过虑查询：作用：在q查询符合结果中同时是fq查询符合的
如：过滤查询价格从1到20的记录，使用price:[1 TO 20]
也可以使用“*”表示无限，例如：
20以上：price:[20 TO ]
20以下：price:[ TO 20]

sort：排序：格式：sort=+<desc|asc>[,+<desc|asc>]… 。
示例：product_price desc 按照价格从高到低进行排序
product_price asc 按照价格从低到高进行排序
start, rows：行的索引，从0开始，[start, rows]
fl：指定返回那些字段内容：用逗号或空格分隔多个，不写默认返回全部配置的。
df：指定一个默认搜索Field：一般默认
wt：(writer type)指定输出格式：可以有xml, json, csv, python, php等格式
hl：是否高亮：设置高亮Field，设置格式前缀和后缀。

Ik分词器

Net Core使用Lucene.Net和盘古分词器实现全文检索

docker 部署 Elasticsearch kibana及ik分词器详解

ElasticSearch 5.5 离线环境的完整安装及配置详情，附kibana、ik插件配置及安装包下载路径

Laravel个人博客集成Elasticsearch和ik分词

ElasticSearch 分词器

Lucene-分词器简介及IK分词器的使用

docker 安装(6.x单机)elasticsearch、elasticsearch-head、ik分词器

基于字典树的前向/后向分词器

ek插件------ik中文分词器的使用

ElasticSearch学习 - （八）安装中文分词器IK和拼音分词器

Ik分词器

Net Core使用Lucene.Net和盘古分词器 实现全文检索

docker 部署 Elasticsearch kibana及ik分词器详解

ElasticSearch 5.5 离线环境的完整安装及配置详情，附kibana、ik插件配置及安装包下载路径

Laravel个人博客集成Elasticsearch和ik分词

ElasticSearch 分词器

Lucene-分词器简介及IK分词器的使用

docker 安装(6.x单机)elasticsearch、elasticsearch-head、ik分词器

基于字典树的前向/后向分词器

ek插件------ik中文分词器的使用

ElasticSearch学习 - （八）安装中文分词器IK和拼音分词器

Net Core使用Lucene.Net和盘古分词器实现全文检索