Ik分词器
程序员文章站
2022-07-09 15:27:27
...
- IK Analyzer简介
IK Analyzer 是一个开源的,基于 java 语言开发的轻量级的中文分词工具包。从 2006年 12 月推出 1.0 版开始, IKAnalyzer 已经推出了 4 个大版本。最初,它是以开源项目Luence 为应用主体的,结合词典分词和文法分析算法的中文分词组件。从 3.0 版本开始,IK 发展为面向 Java 的公用分词组件,独立 Lucene 项目,同时提供了对 Lucene 的默认优化实现。在 2012 版本中,IK 实现了简单的分词歧义排除算法,标志着 IK 分词器从单纯的词典分词向模拟语义分词衍化。 - IK Analyzer配置
步骤:
1、下载IKAnalyzer for solr5的源码包,然后使用Maven编译,得到一个文件IKAnalyzer-5.0.jar
ik分词下载
2、上传ik jar包到/usr/local/solr/server/solr-webapp/webapp/WEB-INF/lib目录中
3、修改/usr/local/solr/server/solr/collection1/conf/managed-schema,添加fieldType内容:
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index" useSmart="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<analyzer type="query" useSmart="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
然后,重启solr
选择ik分词
由此看到配置成功
Query界面简洁:
q:查询关键字:必须的,如果查询所有使用*????
fq:(filter query)过虑查询:作用:在q查询符合结果中同时是fq查询符合的
如:过滤查询价格从1到20的记录,使用price:[1 TO 20]
也可以使用“*”表示无限,例如:
20以上:price:[20 TO ]
20以下:price:[ TO 20]
sort:排序:格式:sort=+<desc|asc>[,+<desc|asc>]… 。
示例:product_price desc 按照价格从高到低进行排序
product_price asc 按照价格从低到高进行排序
start, rows:行的索引,从0开始,[start, rows]
fl:指定返回那些字段内容:用逗号或空格分隔多个,不写默认返回全部配置的。
df:指定一个默认搜索Field:一般默认
wt:(writer type)指定输出格式:可以有xml, json, csv, python, php等格式
hl:是否高亮:设置高亮Field,设置格式前缀和后缀。
上一篇: IK分词器
推荐阅读
-
Net Core使用Lucene.Net和盘古分词器 实现全文检索
-
docker 部署 Elasticsearch kibana及ik分词器详解
-
ElasticSearch 5.5 离线环境的完整安装及配置详情,附kibana、ik插件配置及安装包下载路径
-
Laravel个人博客集成Elasticsearch和ik分词
-
ElasticSearch 分词器
-
Lucene-分词器简介及IK分词器的使用
-
docker 安装(6.x单机)elasticsearch、elasticsearch-head、ik分词器
-
基于字典树的前向/后向分词器
-
ek插件------ik中文分词器的使用
-
ElasticSearch学习 - (八)安装中文分词器IK和拼音分词器