欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Ik分词器

程序员文章站 2022-07-09 15:27:27
...
  1. IK Analyzer简介
    IK Analyzer 是一个开源的,基于 java 语言开发的轻量级的中文分词工具包。从 2006年 12 月推出 1.0 版开始, IKAnalyzer 已经推出了 4 个大版本。最初,它是以开源项目Luence 为应用主体的,结合词典分词和文法分析算法的中文分词组件。从 3.0 版本开始,IK 发展为面向 Java 的公用分词组件,独立 Lucene 项目,同时提供了对 Lucene 的默认优化实现。在 2012 版本中,IK 实现了简单的分词歧义排除算法,标志着 IK 分词器从单纯的词典分词向模拟语义分词衍化。
  2. IK Analyzer配置
    步骤:
    1、下载IKAnalyzer for solr5的源码包,然后使用Maven编译,得到一个文件IKAnalyzer-5.0.jar
    ik分词下载

2、上传ik jar包到/usr/local/solr/server/solr-webapp/webapp/WEB-INF/lib目录中
3、修改/usr/local/solr/server/solr/collection1/conf/managed-schema,添加fieldType内容:

 <fieldType name="text_ik" class="solr.TextField">
        <analyzer type="index" useSmart="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
        <analyzer type="query" useSmart="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType>

然后,重启solr
选择ik分词
Ik分词器
由此看到配置成功
Query界面简洁:

q:查询关键字:必须的,如果查询所有使用*????
fq:(filter query)过虑查询:作用:在q查询符合结果中同时是fq查询符合的
如:过滤查询价格从1到20的记录,使用price:[1 TO 20]
也可以使用“*”表示无限,例如:
20以上:price:[20 TO ]
20以下:price:[
TO 20]

sort:排序:格式:sort=+<desc|asc>[,+<desc|asc>]… 。
示例:product_price desc 按照价格从高到低进行排序
product_price asc 按照价格从低到高进行排序
start, rows:行的索引,从0开始,[start, rows]
fl:指定返回那些字段内容:用逗号或空格分隔多个,不写默认返回全部配置的。
df:指定一个默认搜索Field:一般默认
wt:(writer type)指定输出格式:可以有xml, json, csv, python, php等格式
hl:是否高亮:设置高亮Field,设置格式前缀和后缀。

相关标签: solr java