欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

solr配置IK中文分词器

程序员文章站 2024-02-21 22:29:34
...
  • solr版本:4.7.2
  • ik版本:IK Analyzer 2012FF_hf1
  • 平台:Max OS X

解压安装包

解压后目录如下

solr配置IK中文分词器

移动jar文件到tomcat

mv ~/Downloads/IK\ Analyzer\ 2012FF_hf1/IKAnalyzer2012FF_u1.jar /usr/local/Tomcat/webapps/solr/WEB-INF/lib/

移动词典到core内

IK 分词器还支持通过配置 IKAnalyzer.cfg.xml 文件来扩充您的专有词典以及停止词典 (过滤词典)。

1. 部署 IKAnalyzer.cfg.xml

IKAnalyzer.cfg.xml 部署在代码根目录下(对于 web 项目,通常是WEB-INF/classes 目录)同 hibernate、log4j 等配置文件相同。

mv ~/Downloads/IK\ Analyzer\ 2012FF_hf1/IKAnalyzer.cfg.xml /usr/local/tomcat/webapps/solr/WEB-INF/classes/
2. 词典文件的编辑与部署

词典文件应部署在 Java 的资源路径下,即 ClassLoader 能够加载的路径中。(推荐同 IKAnalyzer.cfg.xml 放在一起)

mv ~/Downloads/IK\ Analyzer\ 2012FF_hf1/mydict.dic /usr/local/tomcat/webapps/solr/WEB-INF/classes/

mv ~/Downloads/IK\ Analyzer\ 2012FF_hf1/stopword.dic /usr/local/tomcat/webapps/solr/WEB-INF/classes/

修改Schema.xml

在很多field那里并列加入:

<field name="text_ik"  type="text_general" indexed="true"  stored="true"  multiValued="false" />

在很多fieldType那里并列加入

<fieldType name="text_ik" class="solr.TextField">
     <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

测试是否成功

重启tomcat,选择types类型的text_ik。如有下图则成功。

solr配置IK中文分词器