solr 4.0 集成 IK Analyzer 中文分词
程序员文章站
2022-03-11 08:28:58
...
环境
jdk 1.7
tomcat1.7
solr 4.10
IK Analyzer 2012FF_hf1.zip
solr的下载
官网[url]http://lucene.apache.org/solr/[/url]
下载:[url]http://www.eu.apache.org/dist/lucene/solr/[/url]
IK Analyzer下载 (找个免费 VPN 翻)
google Code:[url]https://code.google.com/p/ik-analyzer/downloads/list[/url]
尤其要注意 IK Analyzer 支持的 solr 版本
我们这里下载 IK Analyzer 2012FF_hf1.zip
[img]http://dl2.iteye.com/upload/attachment/0104/2118/fb6f1dba-8b08-3e1e-9deb-2f7d0e2acdc1.jpg[/img]
部署solr到tomcat中
集成 IK Analyzer 2012FF_hf1
[img]http://dl2.iteye.com/upload/attachment/0104/2116/47101900-bb32-3bfe-899b-e6ec7c7f560b.png[/img]
重启 tomcat 然后访问
http://localhost:8983/solr/#/core0/analysis
[img]http://dl2.iteye.com/upload/attachment/0104/2124/a25800d9-54f1-36a4-b0e5-191d954eed48.jpg[/img]
jdk 1.7
tomcat1.7
solr 4.10
IK Analyzer 2012FF_hf1.zip
solr的下载
官网[url]http://lucene.apache.org/solr/[/url]
下载:[url]http://www.eu.apache.org/dist/lucene/solr/[/url]
IK Analyzer下载 (找个免费 VPN 翻)
google Code:[url]https://code.google.com/p/ik-analyzer/downloads/list[/url]
尤其要注意 IK Analyzer 支持的 solr 版本
我们这里下载 IK Analyzer 2012FF_hf1.zip
[img]http://dl2.iteye.com/upload/attachment/0104/2118/fb6f1dba-8b08-3e1e-9deb-2f7d0e2acdc1.jpg[/img]
部署solr到tomcat中
//1.修改tomcat 的编码格式
cd C:\Tomcat 6.0\conf\server.xml
加上 URIEncoding="UTF-8"
<Connector port="8080" protocol="HTTP/1.1"
connectionTimeout="20000"
redirectPort="8443" URIEncoding="UTF-8" />
//2.拷贝 E:\solr\apache-solr-3.6.2\example\webapps\solr.war 到 C:\Tomcat 6.0\webapps
//3.配置solr.home
在 C:\Tomcat 6.0\conf\Catalina\localhost 新建 solr.xml
<?xml version="1.0" encoding="UTF-8"?>
<Context docBase="C:\Tomcat 6.0\webapps\solr.war" debug="0" crossContext="true">
<Environment name="solr/home" type="java.lang.String" value="E:\solr\apache-solr-3.6.2\example\solr" override="true"/>
</Context>
//3.5配置 solr.home 的 方法二
修改 solr.war 中的 web.xml 添加 如下配置 也可以(一般web.xml中已经包含了只需取消注释就可以了)
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>E:\solr\apache-solr-3.6.2\example\solr</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
然后重新打包
java -cvf solr.war *.* 将 解压后的sole.war 重新打包部署
//4.启动 tomcat就 然后 访问 http://localhost:8080/solr/admin
//5 进入控制台 默认使用 "*:*" 查询所有 文档 这个 可以在 E:\solr\apache-solr-3.6.2\example\solr\conf\solrconfig.xml 中 修改
<defaultQuery>*:*</defaultQuery> 一般 不建议修改
集成 IK Analyzer 2012FF_hf1
[img]http://dl2.iteye.com/upload/attachment/0104/2116/47101900-bb32-3bfe-899b-e6ec7c7f560b.png[/img]
// 复制 IKAnalyzer2012FF_u1.jar 到 tomcat/webappa/solr/web-inf/lib
// 复制 IKAnalyzer.cfg.xml 和 stopword.dic 到上面配置的 solr/home/solr/core0/conf/
或者 到 \example\solr\core0\conf 下面
打开 \example\solr\core0\conf 或者 solr/home/solr/core0/conf/ 下面的schema.xml 配置文件
在 <types>下加入
<!-- IK Analyzer-->
<fieldType name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
在
<fields> 中加入
<field name="text" type="text_ik" indexed="true" stored="false" multiValued="false"/>
重启 tomcat 然后访问
http://localhost:8983/solr/#/core0/analysis
[img]http://dl2.iteye.com/upload/attachment/0104/2124/a25800d9-54f1-36a4-b0e5-191d954eed48.jpg[/img]