solr 5.0搭建 和使用 ik分词
程序员文章站
2022-04-03 14:10:29
...
1.将下载来的solr-5.0.0.zip解压。
创建D:\mysoftsetup\solrserver目录,复制solr-5.0.0\server\solr下所有文件到D:\mysoftsetup\solrserver,
复制Tomcat 到 D:\mysoftsetup\solrserver 目录
把solr-5.0.0\server\webapps\solr.war放到tomcat的webapps目录下;启动tomcat自动解压得到solr文件夹。
把solr-5.0.0\server\lib\ext下所有的jar,复制到刚才得到的solr文件夹下的WEB-INF\lib目录下。
把solr-5.0.0\server\resources\log4j.properties复制到webapps\solr\WEB-INF\classes目录下。
修改webapps\solr\WEB-INF\web.xml的:
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>../../solr</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
指定solr/home为../../solr目录(其实就是:D:\mysoftsetup\solrserver目录中的solr)。
启动tomcat ,访问http://localhost:8393
查看信息:
建立core
把D:\mysoftsetup\solr-5.0.0\example\techproducts\solr\techproducts 复制到D:\mysoftsetup\solrserver\solr 中,techproducts修改为shop_goods,重新启动tomcat
2.使用ik和smartcn 中文分词
复制 solr-5.0.0\contrib\analysis-extras\lucene-libs 下的jar 到Tomcat 中solr/WEB-INF\lib 中,把附件中ik-analyzer-solr5-5.x.jar 也要复制到Tomcat 中solr/WEB-INF\lib 中
3.修改shop_goods中的schema.xml 中添加ik和smartcn 的配置
<fieldType name="text_smart" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>
<filter class="solr.SmartChineseWordTokenFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>
<filter class="solr.SmartChineseWordTokenFilterFactory"/>
</analyzer>
</fieldType>
<field name="text_smart_ceshi" type="text_smart" indexed="true" stored="true" multiValued="true"/>
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
<field name="text_ik_ceshi" type="text_ik" indexed="true" stored="true" multiValued="true"/>
4.重启tomcat测试切词
在左侧选择shop_goods,然后单击“analysis”
测试ik 分词:在Analyse Fieldname / FieldType 中选择“text_ik”,效果如图:
测试smark-cn 分词:在Analyse Fieldname / FieldType 中选择“text_smart”,效果如图:
shop_goods.rar 为配置好的core
创建D:\mysoftsetup\solrserver目录,复制solr-5.0.0\server\solr下所有文件到D:\mysoftsetup\solrserver,
复制Tomcat 到 D:\mysoftsetup\solrserver 目录
把solr-5.0.0\server\webapps\solr.war放到tomcat的webapps目录下;启动tomcat自动解压得到solr文件夹。
把solr-5.0.0\server\lib\ext下所有的jar,复制到刚才得到的solr文件夹下的WEB-INF\lib目录下。
把solr-5.0.0\server\resources\log4j.properties复制到webapps\solr\WEB-INF\classes目录下。
修改webapps\solr\WEB-INF\web.xml的:
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>../../solr</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
指定solr/home为../../solr目录(其实就是:D:\mysoftsetup\solrserver目录中的solr)。
启动tomcat ,访问http://localhost:8393
查看信息:
建立core
把D:\mysoftsetup\solr-5.0.0\example\techproducts\solr\techproducts 复制到D:\mysoftsetup\solrserver\solr 中,techproducts修改为shop_goods,重新启动tomcat
2.使用ik和smartcn 中文分词
复制 solr-5.0.0\contrib\analysis-extras\lucene-libs 下的jar 到Tomcat 中solr/WEB-INF\lib 中,把附件中ik-analyzer-solr5-5.x.jar 也要复制到Tomcat 中solr/WEB-INF\lib 中
3.修改shop_goods中的schema.xml 中添加ik和smartcn 的配置
<fieldType name="text_smart" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>
<filter class="solr.SmartChineseWordTokenFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>
<filter class="solr.SmartChineseWordTokenFilterFactory"/>
</analyzer>
</fieldType>
<field name="text_smart_ceshi" type="text_smart" indexed="true" stored="true" multiValued="true"/>
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
<field name="text_ik_ceshi" type="text_ik" indexed="true" stored="true" multiValued="true"/>
4.重启tomcat测试切词
在左侧选择shop_goods,然后单击“analysis”
测试ik 分词:在Analyse Fieldname / FieldType 中选择“text_ik”,效果如图:
测试smark-cn 分词:在Analyse Fieldname / FieldType 中选择“text_smart”,效果如图:
shop_goods.rar 为配置好的core