欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

solr 5.0搭建 和使用 ik分词

程序员文章站 2022-04-03 14:10:29
...
1.将下载来的solr-5.0.0.zip解压。
创建D:\mysoftsetup\solrserver目录,复制solr-5.0.0\server\solr下所有文件到D:\mysoftsetup\solrserver,
复制Tomcat 到 D:\mysoftsetup\solrserver 目录

solr 5.0搭建 和使用 ik分词
            
    
    博客分类: 分布式技术 solr5分词 

把solr-5.0.0\server\webapps\solr.war放到tomcat的webapps目录下;启动tomcat自动解压得到solr文件夹。
把solr-5.0.0\server\lib\ext下所有的jar,复制到刚才得到的solr文件夹下的WEB-INF\lib目录下。
把solr-5.0.0\server\resources\log4j.properties复制到webapps\solr\WEB-INF\classes目录下。
修改webapps\solr\WEB-INF\web.xml的:
   <env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>../../solr</env-entry-value>
       <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>
指定solr/home为../../solr目录(其实就是:D:\mysoftsetup\solrserver目录中的solr)。

启动tomcat ,访问http://localhost:8393 
查看信息:

solr 5.0搭建 和使用 ik分词
            
    
    博客分类: 分布式技术 solr5分词 

建立core
把D:\mysoftsetup\solr-5.0.0\example\techproducts\solr\techproducts 复制到D:\mysoftsetup\solrserver\solr 中,techproducts修改为shop_goods,重新启动tomcat


2.使用ik和smartcn 中文分词
复制 solr-5.0.0\contrib\analysis-extras\lucene-libs 下的jar 到Tomcat 中solr/WEB-INF\lib 中,把附件中ik-analyzer-solr5-5.x.jar 也要复制到Tomcat 中solr/WEB-INF\lib 中
3.修改shop_goods中的schema.xml 中添加ik和smartcn 的配置

<fieldType name="text_smart" class="solr.TextField" positionIncrementGap="100">
          <analyzer type="index">
            <tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>
            <filter class="solr.SmartChineseWordTokenFilterFactory"/>
          </analyzer>
          <analyzer type="query">
            <tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>
            <filter class="solr.SmartChineseWordTokenFilterFactory"/>
          </analyzer>
    </fieldType>

<field name="text_smart_ceshi" type="text_smart" indexed="true" stored="true" multiValued="true"/>


<fieldType name="text_ik" class="solr.TextField">  
          <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>  
          <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>  
    </fieldType>

<field name="text_ik_ceshi" type="text_ik" indexed="true" stored="true" multiValued="true"/>


4.重启tomcat测试切词
在左侧选择shop_goods,然后单击“analysis”

solr 5.0搭建 和使用 ik分词
            
    
    博客分类: 分布式技术 solr5分词 


测试ik 分词:在Analyse Fieldname / FieldType 中选择“text_ik”,效果如图:

solr 5.0搭建 和使用 ik分词
            
    
    博客分类: 分布式技术 solr5分词 




测试smark-cn 分词:在Analyse Fieldname / FieldType 中选择“text_smart”,效果如图:

solr 5.0搭建 和使用 ik分词
            
    
    博客分类: 分布式技术 solr5分词 

shop_goods.rar 为配置好的core
  • solr 5.0搭建 和使用 ik分词
            
    
    博客分类: 分布式技术 solr5分词 
  • 大小: 8.6 KB
  • solr 5.0搭建 和使用 ik分词
            
    
    博客分类: 分布式技术 solr5分词 
  • 大小: 44.8 KB
  • solr 5.0搭建 和使用 ik分词
            
    
    博客分类: 分布式技术 solr5分词 
  • 大小: 25 KB
  • solr 5.0搭建 和使用 ik分词
            
    
    博客分类: 分布式技术 solr5分词 
  • 大小: 21.5 KB
  • solr 5.0搭建 和使用 ik分词
            
    
    博客分类: 分布式技术 solr5分词 
  • 大小: 93.8 KB
相关标签: solr5 分词