发布IKAnalyzer中文分词器V3.1.5GA
程序员文章站
2024-02-21 22:33:40
...
祝贺网友-1987(李良杰)加盟IKAnalyzer开发团队,感谢他对solr集成部分的测试工作
[size=large][b]V3.1.5GA版本变更:[/b][/size]
[b]1.新增org.wltea.analyzer.solr.IKTokenizerFactory,支持solr的TokenizerFactory接口配置[/b]
类org.wltea.analyzer.solr.IKTokenizerFactory
说明:该类继承与solr的BaseTokenizerFactory,是IK分词器对solr项目TokenizerFactory接口的扩展实现。从版本V3.1.5起。
属性:isMaxWordLength。该属性决定分词器是否采用最大词语切分。
[b]solr配置样例[/b]
使用IKAnalyzer的配置
使用IKTokenizerFactory的配置
[b]2.修订了3.1.3GA中,在特殊情况下对未知词的切分不输出的bug[/b]
[b]3.应广大网友要求,使用JDK5.0对jar包编译发布[/b]
下载 :[url=http://ik-analyzer.googlecode.com/files/IKAnalyzer3.1.5GA_AllInOne.rar]IKAnalyzer3.1.5GA完整包[/url]
更多详细请参看[url=http://ik-analyzer.googlecode.com/files/IKAnalyzer%E4%B8%AD%E6%96%87%E5%88%86%E8%AF%8D%E5%99%A8V3.1.5%E4%BD%BF%E7%94%A8%E6%89%8B%E5%86%8C.pdf]《IKAnalyzer中文分词器V3.1.5使用手册》[/url]
[size=large][b]V3.1.5GA版本变更:[/b][/size]
[b]1.新增org.wltea.analyzer.solr.IKTokenizerFactory,支持solr的TokenizerFactory接口配置[/b]
类org.wltea.analyzer.solr.IKTokenizerFactory
说明:该类继承与solr的BaseTokenizerFactory,是IK分词器对solr项目TokenizerFactory接口的扩展实现。从版本V3.1.5起。
属性:isMaxWordLength。该属性决定分词器是否采用最大词语切分。
[b]solr配置样例[/b]
使用IKAnalyzer的配置
<schema name="example" version="1.1">
……
<fieldType name="text" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
……
</schema>
使用IKTokenizerFactory的配置
<fieldType name="text" class="solr.TextField" >
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false"/>
……
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="true"/>
……
</analyzer>
</fieldType>
[b]2.修订了3.1.3GA中,在特殊情况下对未知词的切分不输出的bug[/b]
[b]3.应广大网友要求,使用JDK5.0对jar包编译发布[/b]
下载 :[url=http://ik-analyzer.googlecode.com/files/IKAnalyzer3.1.5GA_AllInOne.rar]IKAnalyzer3.1.5GA完整包[/url]
更多详细请参看[url=http://ik-analyzer.googlecode.com/files/IKAnalyzer%E4%B8%AD%E6%96%87%E5%88%86%E8%AF%8D%E5%99%A8V3.1.5%E4%BD%BF%E7%94%A8%E6%89%8B%E5%86%8C.pdf]《IKAnalyzer中文分词器V3.1.5使用手册》[/url]
上一篇: 为什么需要缓存
下一篇: 为什么需要 Handler?
推荐阅读
-
发布IKAnalyzer中文分词器V3.1.5GA
-
java鬼混笔记:lucene 4、中文分词器--IKAnalyzer
-
IKanalyzer、ansj_seg、jcseg三种中文分词器的实战较量
-
读IKAnalyzer源码之IK启动 lucene分词器中文分词分词器
-
IKanalyzer中文分词器
-
solr7.4 配置ikanalyzer和自带的中文分词器
-
发布IK Analyzer 中文分词器 3.1.1Stable稳定版本
-
IKanalyzer、ansj_seg、jcseg三种中文分词器的实战较量
-
cws_evaluation v1.1 发布,9大中文分词器分词效果评估对比
-
发布IK Analyzer 3.0 中文分词器