欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

如何使用IKAnalyzer分词器自定义扩展词典

程序员文章站 2022-03-08 08:50:26
...
本文主要介绍了如何使用IKAnalyzer分词器自定义扩展词典,希望大家可以耐心学习。

下载IKAnalyzer完整分发包后,IK Analyzer安装包包含:
1. 《IKAnalyzer中文分词器V2012使用手册》
2. IKAnalyzer2012.jar(主jar包)
3. IKAnalyzer.cfg.xml(分词器扩展配置文件)
4. stopword.dic(停止词典)
5. LICENSE.TXT ; NOTICE.TXT (apache版权申明)
它的安装部署十分简单,将 IKAnalyzer2012.jar 部署于项目的 lib 目录中;
IKAnalyzer.cfg.xml 与 stopword.dic 文件放置在 class 根目录(对于 web 项目,通常是
WEB-INF/classes目录,同hibernate、log4j等配置文件相同)下即可。

要扩展自定义词典,打开IKAnalyzer.cfg.xml

如何使用IKAnalyzer分词器自定义扩展词典

将扩展词典的注释去掉。

如何使用IKAnalyzer分词器自定义扩展词典

同时在class根目录,即src文件夹下自己新建ext.dic文件。建好之后用Notepad++软件打开ext.dic。

如何使用IKAnalyzer分词器自定义扩展词典

相关推荐:

详解Java开源的11个中文分词器使用方法和分词效果对比

使用Discuz关键词服务器实现PHP中文分词_PHP教程

以上就是如何使用IKAnalyzer分词器自定义扩展词典的详细内容,更多请关注其它相关文章!

相关标签: IKAnalyzer,python