Zend_Search_Lucene 中文搜索问题
程序员文章站
2022-04-08 13:17:09
...
Joomla Jifile组件使用了Zend_Search_Lucene来搜索内容,虽然也能搜索到中文,不过搜索结果有点问题。
例如我搜索“日内瓦协议”可以搜索到内容,但我搜索“日内瓦”或者“协议”就无法搜索得到。内容并不多,我不需要实现中文分词,只需要匹配到文字就行了。能否把Zend_Search_Lucene改为关键字直接匹配呢?
请大家给点建议我,无论是不是最终答案。
回复内容:
Joomla Jifile组件使用了Zend_Search_Lucene来搜索内容,虽然也能搜索到中文,不过搜索结果有点问题。
例如我搜索“日内瓦协议”可以搜索到内容,但我搜索“日内瓦”或者“协议”就无法搜索得到。内容并不多,我不需要实现中文分词,只需要匹配到文字就行了。能否把Zend_Search_Lucene改为关键字直接匹配呢?
请大家给点建议我,无论是不是最终答案。
Lucene默认不支持中文分词,你又想按照“日内瓦”或者“协议”的方式搜索,那是没办法的,全文搜索的索引方式就是这样。
针对Zend_Search_Lucene,网上有人已经实现了简单中文分词了,如果你对分词语义精度要求不高就可以直接用了。自己google下“Zend_Search_Lucene CN_Lucene_Analyzer”
上一篇: python实现的防DDoS脚本
下一篇: SqlServer中插入无时间的日期
推荐阅读
-
困扰JSP的一些问题与解决方法
-
python logging 日志轮转文件不删除问题的解决方法
-
ToolBar中menu无法同时显示图标和文字问题的解决方法
-
Java算法之最长公共子序列问题(LCS)实例分析
-
用Python解决计数原理问题的方法
-
Mysql启动中 InnoDB: Error: log file ./ib_logfile0 is of different size 0 5242880 bytes 的问题
-
解决表单post,get到springMVC后台乱码的问题
-
mysql建立自定义函数的问题
-
解决Android应用冷启动时出现的白屏问题的方法
-
完美解决node.js中使用https请求报CERT_UNTRUSTED的问题