欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

Zend_Search_Lucene 中文搜索问题

程序员文章站 2022-04-08 13:17:09
...
Joomla Jifile组件使用了Zend_Search_Lucene来搜索内容,虽然也能搜索到中文,不过搜索结果有点问题。

例如我搜索“日内瓦协议”可以搜索到内容,但我搜索“日内瓦”或者“协议”就无法搜索得到。内容并不多,我不需要实现中文分词,只需要匹配到文字就行了。能否把Zend_Search_Lucene改为关键字直接匹配呢?

请大家给点建议我,无论是不是最终答案。

回复内容:

Joomla Jifile组件使用了Zend_Search_Lucene来搜索内容,虽然也能搜索到中文,不过搜索结果有点问题。

例如我搜索“日内瓦协议”可以搜索到内容,但我搜索“日内瓦”或者“协议”就无法搜索得到。内容并不多,我不需要实现中文分词,只需要匹配到文字就行了。能否把Zend_Search_Lucene改为关键字直接匹配呢?

请大家给点建议我,无论是不是最终答案。

Lucene默认不支持中文分词,你又想按照“日内瓦”或者“协议”的方式搜索,那是没办法的,全文搜索的索引方式就是这样。

针对Zend_Search_Lucene,网上有人已经实现了简单中文分词了,如果你对分词语义精度要求不高就可以直接用了。自己google下“Zend_Search_Lucene CN_Lucene_Analyzer”

相关标签: php