欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  php教程

TP3.1.3中文分词

程序员文章站 2024-01-11 19:25:46
...
TP3.1.3中文分词
http://www.thinkphp.cn/extend/435.html
分词类是使用上面的处理类
我的页是使用的是utf-8, 有些词分出是乱码.
我是这样处理的
Vendor ( 'SplitWord\lib_splitword_full' );
$sp = new SplitWord ();
$temp_str = $sp->SplitRMM ( trim ( $val ) );
$sp->Clear ();
if (mb_detect_encoding ( $temp_str, array (
'ASCII',
'UTF-8',
'GB2312',
'GBK',
'BIG5'
) ) !== 'UTF-8') {
$temp_str = iconv ( 'gbk', 'utf-8', $temp_str );
}

TP3.1.3中文分词 SplitWord.rar ( 660.26 KB 下载:174 次 )

AD:真正免费,域名+虚机+企业邮箱=0元