欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

关于pscws4分词有关问题

程序员文章站 2022-06-14 13:02:23
...
关于pscws4分词问题
用pscws4分词,为什么只打印出里面的数字,中文直接不分词打印,网页编码是utf8

function get_tags_arr($title){
require 'pscws4/pscws4.class.php';
$pscws = new PSCWS4();
$pscws->set_dict('scws/dict.utf8.xdb');
$pscws->set_rule('scws/rules.utf8.ini');
$pscws->set_ignore(true);
$pscws->send_text($title);
$words = $pscws->get_tops(10);
$tags = array();
foreach ($words as $val) {
$tags[] = $val['word'];
}
$pscws->close();
return $tags;
}
------------------------------------
$title=并遵守*有关法律法规,21343尊重网上道德;
$tags=get_tags_arr($title);
echo print_r($tags);

为什么只打印出里面的数字,中文直接不分词打印


------解决方案--------------------
$pscws->set_dict('scws/dict.utf8.xdb');
$pscws->set_rule('scws/rules.utf8.ini');
这两个文件名和路径对吗?

对于 php 5.3 及以后会有 Redefining already defined constructor 错误,打开错误提示后并不影响正常工作