中文分词处理方法_PHP教程
/**
* 中文分词处理方法
*+---------------------------------
* @param stirng $string 要处理的字符串
* @param boolers $sort=false 根据value进行倒序
* @param Numbers $top=0 返回指定数量,默认返回全部
*+---------------------------------
* @return void
*/
function scws($text, $top = 5, $return_array = false, $sep = ',') {
include('./pscws4/pscws4.php');//去下面给的网址把pscws4下载下来
$cws = new pscws4('utf-8');
$cws -> set_charset('utf-8');
$cws -> set_dict('./pscws4/etc/dict.utf8.xdb');
$cws -> set_rule('./pscws4/etc/rules.utf8.ini');
//$cws->set_multi(3);
$cws -> set_ignore(true);
//$cws->set_debug(true);
//$cws->set_duality(true);
$cws -> send_text($text);
$ret = $cws -> get_tops($top, 'r,v,p');
$result = null;
foreach ($ret as $value) {
if (false === $return_array) {
$result .= $sep . $value['word'];
} else {
$result[] = $value['word'];
}
}
return false === $return_array ? substr($result, 1) : $result;
}
print_r(scws('青花夔龙纹香炉'));
/**
* 中文分词处理方法
*+---------------------------------
* @param stirng $string 要处理的字符串
* @param boolers $sort=false 根据value进行倒序
* @param Numbers $top=0 返回指定数量,默认返回全部
*+---------------------------------
* @return void
*/
function scws($text, $top = 5, $return_array = false, $sep = ',') {
include('./pscws4/pscws4.php');//去下面给的网址把pscws4下载下来
$cws = new pscws4('utf-8');
$cws -> set_charset('utf-8');
$cws -> set_dict('./pscws4/etc/dict.utf8.xdb');
$cws -> set_rule('./pscws4/etc/rules.utf8.ini');
//$cws->set_multi(3);
$cws -> set_ignore(true);
//$cws->set_debug(true);
//$cws->set_duality(true);
$cws -> send_text($text);
$ret = $cws -> get_tops($top, 'r,v,p');
$result = null;
foreach ($ret as $value) {
if (false === $return_array) {
$result .= $sep . $value['word'];
} else {
$result[] = $value['word'];
}
}
return false === $return_array ? substr($result, 1) : $result;
}
print_r(scws('青花夔龙纹香炉'));
上一篇: 关于PHP正则表达式的总结
推荐阅读
-
PHP使用mysql_fetch_row查询获得数据行列表的方法,phpmysql_fetch_row_PHP教程
-
删除mysql数据库所有数据表方法_PHP教程
-
ThinkPHP中SHOW_RUN_TIME不能正常显示运行时间的解决方法 原创,thinkphprun_PHP教程
-
关于session不能自动去除的临时处理方法(转载)我一直没用SESSI_PHP
-
我的MySQL事务处理_PHP教程
-
php通过array_merge()函数合并两个数组的方法,array_merge数组_PHP教程
-
谈谈中文验证码的实现方法实例教程
-
php过滤或替换textarea换行回车rn的2种方法_PHP教程
-
fleaphp下不确定的多条件查询的巧妙解决方法_PHP教程
-
PHP json_encode() 函数详解及中文乱码问题,_PHP教程