欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

【对比】PHP检测提交的段落是否有重复行,哪一种更好?解决办法

程序员文章站 2024-02-15 17:58:58
...
【对比】PHP检测提交的段落是否有重复行,哪一种更好?
写的两个函数,对比提交的文本段落里面重复的有无,发现一些问题:
(1)in_array()检测中文有的时候会有问题,明明存在却提示不存在,长文本的时候概率更高
(2)有时候短段落重复3~4次是允许的,但是如果用similar_text作对比就导致只要有一次重复就拒绝用户提交了。如何改进才更好
(3)还有没有更好的方法,求~





function hasSimilarText($string)
{
$lineArr = explode("\n",$string);
$arrStr = $arrLen = array();
foreach($lineArr as $k => $v)
{
$arrLen[] = strlen($v);
$arrStr[] = $v;
}

foreach($arrStr as $k1 => $v1)
{
foreach($arrStr as $k2 => $v2)
{
if($k1 == $k2) continue;
if($arrLen[$k2] 100) continue;
similar_text($v1, $v2, $pct);
if($pct > 90) return true;
}
}
return false;
}


/* 重复段落检测 */
function hasRepeatLine($string)
{
$string = str_replace(array("\t"," ","@","#","。",",",".",","),'',$string);
//$string = str_replace("\r","\n",$string);
$lineArr = explode("\n",$string);
$countShort = $countMiddle = $countLong = 0;
$arr = array();

foreach($lineArr as $lineString)
{
$length = strlen( $lineString );
if($length if(in_array($lineString,$arr))
{
if($length {
$countShort++;
if($countShort > 4) return true;//5次
} elseif($length>12 && $length $countMiddle++;
if($countMiddle > 3) return true; //4次
} elseif($length>50 && $length $countLong++;
if($countLong > 2) return true; //3次
【对比】PHP检测提交的段落是否有重复行,哪一种更好?解决办法

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。

相关文章

相关视频