百度百科的基本词链接是怎样实现的呢
程序员文章站
2024-04-03 09:47:58
...
百度百科的关键词链接是怎样实现的呢
百度百科的关键词带有链接。我在想少量关键词,只需要简单替换成链接就可以。可是百度的关键词是狠多的,可能成万上千万个。如果替换上万次,那效率也太低了吧。请教这样的功能是怎样实现的呢?谢谢!
附截图:
百度百科的关键词带有链接。我在想少量关键词,只需要简单替换成链接就可以。可是百度的关键词是狠多的,可能成万上千万个。如果替换上万次,那效率也太低了吧。请教这样的功能是怎样实现的呢?谢谢!
附截图:
关键字链接
------解决方案--------------------
好吧,我再发一遍
TTrie.php
------解决方案--------------------
好吧,我再发一遍
include 'TTrie.php';秦始皇东巡洛阳
class wordkey extends TTrie {
function b() {
$t = array_pop($this->buffer);
$this->buffer[] = "$t";
}
}
$p = new wordkey;
$p->set('秦始皇', 'b');
$p->set('洛阳', 'b');
$t = $p->match('秦始皇东巡洛阳');
echo join('', $t);
TTrie.php
class TTrie {
protected $buffer = array();
protected $dict = array( array() );
protected $input = 0; //字符串当前偏移
protected $backtracking = 0; //字符串回溯位置
public $debug = 0;
public $savematch = 1;
function set($word, $action='') {
if(is_array($word)) {
foreach($word as $k=>$v) $this->set($k, $v);
return;
}
$p = count($this->dict);
$cur = 0; //当前节点号
foreach(str_split($word) as $c) {
if (isset($this->dict[$cur][$c])) { //已存在就下移
$cur = $this->dict[$cur][$c];
continue;
}
$this->dict[$p]= array(); //创建新节点
$this->dict[$cur][$c] = $p; //在父节点记录子节点号
$cur = $p; //把当前节点设为新插入的
$p++;
}
$this->dict[$cur]['acc'] = $action; //一个词结束,标记叶子节点
}
function getto($ch) {
$i =& $this->input; //字符串当前偏移
$p =& $this->backtracking; //字符串回溯位置
$len = strlen($this->doc);
$t = '';
$this->input++;
// while($this->inputdoc{$this->input} != $ch) $t .= $this->doc{$this->input++};
// $t .= $this->doc{$this->input++};
do {
if($this->input >= $len) break;
$t .= $this->doc{$this->input};
}while($this->doc{$this->input++} != $ch);
return trim($t);
}
function match($s) {
$this->doc =& $s;
$this->buffer = array();
$ret = array();
$cur = 0; //当前节点,初始为根节点
$i =& $this->input; //字符串当前偏移
$p =& $this->backtracking; //字符串回溯位置
$i = $p = 0;
$s .= "\0"; //附加结束符
$len = strlen($s);
$buf = '';
while($i $c = $s{$i};
if(isset($this->dict[$cur][$c])) { //如果存在
$cur = $this->dict[$cur][$c]; //转到对应的位置
if(isset($this->dict[$cur][$s[$i+1]])) {//检查下一个字符是否也能匹配,长度优先
$i++;
continue;
}
if(isset($this->dict[$cur]['acc'])) { //是叶子节点,单词匹配!
if($buf != '') {
$this->buffer[] = $buf;
$buf = '';
}
if($this->savematch) $this->buffer[] = substr($s, $p, $i - $p + 1); //取出匹配位置和匹配的词相关文章
相关视频
专题推荐
-
独孤九贱-php全栈开发教程
全栈 170W+
主讲:Peter-Zhu 轻松幽默、简短易学,非常适合PHP学习入门
-
玉女心经-web前端开发教程
入门 80W+
主讲:灭绝师太 由浅入深、明快简洁,非常适合前端学习入门
-
天龙八部-实战开发教程
实战 120W+
主讲:西门大官人 思路清晰、严谨规范,适合有一定web编程基础学习
推荐阅读
-
百度百科的基本词链接是怎样实现的呢
-
百度的搜索拼音联想功能是大致上的原理是怎样的呢 谢谢!
-
javascript - 像那些广告联盟,是怎么实现的呢,比如我淘宝上搜一个商品,然后优酷看视频,其它一些乱七八糟的广告百度联盟的啊,都是相关的推荐广告?
-
三级归类不递归是怎样实现的呢 (附测试代码) 求解
-
javascript - 像那些广告联盟,是怎么实现的呢,比如我淘宝上搜一个商品,然后优酷看视频,其它一些乱七八糟的广告百度联盟的啊,都是相关的推荐广告?
-
百度的搜索拼音联想功能是大致下的原理是怎样的呢 多谢
-
百度的搜索拼音联想功能是大致下的原理是怎样的呢 多谢
-
百度的搜索拼音联想功能是大致下的原理是怎样的呢 多谢
-
三级归类不递归是怎样实现的呢 (附测试代码) 求解
-
百度的搜索拼音联想功能是大致下的原理是怎样的呢 多谢
网友评论
文明上网理性发言,请遵守 新闻评论服务协议
我要评论