php将url地址转化为完整的a标签链接代码(php为url地址添加a标签)
需要提取的内容如下:
<a href="http://baidu.com">http://baidu.com</a>这是第一个a标签,
<a href="http://blog.baidu.com">成长脚印-专注于互联网发展</a>这是第二个a标签。
//www.jb51.net这是第一个需要被提取的url地址,
http://blog.baidu.com这是第二个需要被提取的url地址'。
<img border="0" alt="" src="http://baidu.com/css/sitelogo_zh-cn.gif">,这是一个img标签
类似微博中的自动提取url为超链接地址。即内容提取出来添加a标签,转换成真正的超链接。网上搜索了很久,没有找到一个切实可行的解决方案。大都只是简单的提取url(a标签和img标签内的地址也被提取替换了),并不能满足以上需求。正则表达式中也没发现能够实现提取时过滤掉a标签的方法。于是转换了一下思路,“曲线救国”。即,先将所有的a标签和img标签正则替换为某一个统一的标记,然后再提取url地址替换为超链接,最后再将统一的标记还原替换为以前的a标签和img标签便解决了。
function linkadd($content){
//提取替换出所有a标签(统一标记<{link}>)
preg_match_all('/<a.*?href=".*?".*?>.*?</a>/i',$content,$linklist);
$linklist=$linklist[0];
$str=preg_replace('/<a.*?href=".*?".*?>.*?</a>/i','<{link}>',$content);
//提取替换出所有的img标签(统一标记<{img}>)
preg_match_all('/<img[^>]+>/im',$content,$imglist);
$imglist=$imglist[0];
$str=preg_replace('/<img[^>]+>/im','<{img}>',$str);
//提取替换标准的url地址
$str=preg_replace('(((f|ht){1}tp://)[-a-za-z0-9@:%_/+.~#?&//=]+)','<a href="\0" target="_blank">\0</a>',$str);
//还原a统一标记为原来的a标签
$arrlen=count($linklist);
for($i=0;$i<$arrlen;$i++){
$str=preg_replace('/<{link}>/',$linklist[$i],$str,1);
}
//还原img统一标记为原来的img标签
$arrlen2=count($imglist);
for($i=0;$i<$arrlen2;$i++){
$str=preg_replace('/<{img}>/',$imglist[$i],$str,1);
}
return $str;
}
$content='
<a href="http://baidu.com">http://baidu.com</a>这是第一个a标签,
<a href="http://blog.baidu.com">成长脚印-专注于互联网发展</a>这是第二个a标签。
//www.jb51.net这是第一个需要被提取的url地址,
http://blog.baidu.com这是第二个需要被提取的url地址。
<img border="0" alt="" src="http://baidu.com/css/sitelogo_zh-cn.gif">,这是一个img标签';
echo linkadd($content);
返回的内容为:
<a href="http://baidu.com">http://baidu.com</a>这是第一个a标签, <a href="http://blog.baidu.com">成长脚印-专注于互联网发展</a>这是第二个a标签。 <a href="//www.jb51.net" target="_blank">//www.jb51.net</a>这是第一个需要被提取的url地址, <a href="http://blog.baidu.com" target="_blank">http://blog.baidu.com</a>这是第二个需要被提取的url地址。
<img border="0" alt="" src="http://baidu.com/css/sitelogo_zh-cn.gif">,这是一个img标签
即为我们想要的内容。
例2,
/**
* php 版本 在 silva 代码的基础上修改的
* 将url地址转化为完整的a标签链接代码
*/
function replace_urltolink($text) {
// grab anything that looks like a url...
$urls = array();
// build the patterns
$scheme = '(https?://|ftps?://)?';
$www = '([w]+.)';
$ip = '(d{1,3}.d{1,3}.d{1,3}.d{1,3})';
$name = '([w0-9]+)';
$tld = '(w{2,4})';
$port = '(:[0-9]+)?';
$the_rest = '(/?([w#!:.?+=&%@!-/]+))?';
$pattern = $scheme.'('.$ip.$port.'|'.$www.$name.$tld.$port.')'.$the_rest;
$pattern = '/'.$pattern.'/is';
// get the urls
$c = preg_match_all($pattern, $text, $m);
if ($c) {
$urls = $m[0];
}
// replace all the urls
if (! empty($urls)) {
foreach ($urls as $url) {
$pos = strpos('http://', $url);
if (($pos && $pos != 0) || !$pos) {
$fullurl = 'http://'.$url;
} else {
$fullurl = $url;
}
$link = ''.$url.'';
$text = str_replace($url, $link, $text);
}
}
return $text;
}
推荐阅读