欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  数据库

MySQL解决抓取文章的html标签替换及其mysql函数的用法说明_MySQL

程序员文章站 2022-05-19 15:40:14
...
bitsCN.com 刚刚做完了一个手机客户端的攻略的Html5 Web App页面,新的需求出现了:由于攻略文章是抓取过来的,有很多外链,一开始没有过滤。于是先用PHP写了一个过滤函数,然后批量执行更新相关数据库记录即可。

	public static function filter_newslink($aid){		$content = mod_news :: get_newscont($aid);		//先过滤图片的外链		$content = preg_replace('/()/a>/i', '${2}', $content);			//再过滤文字的外链文字为文字		$content = preg_replace('/(.*)/a>/i', '${2}', $content);			$data = array('news_id' => $aid, "content" => $content);		$status = mod_news :: update_newscontent($data);		return $status;	}


替换文章的关键词标签可以使用mysql导出后加工再导入数据库,也可以使用存储过程实现。这个的存储过程就不写了。

后来发现有些图片没有抓过来,而产品已经上线,重新抓取数据已是不现实的事情了。于是和同事协商后干脆把图片所在块一起去掉。攻略文章不再展示“卡牌数值”的图片表格。实现方法是采用MySQL的一些不太常用的函数。

SELECT replace(content,SUBSTRING(content FROM POSITION("卡牌数值" IN content) FOR POSITION("-->" IN content)),"