欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

求关于正则表达式PHP过滤编辑器的新闻内容

程序员文章站 2022-06-03 16:45:20
...
从网站A数据库中读取的新闻内容(HTML源码格式)写入网站B的新闻表中,格式不统一,而且有很多冗余代码,很多是从office复制过去的,需要过滤掉网站A新闻内容中冗余的HTML代码。新闻内容在php的$NEWS字段中,给这个字段用正则表达式处理一下。
比如

一级标题粗体1

新闻内容

求关于正则表达式PHP过滤编辑器的新闻内容

一级标题粗体2



求关于正则表达式PHP过滤编辑器的新闻内容

这段文字为居中


这段文字为右对齐


这段文字是斜体


加一个链接


要处理成

一级标题粗体

新闻内容

求关于正则表达式PHP过滤编辑器的新闻内容

第二段新闻正文

一级标题粗体2

求关于正则表达式PHP过滤编辑器的新闻内容

这段文字为居中

这段文字为右对齐

这段文字为斜体

加一个链接



具体的代码说明写了个网页,方便大神看: http://www.sunmuu.com/help/editorHelp.html

后面是php连接查询的代码,方便测试,数据库mysql,表是editor,两个字段ID(INIT)和news(MEDIUMTEXT):
$mysql_db_hostname = "localhost";$mysql_db_user = "root";$mysql_db_password = "root";$mysql_db_database = "test";$con = mysqli_connect($mysql_db_hostname, $mysql_db_user, $mysql_db_password, $mysql_db_database);mysqli_query($con, "SET NAMES utf8");$sql="SELECT * FROM editor";$re=mysqli_query($con,$sql)or die("读取数据出错". mysqli_error());while($row=mysqli_fetch_array($re)){$str=$row["news"];echo $str;}


回复讨论(解决方案)

//去掉不允许的 tag$s = strip_tags($s,'

,,求关于正则表达式PHP过滤编辑器的新闻内容,,');//去掉tag 里面的属性$s = preg_replace('/]+?>/i','',$s);//img 和 a 单独处理$s = preg_replace('/]*?>/i','',$s);echo $s;


试试吧,其它不影响显示的你就自己去改吧

//去掉不允许的 tag$s = strip_tags($s,'

,,求关于正则表达式PHP过滤编辑器的新闻内容,,');//去掉tag 里面的属性$s = preg_replace('/]+?>/i','',$s);//img 和 a 单独处理$s = preg_replace('/]*?>/i','',$s);echo $s;


试试吧,其它不影响显示的你就自己去改吧
太感谢你了jam00!!
有一点,p标签里面的style align属性需要保留,style="text-align: center;"和style="text-align: left;",这个逻辑顺序是怎样的?可以给个提示吗?

//去掉不允许的 tag$s = strip_tags($s,'

,,求关于正则表达式PHP过滤编辑器的新闻内容,,');//去掉tag 里面的属性$s = preg_replace('/]+?>/i','',$s);//img 和 a 单独处理$s = preg_replace('/]*?>/i','',$s);//单独处理 p$s = preg_replace('/

/i','

',$s);echo $s;

//去掉不允许的 tag$s = strip_tags($s,'

,,求关于正则表达式PHP过滤编辑器的新闻内容,,');//去掉tag 里面的属性$s = preg_replace('/]+?>/i','',$s);//img 和 a 单独处理$s = preg_replace('/]*?>/i','',$s);//单独处理 p$s = preg_replace('/

/i','

',$s);echo $s;


很给力,谢谢!

上一篇: 我的PHP练习

下一篇: osgi入门