欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

HTML 的格式化正则

程序员文章站 2022-04-18 13:29:01
...

下面的这些正则是用来格式化HTML的,记录一下,以后用的时候会有帮助的。

//string regexstr = @"<[^>]*>"; //去除所有的标签

//@"<script[^>]*?>.*?</script>" //去除所有脚本,中间部分也删除 // string regexstr = @"<img[^>]*>"; //去除图片的正则

// string regexstr = @"<(?!br).*?>"; //去除所有标签,只剩br

// string regexstr = @"<table[^>]*?>.*?</table>"; //去除table里面的所有内容

string regexstr = @"<(?!img br p /p).*?>"; //去除所有标签,只剩img,br,p