C#使用正则表达式过滤html标签
程序员文章站
2022-04-15 09:32:55
在项目中遇到这样一个需求,需要将一段html转换为一般文本返回,万能的正则表达式来了。
正则表达式来拯救你,代码如下:
public static string...
在项目中遇到这样一个需求,需要将一段html转换为一般文本返回,万能的正则表达式来了。
正则表达式来拯救你,代码如下:
public static string html2text(string htmlstr) { if (string.isnullorempty(htmlstr)) { return ""; } string regex_style = "<style[^>]*?>[\\s\\s]*?<\\/style>"; //定义style的正则表达式 string regex_script = "<script[^>]*?>[\\s\\s]*?<\\/script>"; //定义script的正则表达式 string regex_html = "<[^>]+>"; //定义html标签的正则表达式 htmlstr = regex.replace(htmlstr, regex_style, "");//删除css htmlstr = regex.replace(htmlstr, regex_script, "");//删除js htmlstr = regex.replace(htmlstr, regex_html, "");//删除html标记 htmlstr = regex.replace(htmlstr, "\\s*|\t|\r|\n", "");//去除tab、空格、空行 htmlstr = htmlstr.replace(" ", ""); htmlstr = htmlstr.replace(""", "");//去除异常的引号" " " htmlstr = htmlstr.replace(""", ""); return htmlstr.trim(); }
以上所述是小编给大家介绍的c#使用正则表达式过滤html标签 ,希望对大家有所帮助