欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

C#使用正则表达式过滤html标签

程序员文章站 2022-04-15 09:32:55
在项目中遇到这样一个需求,需要将一段html转换为一般文本返回,万能的正则表达式来了。 正则表达式来拯救你,代码如下: public static string...

在项目中遇到这样一个需求,需要将一段html转换为一般文本返回,万能的正则表达式来了。

正则表达式来拯救你,代码如下:

public static string html2text(string htmlstr)
{
if (string.isnullorempty(htmlstr))
{
return "";
}
string regex_style = "<style[^>]*?>[\\s\\s]*?<\\/style>"; //定义style的正则表达式 
string regex_script = "<script[^>]*?>[\\s\\s]*?<\\/script>"; //定义script的正则表达式 
string regex_html = "<[^>]+>"; //定义html标签的正则表达式 
htmlstr = regex.replace(htmlstr, regex_style, "");//删除css
htmlstr = regex.replace(htmlstr, regex_script, "");//删除js
htmlstr = regex.replace(htmlstr, regex_html, "");//删除html标记
htmlstr = regex.replace(htmlstr, "\\s*|\t|\r|\n", "");//去除tab、空格、空行
htmlstr = htmlstr.replace(" ", "");
htmlstr = htmlstr.replace(""", "");//去除异常的引号" " "
htmlstr = htmlstr.replace(""", "");
return htmlstr.trim();
}

C#使用正则表达式过滤html标签

以上所述是小编给大家介绍的c#使用正则表达式过滤html标签 ,希望对大家有所帮助