欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

C#如何删除UL及LI中指定标签里文字的方法详解

程序员文章站 2022-04-08 17:59:05
...
这篇文章主要介绍了C#删除UL LI中指定标签里文字的方法,涉及C#针对页面HTML元素进行正则匹配与替换的相关操作技巧,需要的朋友可以参考下

本文实例讲述了C#删除UL LI中指定标签里文字的方法。分享给大家供大家参考,具体如下:

现在需求越来越变态,但是做代码只能尽量满足,这里先是扣去ul和li中的超链接里的文字

PromptHtml = GetData.GetHTTPInfo(Config.Prompt_Url, "utf-8");
PromptHtml = PromptHtml.Replace("<ul><li>", "");
PromptHtml=PromptHtml.Replace("</li></ul>", "");
string ss = @"<a[\s\S]*?href=""([^" rel="external nofollow" "]*?)""[^>]*?>([\s\S]*?)</a>"; //这里
MatchCollection mcTable = Regex.Matches(PromptHtml, ss);
foreach (Match mTable in mcTable)
{
  if (mTable.Success)
  {
    PromptHtml = mTable.Groups[2].Value;
  }
}
resultHtml = PromptHtml;

具体的数据源如下:

代码如下:

<ul><li><a href="http://localhost/tg.aspx?ID=4194" rel="external nofollow" >哪些主题基金有望爆发?</a></li></ul>

这篇是扣去ul和li中的span里面的文字:

middlebannerHtml = GetData.GetHTTPInfo(Config.Middlebanner_Url, "utf-8");
middlebannerHtml = middlebannerHtml.Replace("<ul><li>", "");
middlebannerHtml = middlebannerHtml.Replace("</li></ul>", "");
string ss = @"<span>([^<]+)</span>"; //这里
MatchCollection mcTable = Regex.Matches(middlebannerHtml, ss);
foreach (Match mTable in mcTable)
{
  if (mTable.Success)
  {
    middlebannerHtml = mTable.Groups[1].Value;
  }
}
middleContent = middlebannerHtml;

具体的数据源如下:

代码如下:

<ul><li><span>3年5倍涨幅的 不只是股票哦~</span> <a href="http://localhost/tg.aspx?ID=4195" rel="external nofollow" >立即查看</a></li></ul>

以上就是C#如何删除UL及LI中指定标签里文字的方法详解的详细内容,更多请关注其它相关文章!

相关标签: C#,UL,LI