欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

去html代码的正则 推荐

程序员文章站 2022-03-11 08:35:34
复制代码 代码如下:'================================================== '函数名:scripthtml '作 ...
复制代码 代码如下:

'==================================================
'函数名:scripthtml
'作  用:过滤html标记
'参  数:constr ------ 要过滤的字符串
'==================================================
function scripthtml(byval constr,tagname,ftype)
    dim re
    set re=new regexp
    re.ignorecase =true
    re.global=true
    select case ftype
    case 1
       re.pattern="<" & tagname & "([^>])*>"
       constr=re.replace(constr,"")
    case 2
       re.pattern="<" & tagname & "([^>])*>.*?</" & tagname & "([^>])*>"
       constr=re.replace(constr,"")
    case 3
       re.pattern="<" & tagname & "([^>])*>"
       constr=re.replace(constr,"")
       re.pattern="</" & tagname & "([^>])*>"
       constr=re.replace(constr,"")
    end select
    scripthtml=constr
    set re=nothing
end function

1 content=scripthtml(content,"br",1) ‘去掉所有<br>html标记

2 content=scripthtml(content,"a",2) ‘去掉所有<a></a>和两个标记之间的内容 
如  <a href=www.126.com>www.126.com</a>  把这一段全去了

3  content=scripthtml(content,"td",3) ‘去掉<td>和</td>html标记
如  <td>士大夫撒</td>  把<td> </td> 去掉了 但士大夫撒还保留

依次类推把其他html标记都过滤了 div objdect什么的 自己看吧