欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

asp.net中匹配URL网址的正则表达式

程序员文章站 2022-03-27 08:52:57
%<本人做的是asp.net的项目,内容是阻止一个文本框中的某些url>% 首先,正则表达式: string check = @"((http|ft...

%<本人做的是asp.net的项目,内容是阻止一个文本框中的某些url>%

首先,正则表达式:

string check = @"((http|ftp|https)://)(([a-za-z0-9\._-]+\.[a-za-z]{2,6})|([0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}))(:[0-9]{1,4})*(/[a-za-z0-9\&%_\./-~-]*)?";

关于该正则表达式的说明:

①:该正则表达式匹配的字符串必须以http://、https://、ftp://开头;
②:该正则表达式能匹配url或者ip地址;(如:http://www.baidu.com 或者 http://192.168.1.1)
③:该正则表达式能匹配到url的末尾,即能匹配到子url;(如能匹配:http://www.baidu.com/s?wd=a&rsv_spt=1&issp=1&rsv_bp=0&ie=utf-8&tn=baiduhome_pg&inputt=1236)
④:该正则表达式能够匹配端口号;

阻止某些指定的url:

如果我们在输入的文本框中要阻止http://www.baidu.com这个url,传统的方法是用上面的正则表达式去匹配文本框中的url,读出所有的url之后在跟要阻止的url去比较,但是这种方法有一个弊端,就是我们读出的url是一直到子url,而我们在配置文件中可能就写一个母url,这样要对check出来的url进行切割,加上网站默认的端口号是:80,我们要去比较端口号等等,我想出了一种新的方法:

从配置文件中读出要阻止的url,组成一个正则表达式,去匹配文本框中,如果能够匹配到,则阻止掉。

配置文件中应该写:<add key="domaincheckblackurl" value="baidu.com" />

在代码中实现:

现在一个正则表达式由3部分组成:

1:正则表达式的开头,可能由任意的字符组成;
2:正则表达式的中间部分:从配置文件中读出来的部分;
3:正则表达式的结尾部分:可能有一些子目录或者端口号等;

首先,从配置文件中读出url:string[] serverlist = configurationmanager.appsettings["domaincheckblackurl"].split(',');(配置文件中以“,”分割)
其次,string start = @"((http|ftp|https)://)([a-za-z0-9_-]+\.)*";(正则表达式的开头)
然后,正则表达式的结尾: end = @"(:[0-9]{1,4})?((/[a-za-z0-9\&%_\./-~-]*)|(?=[^a-za-z0-9\.]))";
组合之后的正则表达式: string check = start + @"((?<=[^a-za-z0-9])(" + cutstr + "))" + end;

以上是本人的一些小见解,希望对大家能有所帮助。