从此不再惧怕URI编码 JavaScript及C# URI编码详解
程序员文章站
2023-09-04 12:16:24
混乱的uri编码 javascript中编码有三种方法:escape、encodeuri、encodeuricomponent c#中编码主要方法:httputil...
混乱的uri编码
javascript中编码有三种方法:escape、encodeuri、encodeuricomponent
c#中编码主要方法:httputility.urlencode、server.urlencode、uri.escapeuristring、uri.escapedatastring
javascript中的还好,只提供了三个,c#中主要用的就有这么多,还没有列出其他编码(html),一多就弄不明白,弄不明白就心生恐惧,心生恐惧就变得苦逼,本文就向大家详细解释在javascript及c#中如何对uri进行编码的方法(注:本文不涉及到其他编码)。
escape:不推荐使用
原因:eacape是bom中的方法,只能对ascii符号正确编码,而encodeuri、encodeuricomponent可以对所有的unicode符号编码。ecmascript v3 反对使用该方法,应用使用 decodeuri() 和 decodeuricomponent() 替代它。
escape不编码字符有69个:*,+,-,.,/,@,_,0-9,a-z,a-z
encodeuri:用于对网址编码(不包含参数)
encodeuri不编码字符有82个:!,#,$,&,',(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,a-z
encodeuri就是为这个而设计的。encodeuri不对uri中的特殊字符进行编码,如冒号(:)、斜杠(/)。下面看个示例:
encodeuri("//www.jb51.net/a file with spaces.html")
// outputs //www.jb51.net/a%20file%20with%20spaces.html
可以看到仅仅把空格替换成了20%,所以此方法可用于对网址进行编码。
由于encodeuri不对冒号(:)、斜杠(/)进行编码,所以如果参数(如把网址作为参数)中包含冒号(:)、斜杠(/),就会解析出错,所以此方法不能对参数进行编码。
encodeuricomponent:用于对网址参数进行编码
encodeuricomponent不编码字符有71个:!, ',(,),*,-,.,_,~,0-9,a-z,a-z
可以看到此方法对:/都进行了编码,所以不能用它来对网址进行编码。由于此方法对中文,空格,井号(#),斜线(/),冒号(:)都进行了编码,所以适合对uri中的参数进行编码。看下面的示例:
var param="博客园";
var url="//www.jb51.net/?key="+encodeuricomponent(param)+"&page=1";
console.log(url);//outputs //www.jb51.net/?key=%e5%8d%9a%e5%ae%a2%e5%9b%ad&page=1
可以看到,这正是我们想要的结果(这里只对需要编码的参数(page=1不需要编码)进行了编码)。
server.urlencode && httputility.urlencode:不推荐
把这两个放到一起说是因为这两个方法在绝大多数情况下是一样的。它们的区别是httputility.urlencode默认使用utf8格式编码,而server.urlencode是使用系统预设格式编码,server.urlencode使用系統预设编码做为参数调用httputility.urlencode编码,所以如果系统全局都用utf8格式编码,这两个方法就是一样的。
这两个方法是怎么编码的呢,我们来看个示例:
string url1 = "//www.jb51.net/a file with spaces.html?a=1&b=博客园#abc";
response.write(httputility.urlencode(url1) );
//output
http%3a%2f%2fwww.jb51.net%2fa+file+with+spaces.html%3fa%3d1%26b%3d%e5%8d%9a%e5%ae%a2%e5%9b%ad%23abc
由上面的例子我们可以看出,httputility.urlencode对冒号(:)和斜杠(/)进行了编码,所以不能用来对网址进行编码。
那么能不能对参数进行编码呢,答案也是否定的。因为在参数中空格应该被编码为%20而不是被httputility.urlencode编码为加号(+),所以不推荐用这两个方法对uri进行编码。
uri.escapeuristring:用于对网址编码(不包含参数)
我们还是用例子说话:
string url1 = "//www.jb51.net/a file with spaces.html?a=1&b=博客园#abc";
response.write( uri.escapeuristring(url1));
//outputs:
//www.jb51.net/a%20file%20with%20spaces.html?a=1&b=%e5%8d%9a%e5%ae%a2%e5%9b%ad#abc
可以看出,uri.escapeuristring对空格进行了编码,也对中文进行了编码,但对冒号(:)、斜杠(/)和井号(#)未编码,所以此方法可以用于网址进行编码,但不能对参数进行编码,作用类似javascript中的encodeuri方法。
uri.escapedatastring:用于对网址参数进行编码
仍然用例子说话:
string url1 = "//www.jb51.net/a file with spaces.html?a=1&b=博客园#abc";
response.write(uri.escapedatastring(url1));
//outputs:
http%3a%2f%2fwww.jb51.net%2fa%20file%20with%20spaces.html%3fa%3d1%26b%3d%e5%8d%9a%e5%ae%a2%e5%9b%ad%23abc
可以看出,uri.escapedatastring对冒号(:)、斜杠(/)、空格、中文、井号(#)都进行了编码,所以此方法不可以用于网址进行编码,但可以用于对参数进行编码,作用类似javascript中的encodeuricomponent方法。
小结
在javascript中推荐的做法是用encodeuri对uri的网址部分编码,用encodeuricomponent对uri中传递的参数进行编码。
在c#中推荐的做法是用uri.escapeuristring对uri的网址部分编码,用uri.escapedatastring对uri中传递的参数进行编码。
解码部分就不说了,与编码方法相对应。
作者:天行健,自强不息
出处:http://artwl.cnblogs.com
javascript中编码有三种方法:escape、encodeuri、encodeuricomponent
c#中编码主要方法:httputility.urlencode、server.urlencode、uri.escapeuristring、uri.escapedatastring
javascript中的还好,只提供了三个,c#中主要用的就有这么多,还没有列出其他编码(html),一多就弄不明白,弄不明白就心生恐惧,心生恐惧就变得苦逼,本文就向大家详细解释在javascript及c#中如何对uri进行编码的方法(注:本文不涉及到其他编码)。
escape:不推荐使用
原因:eacape是bom中的方法,只能对ascii符号正确编码,而encodeuri、encodeuricomponent可以对所有的unicode符号编码。ecmascript v3 反对使用该方法,应用使用 decodeuri() 和 decodeuricomponent() 替代它。
escape不编码字符有69个:*,+,-,.,/,@,_,0-9,a-z,a-z
encodeuri:用于对网址编码(不包含参数)
encodeuri不编码字符有82个:!,#,$,&,',(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,a-z
encodeuri就是为这个而设计的。encodeuri不对uri中的特殊字符进行编码,如冒号(:)、斜杠(/)。下面看个示例:
复制代码 代码如下:
encodeuri("//www.jb51.net/a file with spaces.html")
// outputs //www.jb51.net/a%20file%20with%20spaces.html
可以看到仅仅把空格替换成了20%,所以此方法可用于对网址进行编码。
由于encodeuri不对冒号(:)、斜杠(/)进行编码,所以如果参数(如把网址作为参数)中包含冒号(:)、斜杠(/),就会解析出错,所以此方法不能对参数进行编码。
encodeuricomponent:用于对网址参数进行编码
encodeuricomponent不编码字符有71个:!, ',(,),*,-,.,_,~,0-9,a-z,a-z
可以看到此方法对:/都进行了编码,所以不能用它来对网址进行编码。由于此方法对中文,空格,井号(#),斜线(/),冒号(:)都进行了编码,所以适合对uri中的参数进行编码。看下面的示例:
复制代码 代码如下:
var param="博客园";
var url="//www.jb51.net/?key="+encodeuricomponent(param)+"&page=1";
console.log(url);//outputs //www.jb51.net/?key=%e5%8d%9a%e5%ae%a2%e5%9b%ad&page=1
可以看到,这正是我们想要的结果(这里只对需要编码的参数(page=1不需要编码)进行了编码)。
server.urlencode && httputility.urlencode:不推荐
把这两个放到一起说是因为这两个方法在绝大多数情况下是一样的。它们的区别是httputility.urlencode默认使用utf8格式编码,而server.urlencode是使用系统预设格式编码,server.urlencode使用系統预设编码做为参数调用httputility.urlencode编码,所以如果系统全局都用utf8格式编码,这两个方法就是一样的。
这两个方法是怎么编码的呢,我们来看个示例:
复制代码 代码如下:
string url1 = "//www.jb51.net/a file with spaces.html?a=1&b=博客园#abc";
response.write(httputility.urlencode(url1) );
//output
http%3a%2f%2fwww.jb51.net%2fa+file+with+spaces.html%3fa%3d1%26b%3d%e5%8d%9a%e5%ae%a2%e5%9b%ad%23abc
由上面的例子我们可以看出,httputility.urlencode对冒号(:)和斜杠(/)进行了编码,所以不能用来对网址进行编码。
那么能不能对参数进行编码呢,答案也是否定的。因为在参数中空格应该被编码为%20而不是被httputility.urlencode编码为加号(+),所以不推荐用这两个方法对uri进行编码。
uri.escapeuristring:用于对网址编码(不包含参数)
我们还是用例子说话:
复制代码 代码如下:
string url1 = "//www.jb51.net/a file with spaces.html?a=1&b=博客园#abc";
response.write( uri.escapeuristring(url1));
//outputs:
//www.jb51.net/a%20file%20with%20spaces.html?a=1&b=%e5%8d%9a%e5%ae%a2%e5%9b%ad#abc
可以看出,uri.escapeuristring对空格进行了编码,也对中文进行了编码,但对冒号(:)、斜杠(/)和井号(#)未编码,所以此方法可以用于网址进行编码,但不能对参数进行编码,作用类似javascript中的encodeuri方法。
uri.escapedatastring:用于对网址参数进行编码
仍然用例子说话:
复制代码 代码如下:
string url1 = "//www.jb51.net/a file with spaces.html?a=1&b=博客园#abc";
response.write(uri.escapedatastring(url1));
//outputs:
http%3a%2f%2fwww.jb51.net%2fa%20file%20with%20spaces.html%3fa%3d1%26b%3d%e5%8d%9a%e5%ae%a2%e5%9b%ad%23abc
可以看出,uri.escapedatastring对冒号(:)、斜杠(/)、空格、中文、井号(#)都进行了编码,所以此方法不可以用于网址进行编码,但可以用于对参数进行编码,作用类似javascript中的encodeuricomponent方法。
小结
在javascript中推荐的做法是用encodeuri对uri的网址部分编码,用encodeuricomponent对uri中传递的参数进行编码。
在c#中推荐的做法是用uri.escapeuristring对uri的网址部分编码,用uri.escapedatastring对uri中传递的参数进行编码。
解码部分就不说了,与编码方法相对应。
作者:天行健,自强不息
出处:http://artwl.cnblogs.com
上一篇: 教你怎样使用百度卫士来清理插件
下一篇: php对微信支付回调处理的方法