js中编码函数:escape,encodeURI与encodeURIComponent详解
1、eacape(): 该方法不会对 ascii 字母和数字进行编码,也不会对下面这些 ascii 标点符号进行编码: * @ - _ + . / 。其他所有的字符都会被转义序列替换。其它情况下escape,encodeuri,encodeuricomponent编码结果相同。
escape对0-255以外的unicode值进行编码时输出%u****格式
可以使用 unescape() 对 escape() 编码的字符串进行解码。
ecmascript v3 反对使用该方法,应用使用 decodeuri() 和 decodeuricomponent() 替代它。
2、encodeuri 和 encodeuricomponent
encodeuri 和 encodeuricomponent都是ecma-262标准中定义的函数,所有兼容这个标准的语言(如javascript, actionscript)都会实现这两个函数。它们都是用来对uri (rfc-2396)字符串进行编码的全局函数,但是它们的处理方式和使用场景有所不同。为了解释它们的不同,我们首先需要理解rfc-2396中对于 uri中的字符分类:
1>保留字符(reserved characters):这类字符是uri中的保留关键字符,它们用于分割uri中的各个部分。这些字符是:";" | "/" | "?" | ":" | "@" | "&" | "=" | "+" | "$" | ","
2>mark字符(mark characters):这类字符在rfc-2396中特别定义,但是没有特别说明用途,可能是和别的rfc标准相关。 这些字符是:"-" | "_" | "." | "!" | "~" | "*" | "'" | "(" | ")"
3>基本字符(alphanum characters):这类字符是uri中的主体部分,它包括所有的大写字母、小写字母和数字。
在介绍完上面三类字符串后,我们就非常容易来解释encodeuri和encodeuricomponent函数的不同之处了:
encodeuri: 该函数对传入字符串中的所有非(基本字符、mark字符和保留字符)进行转义编码(escaping)。所有的需要转义的字符都按照utf-8编码转化成 为一个、两个或者三个字节的十六进制转义字符(%xx)。例如,字符空格" "转换成为"%20"。在这种编码模式下面,需要编码的ascii字符用一个字节转义字符代替,在\u0080和\u007ff之间的字符用两个字节转义字符代替,其他16为unicode字符用三个字节转义字符代替。
encodeuricomponent: 该函数处理方式和encodeuri只有一个不同点,那就是对于保留字符同样做转义编码。这样url中的参数和值才不会被#等特殊字符截断。 比如:http://localhost:8080/xss/xssservlet?username=a&t plastic,该url,后台的代码:
string username = request.getparameter("username");
获得的username值为a,而不是我们希望的 a&t plastic。因为 username=a&t plastic,其中含有了保留字符&,并且没有进行编码,所以username的值被其给截断了。所以正确的做法是,对其进行编码:encodeuricomponent("a&t plastic") == a%26t%20plastic,然后将上面的连接改为:
http://localhost:8080/xss/xssservlet?username=a%26t%20plastic,后台才能获得正确的值:username==a&t plastic。
因为username的值含有了uri的保留字符,所以需要进行编码。
例如,字符":"被转义字符"%3a"代替
之 所以有上面两个不同的函数,是因为我们在写js代码的时候对uri进行两种不同的编码处理需求。encodeuri可以用来对完整的uri字符串进行编码处理。而encodeuricomponent可以对uri中一个部分进行编码,从而让这一部分可以包含一些uri保留字符。这在我们日常编程中是十分有用的。比如下面的uri字符串:
http://www.mysite.com/send-to-friend.aspx?url=http://www.mysite.com/product.html
在 这个uri字符串中。send-to-friend.aspx页面会创建html格式的邮件内容,里面会包含一个链接,这个链接的地址就是上面uri字符 串中的url值。显然上面的url值是uri中的一个部分,里面包含了uri保留关键字符。我们必须调用encodeuricomponent对它进行编 码后使用,否则上面的uri字符串会被浏览器认为是一个无效的uri。
正确的uri应该如下:
http://www.mysite.com/send-to-friend.aspx?url=http%3a%2f%2fwww.mysite.com%2fproduct.html
最多使用的应为encodeuricomponent,它是将中文、韩文等特殊字符转换成utf-8格式的url编码,所以如果给后台传递参数需要使用encodeuricomponent时需要后台解码对utf-8支持(form表单中的编码方式和当前页面编码方式相同)
escape不编码字符有69个:*,+,-,.,/,@,_,0-9,a-z,a-z
encodeuri不编码字符有82个:!,#,$,&,',(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,a-z
encodeuricomponent不编码字符有71个:!, ',(,),*,-,.,_,~,0-9,a-z,a-z
例子:
alert(encodeuricomponent("a&t plastic")); //a%26t%20plastic alert(escape("a&t plastic")); //a%26t%20plastic alert(encodeuri("a&t plastic")); //a&t%20plastic alert(escape("a&t plastic中")); //a%26t%20plastic%ufffd%ufffd
我们看到 encodeuri 没有编码uri的保留字符 & ,'中'被编码成了 %ufffd%ufffd
encodeuricomponent 就编码了保留字符& 。
url的编码经常会被利用在xss攻击中来绕过服务端的 xss filter, 对有威胁的url进行伪装,让不明用户去点击。
所以如果只是处理 get 提交时url地址中的乱码问题,可以使用 encodeuri 来编码整个url;
如果参数中含有保留字符需要进行编码,那么应该使用 encodeuricomponent 来编码部分参数;
如果使用encodeuricomponent来处理中文乱码,那么前端需要使用两次encodeuricomponent(encodeuricomponent('你好')),java后端使用:
java.net.urldecoder.decode(param,"utf-8");
来解码;
参考:
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对的支持。
上一篇: 产品和服务是两种永恒的网站赢利模式
下一篇: js弹出窗口简单实现代码
推荐阅读
-
js中编码函数:escape,encodeURI与encodeURIComponent详解
-
JS中变量与函数提升步骤详解
-
Python中关于字符编码与函数的使用详解
-
详解js中函数的相关定义与用法
-
js中字符串编码函数escape()、encodeURI()、encodeURIComponent()区别详解_javascript技巧
-
js中escape()、encodeURI()、encodeURIComponent()的区别有哪些
-
Python中关于字符编码与函数的使用详解
-
JS和PHP中URL编码转换:escape()、encodeURI()、encodeURIComponent()
-
js中编码函数:escape,encodeURI与encodeURIComponent详解
-
JS中变量与函数提升步骤详解