java 使用URLDecoder和URLEncoder对中文进行处理
java 使用urldecoder和urlencoder对中文进行处理
一 urlencoder
html 格式编码的实用工具类。该类包含了将 string 转换为 application/x-www-form-urlencoded mime 格式的静态方法。有关 html 格式编码的更多信息,请参阅 html 规范。
对 string 编码时,使用以下规则:
字母数字字符 "a" 到 "z"、"a" 到 "z" 和 "0" 到 "9" 保持不变。
特殊字符 "."、"-"、"*" 和 "_" 保持不变。
空格字符 " " 转换为一个加号 "+"。
所有其他字符都是不安全的,因此首先使用一些编码机制将它们转换为一个或多个字节。然后每个字节用一个包含 3 个字符的字符串 "%xy" 表示,其中 xy 为该字节的两位十六进制表示形式。推荐的编码机制是 utf-8。但是,出于兼容性考虑,如果未指定一种编码,则使用相应平台的默认编码。
例如,使用 utf-8 编码机制,字符串 "the string ü@foo-bar" 将转换为 "the+string+%c3%bc%40foo-bar",因为在 utf-8 中,字符 ü 编码为两个字节,c3 (十六进制)和 bc (十六进制),字符 @ 编码为一个字节 40 (十六进制)。
二 urldecoder
该类包含了将 string 从 application/x-www-form-urlencoded mime 格式解码的静态方法。
该转换过程正好与 urlencoder 类使用的过程相反。假定已编码的字符串中的所有字符为下列之一:"a" 到 "z"、"a" 到 "z"、"0" 到 "9" 和 "-"、"_"、"." 以及 "*"。允许有 "%" 字符,但是将它解释为特殊转义序列的开始。
转换中使用以下规则:
字母数字字符 "a" 到 "z"、"a" 到 "z" 和 "0" 到 "9" 保持不变。
特殊字符 "."、"-"、"*" 和 "_" 保持不变。
加号 "+" 转换为空格字符 " "。
将把 "%xy" 格式序列视为一个字节,其中 xy 为 8 位的两位十六进制表示形式。然后,所有连续包含一个或多个这些字节序列的子字符串,将被其编码可生成这些连续字节的字符所代替。可以指定对这些字符进行解码的编码机制,或者如果未指定的话,则使用平台的默认编码机制。
该解码器处理非法字符串有两种可能的方法。一种方法是不管该非法字符,另一种方法是抛出 illegalargumentexception 异常
简单示例:
try { string encodestr = urlencoder.encode("中国", "utf-8"); system.out.println("处理后:" + encodestr); string decodestr = urldecoder.decode(encodestr, "utf-8"); system.out.println("解码:" + decodestr); } catch (unsupportedencodingexception e) { // todo auto-generated catch block e.printstacktrace(); }
运行结果:
处理后:%e4%b8%ad%e5%9b%bd 解码:中国
感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!
上一篇: thinkPHP中_initialize方法实例分析
下一篇: java随机生成8位数授权码的实例
推荐阅读
-
java 使用URLDecoder和URLEncoder对中文进行处理
-
UrlDecoder和UrlEncoder使用详解_动力节点Java学院整理
-
UrlDecoder和UrlEncoder使用详解_动力节点Java学院整理
-
Java使用poi对Excel进行读和写处理
-
使用python对高光谱数据进行处理和分类
-
如何用 Python 中的 NLTK 对中文进行分析和处理?
-
编写一个Java应用程序,从键盘读取用户输入两个字符串,并重载3个函数分别实现这两个字符串的拼接、整数相加和浮点数相加。要进行异常处理,对输入的不符合要求的字符串提示给用户,不能使程序崩溃。
-
如何用 Python 中的 NLTK 对中文进行分析和处理?