Java中的UrlDecoder 和 UrlEncoder_动力节点Java学院整理

程序员文章站 2024-02-09 12:33:58

一 urlencoder html 格式编码的实用工具类。该类包含了将 string 转换为 application/x-www-form-urlencode...

一 urlencoder

html 格式编码的实用工具类。该类包含了将 string 转换为 application/x-www-form-urlencoded mime 格式的静态方法。有关 html 格式编码的更多信息，请参阅 html 规范。

对 string 编码时，使用以下规则：

字母数字字符 "a" 到 "z"、"a" 到 "z" 和 "0" 到 "9" 保持不变。

特殊字符 "."、"-"、"*" 和 "_" 保持不变。

空格字符 " " 转换为一个加号 "+"。

所有其他字符都是不安全的，因此首先使用一些编码机制将它们转换为一个或多个字节。然后每个字节用一个包含 3 个字符的字符串 "%xy" 表示，其中 xy 为该字节的两位十六进制表示形式。推荐的编码机制是 utf-8。但是，出于兼容性考虑，如果未指定一种编码，则使用相应平台的默认编码。

例如，使用 utf-8 编码机制，字符串 "the string " 将转换为 "the+string+%c3%bc%40foo-bar"，因为在 utf-8 中，字符 ü 编码为两个字节，c3 （十六进制）和 bc （十六进制），字符 @ 编码为一个字节 40 （十六进制）。

二 urldecoder

该类包含了将 string 从 application/x-www-form-urlencoded mime 格式解码的静态方法。

该转换过程正好与 urlencoder 类使用的过程相反。假定已编码的字符串中的所有字符为下列之一："a" 到 "z"、"a" 到 "z"、"0" 到 "9" 和 "-"、"_"、"." 以及 "*"。允许有 "%" 字符，但是将它解释为特殊转义序列的开始。

转换中使用以下规则：

字母数字字符 "a" 到 "z"、"a" 到 "z" 和 "0" 到 "9" 保持不变。

特殊字符 "."、"-"、"*" 和 "_" 保持不变。

加号 "+" 转换为空格字符 " "。

将把 "%xy" 格式序列视为一个字节，其中 xy 为 8 位的两位十六进制表示形式。然后，所有连续包含一个或多个这些字节序列的子字符串，将被其编码可生成这些连续字节的字符所代替。可以指定对这些字符进行解码的编码机制，或者如果未指定的话，则使用平台的默认编码机制。

该解码器处理非法字符串有两种可能的方法。一种方法是不管该非法字符，另一种方法是抛出 illegalargumentexception 异常

简单示例：

java代码

try { 
      string encodestr = urlencoder.encode("中国", "utf-8"); 
      system.out.println("处理后:" + encodestr); 
      string decodestr = urldecoder.decode(encodestr, "utf-8"); 
      system.out.println("解码:" + decodestr); 
    } catch (unsupportedencodingexception e) { 
      // todo auto-generated catch block 
      e.printstacktrace(); 
    }

运行结果：

java代码

处理后:%e4%b8%ad%e5%9b%bd 
解码:中国

上一篇： oracle删除表字段和oracle表增加字段

下一篇： Mysql更换MyISAM存储引擎为Innodb的操作记录总结

Java中的UrlDecoder 和 UrlEncoder_动力节点Java学院整理

jQuery查找和过滤_动力节点节点Java学院整理

Apache和Nginx的优缺点详解_动力节点Java学院整理

Java类之间的关系图_动力节点Java学院整理

Java的动态绑定与双分派_动力节点Java学院整理

Java中实现线程的三种方式及对比_动力节点Java学院整理

Filter、Servlet、Listener的学习_动力节点Java学院整理

Java中Random简介_动力节点Java学院整理

Java中的clone方法详解_动力节点Java学院整理

Java多线程的其他知识_动力节点Java学院整理

Java中线程的等待与唤醒_动力节点Java学院整理