欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

详谈java编码互转(application/x-www-form-urlencoded)

程序员文章站 2024-02-12 12:11:10
本质上来说,java.net.urlencoder适用于将 string 转换为 application/x-www-form-urlencoded mime 格式的静态方...

本质上来说,java.net.urlencoder适用于将 string 转换为 application/x-www-form-urlencoded mime 格式的静态方法 时 ,使用

但!一般情况下,web应用中,当你的服务器,页面编码,请求时编码都已经修改为 utf-8后,依然乱码时,此时则应试着用下方所写到的方法

使用urldecoder将所乱码的数据进行解码,

而在此处简单说一下乱码的场景和简单转换时的执行原理:

首先,form表单提示数据时,默认content-type:为 application/x-www-form-urlencoded,

当然也可以是:multipart/form-data ,multipart/form-data 一般用做form表单以流的形式提交数据时,则设置,enctype为该form-data形式,

不过呢,一般情况下,本宝宝桑面 提到了,提交方式为application/x-www-form-urlencoded, 当 环境等等都已经配置为统一编码后,仍然出现汉字

传到后台 被解码处理的情况时(也就是所谓的乱码 ),此时可以尝试,该文下面所提到的方法,使用urldecoder进行解码再转换,然后转换为汉字,

当然在使用场景上,其实还是有很多情况下需要区分的,当然 也是必须严格按照 格式 来做相对应的处理也才是最正确的方法,目前有些事情需要处理一下

先到这里喽,^_^ bye

java  使用urldecoder和urlencoder对中文进行处理

一 urlencoder

html 格式编码的实用工具类。该类包含了将 string 转换为 application/x-www-form-urlencoded mime 格式的静态方法。有关 html 格式编码的更多信息,请参阅 html 规范。

对 string 编码时,使用以下规则:

字母数字字符 "a" 到 "z"、"a" 到 "z" 和 "0" 到 "9" 保持不变。

特殊字符 "."、"-"、"*" 和 "_" 保持不变。

空格字符 " " 转换为一个加号 "+"。

所有其他字符都是不安全的,因此首先使用一些编码机制将它们转换为一个或多个字节。然后每个字节用一个包含 3 个字符的字符串 "%xy" 表示,其中 xy 为该字节的两位十六进制表示形式。推荐的编码机制是 utf-8。但是,出于兼容性考虑,如果未指定一种编码,则使用相应平台的默认编码。

例如,使用 utf-8 编码机制,字符串 "the string ü@foo-bar" 将转换为 "the+string+%c3%bc%40foo-bar",因为在 utf-8 中,字符 ü 编码为两个字节,c3 (十六进制)和 bc (十六进制),字符 @ 编码为一个字节 40 (十六进制)。

二 urldecoder

该类包含了将 string 从 application/x-www-form-urlencoded mime 格式解码的静态方法。

该转换过程正好与 urlencoder 类使用的过程相反。假定已编码的字符串中的所有字符为下列之一:"a" 到 "z"、"a" 到 "z"、"0" 到 "9" 和 "-"、"_"、"." 以及 "*"。允许有 "%" 字符,但是将它解释为特殊转义序列的开始。

转换中使用以下规则:

字母数字字符 "a" 到 "z"、"a" 到 "z" 和 "0" 到 "9" 保持不变。

特殊字符 "."、"-"、"*" 和 "_" 保持不变。

加号 "+" 转换为空格字符 " "。

将把 "%xy" 格式序列视为一个字节,其中 xy 为 8 位的两位十六进制表示形式。然后,所有连续包含一个或多个这些字节序列的子字符串,将被其编码可生成这些连续字节的字符所代替。可以指定对这些字符进行解码的编码机制,或者如果未指定的话,则使用平台的默认编码机制。

该解码器处理非法字符串有两种可能的方法。一种方法是不管该非法字符,另一种方法是抛出 illegalargumentexception 异常

以上这篇详谈java编码互转(application/x-www-form-urlencoded)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。