欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

HTTP中的Accept-Encoding、Content-Encoding、Transfer-Encoding、Content-Type

程序员文章站 2022-11-07 18:41:03
Accept Encoding和Content Encoding Accept Encoding和Content Encoding是HTTP中用来对采用何种压缩格式传输正文进行协定的一对header。工作原理如下: 浏览器发送请求,通过Accept Encoding带上自己支持的内容编码格式列表 服 ......

accept-encoding和content-encoding

accept-encoding和content-encoding是http中用来对采用何种压缩格式传输正文进行协定的一对header。工作原理如下:

  • 浏览器发送请求,通过accept-encoding带上自己支持的内容编码格式列表
  • 服务端从中挑选一个用来对正文进行编码,并通过content-encoding响应头指明响应编码格式。
  • 浏览器拿到响应正文后,根据content-encoding进行解压缩。服务端若响应未压缩的正文,则不允许返回content-encoding。

压缩类型:

  • gzip:表示采用 lempel-ziv coding (lz77) 压缩算法,以及32位crc校验的编码方式
  • compress:采用lempel-ziv-welch (lzw) 压缩算法。
  • deflate:表示采用 zlib 结构 (在 rfc 1950 中规定),和 deflate 压缩算法(在 rfc 1951 中规定)。
  • identity:用于指代自身(未经过压缩和修改)。除非特别指明,这个标记始终可以被接受。
  • br:表示采用brotli 算法的编码方式。

内容编码:

  1. 内容编码针对的只是传输正文。http/1中,header始终是以ascii文本传输,没有经过任何压缩;http/2中引入header压缩技术。

传输编码transfer-encoding

  • 用于表示节点之间传输message的编码方式。最典型是分块传输(chunked)
  • 是一个响应header

transfer-encoding支持类型:

  • chunked
  • compress
  • deflate
  • gzip
  • identit
  • 多个类型可以共存

gzip+curl例子:

echo "content=web%20%e5%ae%89%e5%85%a8%e6%98%af%e4%b8%80%e9%a1%b9%e7%b3%bb%e7%bb%9f%e5%b7%a5%e7%a8%8b%ef%bc%8c%e4%bb%bb%e4%bd%95%e7%bb%86%e5%be%ae%e7%96%8f%e5%bf%bd%e9%83%bd%e5%8f%af%e8%83%bd%e5%af%bc%e8%87%b4%e6%95%b4%e4%b8%aa%e5%ae%89%e5%85%a8%e5%a0%a1%e5%9e%92%e5%9c%9f%e5%b4%a9%e7%93%a6%e8%a7%a3%e3%80%82" | gzip -c > data.txt.gz

curl -v --data-binary @data.txt.gz -h'content-type: application/x-www-form-urlencoded; charset=utf-8' -h'content-encoding: gzip' -x post https://qgy18.com/node/

transfer-encoding与content-encoding的区别:

  1. transfer-encoding只是在传输过程中才有的,并发请求url对应实体的本身特性。
  2. transfer-encoding是一个"跳到跳"的header,而content-encoding是"端到端"的header。

content-type

content-type是http的实体首部,用于说明请求或者返回的消息主体是用何种方式编码(即资源的mime类型)。在请求、响应header中均存在。

示例如下:

content-type: text/html; charset=utf-8
content-type: multipart/form-data; boundary=something

参数一般包含:

  • media-type:资源或者数据的mime type
  • charset:字符编码标准
  • boundary:多于多部实体,boundary是必需的。其包括一组1到70个字符,用于封装消息的多个部分的边界。

media-type常用类型:

  • application/x-www-form-urlencoded
    • form表单或者提交的数据按照key1=value1&key2=value2方式进行编码,key、value均进行了urlencode
  • multipart/form-data
    • 常见的post数据提交的方式,使用form进行文件上传的时候,必须让form的enctype为这个。
  • application/json
    • 消息主体是序列化后的json字符串。
  • text/html

    • 是一种用http作为传输协议,xml作为编码方式的远程调用规范。