http1.X与2.0
HTTP
HTTP 1.X
HTTP是建立在TCP协议上的,HTTP协议的瓶颈及优化都是基于TCP协议本身的特性。
TCP建立连接时有三次握手 会有1.5RTT的延迟,为了避免每次请求都经历握手待来的延迟,应用层会选择不同策略的http长连接。
HTTP 1.0 连接不能复用以及有head of line blocking问题。
http1.0协议头里可以设置Connection:Keep-Alive。在header里设置Keep-Alive可以在一定时间内复用连接,具体复用时间的长短可以由服务器控制,一般在15s左右。到http1.1之后Connection的默认值就是Keep-Alive,如果要关闭连接复用需要显式的设置Connection:Close。 <br /> head of line blocking会因为一个request没有到达服务器或者一个response因为网络没有及时返回而影响后续所有请求。
连接复用问题
tcp长链接
http long-polling
客户端在初始状态会发送一个polling请求到服务器,服务器并不会马上返回业务数据,而是等待有新的业务数据产生时返回。所以连接会被保持,一旦结束马上又会发起一个新的polling请求,反复如此。
http streaming
与long-polling不同,server并不会结束初始的streaming请求,而是持续的通过这个通道返回最新的业务数据,但这个通道时单向的。
web socket
与传统的 tcp socket连接相似,也是基于tcp协议,并提供双向的数据通道。
解决head of line blocking
http pipelining
让每个请求不用等待其他请求的response返回之后才发出,而是几乎在同一时间把request发送给服务器。
SPDY
http 1.X存在诸多问题,在尝试了各种优化手段后提出的SPDY方案。
SPDY目标
- 降低延迟,客户端的单连接单请求,server的FIFO响应队列都是延迟的大头。
- http最初设计都是客户端发起请求,然后server响应,server无法主动push内容到客户端。
- 压缩http header,http1.x的header越来越膨胀,cookie和user agent很容易让header的size增至1kb大小,甚至更多。而且由于http的无状态特性,header必须每次request都重复携带,很浪费流量。
SPDY基础功能
- 多路复用。多路复用通过多个请求stream共享一个tcp连接的方式,解决了http 1.x hold of line blocking 的问题,降低了延迟同时提高了带宽的利用率。
- 请求优先级。多路复用带来一个新的问题,在连接共享的基础上可能导致一些关键请求被阻塞。
- header压缩。 http1.X的 header很多时候都是重复多余的。选择合适的压缩算法可以减小包的大小和数量。
SPDY高级功能
- server推送。 http1.x只能由客户端发起请求,然后服务器被动的发送response。开启server push之后,server通过
X-Associated-Content header
告知客户端会有新的内容推送过来。 - server暗示。 和server push不同的是,server hint并不会主动推送内容,只是告诉有新的内容产生,内容的下载还是需要客户端主动发起请求。server hint通过
X-Subresources header
来通知。
HTTP 2.0
- 客户端向server发送request这种基本模式不会变。
- 老的scheme不会变,使用
http://和https://
的服务和应用不会要做任何更改。 - 使用http1.x的客户端和服务器可以无缝的通过代理方式转接到http2.0 上
- 不识别http2.0的代理服务器可以将请求降级到http1.x
HTTP 2.0主要改动
新的二进制格式
http 1.x是明文协议,格式由strat line
,header
,body
组成。需要做协议解析来识别这3哥部分,http1.x的解析是基于文本的,而文本格式解析存在天然缺陷,二进制比文本格式更方便且健壮。
http 2.0的格式定义更接近tcp。由Length
,Type
,Flags
,Stream ID
,Payload
5个部分组成。
-
length
定义了整个frame的开始到结束 -
type
定义frame的类型 -
flags
用bit位定义了一些重要的参数 -
stream id
用作流控制 -
payload
就是request的正文
连接共享
stream id
作用就是连接共享机制,一个request对应一个stream并分配一个id,这样一个连接上可以有多个stream,每个stream的frame随机混杂在一起,接收方根据stream id将frame再归属到各自不同的request里面。每个stream都可以设置优先级和依赖。
header压缩
http2.0使用encoder来减少需要传输的header大小,通讯双方各自cache一份header fields表,避免重复header传输,减少传输大小。
压缩算法选择
SPDY/2使用的是gzip 压缩算法,后来出现BREACH
和CRIME
2种攻击方式,即使走SSL的SPDY也可以破解内容,http2.0采用HPACK
的压缩算法。
重置连接表现
对于http 1.x来说,是通过设置tcp segment里的reset flag来通知对端关闭连接。http2.0引入RST_STREAM
类型的frame,可以在不断开连接的前提下取消某个request的stream。
流量控制
http2.0 通过类似receive window
的做法,数据的接收方通过告知对方自己的flow window
大小表明自己还能接收多少数据。只有Data类型的 frame才有流量控制功能。
服务推送
http2.0 通过push的方式将客户端需求的内容预先推送过去,也叫cache push
。如果客户端退出,需取消server push
,可以通过发送RST_STREAM
类型的frame来做到。
Nagle Algorithm/TCP Delayed Ack
Nagle Algorithm/TCP Delayed Ack
是一组对立的算法。http2.0可以通过TCP_NODELAY
禁用Nagle或TCP_QUICKACK
禁用ACK。官方推荐设置TCP_NODELAY
更安全的SSL
HTTP2.0使用了tls的拓展ALPN来做协议升级,除此之外加密这块还有一个改动,HTTP2.0对tls的安全性做了近一步加强