欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

HTTP请求的缓存(Cache)机制

程序员文章站 2022-07-09 21:26:43
当资源资源第一次被访问的时候,http status返回200,在头部携带当前资源的描述信息,eg: 最后修改的时间:```Last-Modified``` 资源状态唯一标识:```Etag``` 资源在客户端缓存的过期时间:```Expires``` 同时浏览器会将资源缓存到cache目录,... ......

先来一张图:

HTTP请求的缓存(Cache)机制

 

####下面简单的来描述一下http cache机制

当资源资源第一次被访问的时候,http status返回200,在头部携带当前资源的描述信息,eg:

最后修改的时间:```last-modified```
资源状态唯一标识:```etag```
资源在客户端缓存的过期时间:```expires```


同时浏览器会将资源缓存到cache目录,并保存文件描述信息。

当客户端第二次请求资源时,会先检查cache目录中是否含有该资源,如果有,并且还没到expires设置的时间,
即文件还没有过期,那么此时客户端将直接从cache目录中读取文件,而不再发送请求

如果资源已经过期,客户端会发送一次http请求到服务器,同时在header携带上次修改的时间:
```text
if-modified-since thu, 26 nov 2009 13:50:19 gmt
if-none-match "8fb8b-14-4794674acdcc0"
```

####为什么会返回上一次的信息呢?

web服务器在接收到请求时,会先解析header里面的信息,然后校验头部信息。
如果该资源文件从上次时间到现在都没有修改或者etag信息没有变化,,则web服务器将会直接返回304状态,
从而不会在资源文件,状态头部信息如下:
```text
(status-line) http/1.1 304 not modified
date thu, 26 nov 200914:09:07 gmt
server apache/2.2.11 (unix)php/5.2.9
connection keep-alive
keep-alive timeout=5, max=100
etag "8fb8b-14-4794674acdcc0"
```

这样,就能够很大程度上减少网络带宽以及提升用户的浏览器体验。
当然,如果服务器经过匹配发现文件修改过了,就会将文件资源返回,并带上新文件状态信息。


####基本字段

```expires:```
文件在本地缓存的过期时间,如果客户端发现缓存中的文件没有过期,则不发送请求


```cache-control:```
cache-control指定请求和响应遵循的缓存机制。
在请求消息或响应消息中设置cache-control并不会修改另一个消息处理过程中的缓存处理过程。

请求时的缓存指令包括
```text
no-cache
no-store
max-age
max-stale
min-fresh
only-if-cached
```
响应消息中的指令包括
```text
public
private
no-cache
no- store
no-transform
must-revalidate
proxy-revalidate
max-age
```

####指令含义:

```public:```

响应可被任何缓存区缓存。

```private:```

对于单个用户的整个或部分响应消息,不能被共享缓存处理。
这允许服务器仅仅描述当用户的部分响应消息,此响应消息对于其他用户的请求无效。   

```no-cache:```

请求或响应消息不能缓存。

```no-store:```

用于防止重要的信息被无意的发布。
在请求消息中发送将使得请求和响应消息都不使用缓存。

```max-age:```

客户端可以接收生存期不大于指定时间(以秒为单位)的响应。  

```min-fresh:```

客户机可以接收响应时间小于当前时间加上指定时间的响应。   

```max-stale:```

客户端可以接收超出超时期间的响应消息。
如果指定max-stale消息的值,那么客户端可以接收超出超时期指定值之内的响应消息。

 


####```etag/if-none-match``` 

一对验证文件实体的标记 "entity tag:的响应/请求头.
apache中,etag的值,默认是对文件的索引节(inode),大小(size)和最后修改时间(mtime)进行hash后得到的

```last-modified/if-modified-since:```

一对验证文件的修改时间的响应/请求头

expires、 cache-control、last-modified、etag是rfc2616(http/1.1)协议中和网页缓存相关的几个字段。 前两个用来控制缓存的失效日期,浏览器可通过它来判定,需不需要发出http请求; 后两个用来验证网页的有效性,服务器端利用它来验证这个文件是否需要重新返回last-modified vs etag

既然有了last-modified,为什么还要用etag字段呢?因为如果在一秒钟之内对一个文件进行两次更改,last-modified就会不正确。因此,http/1.1利用entity tag头提供了更加严格的验证。