利用客户端缓存对网站进行优化的原理分析第1/2页

程序员文章站 2022-04-09 10:44:31

很多人首先会想从服务器缓存方面着手对程序进行优化,许多不同的服务器缓存方式都有他们自己的特点,像我曾经参与的一些项目中,根据缓存的命中率不同使用过 com+/enterpr...

很多人首先会想从服务器缓存方面着手对程序进行优化,许多不同的服务器缓存方式都有他们自己的特点,像我曾经参与的一些项目中,根据缓存的命中率不同使用过 com+/enterprise libiary caching/windows服务,静态文件等方式的服务器端缓存和 http compression技术,但客户端缓存往往却被人们忽略了,即使服务器的缓存让你的页面访问起来非常地快,但她依然需要依赖浏览器下载并输出,而当你加入客户端缓存时,会给你带来非常多的好处.因为她可以对站点中访问最频繁的页进行缓存充分地提高 web 服务器的吞吐量（通常以每秒的请求数计算）以提升应用程序性能和可伸缩性。
一个在线购物调查显示，大多数人愿意去商店排队，但在在线购物时却不愿意等待。websense调查公司称多达70%的上网者表示不愿意在页面读取上超过10秒钟。超过70%的人会因为中途速度过慢而取消当前的订单。

基础知识
1) 什么是”last-modified”?

在浏览器第一次请求某一个url时，服务器端的返回状态会是200，内容是你请求的资源，同时有一个last-modified的属性标记此文件在服务期端最后被修改的时间，格式类似这样：

last-modified: fri, 12 may 2006 18:53:33 gmt

客户端第二次请求此url时，根据 http 协议的规定，浏览器会向服务器传送 if-modified-since 报头，询问该时间之后文件是否有被修改过：

if-modified-since: fri, 12 may 2006 18:53:33 gmt

如果服务器端的资源没有变化，则自动返回 http 304 （not changed.）状态码，内容为空，这样就节省了传输数据量。当服务器端代码发生改变或者重启服务器时，则重新发出资源，返回和第一次请求时类似。从而保证不向客户端重复发出资源，也保证当服务器有变化时，客户端能够得到最新的资源。

2) 什么是”etag”?

http 协议规格说明定义etag为“被请求变量的实体值” （参见 —— 章节 14.19）。另一种说法是，etag是一个可以与web资源关联的记号（token）。典型的web资源可以一个web页，但也可能是json或xml文档。服务器单独负责判断记号是什么及其含义，并在http响应头中将其传送到客户端，以下是服务器端返回的格式：

etag: "50b1c1d4f775c61:df3"

客户端的查询更新格式是这样的：

if-none-match: w/"50b1c1d4f775c61:df3"

如果etag没改变，则返回状态304然后不返回，这也和last-modified一样。本人测试etag主要在断点下载时比较有用。

last-modified和etags如何帮助提高性能?
聪明的开发者会把last-modified 和etags请求的http报头一起使用，这样可利用客户端（例如浏览器）的缓存。因为服务器首先产生 last-modified/etag标记，服务器可在稍后使用它来判断页面是否已经被修改。本质上，客户端通过将该记号传回服务器要求服务器验证其（客户端）缓存。
过程如下:
1. 客户端请求一个页面（a）。
2. 服务器返回页面a，并在给a加上一个last-modified/etag。
3. 客户端展现该页面，并将页面连同last-modified/etag一起缓存。
4. 客户再次请求页面a，并将上次请求时服务器返回的last-modified/etag一起传递给服务器。
5. 服务器检查该last-modified或etag，并判断出该页面自上次客户端请求之后还未被修改，直接返回响应304和一个空的响应体。

下面的例子描述如何使用服务器端代码去操作客户端缓存:

上一篇：【最短路径Floyd算法详解推导过程】看完这篇，你还能不懂Floyd算法？还不会？

下一篇： PHP错误抑制符(@)导致引用传参失败Bug的分析

利用客户端缓存对网站进行优化的原理分析第1/2页