欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

利用客户端缓存对网站进行优化的原理分析第1/2页

程序员文章站 2022-04-09 10:44:31
很多人首先会想从服务器缓存方面着手对程序进行优化,许多不同的服务器缓存方式都有他们自己的特点,像我曾经参与的一些项目中,根据缓存的命中率不同使用过 com+/enterpr...
很多人首先会想从服务器缓存方面着手对程序进行优化,许多不同的服务器缓存方式都有他们自己的特点,像我曾经参与的一些项目中,根据缓存的命中率不同使用过 com+/enterprise libiary caching/windows服务,静态文件等方式的服务器端缓存和 http compression技术,但客户端缓存往往却被人们忽略了,即使服务器的缓存让你的页面访问起来非常地快,但她依然需要依赖浏览器下载并输出,而当你加入客户端缓存时,会给你带来非常多的好处.因为她可以对站点中访问最频繁的页进行缓存充分地提高 web 服务器的吞吐量(通常以每秒的请求数计算)以提升应用程序性能和可伸缩性。
一个在线购物调查显示,大多数人愿意去商店排队,但在在线购物时却不愿意等待。websense调查公司称多达70%的上网者表示不愿意在页面读取上超过10秒钟。超过70%的人会因为中途速度过慢而取消当前的订单。


基础知识
1) 什么是”last-modified”?

在浏览器第一次请求某一个url时,服务器端的返回状态会是200,内容是你请求的资源,同时有一个last-modified的属性标记此文件在服务期端最后被修改的时间,格式类似这样:

last-modified: fri, 12 may 2006 18:53:33 gmt

客户端第二次请求此url时,根据 http 协议的规定,浏览器会向服务器传送 if-modified-since 报头,询问该时间之后文件是否有被修改过:

if-modified-since: fri, 12 may 2006 18:53:33 gmt

如果服务器端的资源没有变化,则自动返回 http 304 (not changed.)状态码,内容为空,这样就节省了传输数据量。当服务器端代码发生改变或者重启服务器时,则重新发出资源,返回和第一次请求时类似。 从而保证不向客户端重复发出资源,也保证当服务器有变化时,客户端能够得到最新的资源。

2) 什么是”etag”?

http 协议规格说明定义etag为“被请求变量的实体值” (参见 —— 章节 14.19)。 另一种说法是,etag是一个可以与web资源关联的记号(token)。典型的web资源可以一个web页,但也可能是json或xml文档。服务器单独负责判断记号是什么及其含义,并在http响应头中将其传送到客户端,以下是服务器端返回的格式:

etag: "50b1c1d4f775c61:df3"

客户端的查询更新格式是这样的:

if-none-match: w/"50b1c1d4f775c61:df3"

如果etag没改变,则返回状态304然后不返回,这也和last-modified一样。本人测试etag主要在断点下载时比较有用。


last-modified和etags如何帮助提高性能?
聪明的开发者会把last-modified 和etags请求的http报头一起使用,这样可利用客户端(例如浏览器)的缓存。因为服务器首先产生 last-modified/etag标记,服务器可在稍后使用它来判断页面是否已经被修改。本质上,客户端通过将该记号传回服务器要求服务器验证其(客户端)缓存。
过程如下:
1. 客户端请求一个页面(a)。
2. 服务器返回页面a,并在给a加上一个last-modified/etag。
3. 客户端展现该页面,并将页面连同last-modified/etag一起缓存。
4. 客户再次请求页面a,并将上次请求时服务器返回的last-modified/etag一起传递给服务器。
5. 服务器检查该last-modified或etag,并判断出该页面自上次客户端请求之后还未被修改,直接返回响应304和一个空的响应体。

下面的例子描述如何使用服务器端代码去操作客户端缓存:
1