HTTP协议详解
HTTP简介
1.WEB浏览器与WEB服务器之间的一问一答的交互过程必须遵循一定的规则,这个规则就是HTTP协议。
2.HTTP是hypertext tranfer protocol(超文本传输协议)的简写,它是TCP/IP协议几种的一个应用层协议,用于定义WEB浏览器与WEB服务器之间交换数据的过程以及数据本身的格式。
3.HTTP协议的版本
HTTP/1.0、HTTP/1.1、HTTP-NG
4.深入理解HTTP协议,对管理和维护复杂的WEB站点、开发具有特殊用途的WEB服务器程序具有直接影响。
HTTP1.0的会话方式
1.四个步骤:建立连接、发出请求信息、回送响应信息、关闭连接。
2.浏览器与WEB服务器的连接过程是短暂的,每次连接只处理一个请求和响应。对每一个页面的访问,浏览器与WEB服务器都有建立一次单独的连接
3.浏览器到WEB服务器之间的所有通讯都是完全独立分开的请求和响应对。
4.支持代理:
请求链-------------------------------------------------------------------------->
WEB浏览器------------------------代理服务器----------------------------WEB服务器
<--------------------------------------------------------------------------- 响应链
浏览器访问多图网页的过程(略)
HTTP1.1与HTTP1.0的比较
1.HTTP1.1的特点
在一个TCP连接上可以传送多个HTTP请求和响应
多个请求和响应可以重叠进行
增加了更多的请求头和响应头
HTTP请求消息
1.请求消息的结构
一个请求行、若干消息头、以及实体内容,其中的一些消息头和实体内容都是可选的,消息头和实体内容之间要用空行隔开。
举例:
GET /books/java.html HTTP/1.1 //请求行
Aceept: */* /*
Aceept-Language: en-us
Connection: Keep-Alive
Host: localhost 多个消息头
Referer: http://localhost/links.asp
User-Agent: Mozilla/4.0
Accept-Encoding: gzip,deflate */
//一个空行
HTTP响应消息
1.响应消息的结构:
一个状态行、若干消息头、以及实体内容,其中的一些消息头和实体内容都是可选的,消息头和实体内容之间要用空行隔开。
举例:
HTTP/1.1 200 OK //状态行
Server: Mircrosoft-IIS/5.0 /*
Date: Thu, 13 Jul 2000 05:46:53 GMT
Content-Length: 2291 多个消息头
Content-Type: text/html
Cache-control: private */
// 一个空行
<HTML> /*
<BODY> 实体内容
.............. */
HTTP消息---->其它细节
1.响应消息的实体内容就是网页文件的内容,也就是在浏览器中使用查看源文件的方式所看到的内容。
2.一个使用GET方式的请求消息中不能包含实体内容,只有使用POST、PUT和DELETE方式的请求消息中才可以包含实体内容。
3.对于HTTP1.1来说,如果HTTP消息中包括实体内容,且没有采用chunked传输编码方式,那么消息头部分必须包含内容长度的字段,否则,客户和服务程序就无法知道实体内容何时结束。
4.在HTTP协议中,还可以使用简单的请求消息和响应消息,它们都没有消息头部分。简单的请求消息只能用于GET方式,且请求行中不用指定HTTP版本号。对于简单的请求消息,服务器返回简单的响应消息,简单的响应消息中只返回实体内容。
HTTP消息头
1.使用消息头,可以实现HTTP客户机与服务器之间的条件请求和应答,消息头相当于服务器和浏览器之间的一些暗号指令。
2.每个消息头包含一个头字段名称,然后依次是冒号、空格、值、回车和换行符。
举例:Aceept-Language: en-us
3.消息头字段名是不区分大小写的,但习惯上将每个单词的第一个字母大写。
4.整个消息头部分中的各行消息头可按任何顺序排列。
5.消息头又可以分为通用消息头、请求头、响应头、实体头等四类。
6.许多请求头字段都允许客户端在值部分指定多个可接受的选项,多个项之间以逗号分隔。
举例:Aceept-Encoding: gzip, compress
7.有些头字段可以出现多次,例如,响应消息中可以包含多个"Warning"头字段。
请求行与状态行
1.请求行
格式:请求方式 资源路径 HTTP版本号<CRLF>
举例:GET /test.html HTTP/1.1
请求方式:POST、HEAD、OPTIONS、DELETE、 TRACE、 PUT
2.状态行
格式: HTTP版本行 状态码 原因叙述<CRLF>
举例: HTTP/1.1 200 OK
HTTP规范定义了8种可能的请求方法:
GET 检索URI中标识资源的一个简单请求
HEAD 与GET方法相同,服务器只返回状态行和头标,并不返回请求文档
POST 服务器接受被写入客户端输出流中的数据的请求
PUT 服务器保存请求数据作为指定URI新内容的请求
DELETE 服务器删除URI中命名的资源的请求
OPTIONS 关于服务器支持的请求方法信息的请求
TRACE Web服务器反馈Http请求和其头标的请求
CONNECT 已文档化但当前未实现的一个方法,预留做隧道处理
使用GET和POST方式传递参数
1.在URL地址后面可以附加一些参数
举例:http://www.it315.org/servlet/ParamsServlet?param1=abc¶m2=xyz
2.GET方式
举例:GET /servlet/ParamsServlet?param1=abc¶m2=xyz HTTP/1.1
特点:传送的数据量是有限制的,一般限制在1KB以下
3.POST方式
举例:
POST /servlet/ParamsServlet HTTP/1.1
Host:
Content-Type: application/x-www-form-urlencoded
Content-Length: 28
param1=abc¶m2=xyz
特点:传送的数据量要比GET方式传送的数据量大得多
响应状态码
1.响应状态码用于服务器对请求的各种不同处理结果和状态,它是一个三位的十进制数。响应码可归为5种类别,使用最高位为1到5来进行分类,如下所示:
100-199:表示成功接收请求,要求客户端继续提交下一次请求才能完成整个处理过程。
200-299:表示成功接收请求并已完成整个处理过程。
300-399:为完成请求,客户需进一步细化请求。例如,请求的资源已经移动一个新地址。
400-499:客户端的请求有错误。
500-599:服务器端出现错误。
2.响应状态码---->典型情况
200(正常):表示一切正常,返回的是正常请求结果。
206(部分内容):客户发送了一个带有Range头(要求服务器只返回文档中的部分内容)的GET请求。
302/307(临时重定向):指定被请求的文档已被临时移动到别处,此文档的新URL在Location响应头中给出。
304(未修改):表示客户机缓存的版本是最新的,客户机应该继续使用它。
401(未经授权):表示客户机访问的是一个受口令和密码保护的页面,结合使用一个WWW-Authenticate响应头提示客户机应重新发出一个带有Authorization头的请求消息。
404(找不到):服务器上不存在客户机所请求的资源。
500(内部服务器错误):服务器端的CGI、ASP、JSP等程序发生错误。
通用消息头
1.通用消息头字段既能用于请求消息,也能用于响应消息,它包括一些与被传输的实体内容没有关系的常用消息头字段。
Cache-Control: no-cache (*)
Connecton: close (*)
Date: Tue, 11 Jul 2000 18:23:51 GMT
Pragma: no-cache (*)
Trailer: Date
Transfer-Encoding: chunked (*)
Upgrade: HTTP/2.0, SHTTP/1.3
Via: HTTP/1.1 Proxy1, HTTP/1.1 Proxy2
Warning: any text
请求头
1.请求头字段用于客户端在请求消息中向服务器传递附加信息,主要包括客户端可以接受的数据类型、压缩方法、语言、以及发出请求的超链接所属页面的URL地址等信息。
Aceept: text/html,image/* (*)
Aceept-Charset: ISO-8859-1,unicode-1-1 (*)
Aceept-Encoding: gzip,compress (*)
Aceept-Language: en-gb,zh-cn (*)
Authorization: Basic enh4OjEyMzQ1Ng== (*)
Expect: 100-continue
From: zxx@it315.org
Host: www.it315.org:80 (*)
If-Match: "xyzzy","r2d2xxxx"
If-Modified-Since: Tue, 11 Jul 2000 18:23:51 GMT (*)
If-None-Match: "xyzzy","r2d2xxxs"
If-Range: Tue,11 Jue 2000 18:23:51 GMT
If-Unmodified-Since: Tue,11 Jul 2000 18:23:51 GMT
Max-Farwards: 1
Proxy-Authorization: Basic enh4OjEyMzQ1Ng==
Range: bytes=100-599
Referer: http://www.it315.org/index.jsp (*)
TE: trailers,deflate
User-Agent: Mozilla/4.0(compatible;MSIE 5.5;Window NT 5.0) (*)
实体头
1.实体头用作实体内容的元消息,描述了实体内容的属性,包括实体信息类型、长度、压缩方法、最后一次修改时间、数据有效期等。
Allow: GET,POST
Content-Encoding: gzip (*)
Content-Language: zh-cn (*)
Content-Length: 80 (*)
Content-Location: http://www.it315.org/java_cn.html
Content-MD5: JIOEJFENEWIOFJEONFNWEIFJOE==
Content-Range: bytes 2543-4532/7898 (*)
Comtent-Type: text/html; charset=GB2312 (*)
Expires: Tue, 11 Jul 2000 18:23:51 GMT (*)
Last-Modified: Tue, 11 Jul 2000 18:23:51 GMT (*)
扩展头
1.在HTTP消息中,也可以使用一些HTTP1.1正式规范里没有定义的头字段,这些头字段统称为自定义的HTTP头或扩展头,它们通常被当作是一种实体头处理。
2.现在流行的浏览器实际上都支持Cookie、Set-Cookie、Refresh和Content-Disposition等几个常用的扩展头字段。
3.Refresh头字段
Refresh: 1
Refresh: 1;url=http://www.google.cn
4.Content-Disposition头字段
Content-Type: application/octet-stream
Content-Disposition: attachment; filemane=aaa.zip