简单谈谈GET和POST有什么区别
如果有人问你,get和post,有什么区别?你会如何回答?
真实案例
前几天有人问我这个问题。我说get是用于获取数据的,post,一般用于将数据发给服务器之用。
这个答案好像并不是他想要的。于是他继续追问有没有别的区别?我说这就是个名字而已,如果服务器支持,他完全可以把get改个名字叫get2。他反问道,那就是单纯的名字上的区别喽?我想了想,我觉得如果说再具体的区别,只能去看rfc文档了,还要取决于服务器(指apache,iis)的具体实现。但我不得不承认,我的确没有仔细看过http的rfc文档。于是我说,我对http协议不太熟悉。这个问题也就结束了。
最普遍的答案
回来之后寻思了很久,他到底是想问我什么?我一直就觉得get和post没有什么除了语义之外的区别,自打我开始学习web编程开始就是这么理解的。
可能很多人都已经猜到了,他要的答案是:
1. get使用url或cookie传参。而post将数据放在body中。
2. get的url会有长度上的限制,则post的数据则可以非常大。
3. post比get安全,因为数据在地址栏上不可见。
但是很不幸,这些区别全是错误的,更不幸的是,这个答案还是google搜索的头版头条,然而我根本没想着这些是答案,因为在我看来他们都是错的。我来一一解释一下。
get和post与数据如何传递没有关系
get和post是由http协议定义的。在http协议中,method和data(url, body, header)是正交的两个概念,也就是说,使用哪个method与应用层的数据如何传输是没有相互关系的。
http没有要求,如果method是post数据就要放在body中。也没有要求,如果method是get,数据(参数)就一定要放在url中而不能放在body中。
那么,网上流传甚广的这个说法是从何而来的呢?我在html标准中,找到了相似的描述。这和网上流传的说法一致。但是这只是html标准对http协议的用法的约定。怎么能当成get和post的区别呢?
而且,现代的web server都是支持get中包含body这样的请求。虽然这种请求不可能从浏览器发出,但是现在的web server又不是只给浏览器用,已经完全地超出了html服务器的范畴了。
知道这个有什么用?我不想解释了,有时候就得自己痛一次才记得住。
http协议对get和post都没有对长度的限制
http协议明确地指出了,http头和body都没有长度的要求。而对于url长度上的限制,有两方面的原因造成:
1. 浏览器。据说早期的浏览器会对url长度做限制。据说ie对url长度会限制在2048个字符内(流传很广,而且无数同事都表示认同)。但我自己试了一下,我构造了90k的url通过ie9访问live.com,是正常的。网上的东西,哪怕是wikipedia上的,也不能信。
2. 服务器。url长了,对服务器处理也是一种负担。原本一个会话就没有多少数据,现在如果有人恶意地构造几个几m大小的url,并不停地访问你的服务器。服务器的最大并发数显然会下降。另一种攻击方式是,把告诉服务器content-length是一个很大的数,然后只给服务器发一点儿数据,嘿嘿,服务器你就傻等着去吧。哪怕你有超时设置,这种故意的次次访问超时也能让服务器吃不了兜着走。有鉴于此,多数服务器出于安全啦、稳定啦方面的考虑,会给url长度加限制。但是这个限制是针对所有http请求的,与get、post没有关系。
安全不安全和get、post没有关系
我觉得这真是中国特色。我讲个小段子,大家应该可以体会出这个说法多么的可笑。
觉得post数据比get数据安全的人会说
“防君子不防小人;中国小白多,能防小白用户就行了。”
“哼,”我不以为然,“那你怎么不说,url参数都encode过了,或是base64一下,小白也看不懂啊。”
那人反驳道,“encode太简单了,聪明点儿的小白很容易就可以decode并修改掉。”
我笑道,“五十步笑百步耳,再聪明点儿的小白还会截包并重发呢,opera就有这功能。”
那人阴险地祭出神器——最终解释权,说,“这个不算小白。”
我日啊。
最后一点儿感想
我之前一直做windows桌面应用,对web开发无甚了解,直到一年多前转做服务器端开发,才开始接触到http。(注意,我说的是http,不是html。服务器开放接口是基于rest理念设计的,使用的协议是http,但是传输的内容不是html。这不是web server,而是一个web service)
所以我对于get和post的理解,是纯粹地来源于http协议。他们只有一点根本区别,简单点儿说,一个用于获取数据,一个用于修改数据。具体的请参考rfc文档。
如果一个人一开始就做web开发,很可能把html对http协议的使用方式,当成http协议的唯一的合理使用方式。从而犯了以偏概全的错误。
可能有人会觉得我钻牛角尖。我只是不喜欢模棱两可,不喜欢边界不清、概念不明,不喜欢“拿来主义”,也不喜欢被其它喜欢钻牛角尖的人奚落得无地自容。
内容查阅自网络,时间有些久远,若有雷同实属见谅~~
本文参考链接:
1. http协议 https://www.w3.org/protocols/rfc2616/rfc2616.html
2.html标准 https://www.w3.org/tr/rec-html40/interact/forms.html#h-17.13.1