欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

HTTP Referer详解及Referer控制

程序员文章站 2024-01-29 23:19:16
什么是http referer referer的意思简言之,http referer是header的一部分,当浏览器向web服务器发送请求的时候,一般会带上referer...

什么是http referer

referer的意思简言之,http referer是header的一部分,当浏览器向web服务器发送请求的时候,一般会带上referer,告诉服务器我是从哪个页面链接过来的,服务器籍此可以获得一些信息用于处理。

比如在一个网页里面插入一个超链接,链接到其他的网页,那么当点击这个超链接从而链接到另外一个页面的时候,相当于浏览器向 web 服务器发送了一个 http 请求,对于另外一个页面而言,这个 referer 就是上一个页面的 url,而对于从地址栏里面直接输入 url 或者是刷新网页的方式,则 referer = null,通过设置这个 referer 可以防止盗链的问题

例如从我主页上链接到一个朋友那里,他的服务器就能够从http referer中统计出每天有多少用户点击我主页上的链接访问他的网站。

referer其实应该是英文单词referrer,不过拼错的人太多了,所以编写标准的人也就将错就错了。

referer有时也被用作防盗链

即下载时判断来源地址是不是在网站域名之内, 否则就不能下载或显示,很多网站,如天涯就是通过referer页面来判断用户是否能够下载图片.

当然,对于某些恶意用户,也可能伪造referer来获得某些权限,在设计网站时要考虑到这个问题.

还可用做电子商务网站的安全,在提交信用卡等重要信息的页面用referer来判断上一页是不是自己的网站,如果不是,可能是黑客用自己写的一个表单,来提交,为了能跳过你上一页里的javascript的验证等目的。

但是注意不要把rerferer用在身份验证或者其他非常重要的检查上,因为rerferer非常容易在客户端被改变

虽然referer并不可靠,但用来防止图片盗链还是足够的,毕竟不是每个人都会修改客户端的配置。实现一般都是通过apache的配置文件,首先设置允许访问的地址:

# 只允许来自domain.com的访问,图片可能就放置在domain.com网站的页面上
setenvifnocase referer “^http://www.domain.com/” local_ref
# 直接通过地址访问
setenvif referer “^$” local_ref

然后再规定被标记了的访问才被允许:

<filesmatch “.(gif|jpg)”>
order allow,deny
allow from env=local_ref
</filesmatch>

或者

<directory /web/images>
order deny,allow
deny from all
allow from env=local_ref
</directory>

哪些情况下无法获得上一页referrer信息

直接在浏览器地址栏中输入地址;

使用location.reload()刷新(location.href或者location.replace()刷新有信息);

在微信对话框中,点击链接进入微信自身的浏览器;

扫码进入qq或者微信的浏览器;

直接新窗口打开一个页面; 2017.8.3更新 新版本chrome测试,新窗口页面依然有document.referrer

从https的网站直接进入一个http协议的网站(chrome下亲测);

a标签设置rel="noreferrer"(兼容ie7+);

meta标签来控制不让浏览器发送referer;

例如:

<meta content="never" name="referrer">

使用 referer meta 标签控制 referer

使用场景

在某些情况下,出于一些原因,网站想要控制页面发送给 server 的 referer 信息的情况下,可以使用这一 referer metadata 参数。

隐私

社交网站一般都会有用户个人页面,这些页面中用户都有可能添加一些外网的链接,而社交网站有可能不希望在用户点击了这些链接的时候,泄露用户页面的 url ,因为这些 url 中可能包含一些敏感信息。当然,有些社交网站可能只想在 referer 中提供一个 hostname,而不是完整的 url 信息。

安全

有些使用了 https 的网站,可能在 url 中使用一个参数(sid 等)来作为用户身份凭证,而又需要引入其他 https 网站的资源,这种情况下,网站肯定不希望泄露用户的身份凭证信息。

object-capability discipline

有些网站遵循object-capability discipline,而 referer 刚好与这一策略相悖,所以,网站能够控制 refeer 将对 object-capability discipline 很有利。

技术细节

referer 的 metedata 参数可以设置为以下几种类型的值:

never
always
origin
default

如果在文档中插入 meta 标签,并且 name 属性的值为 referer,浏览器客户端将按照如下步骤处理这个标签:

1.如果 meta 标签中没有 content 属性,则终止下面所有操作

2.将 content 的值复制给 referrer-policy ,并转换为小写

3.检查 content 的值是否为上面 list 中的一个,如果不是,则将值置为 default

上述步骤之后,浏览器后续发起 http 请求的时候,会按照 content 的值,做出如下反应(下面 referer-policy 的值即 meta 标签中 content 的值):

1.如果 referer-policy 的值为never:删除 http head 中的 referer;

2.如果 referer-policy 的值为default:如果当前页面使用的是 https 协议,而正要加载的资源使用的是普通的 http 协议,则将 http header 中的 referer 置为空;

3.如果 referer-policy 的值为 origin:只发送 origin 部分;

4.如果 referer-policy 的值为 always:不改变http header 中的 referer 的值,注意:这种情况下,如果当前页面使用了 https 协议,而要加载的资源使用的是 http 协议,加载资源的请求头中也会携带 referer。

例子

如果页面中包含了如下 meta 标签,所有从当前页面中发起的请求将不会携带 referer:

<meta name="referrer" content="never">

如果页面中包含了如下 meta 标签,则从当前页面中发起的 http请求将只携带 origin 部分(注:根据原文中的语境,我理解这里的 origin 是包含了 schema 和 hostname 的部分 url,不包含 path 等后面的其他 url 部分),而不是完整的 url :

<meta name="referrer" content="origin">

注意:在使用本文中所述的 meta 标签的时候,浏览器原有的 referer 策略将被打破,比如从 http 协议的页面跳转到 https 的页面的时候,如果设置了适当的值,也会携带 referer。

其他问题

这与 rel=noreferer 有什么关系呢?可能 rel=noreferer 会覆盖掉本文中的 meta 标签所设置的值。也就是功能覆盖。
origin 信息不是一个完整的 url,所以浏览器客户端估计会在 origin 后面加一个 / 来作为 path 部分。
如果 origin 是唯一的,会发生什么情况呢?估计 referer 会被忽略。