用PHP 4.2书写安全的脚本
程序员文章站
2022-05-25 20:57:38
原著:kevin yank 转自:www.linuxforum.net (恭喜再此开通)在很长一段时间内,php作为服务器端脚本语...
原著:kevin yank 转自:www.linuxforum.net (恭喜再此开通)
在很长一段时间内,php作为服务器端脚本语言的最大卖点之一就是会为从表单提交的值自动建立一个全局变量。在php 4.1中,php的制作者们推荐了一个访问提交数据的替代手段。在php 4.2中,他们取消了那种老的做法!正如我将在这篇文章中解释的那样,作出这样的变化的目的是出于安全性的考虑。我们将研究php在处理表单提交及其它数据时的新的做法,并说明为什么这样做会提高代码的安全性。
这里有什么错误?
看看下面的这段php脚本,它用来在输入的用户名及口令正确时授权访问一个web页面:
<?php
// 检查用户名及口令
if ($username == 'kevin' and $password == 'secret')
$authorized = true;
?>
<?php if (!$authorized): ?>
<!-- 未授权的用户将在这里给予提示 -->
<p>please enter your username and password:</p>
<form action="<?=$php_self?>" method="post">
<p>username: <input type="text" name="username" /><br />
password: <input type="password" name="password" /><br />
<input type="submit" /></p>
</form>
<?php else: ?>
<!-- 有安全要求的html内容 -->
<?php endif; ?>
ok,我相信大约半数的读者会不屑的说“太愚蠢了-- 我不会犯这样的错误的!”但是我保证有很多的读者会想“嗨,没什么问题啊,我也会这么写的!”当然还会有少数人会对这个问题感到困惑(“什么是php?”)。php被设计为一个“好的而且容易的”脚本语言,初学者可以在很短的时间内学会使用它;它也应该能够避免初学者犯上面的错误。
再回到刚才的问题,上面的代码中存在的问题是你可以很容易地获得访问的权力,而不需要提供正确的用户名和口令。只在要你的浏览器的地址栏的最后添加?authorized=1。因为php会自动地为每一个提交的值创建一个变量 -- 不论是来自动一个提交的表单、url查询字符串还是一个cookie -- 这会将$authorized设置为1,这样一个未授权的用户也可以突破安全限制。
那么,怎么简单地解决这个问题呢?只要在程序的开头将$authorized默认设置为false。这个问题就不存在了!$authorized是一个完全在程序代码中创建的变量;但是为什么开发者得为每一个恶意的用户提交的变量担心呢?
php 4.2作了什么改变?
在php 4.2中,新安装的php中的register_globals选项默认为关闭,因此egpcs值(egpcs是environment、get、post、cookies、server的缩写 -- 这是php中外部变量来源的全部范围)不会被作为全局变量来创建。当然,这个选项还可以通过手工来开启,但是php的开发者推荐你将其关闭。要贯彻他们的意图,你需要使用其它的方法来获取这些值。
从php 4.1开始,egpcs值就可以从一组指定的数组中获得:
$_env -- 包含系统环境变量
$_get -- 包含查询字符串中的变量,以及提交方法为get的表单中的变量
$_post -- 包含提交方式为post的表单中的变量
$_cookie -- 包含所有cookie变量
$_server -- 包含服务器变量,例如http_user_agent
$_request -- 包含$_get、$_post和$_cookie的全部内容
$_session -- 包含所有已注册的session变量
在php 4.1之前,当开发者关闭register_globals选项(这也被考虑为提高php性能的一种方法)后,必须使用诸如$http_get_vars这样的令人讨厌的名字来获取这些变量。这些新的变量名不仅仅短,而且它们还有其他优点。
首先,让我们在php 4.2中(也就是说关闭register_globals 选项)重写上面提到的代码:
<?php
$username = $_request['username'];
$password = $_request['password'];
// 检查用户名和口令
if ($username == 'kevin' and $password == 'secret')
$authorized = true;
?>
<?php if (!$authorized): ?>
<!-- 未授权的用户将在这里给予提示 -->
<p>please enter your username and password:</p>
<form action="<?=$php_self?>" method="post">
<p>username: <input type="text" name="username" /><br />
password: <input type="password" name="password" /><br />
<input type="submit" /></p>
</form>
<?php else: ?>
<!-- 有安全要求的html内容 -->
<?php endif; ?>
正如你看到的,我所需要做的只是在代码的开始增加下面两行:
$username = $_request['username'];
$password = $_request['password'];
因为我们希望用户名和密码是由用户提交的,所以我们从$_request数组中获取这些值。使用这个数组使得用户可以*选择传递方式:通过url查询字符串(例如允许用户创建书签时自动输入他们的证书)、通过一个提交的表单或者是通过一个cookie。如果你想要限制只能通过表单提交证书(更精确地说,是通过http post请求),你可以使用$_post数组:
$username = $_post['username'];
$password = $_post['password'];
除了“引入”这两个变量以外,程序代码没有任何改变。简单地关闭register_globals选项促使开发者更进一步了解哪些数据是来自外部的(不可信任的)资源。
请注意这里还有一个小问题:php中默认的error_reporting设置仍然是e_all & ~e_notice,因此如果“username”和“password”这两个值没有被提交,试图从$_request数组或$_post数组中获得这两个值并不会招致任何错误信息。如晨不你的php程序需要严格的错误检查,你还需要增加一些代码以首先检查这些变量。
但是这是不是意味着更多的输入?
是的,在象上面这样的简单程序中,使用php 4.2常常会增加输入量。但是,还是看看光明的一面吧 -- 你的程序终究是更安全了!
不过认真的说,php的设计者并没有完全忽视你的痛苦。在这些新数组中有一个特殊的其它所php变量都不具备的特征,它们是完全的全局变量。这对你有什么帮助呢?让我们先对我们的示例进行一下扩充。
为了使得站点中的多个页面可以使用用户名/口令论证,我们将我们用户认证程序写到一个include文件(protectme.php)中:
<?php /* protectme.php */
function authorize_user($authuser, $authpass)
{
$username = $_post['username'];
$password = $_post['password'];
// 检查用户名和口令
if ($username != $authuser or $password != $authpass):
?>
<!-- 未授权的用户将在这里给予提示 -->
<p>please enter your username and password:</p>
<form action="<?=$php_self?>" method="post">
<p>username: <input type="text" name="username" /><br />
password: <input type="password" name="password" /><br />
<input type="submit" /></p>
</form>
<?php
exit();
endif;
}
?>
现在,我们刚才的页面看上去将是这样的:
<?php
require('protectme.php');
authorize_user('kevin','secret');
?>
<!-- 有安全要求的html内容 -->
很简单,很清晰明了,对不对?现在是考验你的眼力和经验的时候了 -- 在authorize_user 函数中少了什么?
在函数中没有申明$_post是一个全局变量!在php 4.0中,当register_globals开启时,你需要增加一行代码以在函数中获取$username和$password变量:
function authorize_user($authuser, $authpass)
{
global $username, $password;
...
在php中,和其它具有类似语法的语言不同,函数外的变量在函数中不能自动获得,你需要象上面所说明的那样增加一行以指定其来自global范围。
在php 4.0中,当关闭register_globals以提供安全性时,你可以使用$http_post_vars数组以获得你的表单提交的值,但是你还是需要从全局范围导入这个数组:
function authorize_user($authuser, $authpass)
{
global $http_post_vars;
$username = $http_post_vars['username'];
$password = $http_post_vars['password'];
但是在php 4.1及以后的版本中,特殊的$_post变量(以及上面提到的其它变量)可以在所有范围内使用。这就是不需要在函数中申明$_post变量是一个全局变量的原因:
function authorize_user($authuser, $authpass)
{
$username = $_post['username'];
$password = $_post['password'];
这对session有什么影响?
特殊的$_session数组的引入实际上有助于简化session代码。你不需要将session变量申明为全局变量,然后再去留意哪些变量被注册了,你现在可以简单地从$_session['varname']中引用你所有的session变量。
现在让我们来看看另一个用户认证的例子。这一次,我们使用sessions以标志一个在你的网站继续逗留的用户已经经过了用户认证。首先,我们来看看php 4.0版本(开启register_globals):
<?php
session_start();
if ($username == 'kevin' and $password == 'secret')
{
$authorized = true;
session_register('authorized');
}
?>
<?php if (!$authorized): ?>
<!-- 显示html表单以提示用户登录 -->
<?php else: ?>
<!-- 有安全要求的html内容 -->
<?php endif; ?>
和刚开始的程序一样,这个程序也存在安全漏洞,在url的最后加上?authorized=1可以绕过安全措施直接访问页面内容。开发者可以将$authorized视为一个session变量而忽视了可以很容易地通过用户输入设置同样的变量。
当我们增加了我们的特殊的数组(php 4.1)并关闭register_globals(php 4.2)后,我们的程序将是这样的:
<?php
session_start();
if ($username == 'kevin' and $password == 'secret')
$_session['authorized'] = true;
?>
<?php if (!$_session['authorized']): ?>
<!-- 显示html表单以提示用户登录 -->
<?php else: ?>
<!-- 有安全要求的html内容 -->
<?php endif; ?>
是不是更加简单了?你不再需要再将普通的变量注册为一个session变量,你只需要直接设置session变量(在$_session数组中),然后用同样的方法使用它。程序变得更短了,而且对于什么变量是session变量也不会引起混乱!
总结
在这篇文章中,我解释了php脚本语言作出改变的深层原因。在php 4.1中,添加了一组特殊数据以访问外部数据。这些数组可以在任何范围内调用,这使得外部数据的访问更方便。在php 4.2中,register_globals被默认关闭以鼓励使用这些数组以避免无经验的开发者编写出不安全的php代码。
在很长一段时间内,php作为服务器端脚本语言的最大卖点之一就是会为从表单提交的值自动建立一个全局变量。在php 4.1中,php的制作者们推荐了一个访问提交数据的替代手段。在php 4.2中,他们取消了那种老的做法!正如我将在这篇文章中解释的那样,作出这样的变化的目的是出于安全性的考虑。我们将研究php在处理表单提交及其它数据时的新的做法,并说明为什么这样做会提高代码的安全性。
这里有什么错误?
看看下面的这段php脚本,它用来在输入的用户名及口令正确时授权访问一个web页面:
<?php
// 检查用户名及口令
if ($username == 'kevin' and $password == 'secret')
$authorized = true;
?>
<?php if (!$authorized): ?>
<!-- 未授权的用户将在这里给予提示 -->
<p>please enter your username and password:</p>
<form action="<?=$php_self?>" method="post">
<p>username: <input type="text" name="username" /><br />
password: <input type="password" name="password" /><br />
<input type="submit" /></p>
</form>
<?php else: ?>
<!-- 有安全要求的html内容 -->
<?php endif; ?>
ok,我相信大约半数的读者会不屑的说“太愚蠢了-- 我不会犯这样的错误的!”但是我保证有很多的读者会想“嗨,没什么问题啊,我也会这么写的!”当然还会有少数人会对这个问题感到困惑(“什么是php?”)。php被设计为一个“好的而且容易的”脚本语言,初学者可以在很短的时间内学会使用它;它也应该能够避免初学者犯上面的错误。
再回到刚才的问题,上面的代码中存在的问题是你可以很容易地获得访问的权力,而不需要提供正确的用户名和口令。只在要你的浏览器的地址栏的最后添加?authorized=1。因为php会自动地为每一个提交的值创建一个变量 -- 不论是来自动一个提交的表单、url查询字符串还是一个cookie -- 这会将$authorized设置为1,这样一个未授权的用户也可以突破安全限制。
那么,怎么简单地解决这个问题呢?只要在程序的开头将$authorized默认设置为false。这个问题就不存在了!$authorized是一个完全在程序代码中创建的变量;但是为什么开发者得为每一个恶意的用户提交的变量担心呢?
php 4.2作了什么改变?
在php 4.2中,新安装的php中的register_globals选项默认为关闭,因此egpcs值(egpcs是environment、get、post、cookies、server的缩写 -- 这是php中外部变量来源的全部范围)不会被作为全局变量来创建。当然,这个选项还可以通过手工来开启,但是php的开发者推荐你将其关闭。要贯彻他们的意图,你需要使用其它的方法来获取这些值。
从php 4.1开始,egpcs值就可以从一组指定的数组中获得:
$_env -- 包含系统环境变量
$_get -- 包含查询字符串中的变量,以及提交方法为get的表单中的变量
$_post -- 包含提交方式为post的表单中的变量
$_cookie -- 包含所有cookie变量
$_server -- 包含服务器变量,例如http_user_agent
$_request -- 包含$_get、$_post和$_cookie的全部内容
$_session -- 包含所有已注册的session变量
在php 4.1之前,当开发者关闭register_globals选项(这也被考虑为提高php性能的一种方法)后,必须使用诸如$http_get_vars这样的令人讨厌的名字来获取这些变量。这些新的变量名不仅仅短,而且它们还有其他优点。
首先,让我们在php 4.2中(也就是说关闭register_globals 选项)重写上面提到的代码:
<?php
$username = $_request['username'];
$password = $_request['password'];
// 检查用户名和口令
if ($username == 'kevin' and $password == 'secret')
$authorized = true;
?>
<?php if (!$authorized): ?>
<!-- 未授权的用户将在这里给予提示 -->
<p>please enter your username and password:</p>
<form action="<?=$php_self?>" method="post">
<p>username: <input type="text" name="username" /><br />
password: <input type="password" name="password" /><br />
<input type="submit" /></p>
</form>
<?php else: ?>
<!-- 有安全要求的html内容 -->
<?php endif; ?>
正如你看到的,我所需要做的只是在代码的开始增加下面两行:
$username = $_request['username'];
$password = $_request['password'];
因为我们希望用户名和密码是由用户提交的,所以我们从$_request数组中获取这些值。使用这个数组使得用户可以*选择传递方式:通过url查询字符串(例如允许用户创建书签时自动输入他们的证书)、通过一个提交的表单或者是通过一个cookie。如果你想要限制只能通过表单提交证书(更精确地说,是通过http post请求),你可以使用$_post数组:
$username = $_post['username'];
$password = $_post['password'];
除了“引入”这两个变量以外,程序代码没有任何改变。简单地关闭register_globals选项促使开发者更进一步了解哪些数据是来自外部的(不可信任的)资源。
请注意这里还有一个小问题:php中默认的error_reporting设置仍然是e_all & ~e_notice,因此如果“username”和“password”这两个值没有被提交,试图从$_request数组或$_post数组中获得这两个值并不会招致任何错误信息。如晨不你的php程序需要严格的错误检查,你还需要增加一些代码以首先检查这些变量。
但是这是不是意味着更多的输入?
是的,在象上面这样的简单程序中,使用php 4.2常常会增加输入量。但是,还是看看光明的一面吧 -- 你的程序终究是更安全了!
不过认真的说,php的设计者并没有完全忽视你的痛苦。在这些新数组中有一个特殊的其它所php变量都不具备的特征,它们是完全的全局变量。这对你有什么帮助呢?让我们先对我们的示例进行一下扩充。
为了使得站点中的多个页面可以使用用户名/口令论证,我们将我们用户认证程序写到一个include文件(protectme.php)中:
<?php /* protectme.php */
function authorize_user($authuser, $authpass)
{
$username = $_post['username'];
$password = $_post['password'];
// 检查用户名和口令
if ($username != $authuser or $password != $authpass):
?>
<!-- 未授权的用户将在这里给予提示 -->
<p>please enter your username and password:</p>
<form action="<?=$php_self?>" method="post">
<p>username: <input type="text" name="username" /><br />
password: <input type="password" name="password" /><br />
<input type="submit" /></p>
</form>
<?php
exit();
endif;
}
?>
现在,我们刚才的页面看上去将是这样的:
<?php
require('protectme.php');
authorize_user('kevin','secret');
?>
<!-- 有安全要求的html内容 -->
很简单,很清晰明了,对不对?现在是考验你的眼力和经验的时候了 -- 在authorize_user 函数中少了什么?
在函数中没有申明$_post是一个全局变量!在php 4.0中,当register_globals开启时,你需要增加一行代码以在函数中获取$username和$password变量:
function authorize_user($authuser, $authpass)
{
global $username, $password;
...
在php中,和其它具有类似语法的语言不同,函数外的变量在函数中不能自动获得,你需要象上面所说明的那样增加一行以指定其来自global范围。
在php 4.0中,当关闭register_globals以提供安全性时,你可以使用$http_post_vars数组以获得你的表单提交的值,但是你还是需要从全局范围导入这个数组:
function authorize_user($authuser, $authpass)
{
global $http_post_vars;
$username = $http_post_vars['username'];
$password = $http_post_vars['password'];
但是在php 4.1及以后的版本中,特殊的$_post变量(以及上面提到的其它变量)可以在所有范围内使用。这就是不需要在函数中申明$_post变量是一个全局变量的原因:
function authorize_user($authuser, $authpass)
{
$username = $_post['username'];
$password = $_post['password'];
这对session有什么影响?
特殊的$_session数组的引入实际上有助于简化session代码。你不需要将session变量申明为全局变量,然后再去留意哪些变量被注册了,你现在可以简单地从$_session['varname']中引用你所有的session变量。
现在让我们来看看另一个用户认证的例子。这一次,我们使用sessions以标志一个在你的网站继续逗留的用户已经经过了用户认证。首先,我们来看看php 4.0版本(开启register_globals):
<?php
session_start();
if ($username == 'kevin' and $password == 'secret')
{
$authorized = true;
session_register('authorized');
}
?>
<?php if (!$authorized): ?>
<!-- 显示html表单以提示用户登录 -->
<?php else: ?>
<!-- 有安全要求的html内容 -->
<?php endif; ?>
和刚开始的程序一样,这个程序也存在安全漏洞,在url的最后加上?authorized=1可以绕过安全措施直接访问页面内容。开发者可以将$authorized视为一个session变量而忽视了可以很容易地通过用户输入设置同样的变量。
当我们增加了我们的特殊的数组(php 4.1)并关闭register_globals(php 4.2)后,我们的程序将是这样的:
<?php
session_start();
if ($username == 'kevin' and $password == 'secret')
$_session['authorized'] = true;
?>
<?php if (!$_session['authorized']): ?>
<!-- 显示html表单以提示用户登录 -->
<?php else: ?>
<!-- 有安全要求的html内容 -->
<?php endif; ?>
是不是更加简单了?你不再需要再将普通的变量注册为一个session变量,你只需要直接设置session变量(在$_session数组中),然后用同样的方法使用它。程序变得更短了,而且对于什么变量是session变量也不会引起混乱!
总结
在这篇文章中,我解释了php脚本语言作出改变的深层原因。在php 4.1中,添加了一组特殊数据以访问外部数据。这些数组可以在任何范围内调用,这使得外部数据的访问更方便。在php 4.2中,register_globals被默认关闭以鼓励使用这些数组以避免无经验的开发者编写出不安全的php代码。