PHP学习散记 2012_01_07(MySQL)
程序员文章站
2023-12-18 14:55:46
php看起来很简单,一个初学者也可以几个小时内就能开始写函数了。但是建立一个稳定、可靠的数据库确需要时间和经验。下面就是一些这样的经验,不仅仅是mysql,其他数据库也一样...
php看起来很简单,一个初学者也可以几个小时内就能开始写函数了。但是建立一个稳定、可靠的数据库确需要时间和经验。下面就是一些这样的经验,不仅仅是mysql,其他数据库也一样可以参考。
1.使用myisam而不是innodb
mysql有很多的数据库引擎,单一般也就用myisam和innodb。
myisam 是默认使用的。但是除非你是建立一个非常简单的数据库或者只是实验性的,那么到大多数时候这个选择是错误的。myisam不支持外键的约束,这是保证数据完整性的精华所在啊。另外,myisam会在添加或者更新数据的时候将整个表锁住,这在以后的扩展性能上会有很大的问题。
解决办法很简单:使用innodb。
2.使用php的mysql方法
php从一开始就提供了mysql的函数库。很多程序都依赖于mysql_connect、mysql_query、mysql_fetch_assoc等等,但是php手册中建议:
如果你使用的mysql版本在4.1.3之后,那么强烈建议使用mysqli扩展。
mysqli,或者说mysql的高级扩展,有一些优点:
有面向对象的接口
prepared statements(预处理语句,可以有效防止sql-注入攻击,还能提高性能)
支持多种语句和事务
另外,如果你想支持多数据库那么应该考虑一下pdo。
3.不过滤用户输入
应该是:永远别相信用户的输入。用后端的php来校验过滤每一条输入的信息,不要相信javascript。像下面这样的sql语句很容易就会被攻击:
$username = $_post["name"];
$password = $_post["password"];
$sql = "select userid from usertable where username='$username'and password='$password';"; // run query...
这样的代码,如果用户输入”admin';”那么,就相当于下面这条了:
select userid from usertable where username='admin';
这样入侵者就能不输入密码,就通过admin身份登录了。
4.不使用utf-8
那些英美国家的用户,很少考虑语言的问题,这样就造成很多产品就不能在其他地方通用。还有一些gbk编码的,也会有很多的麻烦。
utf-8解决了很多国际化的问题。虽然php6才能比较完美的解决这个问题,但是也不妨碍你将mysql的字符集设置为utf-8。
5.该用sql的地方使用php
如果你刚接触mysql,有时候解决问题的时候可能会先考虑使用你熟悉的语言来解决。这样就可能造成一些浪费和性能比较差的情况。比如:计算平均值的时候不适用mysql原生的avg()方法,而是用php将所有值循环一遍然后累加计算平均值。
另外还要注意sql查询中的php循环。通常,在取得所有结果之后再用php来循环的效率更高。
一般在处理大量数据的时候使用强有力的数据库方法,更能提高效率。
6.不优化查询
99%的php性能问题都是数据库造成的,一条糟糕的sql语句可能让你的整个程序都非常慢。mysql的explain statement,query profiler,many other tools的这些工具可以帮你找出那些调皮的select。
7.使用错误的数据类型
mysql提供一系列数字、字符串、时间等的数据类型。如果你想存储日期,那么就是用date或者datetime类型,使用整形或者字符串会让事情更加复杂。
有时候你想用自己定义的数据类型,例如,使用字符串存储序列化的php对象。数据库的添加可能很容易,但是这样的话,mysql就会变得很笨重,而且以后可能导致一些问题。
8.在select查询中使用*
不要使用*在表中返回所有的字段,这会非常的慢。你只需要取出你需要的数据字段。如果你需要取出所有的字段,那么可能你的表需要更改了。
9.索引不足或者过度索引
一般来说,应该索引出现在select语句中where后面所有的字段。
例如,假如我们的用户表有一个数字的id(主键)和email地址。登录之后,mysql应该通过email找到相应的id。通过索引,mysql可以通过搜索算法很快的定位email。如果没有索引,mysql就需要检查每一项记录直到找到。
这样的话,你可能想给每一个字段都添加索引,但是这样做的后果就是在你更新或者添加的时候,索引就会重新做一遍,当数据量大的时候,就会有性能问题。所以,只在需要的字段做索引。
10.不备份
也许不常发生,但是数据库损毁,硬盘坏了、服务停止等等,这些都会对数据造成灾难性的破坏。所以你一定要确保自动备份数据或者保存副本。
11.另外:不考虑其他数据库
mysql可能是php用的最多的数据库了,但是也不是唯一的选择。 postgresql和firebird也是竞争者,他们都开源,而且不被某些公司所控制。微软提供sql server express,oracle有10g express,这些企业级的也有免费版。sqlite对于一些小型的或者嵌入式应用来说也是不错的选择。
1.使用myisam而不是innodb
mysql有很多的数据库引擎,单一般也就用myisam和innodb。
myisam 是默认使用的。但是除非你是建立一个非常简单的数据库或者只是实验性的,那么到大多数时候这个选择是错误的。myisam不支持外键的约束,这是保证数据完整性的精华所在啊。另外,myisam会在添加或者更新数据的时候将整个表锁住,这在以后的扩展性能上会有很大的问题。
解决办法很简单:使用innodb。
2.使用php的mysql方法
php从一开始就提供了mysql的函数库。很多程序都依赖于mysql_connect、mysql_query、mysql_fetch_assoc等等,但是php手册中建议:
如果你使用的mysql版本在4.1.3之后,那么强烈建议使用mysqli扩展。
mysqli,或者说mysql的高级扩展,有一些优点:
有面向对象的接口
prepared statements(预处理语句,可以有效防止sql-注入攻击,还能提高性能)
支持多种语句和事务
另外,如果你想支持多数据库那么应该考虑一下pdo。
3.不过滤用户输入
应该是:永远别相信用户的输入。用后端的php来校验过滤每一条输入的信息,不要相信javascript。像下面这样的sql语句很容易就会被攻击:
$username = $_post["name"];
$password = $_post["password"];
$sql = "select userid from usertable where username='$username'and password='$password';"; // run query...
这样的代码,如果用户输入”admin';”那么,就相当于下面这条了:
select userid from usertable where username='admin';
这样入侵者就能不输入密码,就通过admin身份登录了。
4.不使用utf-8
那些英美国家的用户,很少考虑语言的问题,这样就造成很多产品就不能在其他地方通用。还有一些gbk编码的,也会有很多的麻烦。
utf-8解决了很多国际化的问题。虽然php6才能比较完美的解决这个问题,但是也不妨碍你将mysql的字符集设置为utf-8。
5.该用sql的地方使用php
如果你刚接触mysql,有时候解决问题的时候可能会先考虑使用你熟悉的语言来解决。这样就可能造成一些浪费和性能比较差的情况。比如:计算平均值的时候不适用mysql原生的avg()方法,而是用php将所有值循环一遍然后累加计算平均值。
另外还要注意sql查询中的php循环。通常,在取得所有结果之后再用php来循环的效率更高。
一般在处理大量数据的时候使用强有力的数据库方法,更能提高效率。
6.不优化查询
99%的php性能问题都是数据库造成的,一条糟糕的sql语句可能让你的整个程序都非常慢。mysql的explain statement,query profiler,many other tools的这些工具可以帮你找出那些调皮的select。
7.使用错误的数据类型
mysql提供一系列数字、字符串、时间等的数据类型。如果你想存储日期,那么就是用date或者datetime类型,使用整形或者字符串会让事情更加复杂。
有时候你想用自己定义的数据类型,例如,使用字符串存储序列化的php对象。数据库的添加可能很容易,但是这样的话,mysql就会变得很笨重,而且以后可能导致一些问题。
8.在select查询中使用*
不要使用*在表中返回所有的字段,这会非常的慢。你只需要取出你需要的数据字段。如果你需要取出所有的字段,那么可能你的表需要更改了。
9.索引不足或者过度索引
一般来说,应该索引出现在select语句中where后面所有的字段。
例如,假如我们的用户表有一个数字的id(主键)和email地址。登录之后,mysql应该通过email找到相应的id。通过索引,mysql可以通过搜索算法很快的定位email。如果没有索引,mysql就需要检查每一项记录直到找到。
这样的话,你可能想给每一个字段都添加索引,但是这样做的后果就是在你更新或者添加的时候,索引就会重新做一遍,当数据量大的时候,就会有性能问题。所以,只在需要的字段做索引。
10.不备份
也许不常发生,但是数据库损毁,硬盘坏了、服务停止等等,这些都会对数据造成灾难性的破坏。所以你一定要确保自动备份数据或者保存副本。
11.另外:不考虑其他数据库
mysql可能是php用的最多的数据库了,但是也不是唯一的选择。 postgresql和firebird也是竞争者,他们都开源,而且不被某些公司所控制。微软提供sql server express,oracle有10g express,这些企业级的也有免费版。sqlite对于一些小型的或者嵌入式应用来说也是不错的选择。