php面试题汇总
8、redis集群怎么做
1、redis集群提供了以下两个好处
1、将数据自动切分(split)到多个节点
2、当集群中的某一个节点故障时,redis还可以继续处理客户端的请求。
2、集群的方案:
redis-cluster集群,采用无中心结构,每个节点保存数据和整个集群状态,每个节点都和其他所有节点连接,主要通过节点的配置,辅以redis的主从来完成集群。由于这块东西我使用得很少,所以只是平时抽时间去研究过,并没有真正的在线上实现过。
9、redis和memcacahe、mongodb的区别
答:都是非关系型数据库,性能都非常高,但是mongodb和memcache、redis是不同的两种类型。后两者主要用于数据的缓存,前者主要用在查询和储存大数据方面,是最接近数据库的文档型的非关系数据库。
这里我主要谈谈memcache和redis的区别。
①从数据存储位置上来分,memcache的数据存在内存中,而redis既可以存储在内存中,也可以存储的到磁盘中,达到持久化存储的功能,memcache一旦断电,数据全部丢失,redis可以利用快照和aof把数据存到磁盘中,当恢复时又从磁盘中读取到内存中,当物理内存使用完毕后,可以把数据写入到磁盘中。
②从存储数据的类型上来分,memcache和redis存储的方式都是键值对,只不过redis值的类型比较丰富,有string(字符串),hash(哈希),list(列表),set(集合)zset(有序集合),而memcache主要存储的是字符串。
③从架构层次来分,redis支持master-slave(主—从)模式应用,memcache支持分布式。
④另外从存储数据的大小上来分,redis单个value的最大限制是1gb,memcached只能保存1mb的数据。但是memcache在存储100k以上的数据,性能稍微好一点。
⑤另外redis只支持单核,memcache可以支持多核,当然关于redis取代memcache的说法,在一般情况下,两者性能都很高,在大多的业务场景选择上,redis的选择可能更加具有优势,但也不能说可以完全取代,最终还是取决于你的应用场景。
10、持久化redis有几种方式?
答:主要有两种方式:
① 快照持久化
在redis配置文件中已经自动开启了,
格式是:save n m
表示在n秒之内,redis至少发生m次修改则redis抓快照到磁盘。
当然我们也可以手动执行save或者bgsave(异步)命令来做快照
②append only file aof持久化
总共有三种模式,如
appendfsync everysec默认的是每秒强制写入磁盘一次
appendfsync always 每次执行写操作的时候就强制写入磁盘
appendfsync no 完全取决于os,性能最好但是持久化没法保证
其中第三种模式最好。redis默认的也是采取第三种模式。
11、mysql存储引擎
答:常用的主要分为两种,一种是innodb,一种是myisam,两者的主要区别是
①myisam不支持事务处理,而innodb支持事务处理
②myisam 不支持外键,innodb支持外键
③myisam支持全文检索,而innodb在mysql5.6版本之后才支持全文检索
④数据的存储形式不一样,mysiam表存放在三个文件:结构、索引、数据,innodb存储把结构存储为一个文件,索引和数据存储为一个文件
⑤myisam在查询和增加数据性能更优于innodb,innodb在批量删除方面性能较高。
⑥myisam支持表锁,而innodb支持行锁
12、 sql注入是什么及如何预防sql注入?
答:sql注入攻击指的是用户或者黑客通过构建特殊的输入作为参数传入我们的web应用程序端,而这些输入大都是sql语法里的一些组合,通过执行sql语句进而执行攻击者所要的操作,其主要原因是程序员没有细致地过滤用户输入的数据,致使非法数据侵入系统而造成的。因此我们在做开发过程中一定要预防sql注入,主要从两方面着手:1、占位符的方式,就是对sql语句进行预处理,然后执行sql语句
2、通过addslashes或者mysql_real_escape_string这两个函数对用户输入的值进行转义处理,把一些特殊的字符转义掉。
13、有用过预处理么?
答:用过,pdo类中,有个prepare方法可以实现预处理,pdostament类中 的excute方法可以执行预处理,预处理的参数分为两种,一种是:字符串占位符,另一种是?占位符,:字符串占位符在执行预处理传递参数时传入的是关联数组,而?占位符传递的是索引数组。两者不能混合使用,但一般推荐使用:字符串占位符。
14、用框架还用自己的处理吗
答:一般成熟的开源框架中都考虑到了数据安全这方面的东西,但有时候我们可能会使用一些原生的sql语句时,我们就需要考虑自己对sql语句进行预处理。当然有时候框架中的过滤方法我们不希望采用,比如使用文本编辑器时,我们可以使用自己的过滤方式。
15、mysql优化怎么做的?
答:mysql优化主要从以下几个方面来实现:
①设计角度:存储引擎的选择,字段类型选择,范式
②功能角度:可以利用mysql自身的特性,如索引,查询缓存,碎片整理,分区、分表等
③sql语句的优化方面:尽量简化查询语句,能查询字段少就尽量少查询字段,优化分页语句、分组语句等。
④部署大负载架构体系:数据库服务器单独出来,负载大时可以采用主从复制,读写分离机制进行设计
⑤从硬件上升级数据库服务器。
16、订单表用是什么存储引擎
答:因为订单表存在着事务的处理,比如下了订单,商品的库存就要减少,这里就涉及到了事务,所以就用到innodb。
19 、sql语句的优化
答:首先我们得确定哪些sql语句需要优化,一般在一个系统中,查询语句最多,所以我们主要是针对查询语句进行优化。主要采用两种方式来确定要优化的sql语句:
①使用慢查询日志,设置需要优化的sql语句的执行时间,记录下超过该设置时间的语句,即为需要优化的语句。
②使用profiling机制,记录下每条sql语句的执行时间,找出执行较慢的语句,即为需要优化的语句。
我们主要通过给表字段添加索引的方式进行优化,加上索引后,sql语句的执行时间显著提高了,但并不是加上索引了这条sql语句就会用到索引,所以首先看执行慢的语句后面是否有加索引,我们可以使用explain或者desc加在要执行的sql语句前,查看是否使用到索引。有几个地方需要注意的是:
①为了避免建议索引而造成索引文件过大,有时候我们会使用复合索引,这时候要遵循最左原则。
②like查询,前%不会用到索引
③如果条件中有or,则要求or的索引字段都必须有索引,否则不能用到索引。
④如果列类型是字符串,一定要在条件中将数据使用引号引用起来,否则不使用索引。
⑤优化group by 语句
⑥尽量避免模糊匹配,这样会导致全盘扫描
21、 索引有几种
答:索引主要有:
主键索引:数据记录里面不能有null,数据内容不能重复,在一张表里面不能有多个主键索引。
普通索引:使用字段关键字建立的索引,主要是提高查询速度
唯一索引:字段数据是唯一的,数据内容里面能否为null,在一张表里面,是可以添加多个唯一索引。
全文索引:在比较老的版本中,只有myisam引擎支持全文索引,在innodb5.6后引擎也支持全文索引,在mysql中全文索引不支持中文。我们一般使用sphinx集合coreseek来实现中文的全文索引。
23 、左前索引原则
答:左前索引主要指的是在复合索引中,给两个或多个字段建立了复合索引后,在sql语句后的条件中,只有复合索引前面的字段在条件的前面时,该索引才起作用,比如创建了个复合索引index (a,b),在使用where或者orderby条件时,如果只有条件b的,该索引不会生效,必须有条件a且必须要在条件b的前面该索引才会生效。
24 、分布式数据库
答:我所知道的分布式数据库有memcache,主要是分布式的非关系型数据库,用于缓存处理。
分布式是指将不同的业务分布在不同的地方。 而集群指的是将几台服务器集中在一起,实现同一业务。
分布式中的每一个节点,都可以做集群。 而集群并不一定就是分布式的。
举例:就比如新浪网,访问的人多了,他可以做一个群集,前面放一个响应服务器,后面几台服务器完成同一业务,如果有业务访问的时候,响应服务器看哪台服务器的负载不是很重,就将给哪一台去完成。
而分布式,从窄意上理解,也跟集群差不多, 但是它的组织比较松散,不像集群,有一个组织性,一台服务器垮了,其它的服务器可以顶上来。
memcache的应用场景
1、适用memcached的业务场景?
1)如果网站包含了访问量很大的动态网页,因而数据库的负载将会很高。由于大部分数据库请求都是读操作,那么memcached可以显著地减小数据库负载。
2)利用memcached可以缓存session数据、临时数据以减少对他们的数据库写操作。
4)缓存一些很小但是被频繁访问的文件。
5)访问比较频繁,安全性不高,丢失无所谓,修改比较频繁的数据,比如一些用户的在线状态
2 、不适用memcached的业务场景?
1)缓存对象的大小大于1mb
memcache本身就不是为了处理庞大的多媒体(large media)和巨大的二进制块(streaming huge blobs)而设计的。
2)key的长度大于250字符
3)应用运行在不安全的环境中
4)业务本身需要的是持久化数据或者说需要的应该是database
25、nginx日志,怎么统计每个ip的访问量
(参考阿铭哥手册)
stub_status模块主要用于查看nginx的一些状态信息,例如统计nginx的访问量,首先我们得查看该模块有没有安装,如果没有安装,得先安装,安装好后,修改nginx的配置文件,开启该模块,然后就可以使用以下命令来进行统计,如:
1.根据访问ip统计uv
awk '{print $1}' access.log|sort | uniq -c |wc -l
2.统计访问url统计pv
awk '{print $7}' access.log|wc -l
3.查询访问最频繁的url
awk '{print $7}' access.log|sort | uniq -c |sort -n -k 1 -r|more
4.查询访问最频繁的ip
awk '{print $1}' access.log|sort | uniq -c |sort -n -k 1 -r|more
统计nginx日志中访问最多的100个ip及访问次数
awk ‘{print $1}’ access.log|sort | uniq -c |sort -n -k 1 -r| head -n 100
26、http协议
http是一个属于应用层的面向对象的协议,由于其简捷、快速的方式,适用于分布式超媒体信息系统
http协议的主要特点可概括如下:
1.支持客户/服务器模式。
2.简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用 的有get、head、post。每种方法规定了客户与服务器联系的类型不同。由于http协议简单,使得http服务器的程序规模小,因而通信速度很快。
3.灵活:http允许传输任意类型的数据对象。正在传输的类型由content-type加 以标记。
4.无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请 求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。
5.无状态:http协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。 缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次 连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。
27、cookie与session的区别
1、cookie数据存放在客户的浏览器上,session数据放在服务器上。
2、cookie不是很安全,别人可以分析存放在本地的cookie并进行cookie欺骗
考虑到安全应当使用session。
3、session会在一定时间内保存在服务器上。当访问增多,会比较占用你服务器的性能
考虑到减轻服务器性能方面,应当使用cookie。
4、单个cookie保存的数据不能超过4k,很多浏览器都限制一个站点最多保存20个cookie。
5、所以个人建议:
将登陆信息等重要信息存放为session
其他信息如果需要保留,可以放在cookie中
28、php在储存session以什么形式存在
php为session的存储提供了三种方式: 文件/ 内存/ 自定义存储,默认是使用文件存储.在访问量大的网站上采用这种方式就不大合 适,因为这样会导致大量的输入输出的冗余.我们可以在php.ini更改配置文件或者php脚本中通过相应的函数来设置session文件的存储类型来改变session文件的存储形式
29、xss攻击怎么防止
xss又称css,全称cross sitescript(跨站脚本攻击), xss攻击类似于sql注入攻击,是web程序中常见的漏洞,xss属于被动式且用于客户端的攻击方式,所以容易被忽略其危害性。其原理是攻击者向有xss漏洞的网站中输入(传入)恶意的html代码,当用户浏览该网站时,这段html代码会自动执行,从而达到攻击的目的。如,盗取用户cookie信息、破坏页面结
常见的恶意字符xss输入:
1. xss 输入通常包含 javascript 脚本,如弹出恶意警告框:<script>alert("xss");</script>
2. xss 输入也可能是 html 代码段,譬如:
(1) 网页不停地刷新 <meta http-equiv="refresh" content="0;">
(2) 嵌入其它网站的链接 <iframe src=http://xxxx width=250 height=250></iframe>
构、重定向到其它网站等。
方法:利用php htmlentities()函数
php防止xss跨站脚本攻击的方法:是针对非法的html代码包括单双引号等,使用htmlspecialchars()函数。
在使用htmlspecialchars()函数的时候注意第二个参数, 直接用htmlspecialchars($string)的话,第二个参数默认是ent_compat,函数默认只是转化双引号("),不对单引号(')做转义。
所以,htmlspecialchars()函数更多的时候要加上第二个参数,应该这样用: htmlspecialchars($string,ent_quotes)。当然,如果需要不转化如何的引号,用htmlspecialchars($string,ent_noquotes)。
另外,尽量少用htmlentities(), 在全部英文的时候htmlentities()和htmlspecialchars()没有区别,都可以达到目的。但是,中文情况下, htmlentities()却会转化所有的html代码,连同里面的它无法识别的中文字符也给转化了。
htmlentities()和htmlspecialchars()这两个函数对单引号(')之类的字符串支持不好,都不能转化, 所以用htmlentities()和htmlspecialchars()转化的字符串只能防止xss攻击,不能防止sql注入攻击。
所有有打印的语句如echo,print等,在打印前都要使用htmlentities()进行过滤,这样可以防止xss,注意中文要写出htmlentities($name,ent_noquotes,gb2312)。
30、禁用cookie后,session还能用吗?
可以,在存储session的文件中,生成sessionid,通过get传参的方式将sessionid传到要实现session共享的页面,读取sessionid,从而从session中获取数据。
31、mongodb基于什么开发的
mongodb是一个基于分布式文件存储的数据库。由c++语言编写。旨在为web应用提供可扩展的高性能数据存储解决方案。
32、mongodb是非范式还是范式
数据表示的方式有很多种,其中最重要的问题之一就是在多大程度上对数据进行范式化。范式化(normalization)是将数据分散到多个不同的集合,不同集合之间可以相互引用数据。虽然很多文档可以引用某一块数据,但是这块数据只存储在一个集合中。所以,如果要修改这块数据,只需修改保存这块数据的那一个文档就行了。但是,mongodb没有提供连接(join)工具,所以在不同集合之间执行连接查询需要进行多次查询。
反范式化(denormalization)与范式化相反:将每个文档所需的数据都嵌入在文档内部。每个文档都拥有自己的数据副本,而不是所有文档共同引用同一个数据副本。这意味着,如果信息发生了变化,那么所有相关文档都需要进行更新,但是在执行查询时,只需要一次查询,就可以得到所有数据。
决定何时采用范式化何时采用反范式化时比较困难的。范式化能够提高数据写入速度,反范式化能够提高数据读取速度。需要根据自己应用程序的十几需要仔细权衡。
33、mongodb与mysql区别
mysql是关系型数据库。
优势:
在不同的引擎上有不同 的存储方式。
查询语句是使用传统的sql语句,拥有较为成熟的体系,成熟度很高。
开源数据库的份额在不断增加,mysql的份额页在持续增长。
缺点:
在海量数据处理的时候效率会显著变慢。
mongodb是非关系型数据库(nosql ),属于文档型数据库。文档是mongodb中数据的基本单元,类似关系数据库的行,多个键值对有序地放置在一起便是文档,语法有点类似javascript面向对象的查询语言,它是一个面向集合的,模式*的文档型数据库。
存储方式:虚拟内存+持久化。
查询语句:是独特的mongodb的查询方式。
适合场景:事件的记录,内容管理或者博客平台等等。
架构特点:可以通过副本集,以及分片来实现高可用。
数据处理:数据是存储在硬盘上的,只不过需要经常读取的数据会被加载到内存中,将数据存储在物理内存中,从而达到高速读写。
成熟度与广泛度:新兴数据库,成熟度较低,nosql数据库中最为接近关系型数据库,比较完善的db之一,适用人群不断在增长。
优点:
快速!在适量级的内存的mongodb的性能是非常迅速的,它将热数据存储在物理内存中,使得热数据的读写变得十分快。高扩展性,存储的数据格式是json格式!
缺点:
不支持事务,而且开发文档不是很完全,完善。
mysql和mongodb主要应用场景(简单了解叙述下即可)
1.如果需要将mongodb作为后端db来代替mysql使用,即这里mysql与mongodb 属于平行级别,那么,这样的使用可能有以下几种情况的考量: (1)mongodb所负责部分以文档形式存储,能够有较好的代码亲和性,json格式的直接写入方便。(如日志之类) (2)从data models设计阶段就将原子性考虑于其中,无需事务之类的辅助。开发用如nodejs之类的语言来进行开发,对开发比较方便。 (3)mongodb本身的failover机制,无需使用如mha之类的方式实现。
2.将mongodb作为类似redis ,memcache来做缓存db,为mysql提供服务,或是后端日志收集分析。 考虑到mongodb属于nosql型数据库,sql语句与数据结构不如mysql那么亲和 ,也会有很多时候将mongodb做为辅助mysql而使用的类redis memcache 之类的缓存db来使用。 亦或是仅作日志收集分析。
34、写一个函数统计每一个元素出现的次数
php 中的 array_count_values() 函数可以实现 array_count_values() 函数用于统计数组中所有值出现的次数。 本函数返回一个数组,其元素的键名是原数组的值,键值是该值在原数组中出现的次数。
35、手写排序
主要从原理方面来说:重点介绍冒泡排序和选择排序
· // 冒泡排序
function bubblesort($arr) {
// 获得数组总长度
$num = count($arr);
// 正向遍历数组
for ($i = 1; $i < $num; $i++) {
// 反向遍历
for ($j = $num - 1; $j >= $i ; $j--) {
// 相邻两个数比较
if ($arr[$j] < $arr[$j-1]) {
// 暂存较小的数
$itemp = $arr[$j-1];
// 把较大的放前面
$arr[$j-1] = $arr[$j];
// 较小的放后面
$arr[$j] = $itemp;
}
}
}
return $arr;
}
· // 交换法排序
function exchangesort($arr){
$num = count($arr);
// 遍历数组
for ($i = 0;$i < $num - 1; $i++) {
// 获得当前索引的下一个索引
for ($j = $i + 1; $j < $num; $j++) {
// 比较相邻两个的值大小
if ($arr[$j] < $arr[$i]) {
// 暂存较小的数
$itemp = $arr[$i];
// 把较大的放前面
$arr[$i] = $arr[$j];
// 较小的放后面
$arr[$j] = $itemp;
}
}
}
return $arr;
}
· // 选择法排序
function selectsort($arr) {
// 获得数组总长度
$num = count($arr);
// 遍历数组
for ($i = 0;$i < $num-1; $i++) {
// 暂存当前值
$itemp = $arr[$i];
// 暂存当前位置
$ipos = $i;
// 遍历当前位置以后的数据
for ($j = $i + 1;$j < $num; $j++){
// 如果有小于当前值的
if ($arr[$j] < $itemp) {
// 暂存最小值
$itemp = $arr[$j];
// 暂存位置
$ipos = $j;
}
}
// 把当前值放到算好的位置
$arr[$ipos] = $arr[$i];
// 把当前值换成算好的值
$arr[$i] = $itemp;
}
return $arr;
}
· // 插入法排序
function insertsort($arr){
$num = count($arr);
// 遍历数组
for ($i = 1;$i < $num; $i++) {
// 获得当前值
$itemp = $arr[$i];
// 获得当前值的前一个位置
$ipos = $i - 1;
// 如果当前值小于前一个值切未到数组开始位置
while (($ipos >= 0) && ($itemp < $arr[$ipos])) {
// 把前一个的值往后放一位
$arr[$ipos + 1] = $arr[$ipos];
// 位置递减
$ipos--;
}
$arr[$ipos+1] = $itemp;
}
return $arr;
}
· // 快速排序
function quicksort($arr){
$num = count($arr);
$l = $r = 0;
$left = $right = array();
// 从索引的第二个开始遍历数组
for ($i = 1;$i < $num; $i++) {
// 如果值小于索引1
if ($arr[$i] < $arr[0]) {
// 装入左索引数组(小于索引1的数据)
$left[] = $arr[$i];
$l++;
} else {
// 否则装入右索引中(大于索引1的数据)
$right[] = $arr[$i];
$r++; //
}
}
// 如果左索引有值 则对左索引排序
if($l > 1) {
$left = quicksort($left);
}
// 排序后的数组
$new_arr = $left;
// 将当前数组第一个放到最后
$new_arr[] = $arr[0];
// 如果又索引有值 则对右索引排序
if ($r > 1) {
$right = quicksort($right);
}
// 根据右索引的长度再次增加数据
for($i = 0;$i < $r; $i++) {
$new_arr[] = $right[$i];
}
return $new_arr;
}
36、设计模式
在php中,我主要使用了以下两种设计模式
1、单例模式
单例模式顾名思义,就是只有一个实例。作为对象的创建模式, 单例模式确保某一个类只有一个实例,而且自行实例化并向整个系统提供这个实例。
单例模式的要点有三个:
一是某个类只能有一个实例;
二是它必须自行创建这个实例;
三是它必须自行向整个系统提供这个实例。
典型的代表如框架中的基类对象。
2、简单工厂模式
①抽象基类:类中定义抽象一些方法,用以在子类中实现
②继承自抽象基类的子类:实现基类中的抽象方法
③工厂类:用以实例化所有相对应的子类
这种我们使用最常见,基本所有的mvc框架中都是这样产生的。
37、用过什么php框架
在开发过程中,我主要使用过了这么几种框架。thinkphp框架、ci框架,laravel框架和yii框架。我接触到的第一个框架是tp框架,我简单的说下我对这几个框架的看法:
thinkphp框架
优点:
tp借鉴了java思想,基于php5,充分利用了php5的特性,部署简单只需一个入口文件,一切搞定,简单高效,中文文档齐全,入门超级简单。自带模板引擎,具有独特的数据验证和自动填充功能,框架更新速度比较迅速。
缺点:一个model中可以操作多个表,但tp只能一个。
tp默认初始化了很多配置,使用起来很方便,但自然也会影响效率。但是把一些加载配置的时间拿去研究算法,这些小影响近乎可以忽略了。
codeigniter框架
优点:
配置简单,上手很快,全部的配置使用php脚本来配置,没有使用很多太复杂的设计模式,执行性能和代码可读性上都不错,执行效率比较高,具有基本的mvc功能. 快速简洁,代码量少,框架简单,容易上手,自带了很多简单好用的library,框架适合中小型项目,大型项目也不是不可以,只是扩展能力稍差。
缺点:
1. 把model层简单的理解为数据库操作
2. php框架略显简单,只能够满足小型应用,略微不太能够满足中型应用需要
laravel框架(目前最新的是5.3,要求php版本较高5.6)
优点:
1.laravel注重代码的模块化和可扩展性。
2.artisan: 命令行工具,很多手动的工作都自动了
3.可继承的模版,简化view的开发和管理
laravel一直是php开发者最受欢迎的php框架。这是一个年轻的框架,但是拥有优雅的语法,可简单快速开发你的应用。它拥有大多数常见的功能,如:路由,身份验证,会话,队列和缓存。
缺点:
laravel的中英文文档比较少 demo也比较少 有时候一个功能要试好久 甚至要看源码
yii框架(目前是2.0版本)
优点:
1、快速,敏捷,不拖沓,给程序员飞翔的能力;
2、有gii功能!(创建控制器,model层,crud等操作);
3、具有高度的可重用性和可扩展性,是纯粹的面向对象的。开发速度快,完备的文档,可重用性可高扩展,是最高效的开发框架之一。
缺点:
1、对model层的指导和考虑较少
2、文档实例较少
3、英文太多
4、要求php技术精通,oop编程要熟练!
5、要求会bootstrap
38 、代码管理工具
我使用过的版本控制工具有两种:早期的时候使用的是svn,现在主要使用git,我就我个人的观点,简单的说下两者的区别:
1. git是分布式的,svn是集中式的,好处是跟其他同事不会有太多的冲突,自己写的代码放在自己电脑上,一段时间后再提交、合并,也可以不用联网在本地提交;
2. git下载下来后,在本地不必联网就可以看到所有的log,很方便学习,svn却需要联网;
3. git鼓励分branch(分支),而svn,说实话,我用branch的次数还挺少的,svn自带的branch merge我还真没用过,有merge时用的是beyond compare工具合并后再commit的;
4. svn在commit前,我们都建议是先update一下,跟本地的代码编译没问题,并确保开发的功能正常后再提交
svn 的主要功能
svn属于集中化的版本控制系统,有个不太精确的比喻:svn = 版本控制+ 备份服务器
svn使用起来有点像是档案仓库的感觉,支持并行读写文件,支持代码的版本化管理,功能包括取出、导入、更新、分支、改名、还原、合并等。
功能有许多我就不一一列了,svn大都采用图形界面操作,直观,上手快。
git的主要功能
git是一个分布式版本控制系统,操作命令包括:clone,pull,push,branch ,merge ,rebas,git擅长的是程序代码的版本化管理。
svn 的优缺点
svn对中文支持好,操作简单,使用没有难度,美工人员,产品人员,测试人员,实施人员都可轻松上手。使用界面统一,功能完善,操作方便。
git的优缺点
对程序源代码进行差异化的版本管理,代码库占极少的空间。易于代码的分支化管理。不支持中文,图形界面支持差,使用难度大。不易推广。
svn 和 git 哪个更适用于项目管理?
svn更适用于项目管理, git仅适用于代码管理。
一个研发队伍的成员正常包括:需求分析、设计、美工、程序员、测试、实施、运维,每个成员在工作中都有产出物, 包括了文档、设计代码、程序代码,这些都需要按项目集中进行管理的。svn能清楚的按目录进行分类管理, 使项目组的管理处于有序高效的状态。
现在越来越多人使用git做为版本控制工具,我以前的公司也是使用git.
39、手写单例模式怎么写
三私一公。
class example
{
//保存例实例在此属性中
private static $_instance;
//构造函数声明为private,防止直接创建对象
private function __construct()
{
echo 'i am construceted';
}
//单例方法
public static function singleton()
{
if(!isset(self::$_instance))
{
$c=__class__;
self::$_instance=new $c;
}
return self::$_instance;
}
//阻止用户复制对象实例
public function __clone()
{
trigger_error('clone is not allow' ,e_user_error);
}
function test()
{
echo("test");
}
}
// 这个写法会出错,因为构造方法被声明为private
$test = new example;
// 下面将得到example类的单例对象
$test = example::singleton();
$test->test();
// 复制对象将导致一个e_user_error.
$test_clone = clone $test;
?>
40、nosql和mysql的区别
也即非关系型数据库和关系型数据库。
目前世界上主流的存储系统大部分还是采用了关系型数据库,其主要有一下优点:
1.事务处理—保持数据的一致性;
2.由于以标准化为前提,数据更新的开销很小(相同的字段基本上只有一处);
3.可以进行join等复杂查询。
nosql在优势方面,主要体现在下面这三点:
1. 简单的扩展:典型例子是cassandra,由于其架构是类似于经典的p2p,所以能通过轻松地添加新的节点来扩展这个集群;
2. 快速的读写:主要例子有redis,由于其逻辑简单,而且纯内存操作,使得其性能非常出色,单节点每秒可以处理超过10万次读写操作;
3. 低廉的成本:这是大多数分布式数据库共有的特点,因为主要都是开源软件,没有昂贵的license成本;
4.
但瑕不掩瑜,nosql数据库还存在着很多的不足,常见主要有下面这几个:
1. 不提供对sql的支持:如果不支持sql这样的工业标准,将会对用户产生一定的学习和应用迁移成本;
2. 支持的特性不够丰富:现有产品所提供的功能都比较有限,大多数nosql数据库都不支持事务,也不像 sql server和oracle那样能提供各种附加功能,比如bi和报表等;
3. 现有产品的不够成熟:大多数产品都还处于初创期,和关系型数据库几十年的完善不可同日而语;
41、在tp中m方法与d方法的区别
虽然都是实例化模型对象,两者还是有区别的
d和m的区别主要在于
m方法不需要创建模型类文件,m方法不会读取模型类,所以默认情况下自动验证是无效的,但是可以通过动态赋值的方式实现
而d方法必须有创建模型类。
我们可以用下面两种方法去创建一个数据表的映射对象
第一种:$test = d(‘test’)
第二种:$test = new model(‘test’)
虽然这两种都可以对数据进行select,insert,delete,udpate操作,在
数据验证上有很大的不同,
用第一种方式实例一个模型就会有数据检查功能,如果 title 没有填写的话就会提示 “请输入标题” (这个是tp提供的一个自动验证功能,当然也需要在相应的model中定义好验证条件);
如果用第二种就没有了这个数据验证功能,需要手动验证。
d函数实例化的是你当前项目的lib/model下面的模块。
如果该模块不存在的话,直接返回实例化model的对象(意义就与m()函数相同)。
而m只返回,实例化model的对象。它的$name参数作为数据库的表名来处理对数据库的操作。
42、对网站大访问量的优化方案
提高访问速度。从硬件,最好从网站程序等等方面考虑。我给出以下几种方案:
1.尽量使用静态页,不要老使用动态信息调用。非常容易出问题
2.图片内容与网站数据尽量放在同一个服务器或者机房内。大量外链图片是会有问题的
3.一次又一次,一遍又一遍的分析流量走向,然后缩短浏览者浏览距离,举个例子,浏览者如果现在在你网站看一个新闻需要点5次鼠标,你就要缩短这个点击数。
4.一次又一次,一遍又一遍的分析,修改你的网站数据库结构,使其更加简洁。
5.提高网站的安防能力
6.买个好服务器,托管在一个好的机房!
43、
第一:确认服务器硬件是否足够支持当前的流量。
普通的p4服务器一般最多能支持每天10万独立ip,如果访问量比这个还要大,那么必须首先配置一台更高性能的专用服务器才能解决问题,否则怎么优化都不可能彻底解决性能问题。
第二:优化数据库访问
前台实现完全的静态化当然最好,可以完全不用访问数据库,不过对于频繁更新的网站,静态化往往不能满足某些功能。
缓存就是另一个解决方案,就是将动态数据存储到缓存文件中,动态网页直接调用这些文件,而不必再访问数据库,技术如果确实无法避免对数据库的访问,那么可以尝试优化数据库的查询sql.避免使用select * from这样的语句,每次查询只返回自己需要的结果,避免短时间内的大量sql查询。最好在相同字段进行比较操作,在建立好的索引字段上尽量减少函数操作,如果要做到极致的话需要代码的优化;
第三,禁止外部的盗链。
外部网站的或者文件盗链往往会带来大量的负载压力,因此应该严格限制外部对于自身的图片或者文件盗链,好在目前可以简单地通过refer来控制盗链,自己就可以通过配置来禁止盗链。当然,伪造refer也可以通过来实现盗链,不过目前蓄意伪造refer盗链的还不多,可以先不去考虑,或者使用非技术手段来解决,比如在图片上增加水印。
第四,控制大文件的下载。
大文件的下载会占用很大的流量,并且对于非scsi硬盘来说,大量文件下载会消耗cpu,使得网站响应能力下降。因此,尽量不要提供超过2m的大文件下载,如果需要提供,建议将大文件放在另外一台服务器上。
第五,使用不同主机分流主要流量
将文件放在不同的主机上,提供不同的镜像供用户下载。比如如果觉得rss文件占用流量大,那么使用feedburner或者feedsky等服务将rss输出放在其他主机上,这样别人访问的流量压力就大多集中在feedburner的主机上,rss就不占用太多资源了。
第六,使用流量分析统计软件。
在网站上一个流量分析统计软件,可以即时知道哪些地方耗费了大量流量,哪些页面需要再进行优化,因此,解决流量问题还需要进行精确的统计分析才可以。我推荐使用的流量分析统计软件是analytics(google分析)。
45、主要运用到哪些缓存
一、数据缓存
这里所说的数据缓存是指数据库查询缓存,每次访问页面的时候,都会先检测相应的缓存数据是否存在,如果不存在,就连接数据库,得到数据,并把查询结果序列化后保存到文件中,以后同样的查询结果就直接从缓存表或文件中获得。
用的最广的例子看discuz的搜索功能,把结果id缓存到一个表中,下次搜索相同关键字时先搜索缓存表。
举个常用的方法,多表关联的时候,把附表中的内容生成数组保存到主表的一个字段中,需要的时候数组分解一下,这样的好处是只读一个表,坏处就是两个数据同步会多不少步骤,数据库永远是瓶颈,用硬盘换速度,是这个的关键点。
二、页面缓存
每次访问页面的时候,都会先检测相应的缓存页面文件是否存在,如果不存在,就连接数据库,得到数据,显示页面并同时生成缓存页面文件,这样下次访问的时候页面文件就发挥作用了。(模板引擎和网上常见的一些缓存类通常有此功能)。
三、时间触发缓存
检查文件是否存在并且时间戳小于设置的过期时间,如果文件修改的时间戳比当前时间戳减去过期时间戳大,那么就用缓存,否则更新缓存。
四、内容触发缓存
当插入数据或更新数据时,强制更新缓存。
五、静态缓存
这里所说的静态缓存是指静态化,直接生成html或xml等文本文件,有更新的时候重生成一次,适合于不太变化的页面,这就不说了。
六、内存缓存
memcached是高性能的,分布式的内存对象缓存系统,用于在动态应用中减少数据库负载,提升访问速度。redis 也可以做到。
46、php的设计模式
1、单例模式 2、工厂模式 3、观察者模式 4、命令链模式 5、策略模式
单例模式:
一个类在整个应用中,只有一个对象实例的设计模式
类必须自行创建这个实例
必须自行向整个系统提供这个实例
三私:私有静态成员变量、构造函数、克隆函数
一公:公共的静态方法
2、工厂模式
可以根据输入的参数或者应用程序配置的不同一创建一种专门用来实例化并返回其它类的实例的类
3、观察者模式
观察者模式提供了组件之间紧密耦合的另一种方法。
该模式:一个对象通过添加一个方法(该方法允许另一个对象,即观察者注册自己)全本身变得可观察。当可观察的对象更改时,它会将消息发送到已注册的观察者。这些观察者使用该信息执行的操作与可观察的对象无关。
4、命令链模式:
以松散耦合主题为基础,发送消息、命令和请求,或通过一组处理程序发送任意内容。每个处理程序都会自行判断自己能否处理请求,如果可以,该请求被处理,进程停止。
5、策略模式:
此算法是从复杂类提取的,因而可以方便地替换。
47.mysql事务的特性
事务是作为一个逻辑单元执行的一系列操作,一个逻辑工作单元必须有四个属性,称为 acid(原子性、一致性、隔离性和持久性)属性,只有这样才能成为一个事务:
原子性
事务必须是原子工作单元;对于其数据修改,要么全都执行,要么全都不执行。
一致性
事务在完成时,必须使所有的数据都保持一致状态。在相关数据库中,所有规则都必须应用于事务的修改,以保持所有数据的完整性。
事务结束时,所有的内部数据结构(如 b 树索引或双向链表)都必须是正确的。
隔离性
由并发事务所作的修改必须与任何其它并发事务所作的修改隔离。事务查看数据时数据所处的状态,要么是另一并发事务修改它之前的状态,
要么是另一事务修改它之后的状态,事务不会查看中间状态的数据。这称为可串行性,因为它能够重新装载起始数据,
并且重播一系列事务,以使数据结束时的状态与原始事务执行的状态相同。
持久性
事务完成之后,它对于系统的影响是永久性的。该修改即使出现系统故障也将一直保持。
begin 开始一个事务
rollback事务回滚
commit事务确认
48、mysql事务的应运场景
事务处理在各种管理系统中都有着广泛的应用,比如人员管理系统,很多同步数据库操作大都需要用到事务处理。比如说,在人员管理系统中,你删除一个人员,你即需要删除人员的基本资料,也要删除和该人员相关的信息,如信箱,文章等等,这样,这些数据库操作语句就构成一个事务!
比如手机充值过程,支付宝金额减少,相应的手机话费增加,只要有一个操作不成功,则另外一个操作也不会成功
49.include和require的区别
require函数通常放在php程序的最前面,在php程序执行之前,就会先读取require指定引入的文件,使它变成php程序网页的一部分。
include函数一般是放在流程控制的处理部分中。php程序在读到include的文件时,才将它读进来,这种方式可以把程序执行时的流程简单化。
他们两个的用途是一样的,不一定非要哪个放在最前面哪个放在中间,他们最根本的区别在于错误处理的方式不一样。
require一个文件存在错误的话,那么程序就会中断执行,并显示致命错误
而include一个文件存在错误的话,那么程序不会中断,会继续执行,并显示一个警告的错误
其它区别:include有返回值,而require没有。
50、索引的建立与使用
索引就是类似书的目录,提高检索数据的效率。
索引是系统按照某个具体的算法(哈希,散列,二叉树),将数据从全部数据里进行提取,维护成一个索引文件,然后系统在进行数据查询的时候,发现如果查询条件刚好满足索引条件,就可以从索引文件中快速的定位的数据所在位置。
mysql中有以下几种索引:
主键索引(primary key效率最高的索引)
唯一索引(unique key):不为空的情况下效率最高
普通索引(index)对数据没有要求,文件很大,效率比较低
全文索引(fulltext),对整个文章内部进行关键字索引(mysql5.5以后innodb支持全文索引)
英文的全文索引很简单:英文单词默认是用空格分离的
中文的全文索引很难:中文的词组成很麻烦,需要利用分词工具(sphinx)
索引可以在创建表的同时创建索引,也可以在修改表结构时添加索引,索引主要是加在经常做为查询条件的字段上,可以使用相应的手段来检测所执行的sql语句中是否使用到了索引。
51.正则匹配表达式各个符文表达的意义
\ 将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用、或一个八进制转义符。例如,’n’ 匹配字符 “n”。’\n’ 匹配一个换行符。序列 ‘\\’ 匹配 “\” 而 “\(” 则匹配 “(”。
^ 匹配输入字符串的开始位置。如果设置了 regexp 对象的 multiline 属性,^ 也匹配 ‘\n’ 或 ‘\r’ 之后的位置。
$ 匹配输入字符串的结束位置。如果设置了regexp 对象的 multiline 属性,$ 也匹配 ‘\n’ 或 ‘\r’ 之前的位置。
* 匹配前面的子表达式零次或多次。例如,zo* 能匹配 “z” 以及 “zoo”。* 等价于{0,}。
+ 匹配前面的子表达式一次或多次。例如,’zo+’ 能匹配 “zo” 以及 “zoo”,但不能匹配 “z”。+ 等价于 {1,}。
? 匹配前面的子表达式零次或一次。例如,”do(es)?” 可以匹配 “do” 或 “does” 中的”do” 。? 等价于 {0,1}。
{n} n 是一个非负整数。匹配确定的 n 次。
{n,} n 是一个非负整数。至少匹配n 次。
{n,m} m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。
. 匹配除 “\n” 之外的任何单个字符。要匹配包括 ‘\n’ 在内的任何字符,请使用象 ‘[.\n]’ 的模式。
x|y 匹配 x 或 y。
[xyz] 字符集合。匹配所包含的任意一个字符。例如, ‘[abc]’ 可以匹配 “plain” 中的 ‘a’。
[^xyz] 负值字符集合。匹配未包含的任意字符。例如, ‘[^abc]’ 可以匹配 “plain” 中的’p'。
[a-z] 字符范围。匹配指定范围内的任意字符。例如,’[a-z]’ 可以匹配 ‘a’ 到 ‘z’ 范围内的任意小写字母字符。
[^a-z] 负值字符范围。匹配任何不在指定范围内的任意字符。例如,’[^a-z]’ 可以匹配任何不在 ‘a’ 到 ‘z’ 范围内的任意字符。
\b 匹配一个单词边界,也就是指单词和空格间的位置。例如, ‘er\b’ 可以匹配”never” 中的 ‘er’,但不能匹配 “verb” 中的 ‘er’。
\d 匹配一个数字字符。等价于 [0-9]。
\d 匹配一个非数字字符。等价于 [^0-9]。
\f 匹配一个换页符。等价于 \x0c 和 \cl。
\n 匹配一个换行符。等价于 \x0a 和 \cj。
\r 匹配一个回车符。等价于 \x0d 和 \cm。
\s 匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。
\s 匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
\t 匹配一个制表符。等价于 \x09 和 \ci。
\v 匹配一个垂直制表符。等价于 \x0b 和 \ck。
\w 匹配包括下划线的任何单词字符。等价于’[a-za-z0-9_]’。
\w 匹配任何非单词字符。等价于 ‘[^a-za-z0-9_]’。
52.php的变量类型
四种标量类型:
boolean (布尔型):这是最简单的类型,只有两种取值,可以为 true/true 或 false/false ,不区分大小写。详细请查看:php布尔类型(boolean)
integer (整型):在32 位操作系统中它的有效范围是:-2 147 483 648~+2 147 483 647。整型值可以使用十进制,十六进制或八进制表示,前面可以加上可选的符号(- 或者 +)。八进制表示数字前必须加上 0(零),十六进制表示数字前必须加上 0x。
float (浮点型, 也称作 double)
string (字符串):字符型变量不同于其他编程语言有字符与字符串之分,在php 中,统一使用字符型变量来定义字符或者字符串。
两种复合类型:
array (数组):数组型变量是一种比较特殊的变量类型,将在后续章节中详细说明。
object (对象):对象也是一种特殊的数据类型。要创建object变量,请使用 new 关键字。详细请查看:php对象类型(object)
最后是两种特殊类型:
resource(资源):源是一种特殊变量,保存了到外部资源的一个引用。资源是通过专门的函数来建立和使用的。详情请查看:php资源类型(resource)
null(null):表示一个变量没有值。null 类型唯一可能的值就是 null。
54.商城秒杀的实现
抢购、秒杀是如今很常见的一个应用场景,主要需要解决的问题有两个:
1 高并发对数据库产生的压力
2 竞争状态下如何解决库存的正确减少("超卖"问题)
对于第一个问题,已经很容易想到用缓存来处理抢购,避免直接操作数据库,例如使用redis。第二个问题,我们可以使用redis队列来完成,把要秒杀的商品放入到队列中,因为pop操作是原子的,即使有很多用户同时到达,也是依次执行,文件锁和事务在高并发下性能下降很快,当然还要考虑其他方面的东西,比如抢购页面做成静态的,通过ajax调用接口,其中也可能会出现一个用户抢多次的情况,这时候需要再加上一个排队队列和抢购结果队列及库存队列。高并发情况下,将用户进入排队队列,用一个线程循环处理从排队队列取出一个用户,判断用户是否已在抢购结果队列,如果在,则已抢购,否则未抢购,库存减1,写数据库,将用户入结果队列。
55.购物车的原理
购物车相当于现实中超市的购物车,不同的是一个是实体车,一个是虚拟车而已。用户可以在购物网站的不同页面之间跳转,以选购自己喜爱的商品,点击购买时,该商品就自动保存到你的购物车中,重复选购后,最后将选中的所有商品放在购物车中统一到付款台结账,这也是尽量让客户体验到现实生活中购物的感觉。服务器通过追踪每个用户的行动,以保证在结账时每件商品都物有其主。
主要涉及以下几点:
1、把商品添加到购物车,即订购
2、 删除购物车中已定购的商品
3、 修改购物车中某一本图书的订购数量
4、 清空购物车
5、 显示购物车中商品清单及数量、价格
实现购物车的关键在于服务器识别每一个用户并维持与他们的联系。但是http协议是一种“无状态(stateless)”的协议,因而服务器不能记住是谁在购买商品,当把商品加入购物车时,服务器也不知道购物车里原先有些什么,使得用户在不同页面间跳转时购物车无法“随身携带”,这都给购物车的实现造成了一定的困难。
目前购物车的实现主要是通过cookie、session或结合数据库的方式。下面分析一下它们的机制及作用。
1. cookie
cookie是由服务器产生,存储在客户端的一段信息。它定义了一种web服务器在客户端存储和返回信息的机制,cookie文件它包含域、路径、生存期、和由服务器设置的变量值等内容。当用户以后访问同一个web服务器时,浏览器会把cookie原样发送给服务器。通过让服务器读取原先保存到客户端的信息,网站能够为浏览者提供一系列的方便,例如在线交易过程中标识用户身份、安全要求不高的场合避免用户重复输入名字和密码、门户网站的主页定制、有针对性地投放广告等等。利用cookie的特性,大大扩展了web应用程序的功能,不仅可以建立服务器与客户机的联系,因为cookie可以由服务器定制,因此还可以将购物信息生成cookie值存放在客户端,从而实现购物车的功能。用基于cookie的方式实现服务器与浏览器之间的会话或购物车,有以下特点:
1、 cookie存
上一篇: php —— 观察者模式