PHP读取大文件的类SplFileObject使用介绍
程序员文章站
2023-11-23 15:41:10
如果加载的文件特别大时,如几百m,上g时,这时性能就降下来了,那么php里有没有对大文件的处理函数或者类呢? 答案是:有的。php真的越来越“面向对象”了,一些原有的基础的...
如果加载的文件特别大时,如几百m,上g时,这时性能就降下来了,那么php里有没有对大文件的处理函数或者类呢? 答案是:有的。
php真的越来越“面向对象”了,一些原有的基础的spl方法都开始陆续地实现出class了。
从 php 5.1.0 开始,spl 库增加了 splfileobject 与 splfileinfo 两个标准的文件操作类。splfileinfo 是从 php 5.1.2 开始实现的。
从字面意思理解看,可以看出 splfileobject 要比 splfileinfo 更为强大。
不错,splfileinfo 仅用于获取文件的一些属性信息,如文件大小、文件访问时间、文件修改时间、后缀名等值,而 splfileobject 是继承 splfileinfo 这些功能的。
复制代码 代码如下:
/** 返回文件从x行到y行的内容(支持php5、php4)
* @param string $filename 文件名
* @param int $startline 开始的行数
* @param int $endline 结束的行数
* @return string
*/
function getfilelines($filename, $startline = 1, $endline=50, $method='rb') {
$content = array();
$count = $endline - $startline;
// 判断php版本(因为要用到splfileobject,php>=5.1.0)
if(version_compare(php_version, '5.1.0', '>=')){
$fp = new splfileobject($filename, $method);
$fp->seek($startline-1);// 转到第n行, seek方法参数从0开始计数
for($i = 0; $i <= $count; ++$i) {
$content[]=$fp->current();// current()获取当前行内容
$fp->next();// 下一行
}
}else{//php<5.1
$fp = fopen($filename, $method);
if(!$fp) return 'error:can not read file';
for ($i=1;$i<$startline;++$i) {// 跳过前$startline行
fgets($fp);
}
for($i;$i<=$endline;++$i){
$content[]=fgets($fp);// 读取文件行内容
}
fclose($fp);
}
return array_filter($content); // array_filter过滤:false,null,''
}
* @param string $filename 文件名
* @param int $startline 开始的行数
* @param int $endline 结束的行数
* @return string
*/
function getfilelines($filename, $startline = 1, $endline=50, $method='rb') {
$content = array();
$count = $endline - $startline;
// 判断php版本(因为要用到splfileobject,php>=5.1.0)
if(version_compare(php_version, '5.1.0', '>=')){
$fp = new splfileobject($filename, $method);
$fp->seek($startline-1);// 转到第n行, seek方法参数从0开始计数
for($i = 0; $i <= $count; ++$i) {
$content[]=$fp->current();// current()获取当前行内容
$fp->next();// 下一行
}
}else{//php<5.1
$fp = fopen($filename, $method);
if(!$fp) return 'error:can not read file';
for ($i=1;$i<$startline;++$i) {// 跳过前$startline行
fgets($fp);
}
for($i;$i<=$endline;++$i){
$content[]=fgets($fp);// 读取文件行内容
}
fclose($fp);
}
return array_filter($content); // array_filter过滤:false,null,''
}
ps: 上面都没加”读取到末尾的判断”:!$fp->eof() 或者 !feof($fp),加上这个判断影响效率,自己加上测试很多很多很多行的运行时间就晓得了,而且这里加上也完全没必要。
从上面的函数就可以看出来使用splfileobject比下面的fgets要快多了,特别是文件行数非常多、并且要取后面的内容的时候。fgets要两个循环才可以,并且要循环$endline次。
此方法花了不少功夫,测试了很多中写法,就是想得出效率最高的方法。哪位觉得有值得改进的欢迎赐教。
使用,返回35270行-35280行的内容:
复制代码 代码如下:
echo '<pre>';
var_dump(getfilelines('test.php',35270,35280));
echo '</pre>';
var_dump(getfilelines('test.php',35270,35280));
echo '</pre>';