欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

PHP读取大文件的类SplFileObject使用介绍

程序员文章站 2023-11-23 15:41:10
如果加载的文件特别大时,如几百m,上g时,这时性能就降下来了,那么php里有没有对大文件的处理函数或者类呢? 答案是:有的。php真的越来越“面向对象”了,一些原有的基础的...

如果加载的文件特别大时,如几百m,上g时,这时性能就降下来了,那么php里有没有对大文件的处理函数或者类呢? 答案是:有的。
php真的越来越“面向对象”了,一些原有的基础的spl方法都开始陆续地实现出class了。
从 php 5.1.0 开始,spl 库增加了 splfileobject 与 splfileinfo 两个标准的文件操作类。splfileinfo 是从 php 5.1.2 开始实现的。
从字面意思理解看,可以看出 splfileobject 要比 splfileinfo 更为强大。
不错,splfileinfo 仅用于获取文件的一些属性信息,如文件大小、文件访问时间、文件修改时间、后缀名等值,而 splfileobject 是继承 splfileinfo 这些功能的。
 

复制代码 代码如下:
/** 返回文件从x行到y行的内容(支持php5、php4) 
 * @param string $filename 文件名
 * @param int $startline 开始的行数
 * @param int $endline 结束的行数
 * @return string
 */
function getfilelines($filename, $startline = 1, $endline=50, $method='rb') {
    $content = array();
    $count = $endline - $startline; 
    // 判断php版本(因为要用到splfileobject,php>=5.1.0)
    if(version_compare(php_version, '5.1.0', '>=')){
        $fp = new splfileobject($filename, $method);
        $fp->seek($startline-1);// 转到第n行, seek方法参数从0开始计数
        for($i = 0; $i <= $count; ++$i) {
            $content[]=$fp->current();// current()获取当前行内容
            $fp->next();// 下一行
        }
    }else{//php<5.1
        $fp = fopen($filename, $method);
        if(!$fp) return 'error:can not read file';
        for ($i=1;$i<$startline;++$i) {// 跳过前$startline行
            fgets($fp);
        }
        for($i;$i<=$endline;++$i){
            $content[]=fgets($fp);// 读取文件行内容
        }
        fclose($fp);
    }
    return array_filter($content); // array_filter过滤:false,null,''
}
   
ps: 上面都没加”读取到末尾的判断”:!$fp->eof() 或者 !feof($fp),加上这个判断影响效率,自己加上测试很多很多很多行的运行时间就晓得了,而且这里加上也完全没必要。
从上面的函数就可以看出来使用splfileobject比下面的fgets要快多了,特别是文件行数非常多、并且要取后面的内容的时候。fgets要两个循环才可以,并且要循环$endline次。
此方法花了不少功夫,测试了很多中写法,就是想得出效率最高的方法。哪位觉得有值得改进的欢迎赐教。
使用,返回35270行-35280行的内容:
复制代码 代码如下:
echo '<pre>';
var_dump(getfilelines('test.php',35270,35280));
echo '</pre>';