PHP读取大文件的类SplFileObject使用介绍

程序员文章站 2023-11-23 15:41:10

如果加载的文件特别大时，如几百m，上g时，这时性能就降下来了，那么php里有没有对大文件的处理函数或者类呢？答案是：有的。php真的越来越“面向对象”了，一些原有的基础的...

如果加载的文件特别大时，如几百m，上g时，这时性能就降下来了，那么php里有没有对大文件的处理函数或者类呢？答案是：有的。
php真的越来越“面向对象”了，一些原有的基础的spl方法都开始陆续地实现出class了。
从 php 5.1.0 开始，spl 库增加了 splfileobject 与 splfileinfo 两个标准的文件操作类。splfileinfo 是从 php 5.1.2 开始实现的。
从字面意思理解看，可以看出 splfileobject 要比 splfileinfo 更为强大。
不错，splfileinfo 仅用于获取文件的一些属性信息，如文件大小、文件访问时间、文件修改时间、后缀名等值，而 splfileobject 是继承 splfileinfo 这些功能的。

复制代码代码如下:

/** 返回文件从x行到y行的内容(支持php5、php4)  
 * @param string $filename 文件名
 * @param int $startline 开始的行数
 * @param int $endline 结束的行数
 * @return string
 */
function getfilelines($filename, $startline = 1, $endline=50, $method='rb') {
    $content = array();
    $count = $endline - $startline;  
    // 判断php版本（因为要用到splfileobject，php>=5.1.0）
    if(version_compare(php_version, '5.1.0', '>=')){
        $fp = new splfileobject($filename, $method);
        $fp->seek($startline-1);// 转到第n行, seek方法参数从0开始计数
        for($i = 0; $i <= $count; ++$i) {
            $content[]=$fp->current();// current()获取当前行内容
            $fp->next();// 下一行
        }
    }else{//php<5.1
        $fp = fopen($filename, $method);
        if(!$fp) return 'error:can not read file';
        for ($i=1;$i<$startline;++$i) {// 跳过前$startline行
            fgets($fp);
        }
        for($i;$i<=$endline;++$i){
            $content[]=fgets($fp);// 读取文件行内容
        }
        fclose($fp);
    }
    return array_filter($content); // array_filter过滤：false,null,''
}

ps: 上面都没加”读取到末尾的判断”：!$fp->eof() 或者 !feof($fp)，加上这个判断影响效率，自己加上测试很多很多很多行的运行时间就晓得了，而且这里加上也完全没必要。
从上面的函数就可以看出来使用splfileobject比下面的fgets要快多了，特别是文件行数非常多、并且要取后面的内容的时候。fgets要两个循环才可以，并且要循环$endline次。
此方法花了不少功夫，测试了很多中写法，就是想得出效率最高的方法。哪位觉得有值得改进的欢迎赐教。
使用，返回35270行-35280行的内容:

复制代码代码如下:

echo '<pre>';
var_dump(getfilelines('test.php',35270,35280));
echo '</pre>';  

上一篇： PHP扩展模块Pecl、Pear以及Perl的区别

下一篇： PHP图片等比缩放类SimpleImage使用方法和使用实例分享

PHP读取大文件的类SplFileObject使用介绍

php中jpgraph类库的使用介绍

PHP快速按行读取CSV大文件的封装类分享（也适用于其它超大文本文件）