PHP 读取大文件程序代码_PHP教程

程序员文章站 2022-05-17 18:26:40

...

PHP 读取大文件与读取一般的文件是有些区别的，如果你的文件到了几百MB或GB这样可能普通的php读取文件会很慢或卡死了，下面我来介绍一下PHP 读取大文件技巧吧。

一般读取文件我们用fopen 或者 file_get_contents ,前者可以循环读取，后者可以一次性读取，但都是将文件内容一次性加载来操作。如果加载的文件特别大时，如几百M，上G时，这时性能就降下来了，那么PHP里有没有对大文件的处理函数或者类呢？答案是：有的。

PHP真的越来越“面向对象”了，一些原有的基础的SPL方法都开始陆续地实现出class了。

从 PHP 5.1.0 开始，SPL 库增加了 SplFileObject 与 SplFileInfo 两个标准的文件操作类。SplFileInfo 是从 PHP 5.1.2 开始实现的。

从字面意思理解看，可以看出 SplFileObject 要比 SplFileInfo 更为强大。

不错，SplFileInfo 仅用于获取文件的一些属性信息，如文件大小、文件访问时间、文件修改时间、后缀名等值，而 SplFileObject 是继承 SplFileInfo 这些功能的。

代码如下

复制代码

/** 返回文件从X行到Y行的内容(支持php5、php4)
* @param string $filename 文件名
* @param int $startLine 开始的行数
* @param int $endLine 结束的行数
* @return string
*/
function getFileLines($filename, $startLine = 1, $endLine=50, $method='rb') {
$content = array();
$count = $endLine - $startLine;
// 判断php版本（因为要用到SplFileObject，PHP>=5.1.0）
if(version_compare(PHP_VERSION, '5.1.0', '>=')){
$fp = new SplFileObject($filename, $method);
$fp->seek($startLine-1);// 转到第N行, seek方法参数从0开始计数
for($i = 0; $i $content[]=$fp->current();// current()获取当前行内容
$fp->next();// 下一行
}
}else{//PHP $fp = fopen($filename, $method);
if(!$fp) return 'error:can not read file';
for ($i=1;$i fgets($fp);
}
for($i;$i $content[]=fgets($fp);// 读取文件行内容
}
fclose($fp);
}
return array_filter($content); // array_filter过滤：false,null,''
}

Ps: 上面都没加”读取到末尾的判断”：!$fp->eof() 或者 !feof($fp)，加上这个判断影响效率，自己加上测试很多很多很多行的运行时间就晓得了，而且这里加上也完全没必要。

从上面的函数就可以看出来使用SplFileObject比下面的fgets要快多了，特别是文件行数非常多、并且要取后面的内容的时候。fgets要两个循环才可以，并且要循环$endLine次。

此方法花了不少功夫，测试了很多中写法，就是想得出效率最高的方法。哪位觉得有值得改进的欢迎赐教。

使用，返回35270行-35280行的内容:

代码如下

复制代码

echo '

';

var_dump(getFileLines('test.php',35270,35280));

echo '

再看一个实例

代码如下

复制代码

function readBigFile($filename, $count = 20, $tag = "rn") {
$content = "";//最终内容
$current = "";//当前读取内容寄存
$step= 1;//每次走多少字符
$tagLen = strlen($tag);
$start = 0;//起始位置
$i = 0;//计数器
$handle = fopen($filename,'r+');//读写模式打开文件，指针指向文件起始位置
while($i fseek($handle, $start, SEEK_SET);//指针设置在文件开头
$current = fread($handle,$step);//读取文件
$content .= $current;//组合字符串
$start += $step;//依据步长向前移动
//依据分隔符的长度截取字符串最后免得几个字符
$substrTag = substr($content, -$tagLen);
if ($substrTag == $tag) { //判断是否为判断是否是换行或其他分隔符
$i++;
$content .= "
";
}
}
//关闭文件
fclose($handle);
//返回结果
return $content;
}
$filename = "csdn.sql";//需要读取的文件
$tag = "n";//行分隔符注意这里必须用双引号
$count = 100;//读取行数
$data = readBigFile($filename,$count,$tag);
echo $data;

注意:通过使用PHP的fseek和fread相结合，即可做到随意读取文件中的某一部份数据，关于函数传入的变量$tag的值，根据系统不一样，传入的值也是有区别的：Windows用”rn”，linux/unix用”n”，Mac OS用”r”。

上一篇： Zend Framework连接Mysql数据库实例分析

下一篇： js获取select选中的option的text示例代码_javascript技巧

PHP 读取大文件程序代码_PHP教程

CentOS7.0下安装PHP5.6.30服务的教程详解

php 中phar包的使用教程详解

PHP如何通过表单直接提交大文件详解

PHP大文件分片上传的实现方法

Zend Studio怎么导入本地项目?Zend Studio导入PHP工程的教程

关于PHP 如何用 curl 读取 HTTP chunked 数据

php成功操作redis cluster集群的实例教程

js读取本地json文件数据（php和mysql网站模板）

PHP开发环境配置(MySQL数据库安装图文教程)

PHP 读取和修改大文件的某行内容的代码