欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  php教程

php读取远程gzip压缩网页的方法

程序员文章站 2024-02-14 20:54:04
...

这篇文章主要介绍了php读取远程gzip压缩网页的方法,当站点使用gzip压缩时,使用常规的远程获取方法会得到乱码结果,使用本文方法即可解决这个问题,需要的朋友可以

今天在调取一家商城的页面信息时候,使用file_get_contents抑或curl:


复制代码 代码如下:


$url = 'http://www.xxx.com/21/?type=23′;
$temp = file_get_contents($url);
echo $temp;


都得到一片乱码,查看了许多内容,包括页面的header信息,发现原来页面使用了。

php读取远程gzip压缩网页的方法

类似的信息,即Content-Encoding为gzip,即该站点开启了gzip压缩。这里的解决方案有多种,当然如果你使用file_get_contents的话,可以这样修改:

复制代码 代码如下:


file_get_contents("compress.zlib://".$url);

或者使用curl来完成:


复制代码 代码如下:


function curl_get($url, $gzip=false){
$curl = curl_init($url);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($curl, CURLOPT_CONNECTTIMEOUT, 10);
if($gzip) curl_setopt($curl, CURLOPT_ENCODING, "gzip"); // 关键在这里
$content = curl_exec($curl);
curl_close($curl);
return $content;
}

同时,参考手册上面的解法,,还可以对保存gzip类型的字符串进行处理如下:

复制代码 代码如下:


function gzdecode($data){
$g=tempnam(‘/tmp','ff');
@file_put_contents($g,$data);
ob_start();
readgzfile($g);
$d=ob_get_clean();
return $d;
}