抓取网页的里面的所有图片

程序员文章站 2021-12-23 21:09:36

...

<?php

download_images('http://gp.qzd18.cn/01/');

function download_images($article_url = '', $image_path = 'tmp'){

// 获取文章类容

$ch = curl_init();

curl_setopt ($ch, CURLOPT_URL, $article_url);

curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);

curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT,10);

$content = curl_exec($ch);

//$content = file_get_contents($article_url);这种老得方式直接放弃

// 利用正则表达式得到图片链接

$reg_tag = '/<img.*?\"([^\"]*(jpg|bmp|jpeg|gif|png)).*?>/';

$ret = preg_match_all($reg_tag, $content, $match_result);

$pic_url_array = array_unique($match_result[1]);

// 创建路径

$dir = getcwd() . DIRECTORY_SEPARATOR .'tmp';

if(!file_exists($dir)){

mkdir(iconv("UTF-8", "GBK", $dir), 0777, true);

}

foreach($pic_url_array as $pic_url){

$tule_pic=$article_url.$pic_url;

// 获取文件信息

$ch = curl_init($tule_pic);

curl_setopt($ch, CURLOPT_HEADER, 0);

curl_setopt($ch, CURLOPT_NOBODY, 0);

curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE );

curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE );

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

$fileInfo = curl_exec($ch);

$httpinfo = curl_getinfo($ch);

curl_close($ch);

// 获取图片文件后缀

$ext = strrchr($tule_pic, '/');//strrchr() 函数查找字符串在另一个字符串中最后一次出现的位置，并返回从该位置到字符串结尾的所有字符。用于截取后缀

$filename = $dir.$ext;

// 保存图片信息到文件

$local_file = fopen($filename, 'w');

if(false !== $local_file){

if( false !== fwrite($local_file, $fileInfo) ){

fclose($local_file);

}

抓取网页的里面的所有图片

Python之多线程爬虫抓取网页图片的实战代码

快速保存网页中所有图片的方法_JavaScript

使用Python3编写抓取网页和只抓网页图片的脚本

C#基于正则表达式实现获取网页中所有信息的网页抓取类实例

python抓取网页中的图片示例

使用Python3编写抓取网页和只抓网页图片的脚本

Python爬虫之网页图片抓取的方法

360浏览器一键存图? 360浏览获取网页上所有的图片的方法

利用HtmlAgilityPack插件写的一个抓取指定网页的图片第一次写很乱随便看看就行

PHP 抓取网页图片并且另存为的实现代码

抓取网页的里面的所有图片

Python之多线程爬虫抓取网页图片的实战代码

快速保存网页中所有图片的方法_JavaScript

使用Python3编写抓取网页和只抓网页图片的脚本

C#基于正则表达式实现获取网页中所有信息的网页抓取类实例

python抓取网页中的图片示例

使用Python3编写抓取网页和只抓网页图片的脚本

Python爬虫之网页图片抓取的方法

360浏览器一键存图? 360浏览获取网页上所有的图片的方法

利用HtmlAgilityPack插件写的一个抓取指定网页的图片 第一次写 很乱 随便看看就行

PHP 抓取网页图片并且另存为的实现代码

利用HtmlAgilityPack插件写的一个抓取指定网页的图片第一次写很乱随便看看就行