Shell脚本实现获取网页快照并生成缩略图
获取网页快照并生成缩略图可分两步进行:
1、获取网页快照
2、生成缩略图
获取网页快照
这里我们用 phantomjs 来实现。关于 phantomjs 的详细用法可参考官方网站。http://phantomjs.org/
1、安装
我的环境是centos6.5,安装时直接下载 tarball 然后解压即可。
# wget https://bitbucket.org/ariya/phantomjs/downloads/phantomjs-1.9.8-linux-i686.tar.bz2
# tar -jxvf phantomjs-1.9.8-linux-i686.tar.bz2
# cp phantomjs-1.9.8-linux-i686/bin/phantomjs /bin/phantomjs
第二步中解压后bin目录下的 phantomjs 二进制文件即是可调用命令。
第三步是为了在以后调用命令时不必输入命令全路径。
2、调用
phantomjs的调用需要一个js脚本。这个js脚本接收两个参数,分别是网址url和快照文件名称filename,脚本snap.js内容如下:
/*
* desc: get snapshot from url
* example: phantomjs snap.js http://www.baidu.com baidu.png
*/
var page = require('webpage').create();
var args = require('system').args;
var pagew = 1024;
var pageh = 768;
page.viewportsize = {
width: pagew,
height: pageh
};
var url = args[1];
var filename = args[2];
page.open(url, function (status) {
if (status !== 'success') {
console.log('unable to load ' + url + ' !');
phantom.exit();
} else {
window.settimeout(function () {
page.cliprect = { left: 0, top: 0, width: pagew, height: pageh };
page.render(filename);
console.log('finish:', filename);
phantom.exit();
}, 1000);
}
});
在这个脚本中还有个小小的设置,就是设置打开页面的浏览器可视区域的大小为1024*768,然后取第一屏内容。
调用命令如下:
phantomjs snap.js http://www.baidu.com baidu.png
注意:这里执行命令的用户需要对目录有写权限。
3、效果
获取的截图如下:
生成缩略图
生成缩略图用的是imagemagick工具,imagemagick是个非常强大的图片处理工具,可对图片进行转化(格式转换、缩放、剪切、模糊、反转等)、屏幕截图、图片显示等,详细用法可参考 我的imagemagick使用心得 一文。
1、安装
redhat系列可使用yum安装:
# yum install imagemagick imagemagick-devel
其他平台安装请参考官方网站:http://www.imagemagick.org/script/binary-releases.php,根据你的系统选择相应的包或自己编译源码。
2、调用
我们这里只使用图片缩放工具,语法为:
convert -resize 320x240 baidu.png baidu_thumbnail.png
默认是按比率缩放,如果要强制缩放,可以在尺寸后面加感叹号:
convert -resize 320x240! baidu.png baidu_thumbnail.png
3、效果
生成的缩略图如下:
整合脚本
如果希望将上两步自动化,可以写一个shell脚本实现:
# !/bin/bash
# desc: create snapshot from url
# example: sh createsnap.sh http://www.baidu.com baidu
url=$1
image_name=$2
snapshot_name="${image_name}.png"
thumbnail_name="${image_name}_thumbnail.png"
phantomjs snap.js $url $snapshot_name
convert -resize 320x240 $snapshot_name $thumbnail_name
exit 0
下一篇: Shell脚本统计文件行数的8种方法