puppeteer实现html截图的示例代码

程序员文章站 2023-11-24 12:32:40

puppeteer是谷歌官方出品的一个通过 devtools 协议控制 headless chrome 的node库。可以通过puppeteer的提供的api直接控制chr...

puppeteer是谷歌官方出品的一个通过 devtools 协议控制 headless chrome 的node库。可以通过puppeteer的提供的api直接控制chrome模拟大部分用户操作来进行ui test或者作为爬虫访问页面来收集数据。

安装

直接运行安装命令：

npm install puppeteer

如果出现无法安装的问题，可以使用淘宝镜像。

puppeteer实现滑动截图

在我 puppeteer 使用截全屏的过程中发现有些图片无法截取到，而实际上是因为有些图片是懒加载的，如果你没有滑动到图片的位置，那么这个图片是不会加载。

现在我的方式是采用模拟浏览器滚动条滑动的方式滑动底部来使图片加载出来。

代码如下：

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch({
    headless: false
  });
  const page = await browser.newpage();
  await page.goto('https://www.cnblogs.com/morethink/p/6525216.html');
  await page.setviewport({
    width: 1200,
    height: 800
  });

  await autoscroll(page);

  await page.screenshot({
    path: '1.png',
    fullpage: true
  });

  await browser.close();
})();


function autoscroll(page) {
  return page.evaluate(() => {
    return new promise((resolve, reject) => {
      var totalheight = 0;
      var distance = 100;
      var timer = setinterval(() => {
        var scrollheight = document.body.scrollheight;
        window.scrollby(0, distance);
        totalheight += distance;
        if (totalheight >= scrollheight) {
          clearinterval(timer);
          resolve();
        }
      }, 100);
    })
  });
}

动图如下：

puppeteer实现html截图的示例代码

puppeteer 实现 html element 截图

在某些情况下我们只想要针对html的某个位置进行截图而不是针对页面截全屏。

puppeteer提供了elementhandle.screenshot 方法，该方法参数和page.screenshot 一样。而elementhandle 对象是页面内的dom对象。可以帮助我对 html element进行截图。这样的话你想截取页面的哪部分就截取页面的哪部分。

代码如下：

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch({
    headless: false
  });
  const page = await browser.newpage();
  await page.goto('https://www.cnblogs.com/morethink/p/6525216.html');
  await page.setviewport({
    width: 1200,
    height: 800
  });
  //获取页面dom对象
  let body = await page.$('#cnblogs_post_body');
  //调用页面内dom对象的 screenshot 方法进行截图
  await body.screenshot({
    path: '2.png'
  });
  await browser.close();
})();

参考文档：

https://github.com/googlechrome/puppeteer/blob/v1.11.0/docs/api.md#elementhandlescreenshotoptions

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

上一篇： Win10两大新版15010/15012现身预计最快本周推送

下一篇： Java实现读取键盘输入保存到txt文件,再统计并输出每个单词出现次数的方法

puppeteer实现html截图的示例代码

java使用spring实现读写分离的示例代码

Spring AOP实现功能权限校验功能的示例代码

HTML5调用手机摄像头拍照的实现思路及代码

微信小程序模板消息限制实现无限制主动推送的示例代码

CSS3 实现弹幕的示例代码

python tkinter实现界面切换的示例代码

JavaScript实现无限级递归树的示例代码

Java实现拖拽文件上传dropzone.js的简单使用示例代码

小程序点赞收藏功能的实现代码示例

HTML高亮关键字的实现代码