欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Headless无头浏览器的入门使用

程序员文章站 2022-05-27 09:02:30
...

无头浏览器即headless browser,是一种没有界面的浏览器。既然是浏览器那么浏览器该有的东西它都应该有,只是看不到界面而已。
浏览器内核

Webkit:目前最主流的浏览器内核,webkit是苹果公司开源的浏览器内核,其前身是KHTML。基于Webkit的浏览器很多,比如Safari,Chrome,Opera

Gecko:是Firefox浏览器的内核

Trident:是IE浏览器的内核

Blink:是webkit的一个分支版本,由google开发

一、Headless Chrome

  截止目前最新的Chrome版本在Mac\Linux\Windows上都可以使用headless模式

  调用方式:a、使用命令行进行调用

            首先需要把chrome的安装路径添加到系统路径下面,调用方式如下
           chrome --headless http://www.baidu.com
          b、通过selenuim进行调用(目前java\python等主流语言都支持selenuim)

Headless无头浏览器的入门使用

二、Headless Firefox

  截止目前最新的Chrome版本在Mac\Linux\Windows上都可以使用headless模式

  调用方式:a、使用命令行进行调用
        firefox -headless http://www.baidu.com
            b、通过selenuim进行调用

Headless无头浏览器的入门使用

三、 PhantomJS

  调用方式:a、使用命令行进行调用                 

            首先在官方网站下载最新的phantomJS版本,并把安装目录的路径添加到系统路径
            下,然后在命令行打开,使用命令 phantomJS  xx.js url 运行JS脚本。

            PhantomJS脚本参考:

Headless无头浏览器的入门使用

         b、在nodejs中使用phantomjs,需要用到phantomjs中的一个Child Process模
         块,介绍在这里http://phantomjs.org/api/child_process/。github已经有对
         phantomjs的node支持库,项目地址在这里https://github.com/amir20
         /phantomjs-node


         c、通过selenuim进行调用(目前已经不支持了)