Nodejs抓取html页面内容
程序员文章站
2022-03-31 15:49:03
...
废话不多说,直接给大家贴node.js抓取html页面内容的核心代码了。
具体代码如下所示:
var http = require("http"); var iconv = require('iconv-lite'); var option = { hostname: "stockdata.stock.hexun.com", path: "/gszl/s601398.shtml" }; var req = http.request(option, function(res) { res.on("data", function(chunk) { console.log(iconv.decode(chunk, "gbk")); }); }).on("error", function(e) { console.log(e.message); }); req.end();
下面再看下面一种nodejs抓取网页内容
function loadPage(url) { var http = require('http'); var pm = new Promise(function (resolve, reject) { http.get(url, function (res) { var html = ''; res.on('data', function (d) { html += d.toString() }); res.on('end', function () { resolve(html); }); }).on('error', function (e) { reject(e) }); }); return pm; } loadPage('http://www.baidu.com').then(function (d) { console.log(d); });
更多Nodejs抓取html页面内容相关文章请关注PHP中文网!
推荐阅读
-
Python使用urllib2模块抓取HTML页面资源的实例分享
-
通过nodejs 服务器读取HTML文件渲染到页面的方法
-
JS实现获取word文档内容并输出显示到html页面示例
-
利用curl抓取远程页面内容的示例代码
-
详解移动端html5页面长按实现高亮全选文本内容的兼容解决方案
-
初学html,任务1:一个简单html页面,要求:内容页面装一篇文章 用html来分段
-
asp.net抓取页面内容+下载文件
-
Python使用urllib2模块抓取HTML页面资源的实例分享
-
【.Net Core】.Net Core通过HtmlAgilityPack组件对页面数据定时进行抓取(通过.net core定时抓取网页内容)以及.net core部署和启动服务
-
Java爬虫系列二:使用HttpClient抓取页面HTML