PuppeteerSharp读取页面完整HTML(.NetCore)
程序员文章站
2022-04-14 18:56:44
1.使用NUGET安装PuppeteerSharp 通过工具或者命令方式安装 2.初始化浏览器 await new BrowserFetcher().DownloadAsync(BrowserFetcher.DefaultRevision); 3.具体代码 using (Browser browse ......
1.使用nuget安装puppeteersharp
通过工具或者命令方式安装
2.初始化浏览器
await new browserfetcher().downloadasync(browserfetcher.defaultrevision);
3.具体代码
using (browser browser = await puppeteer.launchasync(new launchoptions { headless = true }))
{
using (var page = await browser.newpageasync())
{
//设置浏览器的页面大小
await page.setviewportasync(new viewportoptions
{
width = 1024,
height = 768
});
await page.gotoasync("http://www.baidu.com");
var html = await page.getcontentasync();
var sourcefile = "";
var memorystream = new memorystream(encoding.default.getbytes(html));
var sr = new streamreader(memorystream);
sourcefile = sr.readtoend();
//针对源代码进行分析
var te = new textextractor(sourcefile);
te.extract();
sr.close();
//将页面保存为图片
//await page.screenshotasync(@"d:\1.png",
// new screenshotoptions() { fullpage = true, type = screenshottype.png });
}
}
推荐阅读
-
通过nodejs 服务器读取HTML文件渲染到页面的方法
-
JS实现HTML页面中动态显示当前时间完整示例
-
PuppeteerSharp读取页面完整HTML(.NetCore)
-
ajax读取txt文本中的json并显示在html页面表格上
-
jQuery简单实现的HTML页面文本框模糊匹配查询功能完整示例
-
通过nodejs 服务器读取HTML文件渲染到页面的方法
-
页面图片读取问题_html/css_WEB-ITnose
-
读取页面元素的onclick属性值 禁止重定向 获取url重定向后Location头指定的重定向目标_html/css_WEB-ITnose
-
php生成html静态页面完整实例
-
php生成html静态页面完整实例