如何用php抓取js生成的页面?
程序员文章站
2022-05-04 10:38:17
...
目前用的是 simple_html_dom,它获取网页的方式直接file_get_contents获取网页,但是对于js生成的页面就无法获取了,用什么方法能够用php抓取js动态生成的页面?
回复内容:
目前用的是 simple_html_dom,它获取网页的方式直接file_get_contents获取网页,但是对于js生成的页面就无法获取了,用什么方法能够用php抓取js动态生成的页面?
这个并不好实现, 不然现在js的MVVM框架就不用想着服务端渲染来做SEO...
可以用V8JS
,phantomjs
若是ajax生成的获取对应的url返回值即可
还是分析请求,找接口简单点。
使用phantomjs+nodejs来处理这类问题相对来说更容易一些。
phantomjs是一个*面的浏览器环境,可以载入url,然后渲染页面。做到模拟出用户浏览器里输入url打开页面之后渲染的效果。然后通过编程调用phantomjs提供的接口去获取渲染出来的内容。
http://phantomjs.org/
1、phantomjs
2、如果js是异步加载的数据,直接php读那个接口数据。
上一篇: python软件能做什么
下一篇: 代码获取历史上的今天发生的事_基础知识
推荐阅读
-
抓取Js动态生成数据且以滚动页面方式分页的网页
-
JS如何用Math.random()来生成指定范围内(如:1-100)的随机数?
-
javascript - 如何用php或者js获取当前页面引用的iframe窗口动态url地址
-
javascript - php 抓取的页面如何处理可以只保留DOM结构,去掉CSS和JS?
-
如何用php抓取js生成的页面?
-
如何用php抓取js生成的页面?
-
javascript - 如何用php或者js获取当前页面引用的iframe窗口动态url地址
-
JS如何用Math.random()来生成指定范围内(如:1-100)的随机数?
-
(转)scrapy结合webkit抓取js生成的页面