PHP中curl post的用法及原理解析
程序员文章站
2024-02-03 22:34:52
...
1、首先说明一下,curl的百科解释是:
2、简单来说,curl就是抓取页面的升级版,即支持GET、POST等浏览器行为,从而可以达到一个模拟浏览器操作的目的。
我们可以看到浏览器会输出百度的页面结果。我们继续深入研究如何使用curl来达到一个模拟登陆的过程,也就是模拟post的过程。
注:例子亲测有效,只是我把我自己测试的真实账号修改了一下。
根据结果,显示成功。这里我的网址和相关参数全部修改了,读者可以根据自己的需要做相应的修改。
PHP[2]支持的由Daniel Stenberg创建的libcurl库允许你与各种的服务器使用各种类型的协议进行连接和通讯。libcurl目前支持http、https、ftp、gopher、telnet、dict、file和ldap协议。libcurl同时也支持HTTPS认证、HTTP POST、HTTP PUT、 FTP 上传(这个也能通过PHP的FTP扩展完成)、HTTP 基于表单的上传、代理、cookies和用户名+密码的认证。PHP中使用cURL实现Get和Post请求的方法
2、简单来说,curl就是抓取页面的升级版,即支持GET、POST等浏览器行为,从而可以达到一个模拟浏览器操作的目的。
最简单的一个模型就是如下图所示的模型:
就是初始化,配置,取页面源代码数据,关闭。一个非常简单的例子如下所示:
我们可以看到浏览器会输出百度的页面结果。我们继续深入研究如何使用curl来达到一个模拟登陆的过程,也就是模拟post的过程。
3、POST的过程比较复杂一些,但是原理和浏览器提交过程相同,简单来说,就是利用curl直接将用户名和密码(或者其他相应的参数,这个根据post页面具体讨论)提交到post指向的处理页面即可。过程如下图:
当然,我们可以看到过程几乎一样,只是在curl初始化之后,要生成一些列的post参数,然后再提交,等待返回数据。
例子如下:
注:例子亲测有效,只是我把我自己测试的真实账号修改了一下。
上面的例子就可以显示,我们可以成功或者失败的返回数据。
但是上面有一个问题,就是失效性,也就是我们仅仅登陆成功了登陆页是没有效果的,服务器不一定保持了我们的登陆状态,所以如果我们直接取其他页面的数据,网站又会给出未登录提示,这里就需要设置一个cookie。
4、cookie设置及登陆
根据图形,我们可以分两步走,第一步模拟登陆并且设置cookie。第二步读取cookie并且加载需要登陆后访问的页面。
下面给出测试成功的例子。
根据结果,显示成功。这里我的网址和相关参数全部修改了,读者可以根据自己的需要做相应的修改。
上一篇: 怎么抓取网页实时内容
推荐阅读