php爬虫怎么运行
程序员文章站
2022-04-15 10:03:12
...
说到做爬虫,大家都可能第一时间想到的是python,其实php也是可以用来写爬虫程序的。php一贯简洁、易用,亲测使用PHPspider框架能写出一个简单的爬虫。
匹配方式使用XPach语法。 (推荐学习:PHP视频教程)
<?php require '/vendor/autoload.php'; use phpspider\core\phpspider; /* Do NOT delete this comment */ /* 不要删除这段注释 */ $configs = array( 'name' => '简书', 'log_show' =>false, 'tasknum' => 1, //数据库配置 'db_config' => array( 'host' => '127.0.0.1', 'port' => 3306, 'user' => 'root', 'pass' => '', 'name' => 'demo', ), 'export' => array( 'type' => 'db', 'table' => 'jianshu', // 如果数据表没有数据新增请检查表结构和字段名是否匹配 ), //爬取的域名列表 'domains' => array( 'jianshu', 'www.jianshu.com' ), //抓取的起点 'scan_urls' => array( 'https://www.jianshu.com/c/V2CqjW?utm_medium=index-collections&utm_source=desktop' ), //列表页实例 'list_url_regexes' => array( "https://www.jianshu.com/c/\d+" ), //内容页实例 // \d+ 指的是变量 'content_url_regexes' => array( "https://www.jianshu.com/p/\d+", ), 'max_try' => 5, 'fields' => array( array( 'name' => "title", 'selector' => "//h1[@class='title']", 'required' => true, ), array( 'name' => "content", 'selector' => "//div[@class='show-content-free']", 'required' => true, ), ), ); $spider = new phpspider($configs); $spider->start();
打完代码后,记得根据要抓取的内容建立对应的数据库、数据表,字段要能对对上。
接着cmd,输入
php -f d:\jianshu\spider.php
运行如下
以上就是php爬虫怎么运行的详细内容,更多请关注其它相关文章!
推荐阅读
-
探讨:关闭浏览器后,php脚本会不会继续运行
-
非集成环境的php运行环境(Apache配置、Mysql)搭建安装图文教程
-
在Win2003(64位)中配置IIS6+PHP5.2.17+MySQL5.5的运行环境
-
怎么运行用记事本写的java程序
-
PHP+HTML+JavaScript+Css实现简单爬虫开发
-
php运行提示Can't connect to MySQL server on 'localhost'的解决方法
-
优酷客户端启动不了 优酷启动提示优酷客户端运行错误怎么回事?怎么解决?
-
Wallpaper Engine停止运行怎么办?Wallpaper Engine停止运行的解决方法
-
Win8音频服务未运行怎么办?Win8音频服务未运行的解决方法
-
详解PHP的Yii框架的运行机制及其路由功能