原创php采集器 v1.02

程序员文章站 2024-04-02 20:36:40

...

用于网站采集，使用简单：支持分页采集、图片下载、过滤等，说明不多，仅限于php的二次开发，之前的代码片段先删除，请直接下载附件，如需要采集服务可联系我 PHP ?php/** * 抓取器 * @author Administrator * @example $config = array( * 'host'='服务器地

用于网站采集，使用简单：支持分页采集、图片下载、过滤等，说明不多，仅限于php的二次开发，之前的代码片段先删除，请直接下载附件，如需要采集服务可联系我
PHP

'服务器地址',
 * 		'list'=>array(
 * 			'items'=>array(正则表达式组),
 * 			'page_url'=>'分页地址正则表达式,$1为链接，$2显示的数字',
 * 			'page_size'=>'分页大小',
 * 			'page_url_rule'=>'获取页码数的正则，$1必为数字',
 * 			'page_limit'=>数字，要扫描的最大页数，如果不填，则只扫描可视范的页码数
 * 			'this_detail_callback'=>'对详情页的数据执行回调函数',
 * 			'list_detail_url'=>'指定list中的items中名称为详情页的地址'
 * 		)
 *
 * 		details=>array(
 * 			详情页的所有规则,见items结构说明
 * 		),
 *
 * 		time_limit=>array('rule'=>对应的组名，start=>超始时间,end=>结束时间),
 * 		num_limit=>获取多少条数据
 * )
 *
 * items结构解析: array(
 * 		'属性名称'=>array('rule'=>正则表达式，多种情况时为数组,type=>' 1-文本,2-远程请求,3->'子规则列表items',4=>'子config配置',
 * 	replace=>替换结果，以回调函数形式或采用数组array(from=>'正则表达式','to'=>替换字符),'multi'=>是否采集多条数据),
 * )
 */

set_time_limit(0);
define('IN_WEB',true);
date_default_timezone_set('PRC');
include('collector/init.php');

$htmlFilter = '/]*\/>|((onclick|onmouseover|onmouseout|onblur)=\"[^\"]+\")||]*>||
声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn核实处理。

相关标签：原创 php 采集 v1.02 用于网站采集使用简单

上一篇： div+css布局入门_html/css_WEB-ITnose

下一篇： PHP 用了ThinkPHP好像是伪静态的东西,路径我都不认识了

原创php采集器 v1.02

原创php采集器 v1.02

php简单防盗链验证实现方法原创

php简单隔行变色功能实现代码原创

php常用字符串输出方法分析(echo,print,printf及sprintf) 原创

php简单防盗链验证实现方法原创

解决wincache不支持64位PHP5.5/5.6的问题（提供64位wincache下载）原创

php使用curl判断网页404(不存在)的方法原创

php实现子字符串位置相互对调互换的方法原创

php求圆周率的简单实现方法原创

PHP字符串中插入子字符串方法总结原创

原创php采集器 v1.02

原创php采集器 v1.02

php简单防盗链验证实现方法 原创

php简单隔行变色功能实现代码 原创

php常用字符串输出方法分析(echo,print,printf及sprintf) 原创

php简单防盗链验证实现方法 原创

解决wincache不支持64位PHP5.5/5.6的问题（提供64位wincache下载） 原创

php使用curl判断网页404(不存在)的方法 原创

php实现子字符串位置相互对调互换的方法 原创

php求圆周率的简单实现方法 原创

PHP字符串中插入子字符串方法总结 原创

php简单防盗链验证实现方法原创

php简单隔行变色功能实现代码原创

php简单防盗链验证实现方法原创

解决wincache不支持64位PHP5.5/5.6的问题（提供64位wincache下载）原创

php使用curl判断网页404(不存在)的方法原创

php实现子字符串位置相互对调互换的方法原创

php求圆周率的简单实现方法原创

PHP字符串中插入子字符串方法总结原创