欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

(仿)火车头采集器 源码开源

程序员文章站 2023-11-14 17:06:58
菜鸟作品,不喜勿喷 前两年自己花了很久想仿制一款火车头采集器 然后也付出了很多努力,最终未能修成正果 代码一直在电脑中吃灰,本着无私奉献的精神 免费开源,给有需要的人参考和完善 软件功能大部分都已实现 任务新建和编辑 网址采集 标签编辑 数据采集 数据发布 发布配置的修改,编辑和测试 发布模块的修改 ......

菜鸟作品,不喜勿喷

前两年自己花了很久想仿制一款火车头采集器

然后也付出了很多努力,最终未能修成正果

代码一直在电脑中吃灰,本着无私奉献的精神

免费开源,给有需要的人参考和完善

软件功能大部分都已实现

  • 任务新建和编辑
  • 网址采集
  • 标签编辑
  • 数据采集
  • 数据发布
  • 发布配置的修改,编辑和测试
  • 发布模块的修改和编辑

 

 

先上一些效果图

运行效果

(仿)火车头采集器 源码开源

主窗口

(仿)火车头采集器 源码开源

 

 

任务窗口

(仿)火车头采集器 源码开源

 

 

 

采集内容

(仿)火车头采集器 源码开源

 

 

 

网址采集

(仿)火车头采集器 源码开源

 

 

 

发布选择

(仿)火车头采集器 源码开源

 

 

多级网址采集

(仿)火车头采集器 源码开源

 

浏览器获取信息

(仿)火车头采集器 源码开源

 

标签编辑(这个部分耗时比较久)

(仿)火车头采集器 源码开源

 

 

 

接下来是发布部分

 

发布配置

(仿)火车头采集器 源码开源

 

 

 

发布模块

(仿)火车头采集器 源码开源

(仿)火车头采集器 源码开源

 

发布测试

(仿)火车头采集器 源码开源

 

 

 

开发日志(当时手机记录的,比较长,可跳过,下载地址在最后)

5.23
[窗口]主界面布局
[窗口]信息提示窗口
 
 
5.24
[窗口]任务分组列表
[新增]任务列表实现保存和读取
[优化]主界面窗口尺寸自适应完善
 
 
5.25
[新增]分组增加,删除以及修改功能实现,已xml文本形式保存文件
 
5.26
[优化]分组增删改重写,改用sqlite3
 
 
5.27
 [窗口]采集任务第一步布局
[窗口]动态提醒帮助窗口
[控件]picmenu——菜单选择改变文本框
[窗口]网址添加(半成品)
 
5.28
 [控件]高亮显示编辑框
[控件]lable——选项修改代码框
[窗口]添加采集地址添加窗口布局完成
[新增]网址添加部分各个规则生成预览完成
 
5.29
 [优化]重新优化代码高亮编辑框,更多属性和配置,更多展现组合方式
[新增]任务编辑基本信息读取(标题,备注等)
[窗口]多页管理窗口布局完成
[新增]多页管理网址替换和源码中提取
 
5.30
[新增]gac浏览器支持xpath,可视化选取采集元素,支持多选和单选,网址自动纠正
 
5.31
[窗口]添加任务第一步全部布局完成(尺寸自适应)
[新增]通过xpath获取网址
[优化]代码高亮,支持post随机值和分页
[代码]新增获取规则网址列表(待测试)
 
6.1
[窗口]第一步读取配置信息完成
[新增]多级网址规则增删改
[新增]post参数增删改
[新增]自动获取网址链接
[新增]手动获取网址链接
[新增]get和post方式获取链接6.2[新增]多级网址支持标签
[新增]支持附加参数
[新增]列表分页获取
[核心]获取网址列表(一级网址)
 
6.3
[新增]获取网址列表支持xpath
[新增]测试地址采集结果,实时状态
[新增]测试结果的导出,复制,浏览
[新增]获取网址列表支持多级
[新增]检测重复网址
[新增]多级网址只测试第一级
[新增]网址列表结果支持标签
[优化]浏览器获取cookies自动跳转第一个网址
 
6.4-6.9暂停开发六天
 
6.10
[优化]网址采集支持多级标签
[布局]新建任务第三步布局完成
 
6.12
-16[辅助]xml生成实体类工具开发
 
6.17
暂停一天
 
6.18
[窗口]多页管理实现
 
6.19
[窗口]标签编辑基本布局
 
6.20
[新增]标签处理列表读取
 
6.21-6.22
[优化]部分标签处理编辑
 
6.24
[优化]除ocr外所有标签读取编辑保存
[优化]固定格式读取,测试 
后面懒得写了
(0)
打赏 (仿)火车头采集器 源码开源 微信扫一扫

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

(仿)火车头采集器 源码开源
验证码: (仿)火车头采集器 源码开源