欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Python实现FTP文件定时自动下载

程序员文章站 2024-02-03 20:10:58
之前遇到技术问题总能在技术博客上得到启发,十分感谢各位的无私分享。而自己却很少发文,固然是水平有限,但也限制了知识积累和总结。今后多总结分享,回馈博客的同时也希望大家多多批评。 一、需求: 某数据公司每日15:00~17:00之间,在其FTP发布当日数据供下载,我方需及时下载当日数据至指定本地目录。 ......

  之前遇到技术问题总能在技术博客上得到启发,十分感谢各位的无私分享。而自己却很少发文,固然是水平有限,但也限制了知识积累和总结。今后多总结分享,回馈博客的同时也希望大家多多批评。

 

一、需求:

  某数据公司每日15:00~17:00之间,在其ftp发布当日数据供下载,我方需及时下载当日数据至指定本地目录。

 

二、分析:

  1、需实现ftp登陆、查询、下载功能;

  解答:使用内置的ftplib模块中ftp类;

 

  2、需判断文件是否下载;

  解答:使用os模块中path.exists方法;

 

  3、需判断在指定时间段内才执行下载任务;

  解答:使用内置的time模块抓取当前时间,并与指定时间做比较;

 

  4、需考虑日期切换问题;

  解答:使用内置的time模块抓取当前日期,并与变量中的日期做比较。

 

三、代码实现

 1 #!/usr/bin/env python
 2 # _*_ coding:utf-8 _*_
 3 
 4 '''
 5 @time    : 2019-11-11 13:30
 6 @author  : peanut_c
 7 @filename: ftp_auto_download.py
 8 '''
 9 
10 
11 import time
12 from ftplib import ftp
13 import os
14 
15 
16 remote_path = "/xxx/yy/z/"  # 远端目录
17 begin_time = 1500  # 任务开始时间
18 end_time = 1700  # 任务结束时间
19 
20 
21 today = time.strftime("%y%m%d")  # 当天日期
22 today_file = today + 'test.txt'  # 得到当天日期的目标文件名
23 remote_file = remote_path + today_file  # 远端文件名
24 local_file = '\\\\local\\' + today + '\\' + today_file  # 本地文件名
25 log_file = 'c:\\\\log\\ftp_log.txt'
26 
27 
28 def ftp_connect():
29     """用于ftp连接"""
30     ftp_server = 'w.x.y.z'  # ftp站点对应的ip地址
31     username = 'ftpuser'  # 用户名
32     password = 'ftppass'  # 密码
33     ftp = ftp()
34     ftp.set_debuglevel(0) # 较高的级别方便排查问题
35     ftp.connect(ftp_server, 21)
36     ftp.login(username, password)
37     return ftp
38 
39 def remote_file_exists():
40     """用于ftp站点目标文件存在检测"""
41     ftp = ftp_connect()
42     ftp.cwd(remote_path) # 进入目标目录
43     remote_file_names = ftp.nlst()  # 获取文件列表
44     ftp.quit()
45     if today_file in remote_file_names:
46         return true
47     else:
48         return false
49 
50 def download_file():
51     """用于目标文件下载"""
52     ftp = ftp_connect()
53     bufsize = 1024
54     fp = open(local_file, 'wb')
55     ftp.set_debuglevel(0) # 较高的级别方便排查问题
56     ftp.retrbinary('retr ' + remote_file, fp.write, bufsize)
57     fp.close()
58     ftp.quit()
59 
60 
61 while true:
62     if int(time.strftime("%h%m")) in range(begin_time, end_time):  # 判断是否在执行时间范围
63         if int(time.strftime("%y%m%d")) - int(today) == 0:  # 判断是否跨日期
64             while not os.path.exists(local_file):  # 判断本地是否已有文件
65                 if remote_file_exists():  # 判断远端是否已有文件
66                     download_file() 
67                     with open(log_file, 'a') as f:
68                         f.write('\n' + time.strftime("%y/%m/%d %h:%m:%s") + " 今日文件已下载!")
69                     time.sleep(60)  # 下载完毕静默1分钟
70                 else:
71                     time.sleep(180)
72                     break # 注意,此处跳出循环重新判断日期,避免周末或当天没文件时陷入内层循环
73             else:
74                 time.sleep(180)
75         else:
76             """如果跨日期,则根据当前日期,更新各文件日期"""
77             today = time.strftime("%y%m%d")  # 当天日期
78             today_file = today + 'test.txt'  # 得到当天日期的目标文件名
79             remote_file = remote_path + today_file  # 远端文件名
80             local_file = '\\\\local\\' + today + '\\' + today_file  # 本地文件名
81             with open(log_file, 'a') as f:
82                 f.write('\n' + time.strftime("%y/%m/%d %h:%m:%s") + " 任务启动, 文件日期已更新。")
83     else:
84         time.sleep(1800)

 

四、运行情况

  保存为pyw文件,任务在后台持续运行,不需要计划任务,省心省力。

  不用下载标记,一则较为简洁,二则本地文件如果被人误删或移动可自动重新下载。

  日志中,每天仅写入任务启动和文件已下载标志,并记录对应时间,如有需要可再添加。

 

  希望能帮到有需要的朋友。

 

  多多指教!