Python-标准库(常用模块)
前言: 之所以为不同模块划分重要程度,是因为大家不不可能精力一直集中,也不可能一下掌握所有,
但这个并不表示重要度低的可以不用掌握 !
你必须掌握的点是每个模块分别干什么事,今后在需要实现某些功能时能够想起来这个模块的名字,然后再去查自己的资料找对应的使用方法
一.logging模块
logging翻译为日志记录
那问题是什么是日志?
日志实际上是日记的一种,用于记录某个时间点发生了什么事情,比如大学老师的教学日志,工作日志等
为什么要记录日志?
在实际生活中记录日志主要为了日后复查,
比如某个大学老师每天记录自己讲的什么内容,后面有学生某科成绩优异获奖了,校长想要奖励对应的老师,但由于每个老师教的班级都很多,并不一定记得是谁教的,这时候就可以查看教学日志来获取需要的信息了
再比如,工厂的生产日志,如果某个产品除了因为某个零件出现了故障,通过生成日志,可以找到与这个产品同批次的其他产品,进行返工,或是通过日志找到该零件的供应商,进行沟通解决!
程序中的日志
我们的程序开发完成后会被不同系统环境的用户下载使用,期间可能就会出现问题,直接把错误信息展示给用户看是没有任何意义的,用户看不懂也不会解决,那这时候就可以将用户执行的所有操作,以及代码运行的过程,记录到日志中,程序员通过分析日志内容,可以快速的定位问题
综上: 日志就是用来记录发生的事件的
日志并不会立即产生作用,而是当程序出现了问题时在去分析日志文件提取有用信息
什么是logging模块
logging模块是python提供的用于记录日志的模块
为什么需要logging
我们完全可以自己打开文件然后,日志写进去,但是这些操作重复且没有任何技术含量,所以python帮我们进行了封装,有了logging后我们在记录日志时 只需要简单的调用接口即可,非常方便!
日志级别
在开始记录日志前还需要明确,日志的级别
随着时间的推移,日志记录会非常多,成千上万行,如何快速找到需要的日志记录这就成了问题
解决的方案就是 给日志划分级别
logging模块将日志分为了五个级别,从高到低分别是:
1.info 常规信息
2.debug 调试信息
3.warning 警告信息
4.error 错误信息
5.cretical 严重错误
本质上他们使用数字来表示级别的,从高到低分别是10,20,30,40,50
logging模块的使用
#1.导入模块 import logging #2.输出日志 logging.info("info") logging.debug("debug") logging.warning("warning") logging.error("error") logging.critical("critical") #输出 warning:root:warning #输出 error:root:error #输出 critical:root:critical
我们发现info 和 debug都没有输出,这是因为它们的级别不够,
默认情况下:
logging的最低显示级别为warning,对应的数值为30
日志被打印到了控制台
日志输出格式为:级别 日志生成器名称 日志消息
如何修改这写默认的行为呢?,这就需要我们自己来进行配置
自定义配置
import logging logging.basicconfig() """可用参数 filename:用指定的文件名创建filedhandler(后边会具体讲解handler的概念),这样日志会被存储在指定的文件中。 filemode:文件打开方式,在指定了filename时使用这个参数,默认值为“a”还可指定为“w”。 format:指定handler使用的日志显示格式。 datefmt:指定日期时间格式。 level:设置rootlogger(后边会讲解具体概念)的日志级别 """ #案例: logging.basicconfig( filename="aaa.log", filemode="at", datefmt="%y-%m-%d %h:%m:%s %p", format="%(asctime)s - %(name)s - %(levelname)s - %(module)s: %(message)s", level=10 )
格式化全部可用名称
%(name)s:logger的名字,并非用户名,详细查看 %(levelno)s:数字形式的日志级别 %(levelname)s:文本形式的日志级别 %(pathname)s:调用日志输出函数的模块的完整路径名,可能没有 %(filename)s:调用日志输出函数的模块的文件名 %(module)s:调用日志输出函数的模块名 %(funcname)s:调用日志输出函数的函数名 %(lineno)d:调用日志输出函数的语句所在的代码行 %(created)f:当前时间,用unix标准的表示时间的浮 点数表示 %(relativecreated)d:输出日志信息时的,自logger创建以 来的毫秒数 %(asctime)s:字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒 %(thread)d:线程id。可能没有 %(threadname)s:线程名。可能没有 %(process)d:进程id。可能没有 %(message)s:用户输出的消息
至此我们已经可以自己来配置一 写基础信息了,但是当我们想要将同一个日志输出到不同位置时,这些基础配置就无法实现了,
例如 有一个登录注册的功能 需要记录日志,同时生成两份 一份给程序员看,一份给老板看,作为程序员应该查看较为详细的日志,二老板则应该简单一些,因为他不需要关心程序的细节
要实现这样的需要我们需要系统的了解loggin模块
logging模块的四个核心角色
1.logger 日志生成器 产生日志
2.filter 日志过滤器 过滤日志
3.handler 日志处理器 对日志进行格式化,并输出到指定位置(控制台或文件)
4.formater 处理日志的格式
一条日志完整的生命周期
1.由logger 产生日志 -> 2.交给过滤器判断是否被过滤 -> 3.将日志消息分发给绑定的所有处理器 -> 4处理器按照绑定的格式化对象输出日志
其中 第一步 会先检查日志级别 如果低于设置的级别则不执行
第二步 使用场景不多 需要使用面向对象的技术点 后续用到再讲
第三步 也会检查日志级别,如果得到的日志低于自身的日志级别则不输出
生成器的级别应低于句柄否则给句柄设置级别是没有意义的,
例如 handler设置为20 生成器设置为30
30以下的日志压根不会产生
第四步 如果不指定格式则按照默认格式
logging各角色的使用(了解)
# 生成器 logger1 = logging.getlogger("日志对象1") # 文件句柄 handler1 = logging.filehandler("log1.log",encoding="utf-8") handler2 = logging.filehandler("log2.log",encoding="utf-8") # 控制台句柄 handler3 = logging.streamhandler() # 格式化对象 fmt1 = logging.formatter( fmt="%(asctime)s - %(name)s - %(levelname)s: %(message)s", datefmt="%m-%d %h:%m:%s %p") fmt2 = logging.formatter( fmt="%(asctime)s - %(levelname)s : %(message)s", datefmt="%y/%m/%d %h:%m:%s") # 绑定格式化对象与文件句柄 handler1.setformatter(fmt1) handler2.setformatter(fmt2) handler3.setformatter(fmt1) # 绑定生成器与文件句柄 logger1.addhandler(handler1) logger1.addhandler(handler2) logger1.addhandler(handler3) # 设置日志级别 logger1.setlevel(10) #生成器日志级别 handler1.setlevel(20) #句柄日志级别 # 测试 logger1.debug("debug msessage") logger1.info("info msessage") logger1.warning("warning msessage") logger1.critical("critical msessage")
到此我们已经可以实现上述的需求了,但是这并不是我们最终的实现方式,因为每次都要编写这样的代码是非常痛苦的
logging的继承(了解)
可以将一个日志指定为另一个日志的子日志 或子孙日志
当存在继承关系时 子孙级日志收到日志时会将该日志向上传递
指定继承关系:
import logging log1 = logging.getlogger("mother") log2 = logging.getlogger("mother.son") log3 = logging.getlogger("mother.son.grandson") # handler fh = logging.filehandler(filename="cc.log",encoding="utf-8") # formatter fm = logging.formatter("%(asctime)s - %(name)s -%(filename)s - %(message)s") # 绑定 log1.addhandler(fh) log2.addhandler(fh) log3.addhandler(fh) # 绑定格式 fh.setformatter(fm) # 测试 # log1.error("测试") # log2.error("测试") log3.error("测试") # 取消传递 log3.propagate = false # 再次测试 log3.error("测试")
通过字典配置日志模块(重点)
每次都要编写代码来配置非常麻烦 ,我们可以写一个完整的配置保存起来,以便后续直接使用
import logging.config logging.config.dictconfig(logging_dic) logging.getlogger("aa").debug("测试")
logging_dic模板
standard_format = '[%(asctime)s][%(threadname)s:%(thread)d][task_id:%(name)s][%(filename)s:%(lineno)d]' \ '[%(levelname)s][%(message)s]' #其中name为getlogger指定的名字 simple_format = '[%(levelname)s][%(asctime)s][%(filename)s:%(lineno)d]%(message)s' id_simple_format = '[%(levelname)s][%(asctime)s] %(message)s' logfile_path = "配置文件路径" logging_dic = { 'version': 1, 'disable_existing_loggers': false, 'formatters': { 'standard': { 'format': standard_format }, 'simple': { 'format': simple_format }, }, 'filters': {}, 'handlers': { #打印到终端的日志 'console': { 'level': 'debug', 'class': 'logging.streamhandler', # 打印到屏幕 'formatter': 'simple' }, #打印到文件的日志,收集info及以上的日志 'default': { 'level': 'debug', 'class': 'logging.handlers.rotatingfilehandler', # 保存到文件 'formatter': 'standard', 'filename': logfile_path, # 日志文件 'maxbytes': 1024*1024*5, # 日志大小 5m 'backupcount': 5, #日志文件最大个数 'encoding': 'utf-8', # 日志文件的编码 }, }, 'loggers': { #logging.getlogger(__name__)拿到的logger配置 'aa': { 'handlers': ['default', 'console'], # 这里把上面定义的两个handler都加上,即log数据既写入文件又打印到屏幕 'level': 'debug', 'propagate': true, # 向上(更高level的logger)传递 }, }, }
补充:
getlogger参数就是对应字典中loggers的key , 如果没有匹配的key 则返回系统默认的生成器,我们可以在字典中通过空的key来将一个生成器设置为默认的
'loggers': { # 把key设置为空 '': { 'handlers': ['default', 'console'], # 这里把上面定义的两个handler都加上,即log数据既写入文件又打印到屏幕 'level': 'debug', 'propagate': true, # 向上(更高level的logger)传递 }, },
,往后在使用时可以这调用模块提供的函数,来输出日志
logging.info("测试信息!")
另外我们在第一次使用日志时并没有指定生成器,但也可以使用,这是因为系统有默认的生成器名称就叫root
最后来完成之前的需求:
有一个登录注册的功能 需要记录日志,同时生成两份 一份给程序员看,一份给老板看,作为程序员应该查看较为详细的日志,二老板则应该简单一些,因为他不需要关心程序的细节
# 程序员看的格式 standard_format = '[%(asctime)s][%(threadname)s:%(thread)d][task_id:%(name)s][%(filename)s:%(lineno)d]' \ '[%(levelname)s][%(message)s]' #其中name为getlogger指定的名字 logfile_path1 = "coder.log" # 老板看的格式 simple_format = '[%(levelname)s][%(asctime)s]%(message)s' logfile_path2 = "boss.log" logging_dic = { 'version': 1, 'disable_existing_loggers': false, 'formatters': { 'standard': { 'format': standard_format }, 'simple': { 'format': simple_format }, }, 'filters': {}, 'handlers': { #打印到终端的日志 'console': { 'level': 'debug', 'class': 'logging.streamhandler', # 打印到屏幕 'formatter': 'simple' }, #打印到文件的日志,收集info及以上的日志 'std': { 'level': 'debug', 'class': 'logging.handlers.rotatingfilehandler', # 保存到文件 'formatter': 'standard', 'filename': logfile_path1, # 日志文件 'maxbytes': 1024*1024*5, # 日志大小 5m 'backupcount': 5, #日志文件最大个数 'encoding': 'utf-8', # 日志文件的编码 }, 'boss': { 'level': 'debug', 'class': 'logging.handlers.rotatingfilehandler', # 保存到文件 'formatter': 'simple', 'filename': logfile_path2, # 日志文件 'maxbytes': 1024 * 1024 * 5, # 日志大小 5m 'backupcount': 5, # 日志文件最大个数 'encoding': 'utf-8', # 日志文件的编码 } }, 'loggers': { #logging.getlogger(__name__)拿到的logger配置 'aa': { 'handlers': ['std', 'console',"boss"], # 这里把上面定义的handler都加上,即log数据会同时输出到三个位置 'level': 'info', 'propagate': true, # 向上(更高level的logger)传递 }, }, }
二.os模块
os翻译过来就是操作系统,os模块提供了与操作系统打交道需要用到的函数,
那我们什么时候需要与操作系统打交道呢?
在操作系统中,我们最最常用的操作就是,对文件及文件夹的操作, 所以 当你需要与操作文件时,就应该想到os模块了
os提供一下函数
os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径 os.chdir("dirname") 改变当前脚本工作目录;相当于shell下cd os.curdir 返回当前目录: ('.') os.pardir 获取当前目录的父目录字符串名:('..') os.makedirs('dirname1/dirname2') 可生成多层递归目录 os.removedirs('dirname1') 若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推 os.mkdir('dirname') 生成单级目录;相当于shell中mkdir dirname os.rmdir('dirname') 删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname os.listdir('dirname') 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印 os.remove() 删除一个文件 os.rename("oldname","newname") 重命名文件/目录 os.stat('path/filename') 获取文件/目录信息 os.sep 输出操作系统特定的路径分隔符,win下为"\\",linux下为"/" os.linesep 输出当前平台使用的行终止符,win下为"\t\n",linux下为"\n" os.pathsep 输出用于分割文件路径的字符串 win下为;,linux下为: os.name 输出字符串指示当前使用平台。win->'nt'; linux->'posix' os.system("bash command") 运行shell命令,直接显示 os.environ 获取系统环境变量
三.os.path模块
该模块用于处理路径,我们知道python是一门跨平台的语言,二每种操作系统,文件路径是截然不同的,为了使程序可以在不同平台生正确运行,python提供了该模块,使用该模块可以实现路径在不同品台下的自动转换,从而实现跨平台,
今后只要涉及到文件或文件夹路径,就应该使用该模块
提供的函数:
os.path.abspath(path) 返回path规范化的绝对路径 os.path.split(path) 将path分割成目录和文件名二元组返回 os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素 os.path.basename(path) 返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素 os.path.exists(path) 如果path存在,返回true;如果path不存在,返回false os.path.isabs(path) 如果path是绝对路径,返回true os.path.isfile(path) 如果path是一个存在的文件,返回true。否则返回false os.path.isdir(path) 如果path是一个存在的目录,则返回true。否则返回false os.path.join(path1[, path2[, ...]]) 将多个路径组合后返回,第一个绝对路径之前的参数将被忽略 os.path.getatime(path) 返回path所指向的文件或者目录的最后存取时间 os.path.getmtime(path) 返回path所指向的文件或者目录的最后修改时间 os.path.getsize(path) 返回path的大小
normcase函数 在linux和mac平台上,该函数会原样返回path,在windows平台上会将路径中所有字符转换为小写,并将所有斜杠转换为饭斜杠。 >>> os.path.normcase('c:/windows\\system32\\') 'c:\\windows\\system32\\' normpath函数 规范化路径,如..和/ >>> os.path.normpath('c://windows\\system32\\../temp/') 'c:\\windows\\temp' >>> a='/users/jieli/test1/\\\a1/\\\\aa.py/../..' >>> print(os.path.normpath(a)) /users/jieli/test1
四.subprocess
subprocess 称之为子进程,进程是一个正在运行的程序
为什么要使用子进程,因为之前的os.system()函数无法获取命令的执行结果,另一个问题是当我们启动了某一其他进程时无法与这个子进程进行通讯,
当要在python程序中执行系统指令时 就应该使用subprocess 自动化运维经常会使用
#测试 res = os.system("python") print(res) # res结果为执行状态
subprocess的使用
import subprocess p = subprocess.popen("ls",shell=true) #shell=true 告诉系统这是一个指令 而不是某个文件名 #此时效果与sys.system()没有任何区别,都是将结果输出到控制台 # 那如何与这个进程交互数据呢,这需要用到三个参数 1.stdin 表示输入交给子进程的数据 2.stdout 表示子进程返回的数据 3.stderr 表示子进程发送的错误信息 #这三个参数,的类型都是管道,(管道本质就是一个文件,可以进行读写操作),使用subprocess.pipe来获取一个管道
案例:
理解了三个参数的意义后让我们来实现一个小功能
一个子进程执行tasklist命令获取所有的任务信息,然后将结果交给另一个进程进行查找
另一个子进程执行findstr 查找某个任务信息
p1 = subprocess.popen("tasklist",shell=true,stdout=subprocess.pipe) p2 = subprocess.popen("findstr smss",shell=true,stdin=p1.stdout,stdout=subprocess.pipe) print(p2.stdout.read())
总结: subprocess 主要用于执行系统命令,对比sys.system 区别在于可以在进程间交换数据
五.sys 模块
sys是system的缩写,表示系统,但是要注意
sys指的是解释器自身,而非操作系统
所以该模块主要是处理与解释器相关的操作的
提供的函数和属性:
sys.argv 命令行参数list,第一个元素是程序本身路径 sys.exit(n) 退出程序,正常退出时exit(0) sys.version 获取python解释程序的版本信息 sys.maxint 最大的int值 sys.path 返回模块的搜索路径,初始化时使用pythonpath环境变量的值 sys.platform 返回操作系统平台名称
其中提供了有一个arg属性用于接收从控制台传入的参数,当你要开发一款命令行程序时,该属性非常重要
案例:开发一款命令行界面的文件复制工具
思路:第一个参数是当前执行文件本身,第二个参数用于接收源文件,第三个参数用于接收目标文件
import sys source_path = sys.argv[1] target_path = sys.argv[2] print(source_path) print(target_path) with open(source_path, "rb") as f1: with open(target_path, "wb") as f2: while true: data = f1.read(1024) if not data: break f2.write(data)
六.confiparser
confiparser,翻译为配置解析,很显然,他是用来解析配置文件的,
何为配置文件?
用于编写程序的配置信息的文件
何为配置信息?
为了提高程序的扩展性,我们会把一些程序中需要用到的值交给用户来确定,比如迅雷的下载目录,同时下载数,qq的提示音等等,
作为配置信息的数据 应满足两个条件
1.数据的值不是固定的
2.可以由用户来指定的
例如我们做一个登录功能,为了方便使用我们可以将用户的用户名密码写到配置文件中,可以不需要每次都输入
配置文件编写格式
在使用该模块前必须要先知道其配置文件的格式,由于读写文件的代码是模块封装好的,所以必须按照固定的方式来边编写,才能被正常解析, 当然并不是只有python有配置文件,其他任何语言都有,但是格式是相同的!
格式:
配置文件中只允许出现两种类型的数据
第一种 section 分区 方括号中是分区的名称 例如:[atm ]
第二种 option 选项 名称 = 值
注意:
不能出现重复的分区名
同一个分区下不能有相同的选项名
值可以是任何类型 且字符串不需要加引号
confiparser的使用
读取数据
import configparser #获取解析器对象 config=configparser.configparser() # 读取某个配置文件 config.read('a.cfg') #查看所有的分区 res=config.sections() #['section1', 'section2'] print(res) #查看标题section1下所有key=value的key options=config.options('section1') print(options) #['k1', 'k2', 'user', 'age', 'is_admin', 'salary'] #查看标题section1下所有key=value的(key,value)格式 item_list=config.items('section1') print(item_list) #[('k1', 'v1'), ('k2', 'v2'), ('user', 'egon'), ('age', '18'), ('is_admin', 'true'), ('salary', '31')] #查看标题section1下user的值=>字符串格式 val=config.get('section1','user') print(val) #egon #由于使用前需要进行转换,所以模块封装了转换类型的功能,只需要调用对应的函数即可,如下: val1=config.getint('section1','age') val2=config.getboolean('section1','is_admin') val3=config.getfloat('section1','salary') #是否存在某选项 print(cfg.has_option("mysql","name")) #是否存在某分区 print(cfg.has_section("db"))
添加,删除,修改
import configparser config=configparser.configparser() config.read('a.cfg',encoding='utf-8') #删除整个标题section2 config.remove_section('section2') #删除标题section1下的某个k1和k2 config.remove_option('section1','k1') config.remove_option('section1','k2') #判断是否存在某个标题 print(config.has_section('section1')) #判断标题section1下是否有user print(config.has_option('section1','user')) #添加一个标题 config.add_section('jack') #在标题egon下添加name=egon,age=18的配置 config.set('jack','name','egon') # 如果已存则覆盖原来的值 #config.set('jack','age',18) #报错,必须是字符串 #最后将修改的内容写入文件,完成最终的修改 config.write(open('a.cfg','w'))
代码创建生成文件
import configparser config = configparser.configparser() config.add_section("setion1") config.set("setion1","name","zhangsn") with open("test.config","w") as f: config.write(f)
总结configparser 用于解析配置文件,虽然可以修改和,创建,配置文件,但是并不常用,解析才是其核心功能!
七.shevle模块
该模块用于序列化python中的数据,但是序列化已经有pickle了为什么出现了shevle?
因为shevle更加简单,封装了文件的读写操作.load和dump操作,
只有一个open函数,返回类似字典的对象,可读可写;key必须为字符串,而值可以是python所支持的数据类型
完全可以将其看做是一个带有持久存储功能的字典来看待,操作方式与字典没有任何区别
#保存数据 s = shelve.open("shv.shv") s["name"] = "jack" #取出数据 s = shelve.open("shv.shv") print(s["name"]) #输出 jack #关闭资源 s.close
八.shutil
该模块提供了更加丰富的文件操作功能,压缩,解压缩,获取文件信息等
提供的功能:
shutil.copyfileobj 拷贝文件 提供两个文件对象 长度表示缓冲区大小 shutil.copyfile(src, dst) 拷贝文件 提供两个文件路径 shutil.copymode() 拷贝文件权限 提供两个文件路径 shutil.copystat(src, dst) 拷贝文件状态信息 最后访问 最后修改 权限 提供两个文件路径 shutil.copy(src, dst) 拷贝文件和权限 提供两个文件路径 shutil.copy2(src, dst) 拷贝文件和状态信息 提供两个文件路径 shutil.ignore_patterns("mp3","*.py") shutil.copytree(src, dst, symlinks=false, ignore=none) 拷贝目录 symlinks默认false将软连接拷贝为硬链接 否则拷贝为软连接 shutil.rmtree 删除目录 可以设置忽略文件 shutil.move(src, dst) 移动目录和文件
压缩与解压缩测试
import shutil #压缩, 文件名 格式 需要压缩的文件所在文件夹 shutil.make_archive("压缩测试","zip",r"/users/jerry/pycharmprojects/备课/常用模块五期") #解压缩 #压缩, 文件名 解压后的文件存放目录 shutil.unpack_archive("压缩测试.zip",r"/users/jerry/pycharmprojects/备课/常用模块五期/ # #压缩当前执行文件所在文件夹内容到当前目录 # shutil.make_archive("test","zip") # # #压缩root_dir指定路径的文件到当前目录 # shutil.make_archive("test","zip",root_dir=r"/users/jerry/pycharmprojects/work/re模块") # # #压缩root_dir指定路径的文件到base_name指定路径 # shutil.make_archive("/users/jerry/pycharmprojects/work/压缩文件/test","zip",root_dir=r"/users/jerry/pycharmprojects/work/re模块") # #压缩root_dir指定路径的文件到base_name指定的压缩文件 压缩文件仅包含re模块下的的内容 # shutil.make_archive("test", # "zip", # root_dir=r"/users/jerry/pycharmprojects/work",) # 当指定base_dir时 则优先使用base_dir 与root_dir不同的是 压缩文件不仅包含re模块下的内容 还包括re模块的完整文件夹层级 # # 解压后得到users ->jerry -> pycharmproject->work->re模块 # shutil.make_archive("test", # "zip", # root_dir=r"/users/jerry/pycharmprojects/work/re模块", # base_dir=r"/users/jerry/pycharmprojects/work/re模块")
上一篇: webpack打包配置禁止html标签全部转为小写
下一篇: python-day11(正式学习)