欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

python学习笔记:第8天 文件操作

程序员文章站 2022-06-24 08:53:26
1. 文件操作介绍 说到操作文件我们肯定会想到流,文件的操作都是通过流来操作的。在python中文件的操作非常简单,并不像Java等其他语言一样有各种各样的流操作,我们直接使用open函数即可打开一个文件,然后进行各种操作,但是根据打开的不同的方式所能够执行的操作也不一样,打开文件的方式有:r, w ......

1. 文件操作介绍

说到操作文件我们肯定会想到流,文件的操作都是通过流来操作的。在python中文件的操作非常简单,并不像java等其他语言一样有各种各样的流操作,我们直接使用open函数即可打开一个文件,然后进行各种操作,但是根据打开的不同的方式所能够执行的操作也不一样,打开文件的方式有:r, w, a, r+, w+, a+, rb, wb, ab, r+b, w+b, a+b 等等。

下面我们先看一个读取的文件操作:

in [2]: f = open(file='a.txt', mode='r', encoding='utf-8')

in [3]: f.read()
out[3]: '每天坚持一点,\n每天努力一点,\n每天多思考一点,\n慢慢你会发现,\n你的进步越来越大\n'

in [4]:

使用open函数打开文件,并且返回一个文件对象,open函数常见的几个参数file(要操作的文件名),mode(以什么模式打开)和encoding(指定一种编码来读取文件),根据不同的mode模式,返回的文件会有各种不同的操作。下面我们来看一下文件的几种操作。

2. 文件操作的几种方式

(1)只读操作

只读操作只需指定mode为r即可:

in [5]: f = open(file='a.txt', mode='r', encoding='utf-8')

in [6]: f.read()
out[6]: '每天坚持一点,\n每天努力一点,\n每天多思考一点,\n慢慢你会发现,\n你的进步越来越大\n'

in [7]: f.readable()                # 判断文件是否可读
out[7]: true

in [8]: f.writable()                # 判断文件是否可写
out[8]: false                       # 此处是以只读模式打开的文件,所以返回false不可写

in [9]: f1 = open(file='单分支结构.eddx', mode='rb')        # 使用‘rb’可以打开存储为二进制的数据,图片、视频等

in [10]: f1.read(20)
out[10]: b'pk\x03\x04\x14\x00\x08\x00\x08\x00mn\xe3h\xa9\x95\xb3\x9ew\x01'

(2)只写操作

mode='w'

                                                                             
in [13]: f = open(file='a.txt', mode='w', encoding='utf-8')                  
                                                                             
in [14]: f.read()                       # 此时尝试读取文件会报错                                            
---------------------------------------------------------------------------  
unsupportedoperation                      traceback (most recent call last)  
<ipython-input-14-571e9fb02258> in <module>                                  
----> 1 f.read()                                                             
                                                                             
unsupportedoperation: not readable                                           
                                                                             
in [15]: f.write('葫芦娃')                                                      
out[15]: 3                                                                   
                                                                             
in [16]: f.close()                                                           
                                                                             
in [17]: !cat a.txt                     # 此时查看文件之前那的内容已经被覆盖了                             
葫芦娃                                                                          
in [18]:                                                                     

使用mode='r'操作文件时首先会在打开文件时先清空文件,然后再根据操作把内容写入文件,只读模式有以下特点:

  • 当文件不存在时,会自动创建文件,然后打开文件进行操作
  • 打开文件时会先清空文件的内容,然后再从头开始写入
  • 文件以只写模式打开,不能够读取

(3)追加操作

mode='a'

in [18]: f = open(file='a.txt', mode='a', encoding='utf-8')

in [19]: f.write('每天坚持一点,\n每天努力一点,\n每天多思考一点,\n慢慢你会发现,\n你的进步越来越大\n')
out[19]: 42

in [20]: f.close()

in [21]:

in [21]: !cat a.txt
葫芦娃每天坚持一点,
每天努力一点,
每天多思考一点,
慢慢你会发现,
你的进步越来越大

in [22]:

追加模式的操作:

  • 打开文件时如果文件不存时会先创建文件
  • 往文件中写入内容时都是在文件末尾写入,不论光标在哪
  • 打开的文件只能写入,不能读取

(4)r+模式

r+模式是加强的读操作,即可以读写:

in [22]: f = open(file='a.txt', mode='r+', encoding='utf-8')

in [23]: f.readable()
out[23]: true

in [24]: f.writable()
out[24]: true

in [25]: f.read()
out[25]: '葫芦娃每天坚持一点,\n每天努力一点,\n每天多思考一点,\n慢慢你会发现,\n你的进步越来越大\n'

in [26]: f.write('\n哈哈哈哈哈哈哈')
out[26]: 8

in [27]: f.close()

in [28]: !cat a.txt         # 查看写入的文件并没有异常
葫芦娃每天坚持一点,
每天努力一点,
每天多思考一点,
慢慢你会发现,
你的进步越来越大

哈哈哈哈哈哈哈
in [29]: f = open(file='a.txt', mode='r+', encoding='utf-8')

in [30]: f.seek(0, 2)       # seek可以调整光标位置
out[30]: 153

in [31]: f.write('你的进步越来越大')
out[31]: 8

in [32]: f.read()           # 先写后读会读出空字符
out[32]: ''

in [33]:

总结:增强型的读操作对文件可读可写,但是顺序必须是先读取在往里面写入,如果先读再写入再读取的时候可能会读取到空字符串

r+模式深坑请注意: 在r+模式下. 如果读取了内容. 不论读取内容多少. 光标显⽰的是多少. 再写入或者操作⽂件的时候都是在结尾进⾏的操作

(5)w+和a+模式

w+模式和a+模式在实际使用场景较少,这边简单介绍一下:

  • w+:增强型的w模式,可以写和读操作,但是也跟r+一样,如果先读操作再写操作的话会有坑出现,并且每次在打开文件是会先清空文件,因此使用场景较少
  • a+:增强型的a模式,也可以进行读写操作,但是写入时只能往文件的末尾写入,无论光标怎么移动,都只能在文件末尾写入

3. 文件的操作的方法

(1)文件的读取和写入

文件的写入:主要是write方法以及writelines方法

  • write方法:直接写入字符串即可,上面的例子中也有用到
  • writelines方法:传递的参数必须时可迭代的(如列表和元组等)

文件的读取

  • read方法:read方法接收一个int型的参数,表示一次读取几个字符(seek的单位是字节),不提供默认是读取文件所有内容
  • readline方法:读取文件一行,文件很大时这个方法很使用,不会一次读取整个文件
  • readlines方法:读取出整个文件,以每一行分割存放到一个列表里并返回这个列表
in [34]: f = open(file='a.txt', mode='r', encoding='utf-8')
# 葫芦娃每天坚持一点,
# 每天努力一点,
# 每天多思考一点,
# 慢慢你会发现,
# 你的进步越来越大

# 哈哈哈哈哈哈哈你的进步越来越大
in [35]: f.read(10)                 # 这里时一次读取10个字符
out[35]: '葫芦娃每天坚持一点,'

in [36]: f.readline()
out[36]: '\n'

in [37]: f.readline()               # 每次读取一行
out[37]: '每天努力一点,\n'

in [38]: f.readlines()              # 返回的是一个列表
out[38]: ['每天多思考一点,\n', '慢慢你会发现,\n', '你的进步越来越大\n', '\n', '哈哈哈哈哈哈哈你的进步越来越大']

in [39]:

readline(文件句柄)和readlines的区别

  • 文件句柄是一个可迭代对象,在循环遍历时每遍历一次取一行,不会在读取文件时一次性全部读出来
  • readlines返回的结果是一个列表,会一次性把整个文件的内容读取出来并返回一个列表,在处理大文件时会非常消耗资源

也可以使用循环去遍历文件句柄,输出文件中的内容:

in [39]: f.seek(0)
out[39]: 0

in [40]: for line in f:
    ...:     print(line.strip())
葫芦娃每天坚持一点,
每天努力一点,
每天多思考一点,
慢慢你会发现,
你的进步越来越大

哈哈哈哈哈哈哈你的进步越来越大

in [41]:

(2)文件操作的其他方法

  • close:关闭文件
  • readable:判断文件是否可读
  • seek:移动光标,接收两个数据第一个参数表示偏移到哪个位置(移动的单位是byte. 所以如果是utf-8的中⽂部分要是3的倍数),第二个参数表示从那个位置开始偏移(0,代表开头,1代表当前位置,2代表结尾)
  • seekable:判断当前文件的光标是否可移动
  • tell:返回当前光标所在的位置
  • truncate:截断数据(谨慎操作),默认截断光标后所有字符
  • writable:判断文件是否可写

(3)打开文件的另一种方式

在打开一个文件后,要记得在文件使用结束狗使用close方法关闭文件句柄,但有时在中间进行大量的操作后可能会忘了关闭,下面介绍的这种方法可以不用自己手动关闭文件了,他会在您操作解说后(代码块的语句执行完毕)自动关闭文件句柄,这种方法就是使用context上下文管理,使用with语句实现:

in [43]: with open('a.txt', mode='r', encoding='utf-8') as f:   # 使用with管理上下文,最后退出时会自己执行close动作
    ...:     for line in f:
    ...:         print(line.strip())
葫芦娃每天坚持一点,
每天努力一点,
每天多思考一点,
慢慢你会发现,
你的进步越来越大

哈哈哈哈哈哈哈你的进步越来越大

in [44]: