欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Python3 文件操作

程序员文章站 2024-02-23 20:57:52
...

Python3 文件操作

讲师:张学亮 百度:学亮编程手记 网易云课堂:@张学亮

open() 方法

Python open() 方法用于打开一个文件,并返回文件对象,在对文件进行处理过程都需要使用到这个函数,如果该文件无法被打开,会抛出 OSError。

**注意:**使用 open() 方法一定要保证关闭文件对象,即调用 close() 方法。

open() 函数常用形式是接收两个参数:文件名(file)和模式(mode)。

open(file, mode='r')

完整的语法格式为:

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

参数说明:

  • file: 必需,文件路径(相对或者绝对路径)。
  • mode: 可选,文件打开模式
  • buffering: 设置缓冲
  • encoding: 一般使用utf8
  • errors: 报错级别
  • newline: 区分换行符
  • closefd: 传入的file参数类型
  • opener

mode 参数有:

模式 描述
t 文本模式 (默认)。
x 写模式,新建一个文件,如果该文件已存在则会报错。
b 二进制模式。
+ 打开一个文件进行更新(可读可写)。
U 通用换行模式(Python 3 不支持)。
r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。
r+ 打开一个文件用于读写。文件指针将会放在文件的开头。
rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。
w 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
wb 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。
w+ 打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
wb+ 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。
a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
ab 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+ 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
ab+ 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

默认为文本模式,如果要以二进制模式打开,加上 b

file 对象

file 对象使用 open 函数来创建,下表列出了 file 对象常用的函数:

序号 方法及描述
1 file.close()关闭文件。关闭后文件不能再进行读写操作。
2 file.flush()刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。
3 file.fileno()返回一个整型的文件描述符(file descriptor FD 整型), 可以用在如os模块的read方法等一些底层操作上。
4 file.isatty()如果文件连接到一个终端设备返回 True,否则返回 False。
5 file.next()**Python 3 中的 File 对象不支持 next() 方法。**返回文件下一行。
6 [file.read(size])从文件读取指定的字节数,如果未给定或为负则读取所有。
7 [file.readline(size])读取整行,包括 “\n” 字符。
8 [file.readlines(sizeint])读取所有行并返回列表,若给定sizeint>0,返回总和大约为sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。
9 [file.seek(offset, whence])移动文件读取指针到指定位置
10 file.tell()返回文件当前位置。
11 [file.truncate(size])从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;截断之后后面的所有字符被删除,其中 Widnows 系统下的换行代表2个字符大小。
12 file.write(str)将字符串写入文件,返回的是写入的字符长度。
13 file.writelines(sequence)向文件写入一个序列字符串列表,如果需要换行则要自己加入每行的换行符。

一、文件操作

使用python来读写文件使用open()函数来打开一个文件,获取到文件句柄,然后通过文件句柄就可以进行各种操作了。根据打开方式不同能够执行的操作也有差异。

打开文件的方式:r, w, a, r+, w+, a+, rb, wb, ab, r+b, w+b, a+b默认使用的是r(只读)模式

二、只读操作(r, rb)

file = open("文件名", mode="r", encoding="utf-8")
content = file.read()
print(content)
file.close()

要注意encoding表示编码集

rb读取出来的数据是bytes类型,在rb模式下,不能选择encoding字符集

file = open("文件名", mode="rb")
content = file.read()
print(content)
file.close()

rb的作用是在读取非文本文件的时候,比如读取音视频等信息的时候就要用到rb

读取文件的方法:

1.read()将文件中的内容全部读取出来;占内存。如果文件过大,容易导致内存崩溃

2.read(n)读取n个字符;注意,如果再次读取就会在当前位置继续去读而不是从头读,如果是rb模式则读取出来的是n个字节

3.readline()一次读取一行数据,每次读取出来的数据结尾都会有一个\n,所以要使用strip()方法来去掉\n或者空格

4.readlines()将每一行形成一个元素,放到一个列表中;将所有内容都读取出来,所以也是占内存大

5.循环读取,这是最建议使用的方式,每次读取一行内容。

注意:读取完的文件句柄一定要关闭 f.close()

三、写模式(w, wb)

写的时候,如果没有文件,则会创建文件,如果文件存在,则将原来文件中原内容删除,再写入新内容

file = open("文件名", mode="w", encoding="utf-8")
file.write("写内容")
file.flush()
file.close()

wb模式下可以不指定打开文件的编码,但是在写文件的时候必须将字符串转化成utf8的bytes数据

file = open("文件名", mode="wb")
file.write("写内容".encode("utf-8"))
file.flush()
file.close()

四、追加(a, ab)

在追加模式下,我们写入的内容会追加在文件结尾

五、读写模式(r+, r+b)

对于读写模式,必须是先读,因为默认光标是在开头的,准备读取的;当读完了之后再进行写入,使用频率最高的模式就是r+

file = open("文件名", mode="r+", encoding="utf-8")
content = file.read()
file.write("写内容")
print(content)
file.flush()
file.close()

六、写读(w+, w+b)

先将所有的内容清空,然后写入,最后读取,但是读取的内容是空的,不常用。

file = open("文件名", mode="w+", encoding="utf-8")
file.write("写内容")
content = file.read()
print(content)
file.flush()
file.close()

七、追加读(a+)

a+模式下,不论先读还是后读,都读取不到数据;

八、其他相关操作

1.seek(n)

光标移动到n位置,注意,移动的单位是byte,所以如果是utf-8的中文部分要是3的倍数。

通常我们使用seek都是移动到开头或者结尾

移动到开头:seek(0)

移动到结尾:seek(0,2)

seek的第二个参数表示的是从哪个位置进行偏移,默认是0表示从开头,1表示当前位置,2表示结尾

file = open("文件名", mode="r+", encoding="utf-8")
file.seek(0)        # 光标移动到开头
content = file.read()       # 读取内容,此时光标移动到结尾
print(content)
file.seek(0)        # 再次将光标移动到开头
file.seek(0,2)       # 将光标移动到结尾
content2 = file.read()    # 读取内容,什么都没有
print(content2)

file.seek(0)      # 移动到开头
file.write("新写内容")   # 写入信息,此时光标在9,中文3*3
file.flush()
file.close()

2.tell()

可以获取到当前光标在什么位置

file = open("文件名", mode="r+", encoding="utf-8")
file.seek(0)      # 光标移动到开头
content = file.read()    # 读取内容,此时光标移动到结尾
print(content)
file.seek(0)       # 再次将光标移动到开头
file.seek(0,2)      # 将光标移动到结尾
content2 = file.read()    # 读取内容,什么都没有
print(content2)
file.seek(0)
file.write("写内容")
print(file.tell())      # 光标位置
file.flush()
file.close()

3.truncate()截断文件

如果想做截断的时候,要先移动光标,挪动到想要截断的位置再进行截断;

truncate(n),如果给出了n,则从开头进行截断,如果不给n,则从当前位置截断,后面的内容将会被删除;

注意:在r+模式下,如果读取了内容,不论读取内容多少,光标显示的是多少,再写入或者操作文件的时候都是在结尾进行的操作。

九、修改文件以及另一种打开文件的方式

文件修改只能将文件中的内容读取到内存中,将信息修改完毕后再将源文件删除,将新文件的名字改成老文件的名字

import  os
with open("文件名", mode="r", encoding="utf-8") as file1,\
open("文件名_new", mode="w", encoding="UTF-8") as file2:
    for line in f1:
        new_line = line.replace("大白梨", "冰糖葫芦")
        file2.write(new_line)
os.remove("文件名") # 删除源⽂文件
os.rename("文件名_new", "文件名") # 重命名新⽂文件    

代码演示:

Python3 文件操作

相关标签: 教学课件 Python