初识python(四)
程序员文章站
2022-06-13 11:31:19
文本处理 什么是文件 文件是操作系统虚拟出来的概念,拿来存储信息的 什么是文本 .txt / .word / .md / .py 存储的是文字 文本处理 如何通过文本编辑器去控制txt文件 找到路径 打开文件 读取/修改操作 保存 关闭文件 打开文件的三种操作 r 只读不可写 w 只写不可读(清空后 ......
文本处理
什么是文件
文件是操作系统虚拟出来的概念,拿来存储信息的
什么是文本
.txt / .word / .md / .py 存储的是文字
文本处理
如何通过文本编辑器去控制txt文件
- 找到路径
- 打开文件
- 读取/修改操作
- 保存
- 关闭文件
file_path = 'd:\pycharm_project\config.txt' f = open(file_path, encoding='utf8') # 把该路径的文件读入内存 data = f.read() # 读取文件 print(data) f.close() # 解除对操作系统的占用
打开文件的三种操作
- r 只读不可写
- w 只写不可读(清空后写入)
- a 只写不可读(末尾追加)
file_path = 'd:\pycharm_project\config.txt' f = open(file_path, 'r',encoding='utf8') print('f.readable:',f.readable()) print('f.writable:',f.writable()) # 打印结果: f.readable: true f.writable: false
写入文件
file_path = 'd:\pycharm_project\config.txt' f = open(file_path, 'a',encoding='utf8') data = f.write('234') print(data)
文本处理高级应用
print(r'\n') # \n本来是换行,加上r,变成了\n
gbk/utf8只针对文本,所以音频通过rb模式读取二进制
b模式下没有encoding模式,b一般与r / a / w 一起使用
file_path = 'd:\pycharm_project\movie.mp4' f = open(file_path, 'rb')
r+可写可读,w+可写可读(清空文件),a+可写可读
一般不推荐使用可写可读模式
利用with open 可以自动关闭文件
with open('d:\pycharm_project\config.txt', 'r+', encoding='utf8') as f: data = f.read() print(data) # 这个缩进里面的代码都是文件打开的状态,运行到缩进外面会自动关闭文件 print(123)
文本处理+词云
步骤:
- 读取文件内容
- 利用jieba模块对文件内容进行分割
- 找到一张词云图的背景图片
- 利用wordcloud模块生成词云图
import jieba import wordcloud import imageio with open(r'd:\pycharm_project\day05\语录.txt','r',encoding='utf8') as f: data = f.read() ls = jieba.lcut(data) s = ' '.join(ls) img = imageio.imread(r'd:\pycharm_project\上海老男孩python12期\预科班\33.jpg') w = wordcloud.wordcloud(width=1000,height=1000,font_path=r'c:\windows\fonts\stxinwei.ttf',background_color='white',mask=img) w.generate(s) w.to_file('qq.png')