欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

python学习第十天

程序员文章站 2022-06-11 17:45:31
目录一、储备知识二、字符编码***2.1、什么是字符编码2.2、字符编码的发展历史2.3、乱码问题及解决方案2.4、编码和解码三、文件处理基本处理3.1、什么是文件3.2、为何要用文件3.3、如何用文件3.4、绝对路径和相对路径一、储备知识1、程序运行与三大核心硬件的关系2、程序运行过程中产生的数据最先放在内存中3、python程序运行的三个步骤 python3 D:\a.py 1、先启动python解释器 2、解释器会将a.py的内容当成普通内存从硬盘读入内存,此时没有语法...

一、储备知识

1、程序运行与三大核心硬件的关系
2、程序运行过程中产生的数据最先放在内存中
3、python程序运行的三个步骤
    python3 D:\a.py
    1、先启动python解释器
    2、解释器会将a.py的内容当成普通内存从硬盘读入内存,此时没有语法意义
    3、解释器会解释执行刚刚读入内存的内存,开始识别python语法

二、字符编码***

python学习第十天

2.1、什么是字符编码

字符--------(标准)--------数字

字符编码表,存放的是字符串与数字的对应关系

1、ASCII:只能识别英文字符   
    特点:采用8bit对应一个英文字符
            8bit=》1Byte
            
2、GBK:可以识别中文字符串与英文字符
    特点:采用16bit对应字符,该字符可以是英文字符、也可以是中文字符
    
3、shift-JIS

4unicode:可以识别万国字符
    特点:2Bytes对应一个字符
   
    字符-----unicode格式的数字
                    |
                 GBK   shiftJIS


    中文字符、英文字符------------unicode二进制数-----------》gbk二进制数
    日文字符、英文字符------------unicode二进制数-----------》shiftJIS二进制数
    韩文字符、英文字符------------unicode二进制数-----------》Euc-kr二进制数
    万国字符------------unicode二进制数-----------》utf-8二进制数
    
5、utf-8
        1Byte对应英文字符
        3Byte对应一个中文字符    

2.2、字符编码的发展历史

1、群雄割据:
英文字符--------------内存:ASCII二进制数--------------->硬盘:ASCII二进制数
中文英文字符--------------内存:GBK二进制数--------------->硬盘:GBK二进制数
日文英文字符--------------内存:shiftJIS二进制数--------------->硬盘:shiftJIS二进制数
韩文英文字符--------------内存:Euc-Kr二进制数--------------->硬盘:Euc-Kr二进制数

2、过渡阶段:
中文英文字符------------内存:unicode=========gbk============>硬盘:GBK二进制数
日文英文字符------------内存:unicode=========shifJIS========>硬盘:shiftJIS二进制数
韩文英文字符------------内存:unicode=========Euc-Kr=========>硬盘:Euc-Kr二进制数
万国字符----------------内存:unicode=========utf-8==========>硬盘:utf-8二进制数


内存固定使用:unicode
我们可以改变的是从内存写入硬盘采用的编码格式


3、分久必合:
万国字符----------------内存:unicode=========utf-8==========>硬盘:utf-8二进制数
万国字符----------------内存:utf-8==========================>硬盘:utf-8二进制数

2.3、乱码问题及解决方案

1、存的时候乱了:采用的字符编码表无法识别输入的字符
    存的时候就已经乱了,是无法补救的,取的时候一定也乱了

    解决方法:存入硬盘的编码格式应该用utf-8格式


2、存的时候没有乱码:采用的字符编码表可以识别输入的字符
    但是取的时候乱码了:采用的字符编码表与当初存的时候用的不是同一张表

    解决方法:存的时候用什么编码,取的时候一定要用同样的编码格式

与运行python程序有关的乱码问题:
    1、保证运行python程序的前两个阶段不乱码
        在python文件的开头加一行:
            #coding:文件存的时候用的编码格式

    2、保证第三个阶段不乱码
        使用python3
        如果使用的是python2,应该在符串前加前缀u


编码:
字符-----编码--------unicode格式的数字------编码-----》gbk格式的数字
字符-----解码--------unicode格式的数字《------解码-----gbk格式的数字
# 在python3中字符串类型的值在内存中都是unicode格式的数字
# x="上"
# print(x)

# 在python2中字符串类型的值在内存中都是文件头指定编码格式的数字
x=u"上" # 如果在字符串前加前缀u就把字符串强制存成unicode格式,推荐使用
# print([x,])
print(x)

2.4、编码和解码

x = "上"
# unicode格式的数字==编码===>其他编码格式的数字
res1=x.encode("gbk")
# print(res1,type(res1))
res2=x.encode("utf-8")
# print(res2,type(res2))

# bytes类型可以理解为一种硬盘的原生格式
# str类型

# 其他编码格式的数字==解码==>unicode格式数字
x=res1.decode("gbk")
# print(x)
y=res2.decode("utf-8")
print(y,type(y))

三、文件处理基本处理

3.1、什么是文件

文件是操作系统提供给用户/应用程序操作硬盘的一个虚拟单位

3.2、为何要用文件

存取硬盘必须使用文件

3.3、如何用文件

f = open(文件路径,打开模式)
f.write(数据)
f.close()

应用程序/用户       文件对象/文件句柄=================》遥控器
    操作系统            打开文件a.txt============》空调
    硬件                硬盘

3.4、绝对路径和相对路径

# 绝对路径
# windows系统
# D:\python38\Doc\python383
# C:\a\b\c\new.txt

# linux系统
# /a/b/c/d.txt

# file_path=r'C:\a\b\c\new.txt'
# file_path=r'/a/b/c/d.txt'

# 相对路径:相对于当前位置
# c\d.txt
# d.txt


# 示范:
# r"D:\python全栈15期\day10\a.txt"
# f = open(r"aaa\a.txt", mode='rt',encoding='utf-8')
# res=f.read()
# print(res)
# f.close()


# f = open(r"aaa\a.txt", mode='rb')
# res=f.read()
# # print(res,type(res))
# x=res.decode('utf-8')
# print(x)
# f.close()


f=open('aaa.jpg',mode='rb')
res=f.read()
print(res)
f.close()

本文地址:https://blog.csdn.net/xiaoyurainzi/article/details/107368294