Python面向对象基础：编码细节和注意事项

程序员文章站 2022-06-22 13:00:54

在前面，我用了3篇文章解释python的面向对象： 1. "面向对象：从代码复用开始" 2. "面向对象：设置对象属性" 3. "类和对象的名称空间" 本篇是第4篇，用一个完整的示例来解释面向对象的一些细节。例子的模型是父类Employe和子类Manager，从类的定义开始，一步步完善直到类变得完 ......

在前面，我用了3篇文章解释python的面向对象：

本篇是第4篇，用一个完整的示例来解释面向对象的一些细节。

例子的模型是父类employe和子类manager，从类的定义开始，一步步完善直到类变得完整。

定义employe类

现在，假设employe类有3个属性：名字name、职称job和月薪水pay。

定义这个类：

class employe():
    def __init__(self, name, job=none, pay=0):
        self.name = name
        self.job = job
        self.pay = pay

这里为__init__()的job参数提供了默认值：none，表示这个员工目前没有职称。对于没有职称的人，pay当然也应该是0。这样创建employe对象的时候，可以只给参数name。

例如：

if __name__ == "__main__":
    longshuai = employe("ma longshuai")
    xiaofang = employe("gao xiaofang", job="accountant", pay=15000)

上面的if判断表示这个py文件如果当作可执行程序而不是模块，则执行if内的语句，如果是以模块的方式导入这个文件，则if内的语句不执行。这种用法在测试模块代码的时候非常方便。

运行该py文件，得到结果：

<__main__.employe object at 0x01321690>
<__main__.employe object at 0x01321610>

添加方法

每个employe对象的name属性由姓、名组成，中间空格分隔，现在想取出每个对象的名。对于普通的姓名字符串，可以使用字符串工具的split()函数来处理。

例如：

>>> name = "ma longshuai"
>>> name.split()[-1]
'longshuai'

于是可以在longshuai和xiaofang这两个employe对象上：

print(longshuai.name.split()[-1])
print(xiaofang.name.split()[-1])

结果：

longshuai
xiaofang

与之类似的，如果想要为员工按10%加薪水，可以在每个employe对象上：

xiaofang.pay *= 1.1
print(xiaofang.pay)

无论是截取name的名部分，还是加薪水的操作，都是employe共用的，每个员工都可以这样来操作。所以，更合理的方式是将它们定义为类的方法，以便后续的代码复用：

class employe():
    def __init__(self, name, job=none, pay=0):
        self.name = name
        self.job = job
        self.pay = pay

    def lastname(self):
        return self.name.split()[-1]

    def giveraise(self, percent):
        self.pay = int(self.pay * (1 + percent))

if __name__ == "__main__":
    longshuai = employe("ma longshuai")
    xiaofang = employe("gao xiaofang", job="accountant", pay=15000)
    
    print(longshuai.lastname())
    print(xiaofang.lastname())
    xiaofang.giveraise(0.10)
    print(xiaofang.pay)

上面的giveraise()方法中使用了int()进行类型转换，因为整数乘以一个小数，返回结果会是一个小数(例如15000 * 0.1 = 1500.0)。这里我们不想要这个小数，所以使用int()转换成整数。

定义子类并重写父类方法

现在定义employe的子类manager。

class manager(employe):

manager的薪水计算方式是在原有薪水上再加一个奖金白分别，所以要重写父类的giveraise()方法。有两种方式可以重写：

完全否定父类方法
在父类方法的基础上进行扩展

虽然有了父类的方法，拷贝修改很方便，但第一种重写方式仍然是不合理的。合理的方式是采用第二种。

下面是第一种方式重写：

class manager(employe):
    def giveraise(self, percent, bonus=0.10):
        self.pay = int(self.pay * (1 + percent + bonus))

这种重写方式逻辑很简单，但是完全否定了父类的giveraise()方法，完完全全地重新定义了自己的方法。这种方式不合理，因为如果修改了employe中的giveraise()计算方法，manager中的giveraise()方法也要修改。

下面是第二种在父类方法基础上扩展，这是合理的重写方式。

class manager(employe):
    def giveraise(self, percent, bonus=0.10):
        employe.giveraise(self, percent + bonus)

第二种方式是在自己的giveraise()方法中调用父类的giveraise()方法。这样的的好处是在需要修改薪水计算方式时，要么只需修改employe中的，要么只需修改manager中的，不会同时修改多个。

另外注意，上面是通过硬编码的类名employe来调用父类方法的，python中没有其它方法，只能通过这种硬编码的方式。但好在并没有任何影响。因为调用时明确指定了第一个参数为self，而self代表的是对象自身，所以逻辑上仍然是对本对象的属性self.pay进行修改。

测试下：

if __name__ == "__main__":
    wugui = manager("wu xiaogui", "mgr", 15000)
    wugui.giveraise(0.1, 0.1)
    print(wugui.pay)

一般在重写方法的时候，只要允许，就应该选择在父类基础上进行扩展重写。如果真的需要定义完全不同的方法，可以不要重写，而是在子类中定义新的方法。当然，如果真的有需求要重写，且又要否定父类方法，那也没办法，不过这种情况基本上都是因为在类的设计上不合理。

定制子类构造方法

对于子类manager，每次创建对象的时候其实没有必要去传递一个参数"job=mgr"的参数，因为这是这个子类自然具备的。于是，在构造manager对象的时候，可以让它自动设置"job=mgr"。

所以，在manager类中重写__init__()。既然涉及到了重写，就有两种方式：(1)完全否定父类方法，(2)在父类方法上扩展。无论何时，总应当选第二种。

以下是manager类的定义：

class manager(employe):
    def __init__(self, name, pay):
        employe.__init__(self, name, "mgr", pay)

    def giveraise(self, percent, bonus=0.10):
        employe.giveraise(self, percent + bonus)

现在构造manager对象的时候，只需给name和pay就可以：

if __name__ == "__main__":
    wugui = manager("wu xiaogui", 15000)
    wugui.giveraise(0.1, 0.1)
    print(wugui.pay)

子类必须重写方法

有些父类中的方法可能会要求子类必须重写。

本文的这个示例不好解释这一点。下面简单用父类animal、子类horse、子类sheep、子类cow来说明，这个例子来源于我写的面向对象相关的第一篇文章：。

现在要为动物定义叫声speak()方法，方法的作用是输出"谁发出了什么声音"。看代码即可理解：

class animal:
    def __init__(self, name):
        self.name = name
    def speak(self):
        print(self.name + " speak " + self.sound())
    def sound(self):
        raise notimplementederror("you must override this method")

在这段代码中，speak()方法调用了sound()方法，但animal类中的sound()方法却明确抛出异常"你必须自己实现这个方法"。

为什么呢？因为每种动物发出的叫声不同，而这里又是通过方法来返回叫声的，不是通过属性来表示叫声的，所以每个子类必须定义自己的叫声。如果子类不定义sound()，子类对象调用self.sound()就会搜索到父类animal的名称空间上，而父类的sound()会抛出错误。

现在在子类中重写sound()，但是cow不重写。

class horse(animal):
    def sound(self):
        return "neigh"

class sheep(animal):
    def sound(self):
        return "baaaah"

class cow(animal):
    pass

测试：

h = horse("horsea")
h.speak()

s = sheep("sheepa")
s.speak()

c = cow("cowa")
c.speak()

结果正如预期，h.speak()和s.speak()都正常输出，但c.speak()会抛出"you must override this method"的异常。

再考虑一下，如果父类中不定义sound()会如何？同样会在c.speak()时抛出错误。虽然都会终止程序，但是这已经脱离了面向对象的代码复用原则：对于对象公有的属性，都应该抽取到类中，对于类所公有的属性，都应该抽取到父类中。sound()显然是每种动物都应该具备的属性，要么定义为子类变量，要么通过类方法来返回。

之前也提到过，如果可以，尽量不要定义类变量，因为这破坏了面向对象的封装原则，打开了"黑匣子"。所以最合理的方法，还是每个子类重写父类的sound()，且父类中的sound()强制要求子类重写。

运算符重载

如果用print()去输出我们自定义的类的对象，比如employe对象，得到的都是一个元数据信息，比如包括类型和地址。

例如：

print(longshuai)
print(xiaofang)

## 结果：
<__main__.employe object at 0x01321690>
<__main__.employe object at 0x01321610>

我们可以自定义print()如何输出对象，只需定义类的__str__()方法即可。只要在类中自定义了这个方法，print()输出对象的时候，就会自动调用这个__str__()取得返回值，并将返回值输出。

例如，在输出每个employe对象的时候，都输出它的name、job、pay，并以一种自定义的格式输出。

class employe():
    def __init__(self, name, job=none, pay=0):
        self.name = name
        self.job = job
        self.pay = pay

    def lastname(self):
        return self.name.split()[-1]

    def giveraise(self, percent):
        self.pay = int(self.pay * (1 + percent))

    ## 重载__str__()方法
    def __str__(self):
        return "[employe: %s, %s, %s]" % (self.name, self.job, self.pay)

现在再print()输出对象，将得到这个对象的信息，而不是这个对象的元数据：

print(longshuai)
print(xiaofang)

## 结果：
[employe: ma longshuai, none, 0]
[employe: gao xiaofang, accountant, 15000]

实际上，print()总是会调用对象的__str__()，如果类中没有定义__str__()，就会查找父类中的__str__()。这里employe的父类是祖先类object，它正好有一个__str__()：

>>> object.__dict__["__str__"]
<slot wrapper '__str__' of 'object' objects>

换句话说，当employe中定义了__str__()，就意味着重载了父类object的__str__()方法。而这个方法正好是被print()调用的，于是将这种行为称之为"运算符重载"。

可能从print()上感受不到为什么是运算符，换一个例子就很好理解了。__add__()是决定加号+运算模式的，比如3 + 2之所以是5，是因为int类中定义了__add__()。

>>> a=3
>>> type(a)
<class 'int'>

>>> int.__dict__["__add__"]
<slot wrapper '__add__' of 'int' objects>

这使得每次做数值加法运算的时候，都会调用这个__add__()来决定如何做加法：

实际上在类中定义构造函数__init__()也是运算符重载，它在每次创建对象的时候被调用。

还有很多运算符可以重载，加减乘除、字符串串联、大小比较等等和运算符有关、无关的都可以被重载。在后面，会专门用一篇文章来介绍运算符重载。

序列化

对象也是一种数据结构，数据结构可以进行序列化。通过将对象序列化，可以实现对象的本地持久性存储，还可以通过网络套接字发送给网络对端，然后通过反序列化可以还原得到完全相同的原始数据。

序列化非本文内容，此处仅是介绍一下该功能，后面我会写几篇专门介绍python序列化的文章。

上一篇：基于网址URL中特殊字符转义编码

下一篇： php柱状图多系列动态实现