Python面向对象中super用法与MRO机制

程序员文章站 2023-09-28 22:35:37

1. 引言最近在研究django rest_framework的源码，老是遇到super，搞得一团蒙，多番查看各路大神博客，总算明白了一点，今天做一点总结。 2. 为什么要用super 1）让代码维护更加简单 Python是一门面向对象的语言，定义类时经常用到继承的概念，既然用到继承就少不得要在子 ......

1. 引言

最近在研究django rest_framework的源码，老是遇到super，搞得一团蒙，多番查看各路大神博客，总算明白了一点，今天做一点总结。

2. 为什么要用super

1）让代码维护更加简单

　　python是一门面向对象的语言，定义类时经常用到继承的概念，既然用到继承就少不得要在子类中引用父类的属性，我们可以通过“父类名.属性名”的方式来调用，代码如下：　　

class a:
    def fun(self):
        print('a.fun')

class b(a):
    def fun(self):
        a.fun(self)
        print('b.fun')

上述代码中，我们在子类b中调用了父类a的方法，这时候如果我们改变了a类的类名也只需要在b类中修改一下就好了，但是如果有几十上百个类继承了a类呢？一旦a类类名改了，我们就要分别到那几十上百个子类中修改，不但要改继承时用到的a类名，调用a类方法时用到的a类名也要改，繁琐的很，用super就好多了：

class a:
    def fun(self):
        print('a.fun')

class b(a):
    def fun(self):
        super().fun()
        print('b.fun')

这时候，就算a类类名改了，也只需要在子类声明继承关系时修改就好了，简单得大多。

ps：遇到问题没人解答？需要python学习资料？可以加点击下方链接自行获取
note.youdao.com/noteshare?id=2dce86d0c2588ae7c0a88bee34324d76

2）解决多继承带来的重复调用（菱形继承）、查找顺序（mro）问题

上面说到的例子是单继承，用“父类名.属性”的方法调用出来代码维护时繁琐一点也并无不可，但python是的继承机制是多继承，还是用这种方法来调用父类属性就会就回带来许多问题。假如有a、b、c、d这4个类，继承关系如下，我们要在各子类方法中显式调用父类的方法（姑且不考虑是否符合需求）：

Python面向对象中super用法与MRO机制

用“父类名.属性名” 的方式调用，代码如下：

class a:
    def fun(self):
        print('a.fun')

class b(a):
    def fun(self):
        a.fun(self)
        print('b.fun')

class c(a):
    def fun(self):
        a.fun(self)
        print('c.fun')

class d(b , c):
    def fun(self):
        b.fun(self)
        c.fun(self)
        print('d.fun')

d().fun()

输出结果为：

a.fun
b.fun
a.fun
c.fun
d.fun

可见，a类被实例化了两次。这就是多继承带来的重复调用（菱形继承）的问题。使用super可以很好的解决这一问题：

class a:
    def fun(self):
        print('a.fun')

class b(a):
    def fun(self):
        super(b , self).fun()
        print('b.fun')

class c(a):
    def fun(self):
        super(c , self).fun()
        print('c.fun')

class d(b , c):
    def fun(self):
        super(d , self).fun()
        print('d.fun')

d().fun()

输出结果如下：

a.fun
c.fun
b.fun
d.fun

那么，为什么输出顺序是a->c->b->d而不是a->b->c->d呢？这就涉及到python继承中的mro（method resolution order）：方法解析顺序。

3. super与mro机制

事实上，在每个类声明之后，python都会自动为创建一个名为“__ mro__”的内置属性，这个属性就是python的mro机制生成的，该属性是一个tuple，定义的是该类的方法解析顺序（继承顺序），当用super调用父类的方法时，会按照__ mro__属性中的元素顺序去挨个查找方法。我们可以通过“类名. mro”或“类名.mro()”来查看上面代码中d类的__ mro__属性值：

print(d.__mro__)
print(d.mro())

输出结果为：

(<class '__main__.d'>, <class '__main__.b'>, <class '__main__.c'>, <class '__main__.a'>, <class 'object'>)
[<class '__main__.d'>, <class '__main__.b'>, <class '__main__.c'>, <class '__main__.a'>, <class 'object'>]

一个是tuple，一个list，但本质上是一个东西。这个顺序是怎么生成的呢？在python新式类中（python3中也只存在新式类了），采用的是c3算法（可不是广度优先，更不是深度优先）。我们通过如下图所示的继承关系来简单介绍c3算法（箭头指向父类）。

[图片上传失败...(image-df958a-1576245580059)]

当要生成f的继承顺序时，c3算法过程如下：首先将入度（指向该节点的箭头数量）为零的节点放入列表，并将f节点及与f节点有关的箭头从上图树中删除；

继续找入度为0的节点，找到d和e，左侧优先，故而现将d放入列表，并从上图树中删除d，这是列表中就有了f、d。

继续找入度为0的节点，有a和e满足，左侧优先，所以是a，将a从上图中取出放入列表，列表中顺序为f、d、e；

接下来入度为0的节点只剩下e，取出e放入列表；只剩下b和c节点，且入度都为0，但左侧优先，二先将b放入列表，然后才是后才是c；不过别忘了，python所有类都有一个共同的父类，那就是object类，所以，最好还会把object放入列表末尾。最终生成列表中元素顺序为：f->d->a->e->b->c->object。我们用代码验证一下：

class a(object):
    pass

class b(object):
    pass

class c(object):
    pass

class d(a,b):
    pass

class e(b, c):
    pass

class f(d, e):
    pass

print(f.__mro__)

输出结果为：

(<class '__main__.f'>, <class '__main__.d'>, <class '__main__.a'>, <class '__main__.e'>, <class '__main__.b'>, <class '__main__.c'>, <class 'object'>)

所以，图1中的继承顺序为什么是d->b->c->a就好解释了。但还没弄清楚图1用super实现的代码输出顺序的问题，所以，我们还要继续看super的用法。

4. 怎么用super

super是一个类（不是方法），实例化之后得到的是一个代理的对象，而不是得到了父类，并且我们使用这个代理对象来调用父类或者兄弟类的方法。使用格式如下：

super([type[, object-or-type]])

将这个格式展开来就有一下几种传参方式：

super()
super(type , obj)
super(type_1 , type_2)

注意，可没有super(type)这种方式。下面说说上面三种传参方式。

4.1 super(type , obj)

先说super(type , obj)，这个方式要传入两个常数，第一个参数type必须是一个类名，第二个参数是一个该类的实例化对象，不过可以不是直接的实例化对象，该类的子类的实例化对象也行。

在上文中已经说到，super会按照__ mro__属性中的顺序去查找方法，super(type , obj)两个参数中type作用是定义在__ mro__数组中的那个位置开始找，obj定义的是用哪个类的__ mro__元素。我们用代码来说明，将图2的代码各个类中添加一个fun方法，继承关系不变，代码如下：

class a(object):
    def fun(self):
        print('a.fun')

class b(object):
    def fun(self):
        print('b.fun')

class c(object):
    def fun(self):
        print('c.fun')

class d(a,b):
    def fun(self):
        print('d.fun')

class e(b, c):
    def fun(self):
        print('e.fun')

class f(d, e):
    def fun(self):
        print('f.fun')

然后尝试super(type , obj)两个参数的不同组合，看看输出结果。

先让obj都为f类的实例，尝试不同type下的输出结果：

super(e , f()).fun() # 输出结果：b.fun
super(d , f()).fun() # 输出结果：a.fun
super(f , f()).fun() # 输出结果：d.fun

再回顾一下__mro__的顺序：f->d->a->e->b->c->object，发现规律没？调用的都是type对应的类在__mro__顺序中的下一个类的fun方法。所以，我们可以通过type参数来指定调用父类的范围。

再让type保持不变，obj尝试不同的实例：

super(b , f()).fun() # 输出结果：c.fun
super(b , e()).fun() # 输出结果：c.fun
super(b , b()).fun() # 这是错误的，会报错

发现规律了吗？上面这个类继承关系太简单，可能规律并不明显。事实上，obj参数指定的是用那个类的__mro__属性。

好了，我们现在回到图2中使用super()之后的代码，来解释一下为什么输出顺序是a->c->b->d。

首先我们要明白，d类的__mro__顺序是d->b->c->a，在d类中调用fun方法，然后在d类fun方法中遇到super(d , self).fun()，这个self指的是d类的实例化对象，所以用的是d类的__mro__顺序，而且指明位置是d后面也就是b类，所以继续调用b类的fun方法，遇到super(b , self).fun()，这时候需要注意，这里的self还是原来的d类实例（千万注意不是b类实例）

所以还是用d类的__mro__顺序，那就继续调用下一个c类的fun方法，同理继续调用下一个父类，也就是a类的fun方法，执行完a类的fun方法后，回到c的fun方法中，打印输出，然后回到b类的fun方法，知道d类的fun方法打印输出完。懂了吗？

4.2 super()

super()事实上是懒人版的super(type , obj)，这种方式只能用在类体内部，python会自动把两个参数填充上，type指代当前类，obj指导当前类的实例对象，相当于super(__ class__ , self)。所以，以下三种代码是完全等效的：

代码一：

class b(a):
    def fun(self):
        super().fun()
        print('b.fun')

代码二：

class b(a):
    def fun(self):
        super(b , self).fun()
        print('b.fun')

代码三：

class b(a):
    def fun(self):
        super(__class__ , self).fun()
        print('b.fun')

4.3 super(type_1 , type_2)

当super传入的两个参数都是类名是，type_2必须是type_1的子类。功能上与super(type , obj)有什么不同呢？我们继续上一小节的代码输出测试：

print(super(f , f())) #输出结果为：<super: <class 'f'>, <f object>>
print(super(f , f)) #输出结果为：<super: <class 'f'>, <f object>>

输出结果是一样的，那你就以为super(type_1 , type_2)与super(type , obj)一样吗？看下面输出：

print(super(f , f()).fun()) #输出结果为：d.fun
print(super(f , f).fun()) # 报错：typeerror: fun() missing 1 required positional argument: 'self'

所以，super(type_1 , type_2)与super(type , obj)有区别，在看一下下列输出：

print(super(f , f()).fun)# 输出结果：<bound method d.fun of <__main__.f object at 0x000001bd44a98b38>>
print(super(f , f).fun) # 输出结果：<function d.fun at 0x000001bd44a9ee18>
print(d.fun) # 输出结果：<function d.fun at 0x000001bd44a9ee18>

所以，当super传入的两个传输都是类时，得到的就是一个指向继承顺序下的类的代理，并未绑定实例，要调用d类的fun方法，还需传入实例：

print(super(f , f).fun(f())) #输出结果：d.fun

所以，当super传入的两个参数都是类的时候，最好只用来调用类的静态方法或者类方法。

5. 总结

最好，在实际写代码时，最好不要用诸如super(self.__ class__, self) 的写法，容易导致异常，super 的第一个参数尽量为当前的类。至此，super的总结就结束了。

上一篇： tp5.1 无限极分类前台展示

下一篇： python邮箱发送

Python面向对象中super用法与MRO机制

Python面向对象之类的定义与继承用法示例

python中面向对象_类_对象的概念与定义

Python面向对象之类的定义与继承用法示例

Python面向对象中super用法与MRO机制

Python面向对象程序设计类变量与成员变量、类方法与成员方法用法分析

Python面向对象程序设计类的封装与继承用法示例

python中面向对象_类_对象的概念与定义

Python面向对象——重写与Super

Python面向对象程序设计之继承与多继承用法分析

Java_面向对象中的this和super用法