Python对象体系深入分析
Guido用C语言创造了Python,在Python的世界中一切皆为对象.
一.C视角中的Python对象
让我们一起追溯到源头,Python由C语言实现,且向外提供了C的API http://docs.python.org/c-api/index.html .
我们思考问题的时候,可能对于对象这种东西很容易理解,而计算机能理解的只有0,1序列这样的字节序列,从根本上讲,我们所说的计算机语言中的对象只是在内存中的一块内存空间里的0,1序列而已,这些连续或者非连续的内存空间在更高层次上可以看作是一个整体.在Python中,我们所提到的一般的对象都是C中的结构体在堆Heap上申请的一块内存空间.
为了能够用C语言实现Python的面向对象的机制,需要定义一些结构体,能够操作那些对象的内存空间。
1.PyObject&PyVarObject
所有的Python对象都有一些共同的东西,我们将其高度抽象成一个结构体PyObject
代码如下:
typedef struct _object{
PyObject_HEAD
} PyObject;
//其实PyObject_HEAD这个宏在发行版本中的为
int ob_refcnt;
struct _typeobject *ob_type;
ob_refcnt,就是对象引用计数,它的存在是为了实现了Python的基于引用技术的垃圾回收机制.
还有一个是指向一个类型对象结构体的指针,用以代表该对象的类型.
在C语言的实现的时候,还有一个结构体扩展于PyObject
那便是PyVarObject,其内容为PyObject_VAR_HEAD这个宏,它比PyObject多了一个ob_size,用来表示变长对象的长度,详情见http://docs.python.org/c-api/structures.html
还有一点请大家不要搞混,这里的PyObject和PyVarObject和Python世界中的真实对象没有对应关系,这两个只是Python对象全体在C语言表示中的一种抽象.也就是说在C语言中,只要是一个Python对象结构体的数据,那么其内存的开始部分都会有上面结构体的几个变量,所以一个PyObject的指针便可以指向所有的C语言中的表示Python对象的结构体,这样在C语言的实现中,我们便可以通过这个统一的指针操作所有的内置的Python对象结构体了.
2.PyTypeObject
刚刚还有一个东西没有讲,那便是_typeobject(PyTypeObject)这个结构体,它是Python中所有类型对象的抽象,这样我们在C语言的层次里对于所有的类型对象结构体都可以通过PyTypeObject的指针来调用
代码如下:
typedef struct _typeobject {
//注意开始部分为PyObject_VAR_HEAD
PyObject_VAR_HEAD
char *tp_name; /* For printing, in format
"
int tp_basicsize, tp_itemsize; /* For allocation */
/* Methods to implement standard operations */
destructor tp_dealloc;
printfunc tp_print;
……
/* More standard operations (here for
binary compatibility) */
hashfunc tp_hash;
ternaryfunc tp_call;
……
} PyTypeObject;
3.Python内置对象和C结构体的对应
现在Python面向对象机制的对象和类型的抽象都已经说过了,接下来我们来看下在python中真实存在的对象在C语言实现的时候是怎么样的呢?
首先需要谈的是那些Python的内置对象,这些都是C语言定义了的,当Python环境初始化后,这些对象便创建好了。
代码如下:
PyAPI_DATA(PyTypeObject) PyType_Type; /* built-in 'type' */
PyAPI_DATA(PyTypeObject) PyBaseObject_Type; /* built-in 'object' */
object对象在Python中是一个比较基础的对象,它在C语言中对应的结构体是PyBaseObject_Type,从C语言中的这个命名我们可以大概知道这个类是一个类型对象.
还有就是Python中的
代码如下:
PyTypeObject PyType_Type = {
PyObject_HEAD_INIT(&PyType_Type)
0, /* ob_size */
"type", /* tp_name */
sizeof(PyHeapTypeObject), /* tp_basicsize */
sizeof(PyMemberDef), /* tp_itemsize */
……
};
我们再看看比较具体的整数
一个整数instance在C语言中的表示的结构体是PyIntObject
代码如下:
typedef struct {
PyObject_HEAD
long ob_ival;
} PyIntObject;
也就是说通过这样的结构体我们就可以在C语言的的运行时中指向Python的整数对象.
那么相应的我们Python的整数类型对象为
代码如下:
yTypeObject PyInt_Type = {
PyObject_HEAD_INIT(&PyType_Type)
0,
"int",
sizeof(PyIntObject),
……
};
4.自定义对象
当我们创建一个Python对象的时候,最终都是通过Python的底层来做的,
当我们通过Python语言定义了自己的一个class A之后,Python首先根据你写的代码创建了一个A这样的class对象(类对象),然后当你需要创建A的实例的时候,其实在Python的底层都是通过A这个Class对象进行创建的。
二.Python视角中的对象体系
在单纯的Python的世界中,一切都是对象.这些对象可以分为三类,
metaclasses,classes,instance
其中classes又可以分为内置的type和用户自定义的class
下面我们通过一张图片来作详细的说明
注:
其中C的定义的方式如下(python 中继承于某类直接写在类名后面的括号中):
代码如下:
class C(object):
......
其中实线表示 is-kind-of 的关系 ,虚线表示is-instance-of的关系.
查看当前classes对象(instances对象没有__bases__属性)的基类的时候,可以用过classes_name.__bases__进行查看,其值为一个Tuple元组(Python支持多继承).
查看当前对象的类型的方法是object_name.__class__
我们可以通过一些测试来证实上面的图:
type为所有类的类。
希望本文所述对大家的Python程序设计有所帮助。
下一篇: Python零基础入门之十一文件