欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

实现Lua中数据类型的源码分享

程序员文章站 2022-04-09 20:41:29
概述     在lua中有8种基础类型:nil、boolean、number、string、userdata、function、thread...

概述

    在lua中有8种基础类型:nil、boolean、number、string、userdata、function、thread和table。可以使用函数type查看某个变量或值的类型,返回相应的类型名称。像其他动态语言一样,在语言中没有类型定义的语法,每个值都携带了它自身的类型信息。下面将通过lua 5.2.1的源码来看类型的实现。

   源码实现

     lua将值表示成带标志的联合结构,代码如下(lobject.h):

 90 /* 
 91 ** union of all lua values 
 92 */ 
 93 typedef union value value; 
100 /* 
101 ** tagged values. this is the basic representation of values in lua, 
102 ** an actual value plus a tag with its type. 
103 */ 
104  
105 #define tvaluefields  value value_; int tt_ 
400 struct lua_tvalue { 
401  tvaluefields; 
402 }; 

可以看出结构体有两个成员:

    一个是整型的tt_用来表示数据类型,lua中所有的数据类型定义如下(lua.h):

78 #define lua_tnil    0 
79 #define lua_tboolean    1 
80 #define lua_tlightuserdata 2 
81 #define lua_tnumber   3 
82 #define lua_tstring   4 
83 #define lua_ttable   5 
84 #define lua_tfunction    6 
85 #define lua_tuserdata    7 
86 #define lua_tthread   8 

可以看到实现了9种数据类型,其中把语法中userdata分为lua_tlightuserdata和lua_tuserdata,其中前一种类型即为轻量级userdata(light userdata),轻量级userdata是一种表示c指针的值,对lua虚拟机来说,这种数据类型不需要gc(垃圾回收),其指向的内存由用户分配和释放;后一种userdata类型完全userdata(full userdata),内存是由lua虚拟机分配,并有gc机制负责处理。

 结构体lua_tvalue另一个数据成员是value_,它是一个联合体,代码如下(lobject.h):

 96 #define numfield  lua_number n;  /* numbers */ 
103 typedef lua_number lua_number;(lua.h) 
392 #define lua_number   double(luaconf.h) 
391 union value {  
392  gcobject *gc;  /* collectable objects */ 
393  void *p;     /* light userdata */ 
394  int b;      /* booleans */ 
395  lua_cfunction f; /* light c functions */ 
396  numfield     /* numbers */ 
397 }; 

通过注释,可以很容易理解每个成员的含义,但有必要对以下几个成员说明:

    numfield:用来表示所有数值,其实质对应的是double类型。包括整型也是用这个来表示。另外在lua 5.3实现,分开了整型和浮点数的表示。

    gcobject *gc:用来指向那些需要垃圾回收的对象,包括string、table、function、完全userdata和thread类型。gcobject用来表示可以垃圾回收的对象,它也是一个联合体,其代码如下(lstate.h)

185 union gcobject { 
186  gcheader gch; /* common header */ 
187  union tstring ts; 
188  union udata u; 
189  union closure cl; 
190  struct table h; 
191  struct proto p; 
192  struct upval uv; 
193  struct lua_state th; /* thread */ 
194 }; 

其中成员gcheader gch主要用于gc回收机制使用。其他成员比如tstring ts才是真正存储值的结构,而这些数据结构也会有gcheader,用于gc管理。

    总的来说,lua中各种数值类型结构如下:

实现Lua中数据类型的源码分享

    最后,关于lua的数据类型实现,值得指出使用带标志的结构体来表示lua的数值类型,使得lua中任何一种数据类型至少占用的空间是个16字节(结构体还需要对其),就算nil类型,也会占用8个字节的空间,因此拷贝lua值是比较耗时的。下一篇文章将讨论lua字符串的实现。

以上所述就是本文的全部内容了,希望大家能够喜欢。