欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

mongodb 数据类型(null/字符串/数字/日期/内嵌文档/数组等)

程序员文章站 2022-06-25 09:46:50
mongodb的文档类似于json,json只是一种简单的表示数据的方式,只包含了6种数据类型(null、布尔、数字、字符串、数组及对象). json的数据类型的局限性:...

mongodb的文档类似于json,json只是一种简单的表示数据的方式,只包含了6种数据类型(null、布尔、数字、字符串、数组及对象).

json的数据类型的局限性:
1.无日期类型,对日期型的处理较为繁琐
2.无法区分浮点数和整数、32位和64位
3.其他类型表示局限 如函数、正则式等

mongodb使用bson(binary json)来组织数据,bson还提供日期、32位数字、64位数字等类型。下面为在mongodb shell中这些类型在文档中是如何表示:

1、null  用于表示空值或者不存在的字段。

{"name":null}

2.布尔  布尔类型、即true和false

{"flag":true}/{"flag":false}

3.数字  mongodb中分32位整数、64位整数、64位浮点数

  >javascript只支持64位浮点数,shell中对32位的整数会进行自动的转换:
  默认情况下,shell中的数字被mongdb当做是双精度。若从数据库中获取一个32位整数,修改了文档后在将文档保存到数据库的时候,这个整数已被转换成了浮点数(整数不变也会转换)。
  >shell中会用内嵌文档的方式显示64位整数:
  数字智能表示为双精度数(64位浮点数)的另一个问题是,有些64位的整数并不能精确的表示64位浮点数。因此要是存入了一个64位整数然后在shell中查看,它显示一个内嵌的文档,表示可能不准确。
  如:
  插入文档{"name":"apple","num":5},其中"num"设置为64位整数5.
  查看如下:
  { "_id" : objectid("5000f7af32e3988ad237a202"), "name" : "apple", "num" : {"floatapprox" : 5} }
 
  插入文档{"name":"orange","num":9223372036854775807}
  查看如下:
  { "_id" : objectid("5000f7af32e3988ad237a203"), "name" : "apple", "num" : {"floatapprox" : 9223372036854776000 ,"top" : 2147483647 , "bottom" : 4294967295} }
 
  以上实例(可自己尝试见证)文档参见:mongodb权威指南
 
  我在本机(win7 32位)插入如下文档:
  {"name":"apple","num":5}
  {"name":"orange","num":9223372036854775807}
  {"name":"peach","num":922337203685477580743254354565678678998935345}
 
  >db.a.find()
  { "_id" : objectid("5000f7af32e3988ad237a204"), "name" : "apple", "num" : 5 }
  { "_id" : objectid("5000f87432e3988ad237a205"), "name" : "orange", "num" : 9223372036854776000 }
  { "_id" : objectid("5000fbd232e3988ad237a206"), "name" : "peach", "num" : 9.223372036854776e+44 }
 
 
  64位浮点数:
  {"num":3.14}/{"num":3}
 
4.字符串  utf-8字符串都可以表示为字符串类型的数据

{"name":"orange"}

5.符号  shell中不支持,并将数据库里的符号类型都转换成字符串

6.对象id是文档的12字节的唯一id

  {"x":object()}
  mongodb中存储的(同一个集合内)文档必须有,只有唯一的“_id”键。值可为任意类型,必须保证其唯一性,默认为objectid对象。至于mongodb为什么用objectid对象,以及它有什么好处等请翻阅相关资料。

  下面是objectid的构成:
  objectid使用12字节的存储空间,每个字节两位十六进制数字,是一个24位的字符串。12字节按照如下方式生成:
 
  0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11
    时间戳      |  机器码   |  pid  |    计数器
  -----------------------------------------------
 
  >时间戳:从标准的纪元开始的时间戳,单位为秒。
  >机器码:所在主机的唯一标示符,通常为机器主机名的散列值。
  >pid:产生objectid的进程标示符。
  >计数器:自动增加计数器,同一秒最多允许每个进程拥有256的3次方(16777216)个不同的objectid。
 
  文档的"_id"键:
  1.插入文档的时候,没有该键,系统自动创建一个。
  2.mongodb服务器可自动创建,通常在客户端由驱动程序完成:
     >减少数据库扩展的负担
     >驱动程序提供丰富的api,可返回objectid,也可插入文档;若有服务器生成的话,驱动程序需单独的查询来确定插入的文档中的"_id"值。
    
7.日期型  存储的是从标准纪元开始的毫秒数,不存储时区。

{"name":"xx","date":new date()}  本机查看:{ "_id" : objectid("5001047632e3988ad237a206"), "name" : "xx", "date" : isodate("2012-07-14t05:32:38.189z") }

8.正则式  文档中可以包含正则表达式,采用javascript的正则表达式语法

{"regex":/[0-9]/g}

9.代码或者函数  javascript代码(mongodb中值直接保存到数据库,不对值进行执行,因此不存在安全问题)

  {"setname":function(){var name="jk";alert(name)}}
 
10.二进制数  可以由任意字节的串组成。shell中无法使用。

11.最大值  bson包括一个特殊类型,表示可能的最大值。shell没有这个类型。

12.最小值  bson包括一个特殊类型,表示可能的最小值。shell没有这个类型。

13.未定义(undefined) 文档中也可以使用未定义类型

{"name":undefined}

14.数组  值的集合或者列表可以表示成数组

{"name":["s","d","f"]}

15.内嵌文档  文档可以包含文档,作为值嵌入到父文档中

{"sch" : "s"
 "catl" : {
   "c1" : {"cls1" : "cs1","cls2" : "cs2","cls3" : "cs3"}
   "c2" : {"cls1" : "cs1","cls2" : "cs2","cls3" : "cs3"}
   "c3" : {"cls1" : "cs1","cls2" : "cs2","cls3" : "cs3"}
 }
}

从面向对象的角度来理解文档,文档就是个对象,文档里面的key/value就是属性和属性值。