MongoDB的chunk详解

程序员文章站 2022-06-17 22:30:48

目录chunk的大小如何确定？？？chunk的分裂chunk的迁移通常情况下，chunk迁移由下面三种场景触发： mongodb中，在使用到分片的时候，常常会用到chunk的概念，chunk是指一个...

mongodb中，在使用到分片的时候，常常会用到chunk的概念，chunk是指一个集合数据中的子集，也可以简单理解成一个数据块，每个chunk都是基于片键的范围取值，区间是左闭右开。例如，我们的片键是姓名的第二个字母，包含了a-z这26中可能，理想情况下，划分为26个chunk，其中每个字母开头的姓名记录即为一个chunk。

在数据写入的时候，mongos根据片键shard key的值来写入对应的chunk中，chunk可以表示的最小范围是单个唯一的shard key的值，只包含具体的单个片键值文档的chunk不能被分割，这个也比较容易理解，如果某个chunk只包含一个片键的值，如果对它进行分割，则代表一个片键值映射了2个chunk，下次遇到这个片键的文档时，mongos就不知道应该存放在哪个chunk当中了。

chunk的大小如何确定？？？

在mongodb中，chunk的默认大小是64mb，可以增加或者减少chunk的大小。

chunk的大小不宜过小，如果chunk过小，好处是可以让数据更加均匀的分布，但是会导致chunk之间频繁的迁移，有一定的性能开销；同样的，chunk的大小不宜过大，过大的chunk size会导致数据分布不均匀，

chunk的分裂

当某个chunk的值达到了chunk所能表示的最大值的时候，这个时候chunk不能无限增长，需要通过分割的方法来减少chunk的大小，例如一个64mb的chunk分割成2个32mb的chunk，这样虽然增加了chunk的数量，但是带来的收益是单个chunk的缩小。

MongoDB的chunk详解

chunk的迁移

在分片+复制集的架构中，当某个服务器上的数据记录不停的增多，它上面分割的chunk就会变多，当集群中每个服务器上的chunk数量严重失衡的时候，mongodb会自动进行chunk的迁移工作，这个自动迁移的工作，是通过balancer来进行的。如果balancer发现各个shard之间的chunk数差异超过了提前规定的阈值，则会进行chunk的迁移工作，如下：

MongoDB的chunk详解

也就是从上面的状态变成下面的状态。每个小块代表一个chunk。

mongodb自动触发迁移的阈值表如下：

chunk数量： <20，迁移阈值：2

chunk数量：20~79，迁移阈值：4

chunk数量： >80，迁移阈值：8

chunk的迁移一般使用锁来实现，从mongodb3.4版本起，chunk的迁移分为7个步骤：

1、balancer进程将movechunk的命令发送到源shard中

2、源shard使用内部movechunk命令开始移动，迁移过程中，该chunk的操作依旧在源shard上进行，源shard依旧负责该chunk的写入操作

3、目标shard开始创建所需索引

4、目标shard开始请求chunk中的文档并开始接收数据的复制

5、接收完源shard的最后一个文档之后，目标shard启动一个同步进程，这个进程会拉取迁移期间的日志，将迁移期间对该chunk的操作更新到目标chunk中。

6、当完全同步时，源shard连接到config数据库并更新chunk的位置元数据。

7、完成数据更新后，一旦在源shard上没有对该chunk的操作，源shard会异步删除chunk。当然，用户可以设置_waitfordelete参数为true，让源shard在chunk迁移完成后同步删除chunk数据

通常情况下，chunk迁移由下面三种场景触发：

1、多个shard上分布不均匀

2、用户调用removeshard之后，被移除的shard上的chunk就要被迁移到其他的shard上

3、mongodb的shard tag功能，可以对shard或者shard key range打标签，系统会自动将对应的range的数据迁移到拥有相同tag的shard上。

以上就是mongodb的chunk详解的详细内容，更多关于mongodb chunk的资料请关注其它相关文章！

MongoDB的chunk详解

目录

chunk的大小如何确定？？？

chunk的分裂

chunk的迁移

通常情况下，chunk迁移由下面三种场景触发：

Android selector背景选择器的使用详解

Android源码中的目录结构详解

详解在iOS App中自定义和隐藏状态栏的方法

详解Android Studio 3.0的新特性与适配

详解iOS App开发中UIViewController的loadView方法使用

Python面向对象程序设计中类的定义、实例化、封装及私有变量/方法详解

python中正则表达式的使用详解

Python类的继承、多态及获取对象信息操作详解

PyQt打开保存对话框的方法和使用详解

C语言实现线索二叉树的前中后创建和遍历详解