磊哥评测之数据库：腾讯云MongoDB vs自建

程序员文章站 2022-08-31 13:14:13

本文由云+社区发表作者：磊哥上期文章我们聊到了redis。这期我们来说说另一个网红nosql数据库：MongoDB。有这么一个介绍MongoDB的说法是：MongoDB是非关系数据库当中功能最丰富，最像关系数据库的。这么说是因为作为一个面向文档存储型、数据结构非常松散*的的数据库，却拥有着丰富 ......

本文由云+社区发表

作者：磊哥

上期文章我们聊到了redis。这期我们来说说另一个网红nosql数据库：mongodb。有这么一个介绍mongodb的说法是：mongodb是非关系数据库当中功能最丰富，最像关系数据库的。这么说是因为作为一个面向文档存储型、数据结构非常松散*的的数据库，却拥有着丰富的功能特性如强大灵活的查询语言、支持二级索引等特性，新版本的mongdb甚至还支持事务。听小伙伴说mongodb不仅功能丰富，而且读性能强大到远远把mysql甩在后面，今天我就代替大家来动手进行一下数据库测试，揭开mongodb的神秘“面纱”。

为了进行数据库对比测试，这次我购买了腾讯云mongodb的主从版（1主2从），同时在同样配置的云主机自建mongodb作为对比。

磊哥评测之数据库：腾讯云MongoDB vs自建

下面给出centos7 64位上安装mongodb 3.6的实践如下：

vim /etc/yum.repos.d/mongod-org.repo

编辑内容如下：

[mongodb-org]

name=mongodb repository

baseurl=

gpgcheck=1

enabled=1

gpgkey=

执行指令yum install mongodb-org -y安装

vim /etc/mongod.conf

此处根据自己需求修改bindip: 0.0.0.0 #监听地址 port: 27017 #监听端口

systemctl start mongod.service #开启服务

netstat -anpt | grep 27017 #检查是否启动

服务开启后可以使用上面的指令测试服务是否启动，如果成功启动的话会看到结果如下图所示：

磊哥评测之数据库：腾讯云MongoDB vs自建

如果无法启动，需要根据日志分析具体原因。根据笔者的实践，大部分的原因会落在配置和权限上。如果排除错误太难，建议重新安装来的快一点。

接下来需要安装数据库测试工具，这次我们使用ycsb，雅虎开发的一个很强大的测试工具。

在安装ycsb前需要安装java和maven，测试前需要在workloads文件夹中创建配置文件，配置如下图所示：

磊哥评测之数据库：腾讯云MongoDB vs自建

考虑到购买的mongodb是副本集配置，一个主节点带两个从节点，我们在本地也配置好副本集群，使用用 ./mongod --replset amymongo --dbpath /data/27019 --port 27019 --logpath /var/log/mongodb/27019.log --fork 配置从节点，具体配置和初始化方法参考（当然部署在本机的方案不能保证高可用）

在workloads中防止配置文件，我们选择插入1千万条记录，执行1千万次操作，测试两种场景：read/update 9：1和纯insert场景。

废话少说，下面就一起来看看测试结果吧。

场景读更新read/update 9:1，单位ops/sec:

磊哥评测之数据库：腾讯云MongoDB vs自建

场景纯写入insert，单位ops/sec:

磊哥评测之数据库：腾讯云MongoDB vs自建

场景读更新read/update 9:1，单位us(延时)：

磊哥评测之数据库：腾讯云MongoDB vs自建

场景纯写入insert，单位us(延时):

磊哥评测之数据库：腾讯云MongoDB vs自建

看来mongodb真的是一个高性能的数据库，为啥呢，因为mongo的延时单位居然是us微秒、微秒、微秒。。。16gb的内存基本上20线程之后延时就会大大增加，在100线程的时候基本上延时基本在1000us以上，而读多场景跟写入场景相比，写入场景的性能略差一点，随着线程数的增大，写入场景的吞吐量和延时表现和读更新场景的差距会扩大。

有读者可能会有疑惑，既然数据库测试是比较云和自建，看起来差距也没有那么大，用自建好像也可以接受啊。这里我要把测试中的发现讲给大家听，听完之后大家就明白了。

第一点，笔者买的是16g内存的机器（流下了没有钱的泪水），测试的时候发现cvm的内存占用基本到了百分之60左右，笔者在建立副本集和加大测试数据量（购买数据量的百分之80）之后发现，内存占用基本到了百分之80以上。看来mongo的第一个缺点，就是对内存的消耗真的非常可怕！！如果遇到高并发大数据量读写，恐怕分分钟就存在着存在着oom的风险。

所以这里奉劝各位同学，如果要自建mongodb，还是尽量购买超大内存满足业务需求，避免在业务高峰的时候被“干掉”。如果因为跟笔者一样贫穷不想买那么大的内存，可以考虑使用云数据库，云mongodb具备动态伸缩能力，即使没有买够大的内存，也完全来得及在业务高峰扩容，即使发生故障，也有完善的数据自动备份和无损恢复机制来恢复数据，在可用性上保障就高多了。

第二点，笔者在后续测试本地副本集的时候，尝试读secondary节点的数据，结果遇到了读延迟很高的情况。在网上研究了一下发现是因为，mongodb 复制集里 secondary 不断从主上批量拉取 oplog，然后在本地重放，以保证数据与 primary 一致。这里为了防止脏读，会加一个锁阻塞所有的读请求。

所以如果遇到 secondary 重放 oplog 占用锁时间长，读取的延时也会对应变长。这个锁最高能锁多久呢，看到有个案例锁了接近一个小时。。。看到的人内心一定是崩溃的，而在云mongo测试的时候没有遇到这个情况，我想这一定是针对这个缺陷做了很大的改进，使用了其他方法实现同步。

总的来说，mongodb确实可以不借助其他第三方工具实现高可用和分片功能，具备的高可用的故障切换，分片可以实现数据的分部均衡，大数据量的时候通过路由实现了服务器的负载均衡。所以mongodb自身的可用性较高，也难怪会在短短时间内成为流行的nosql数据库。

但是mongodb也存在着一些坑：如对内存的占用过高、对网络的占用过高、存在从节点锁导致读几乎不可用的情况，这些情况在实际业务使用的时候会导致很严重的问题，集群宕机、服务瘫痪、数据丢失无时不刻不是覆盖在运维同学心头的阴影。这个时候云mongodb几乎就是救星，弹性伸缩、随时扩容、真正安全的数据热备以及强大的专业运维架构师团队，才能真的确保业务安全无故障的运行下去。

写到这里，笔者也在思考，云数据库到底是什么，它仅仅是把数据库封装一下，改改内核，提供给使用者吗？不，云数据库应当是一整套专业服务，除了数据库之外，还有监控、安全、迁移、灾备、运维等一系列的服务提供。能让业务开发专注于业务本身，把专业的交给专业的人去做。

此文已由腾讯云+社区在各渠道发布

获取更多新鲜技术干货，可以关注我们

上一篇： js函数中this指向的问题代码实例分析

下一篇： CSS：nth-child和nth-of-type的深入理解