MongoDB完全使用教程和知识要点
mongodb完全教程
基础知识
mongodb简介
mongodb是一个可扩展,开源,表结构*,用c++语言编写的面向文档的。旨在为web应用提供高性能、高可用性的且易扩展的数据存储解决方案。 mongodb是最像关系数据库的nosql数据库,支持关系数据库的绝大部分查询。mongodb不支持join语句。 mongodb服务端可运行于linux,windows或os x平台,支持32位和64位应用,默认监听端
口是27017。 mongodb内存管理依赖于操作的自动内存管理机制,通过map对数据文件进行内存映射,推荐在64位平台上运行,否则32位模式受虚拟内存地址大小的限制,而且运行时支持的最大文件尺寸也只能为2gb。 mongodb支持日志功能journaling,对数据库的crud操作都会记录在日志文件中(crud操作指,create,read,update,delete增删改查操作)。 mongodb支持副本集和自动分片。 mongodb文档结构和sql结构的对应关系:
sql术语/概念 | mongodb术语/概念 | 解释说明 |
---|---|---|
database | database | 数据库 |
table | collection | 数据库表/集合 |
row | document | 数据记录行/文档 |
column | field | 数据字段/域 |
index | index | 索引 |
table joins | / | 表连接,mongodb不支持 |
primary key | primary key | 主键,mongodb自动将_id设置为主键 |
mongodb安装
windows安装
安装
mongodb提供了32位和64位系统的预编译二进制包,可从mongodb官网下载安装,mongodb预编译二进制包下载地址:https://www.mongodb.org/downloads。mongodb2.2 版本后已经
不再支持 windows xp 系统。 版本介绍:
mongodb for windows 64-bit 适合 64 位的 windows server 2008 r2, windows 7 , 及最新版本的 window 系统 mongodb for windows 32-bit 适合 32 位的 window 系统及最新的 windows vista。 32 位系统上 mongodb 的数据库最大为 2gb mongodb for windows 64-bit legacy 适合 64 位的 windows vista, windows server 2003, 及 windows server 2008 根据系统下载对应的 .msi 文件,双击运行,按操作提示安装即可。
启动
创建数据目录,数据目录必须存在,否则启动失败;假设新建目录为d:/mongo_data/db 启动命令:mongod --dbpath=d:/mongo_data/db;如不指定–dbpath,mongodb默认当
前安装盘符下的mongodb/db目录。 将mongodb服务器作为windows服务运行请注意,你必须有管理权限才能运行下面的命令。执行以下命令将mongodb服务器作为windows服务运行:
mongod.exe --bind_ip youripadress --logpath "d:/mongo_data/db/mongodb.log" --logappend --dbpath "d:/mongo_data/db" --port yourportnumber --servicename "yourservicename" --servicedisplayname "yourservicename" --install使用配置文件的方式启动,创建mongod.conf,使用mongod -f mongod.conf运行
# 数据目录 dbpath = d:/mongo_data/db # 端口 port = 27017 # 是否使用journal日志 journal = true # 日志路径 logpath = d:/mongo_data/db/logs/mongo_start.log # 是否开启授权 auth = true
建议使用配置文件的方式。
mongodb后台管理 shell
mongo ip:port/dbname
如不指定ip,端口和dbname,默认链接本机27107的test数据库。
linux安装
安装
1,下载 curl -o https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-3.0.6.tgz 2,解压 tar -zxvf mongodb-linux-x86_64-3.0.6.tgz 3,拷贝到指定目录 mv mongodb-linux-x86_64-3.0.6/ /usr/local/mongodb
启动
启动方式和windows类似,注意调整路径。
几个重要的进程介绍(以windows平台为例,linux类似)
1,mongod
mongod.exe是数据库实例进程,是整个mongodb中最核心部分,负责数据库的创建、删除等各项管理工作,运行在服务器端
为客户端提供监听,相当于mysql中的mysqld进程。使用示例:mongod -f d:/mongo_data/conf/mongod.conf
2,mongo
mongo是一个与mongod进程进行交互的javascript shell进程,它提供了一些交互的接口函数,用于系统管理员对数据库系
统进行管理。使用示例mongo --port 27017 -username xxx -password xxx -authenticationdatabase admin
3,mongodump
mongodump提供了一种从mongod实例上创建bson dump文件的方法,mongorestore则相反,能够利用这些dump文件重建数据库
,常用命令如下:mongodump --port 27017 --db test --out d:/mongo_data/dump
4,mongoexport
mongoexport是一个将mongodb数据库实例中的数据导出来生成json或者csv文件的工具。命令格式如下:mongoexport --port 27017 --db test --out collection mytest --out d:/mongo_data/test.json
5,mongoimport
mongoimport和mongoexport刚好相反,是一个将csv或json文件内容导入到mongodb实例中的工具,常用命令格式:mongoimport --port 50000 --db shop --collecition goods --file d:/mongo_data/goods.csv
6,mongos
mongos是一个在分片中用到的进程,所有应用程序端的查询操作都会先有它分析,然后将查询定位到某一个分片上。它的作用与mongod类似,客户端的mongo与它连接。
7,mongofiles
mongofiles提供了一个操作mongodb分布式文件存储系统的命令行接口,常用命令如下:mongofile --port 50000 --db mydocs --local d:/mongo_data/docs/c++ primer.pdf put c++_primer.pdf
8,mongostat
mongostat提供了一个展示当前正在运行的mongod实例的状态工具。
9,mongotop
mongotop提供一个而分析mongodb实例花在读写数据上的时间的跟踪方法。它提供的统计数据在每一个collection的级别上。
mongodb crud操作
1,插入文档(create)
mongodb使用insert()或者save()向集合插入文档,基本语法:
-- insert会自动创建collection,删除collection可使用db.collection.drop() db.collection_name.insert(document)
实例:
db.staffinfo.insert({"name":"tdx10274","desc":"very handsome","option":{"age":18,"addr":"wuhan"}})
2,查询操作(read)
语法格式:
db.collection_name.find(document); -- 美化输出 db.collection_name.find(document).pretty()
和rdbms查询where比较:
操作 | 格式 | 范例 | rdbms中类似语句 |
---|---|---|---|
等于 | {key:value} | db.col.find({“by”:”age”}).pretty() | where by = “age” |
小于 | {key:{lt:value}}|db.col.find({"likes":{lt:50}}).pretty() | where likes<50 | |
小于或等于 | {key:{lte:value}}|db.col.find("likes":{lte:50}).pretty() | where likes<=50 |
类似的有大于(
实例:
db.staffinfo.find({"name":"abc"});
3,更新操作(update)
语法格式:
db.collection_name.update( , , { upsert:, mulit:, writeconcern: } )
参数说明:
* query : update的查询条件,类似sql update查询内where后面的。
* update : update的对象和一些更新的操作符(如
* upsert : 可选,这个参数的意思是,如果不存在update的记录,是否插入objnew,true为插入,默认是false,不插入。
* multi : 可选,mongodb 默认是false,只更新找到的第一条记录,如果这个参数为true,就把按条件查出来多条记录全部更新。
* writeconcern :可选,抛出异常的级别
实例:
db.staffinfo.update({"name":"tdx10274"},{$set:{"desc":"smart and handsome"}})
4,删除操作(delete)
语法格式:
db.collection.remove( , { justone:, writeconcern: } )
实例:
db.staffinfo.remove({"name":"tdx10274"});
mongodb复制集
概述
mongodb复制集实现数据库的冗余备份、故障转移,提高了数据库的可用性和安全性。类似mysql中的备库。
复制集基本结构:
复制集配置
主从复制
-- 启动主库 monogd --dbpath="../db" -port=27017 --master -- 启动从库 monogd --dbpath="../db" --port=8888 --slave --source=127.0.0.1:12707
假设已启动端口为5555的mongod服务,如何添加为从库呢?
mongo 127.0.0.1:5555 use local db.sources.insert({"host":"127.0.0.1:27017"}) -- 查询确认主从复制是否添加成功 db.sources.find()
副本集
与主从复制的区别:
* 没有特定的主数据库
* 如果主数据库宕机,集群中会推选一个从数据库作为主数据库顶上,具备自动恢复能力
* 集群中包含一个仲裁节点,集群中数据库数目最好为奇数(包含仲裁数据库),方便仲裁
*
配置示例1(假设replset的名称为myrep):
-- mongod实例1,端口2222 mongod --port=2222 --dbpath="../db" --replset myrep/127.0.0.1:3333 -- mongod实例2,端口3333 mongod --port=3333 --dbpath="../db" --replset myrep/127.0.0.1:2222 -- 初始化副本集,mongo 127.0.0.1:2222 db.initiate({"_id":"myrep","members":[{"_id":1,"host":"127.0.0.1:2222"},{"_id":2,"host":"127.0.0.1:3333"}]}); --添加仲裁节点 mongo --port=4444 -dbpath="../db" --repset myrep/127.0.0.1:2222: -- 只能在primary节点上操作 db.addarb("127.0.0.1:4444")
仲裁数据节点只参与选举,并没有数据副本。它起到的作用只是当primary节点故障时,能参与到复制集剩下的节点中选出一个新的primary,仲裁节点永远不会变成primary节点。
注册用复制启动成功后,从备库查询报错:not master and slaveok=false。解决办法:从mongo客户端执行 db.getmongo().setslaveok()。
mongodb分片
概述
分片技术是解决mongodb数据量大量增长的需求,存储海量数据。将数据分割存在多个分片上,使得数据库可以存储和处理更多的数据。
副本集主要是提高系统的可用性和安全性,决绝故障转移的问题。每个副本都有完整的数据。
分片的基本结构:
分片配置
假设有2个复制集rs0,rs1,一个配置服务器configdb,一个mongos
复制集rs0
节点配置示例rs0_0.conf,其他节点类似
dbpath = d:/mongo_data/db_rs0/data/rs0_0 logpath = d:/mongo_data/db_rs0/logs/rs0_0.log journal = true port = 40000 replset = rs0
启动副本集
mongod -f d:/mongo_data/config_rs0/rs0_0.conf mongod -f d:/mongo_data/config_rs0/rs0_1.conf mongod -f d:/mongo_data/config_rs0/rs0_2.conf
初始化副本集
-- 初始化副本集,假设主机名为win7 mongo --port 40000 rs.initiate() -- 添加副本节点 rs.add("win7:40001") -- 添加仲裁节点 rs.addarb("win7:40002")
复制集rs1
同上,选择不同的端口和文件目录即可。
配置服务器
配置服务器配置示例(其他副本集节点类似,启动方式参见rs0)
dbpath = d:/mongo_data/db_configs/data/db_config0 logpath = d:/mongo_data/db_configs/logs/db_config0.log journal = true port = 40006 configsvr = true
mongos路由服务器
示例配置(cfg_mongos.conf):
logpath = d:/mongo_data/mongos/logs/mongos.log port = 40009 configdb = win7:40006,win7:40007,win7:40008
启动mongos服务器:
mongos --config d:/mongo_data/mongos/cfg_mongos.conf
添加各个分片到集群:
mongo --port 40009 sh.addshard("rs0/win7:40000,win7:40001") sh.addshard("rs1/win7:40003,win7:40004") -- 查看状态 sh.status()
权限控制与监控
权限控制
mongod启动后,默认并没有开启权限认证功能,即使配置文件中指定auth=true。mongod
激活权限控制之后,所有的操作都必须进行权限认证,mongodb采用基于角色的权限控制,一个角色是一组权限的集合,一个权限决定了用户能对数据库进行哪些操作,用户可能具有多个角色。
数据库admin上保存了针对实例上所有数据库的管理用户。常用角色:
* readanydatabase角色:针对所有数据库的只读权限
* readwriteanydatabase角色:针对所有数据的读写权限
* useradminanydatabase角色:针对所有数据库的用户管理权限
* dbadminanydatabase角色:真多所有数据库的管理权限
* root:相当于以上四中角色的组合,权限最大
权限控制示例
针对单个数据库的角色,dbowner相当于单个数据库的管理员db.createuser( { user:"test", pwd:"123456", roles:[{role:"dbowner",db:"staffinfo"}] } )
添加用户完成,在通过mongo --port 27017登陆,无权限执行操作。必须通过权限认证才能正常执行操作。
复制集和集群的权限控制首先要创建一个最少6个字符的文件,该温江将被部署到复制集中的每一个节点上,文件内容相当于密码,用作复制集各成员间的权限认证。启动时mongod需要加上--keyfile指定密码文件的路径。其他同上。
监控
1,mongostat工具命令如下:
mongostat --port 50000 -u test -p 123456 --authenticationdatabase admin
返回字段:
* inserts:每秒插入次数
* query:每秒查询次数
* update:每秒更新次数
* delete:每秒删除次数
* flushes:每秒异步刷新到文件次数
* mapped:映射的数据文件大小
* vsize:进程所占的虚拟内存大小
* res:进程时间占用的物理内存大小
* faults:每秒产生的缺页错误次数
* 2,mongotop工具
命令如下:
mongotop --port 50000 -u test -p 123456 --authenticationdatabase admin 5
每隔5秒返回统计数据。
* 3,数据库命令serverstatus
db.serverstatus()
返回字段解释:
* uptime:实例进程已经激活的总时间,单位秒
* localtime:实例所在服务器的当前时间
* totaltime:数据库启动后运行的总时间,单位微妙
* locktime:获得全局锁的总时间,单位微妙
* currentqueue:因为锁引起多谢等待队列数
* readers:等待读锁的操作数
* writers:等待写锁的操作数
* activeclients:链接的激活客户端读写操作的总数
* readers:激活客户端读操作总数
* writers:激活客户端写操作总数
* mem:当前内存使用情况
* bits:目标机器的架构
* resident:当前使用的物理内存总量,单位mb
* virtual:mongod进程印象的虚拟内存大小,单位mb
* supported:系统是否支持可扩展内存
* mapped:映射数据文件所使用的内存大小,单位mb
* mappedwithjournal:映射journaling锁使用的内存大小,单位mb
mongodb工具介绍
adminmongo
数据库管理工具。基于node.js,界面清爽,操作简单。
安装步骤
clone repository: git clone https://github.com/mrvautin/adminmongo.git && cd adminmongo install dependencies: npm install start application: npm start visit https://127.0.0.1:1234 in your browser使用方法
访问https://127.0.0.1:1234
ycsb
nosql基准测试工具。
安装
编译
下载源码解压 cd ycsb-0.7.0 全数据库绑定编译 mvn clean package 指定mongodb绑定编译 mvn -pl com.yahoo.ycsb:mongodb-binding -am clean package下载安装版
下载页面 https://github.com/brianfrankcooper/ycsb/releases/tag/0.7.0,解压tar.gz即可。
使用方法(windows下,linux下更简单)
查看帮助python bin/ycsb -h
测试
load阶段:加载数据python bin/ycsb load mongodb -threads 100 -s -p workloads/workloada -p mongodb.url=mongodb://mongos:28000/ycsb?w=0 > outputload.txtrun阶段:load完成后,各种场景运行测试
python bin/ycsb run mongodb -threads 100 -s -p workloads/workloada -p mongodb.url=mongodb://mongos:28000/ycsb?w=0 > outputrun.txt
每次load数据前要把上次测试中产生的数据删除,包括各个分片,配置服务器,mongos等的数据。
上一篇: LightGBM的黑科技--plot函数