python爬虫十八:mongodb的简单介绍
1、关系型数据库非关系型数据库
1.1他们之间的区别
1.1.1数据存储方式不同
关系型数据库是表格式的,数据储存在数据表的行和列中,数据表格可以彼此关联协作储存,很容易提取数据;非关系型数据不适合存储在数据表的行和列中,它通常是存储在数据集中,数据的类型是选择数据存储和提取方式的首要因素
1.1.2扩展方式不同
数据存储在关系表中,操作的性能瓶颈可能涉及很多个表,所以要支持更多并发量,SQL数据库是纵向扩展提高资源地物理机的性能,提高处理能力,使用速度更快的计算机,这样处理相同的数据集就更快了。而NoSQL数据库是横向扩展的,数据存储天然就是分布式的,他的扩展可以通过给资源池添加更多普通的数据库服务器(节点)来分担负载。
1.1.3对事务性的支持不同
SQL数据库支持对事务原子性细粒度控制,并且易于回滚事务。
虽然NoSQL数据库也可以使用事务操作,但稳定性方面没法和关系型数据库比较.。
1.2他们之间的优势比较
1.2.1非关系型数据库的优势
①性能NOSQL是基于键值对的,可以想象成表中的主键和值的对应关系,而且不需要经过SQL层的解析,所以性能非常高。
②可扩展性同样也是因为基于键值对,数据之间没有耦合性,所以非常容易水平扩展。
1.2.1关系型数据库的优势
①复杂查询可以用SQL语句方便的在一个表以及多个表之间做非常复杂的数据查询。
②事务支持使得对于安全性能很高的数据访问要求得以实现。对于这两类数据库
2、mongoDB的介绍
MongoDB是一个基于分布式文件存储的nosql数据库。在处理大数据的时候会比MySQL更有优势。爬虫的数据如果上了一个量级,可能用MongoDB会比MySQL更好
2.1MongoDB的优势
①无数据结构限制
没有表结构的概念,每条记录可以有完全不同的结构,业务开发方便快捷
②冗余和扩展
复制集保证数据安全,分片扩展数据规模
③良好的支持
完善的文档,齐全的驱动支持
2.2mongodb的安装
msi文件:一种windows installer数据包,主要提*品所需信息和很多安装程序的指令和数据,类似于exe文件双击就可直接安装了
官网下载msi文件,双击自定义安装,选择路径
不要安装指南,它默认开启的,我们把它关闭,傻瓜式操作一路next,install就可以了
将mongodb的bin目录的路径添加到环境变量
2.3mongodb的使用
安装完成后,默认mongodb是自动开启的服务端,所以不做开启服务端也是可以连接的,也可以关掉默认开启的服务端,通过手动开启服务端
开启服务端mongod --dbpath data的绝对路径
用客户端连接mongo
本文地址:https://blog.csdn.net/weixin_49088841/article/details/108558167
上一篇: 重装系统恢复MYSQL