对 ElasticSearch 的一些认识
大体的认识
ElasticSearch 是分布式搜索引擎,简称 ES。底层是基于 lucene ,核心思想是在多台机器上启动多个 ES 进程实例,进而组成了一个 ES 集群。集群中将会有一个 ES 进程(节点)被选举为 Master,Master 节点主要做一些管理上的工作(例如:维护索引元数据、负责将 replica shard 切换为 primary shard 等等)。要是 Master 节点宕机了,那么会重新选举一个节点做为 Master 节点。
ES 存储数据的基本单位是索引(Index),ES 会将 Index 拆分为若干个 Shard,同时将这些 Shard 分派到各个 ES 进程实例(节点)上,但是这里会有一个问题:
如果某个 ES 进程(节点)挂掉了,那该进程(节点)上的 Shard 就会丢失!
为了解决这个问题,引入了 replica 方案,也就是为每一个 Shard(也就是 primary shard)创建一个或者多个副本(replica shard),且保证副本与 primary shard 被分派到不同的 ES 进程(节点)上,这样,如果某 primary shard 所在的 ES 进程(节点)挂掉了,集群的上 Master 节点会让 primary shard 对应的 replica shard(在其他节点上)切换为 primary shard。当宕机的机器修复了,修复后的节点也不再是 primary shard,而是 replica shard。
看图说话
参考其他文章以及自己对 ES 的一些认识,为了便于日后的理解,整理了两组图片分别来说明如下两个问题:
- Index、primary shard、replica shard 之间的关系
- ES 是如何分派 Shard 到各个ES进程(节点)的
本文地址:https://blog.csdn.net/yangchao1125/article/details/107491580
上一篇: 大数据云计算——Spark组件
下一篇: VMware 2节点vSAN设计与配置