让elasticsearch(es)分片分布在不同的机器上
有两种方法,都是修改es的配置文件(%ES_HOME%/config/elasticsearch.yml):
方法一、设置cluster.routing.allocation.same_shard.host: true。
这个设置是告诉es,将同一shard的primary shard和replica shard分步在不同的主机上(官方文档说按照不同的IP或主机名称来判断是否是同一主机)。这个值,ES默认是false。注意:如果是已经在生产环境使用的ES(每个机器的节点大于1个时),修改完配置重启节点时,可能会导致最后一个节点没有数据(因为最后一个节点在重启的时候,其他节点已经将他这个节点上的数据分配到同一机器上的另外一个节点)。
方法二、设置rack_id
设置如下:
node.rack_id: rack_1 cluster.routing.allocation.awareness.attributes: rack_id |
Rack原义是货架,在这里是指机柜。这个rack_id其实可以自己定义, 上面配置的第二行就是如何定义这个名称。这样定义后,分片会被尽量的分片在不同的rack_id上面。如果rack_1和rack_2在不同的机器上,则就能实现将shard分布在不同的机器上的效果。定义这个名称后,如何查看索引是否分布在不同的机器上(第一个命令只记录了node_name,需要用第二个命令查询对应是那台机器):
curl -XGET 'http://127.0.0.1:9250/index_name/_status?pretty=true' curl -XGET 'http://127.0.0.1:9250/_cluster/nodes?pretty=true' |
参考资料:
http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/modules-cluster.html
对这类话题感兴趣?欢迎发送邮件至donlianli@126.com
请支持原创: