欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Elasticsearch 常用配置参数总结

程序员文章站 2022-05-24 13:14:07
# Cluster # Use a descriptive name for your cluster: # 集群名称,用于定义哪些elasticsearch节点属同一个集群。 cluster.name: bigdata # Node # 节点名称,用于唯一标识节点,不可重名 node.name: ......

# ---------------------------------- cluster -----------------------------------

# use a descriptive name for your cluster:
  
# 集群名称,用于定义哪些elasticsearch节点属同一个集群。
cluster.name: bigdata
  
# ------------------------------------ node ------------------------------------
# 节点名称,用于唯一标识节点,不可重名
node.name: server3
  
# 1、以下列出了三种集群拓扑模式,如下:
# 如果想让节点不具备选举主节点的资格,只用来做数据存储节点。
node.master: false
node.data: true
  
# 2、如果想让节点成为主节点,且不存储任何数据,只作为集群协调者。
node.master: true
node.data: false
  
# 3、如果想让节点既不成为主节点,又不成为数据节点,那么可将他作为搜索器,从节点中获取数据,生成搜索结果等
node.master: false
node.data: false
  
# 这个配置限制了单机上可以开启的es存储实例的个数,当我们需要单机多实例,则需要把这个配置赋值2,或者更高。
#node.max_local_storage_nodes: 1
  
# ----------------------------------- index ------------------------------------
# 设置索引的分片数,默认为5  "number_of_shards" 是索引创建后一次生成的,后续不可更改设置
index.number_of_shards: 5
  
# 设置索引的副本数,默认为1
index.number_of_replicas: 1
  
# 索引的刷新频率,默认1秒,太小会造成索引频繁刷新,新的数据写入就慢了。(此参数的设置需要在写入性能和实时搜索中取平衡)通常在elk场景中需要将值调大一些比如60s,在有_template的情况下,需要设置在应用的_template中才生效。 
index.refresh_interval: 120s
  
# ----------------------------------- paths ------------------------------------
# 数据存储路径,可以设置多个路径用逗号分隔,有助于提高io。 # path.data: /home/path1,/home/path2
path.data: /home/elk/server3_data
  
# 日志文件路径
path.logs: /var/log/elasticsearch
  
# 临时文件的路径
path.work: /path/to/work
  
# ----------------------------------- memory -------------------------------------
# 确保 es_min_mem 和 es_max_mem 环境变量设置为相同的值,以及机器有足够的内存分配给elasticsearch
# 注意:内存也不是越大越好,一般64位机器,最大分配内存别才超过32g
  
# 当jvm开始写入交换空间时(swapping)elasticsearch性能会低下,你应该保证它不会写入交换空间
# 设置这个属性为true来锁定内存,同时也要允许elasticsearch的进程可以锁住内存,linux下可以通过 `ulimit -l unlimited` 命令
  
bootstrap.mlockall: true
  
# 节点用于 fielddata 的最大内存,如果 fielddata 
# 达到该阈值,就会把旧数据交换出去。该参数可以设置百分比或者绝对值。默认设置是不限制,所以强烈建议设置该值,比如 10%。
indices.fielddata.cache.size: 50mb
  
# indices.fielddata.cache.expire  这个参数绝对绝对不要设置!
  
indices.breaker.fielddata.limit 默认值是jvm堆内存的60%,注意为了让设置正常生效,一定要确保 indices.breaker.fielddata.limit 的值
大于 indices.fielddata.cache.size 的值。否则的话,fielddata 大小一到 limit 阈值就报错,就永远道不了 size 阈值,无法触发对旧数据的交换任务了。
  
#------------------------------------ network and http -----------------------------
# 设置绑定的ip地址,可以是ipv4或ipv6的,默认为0.0.0.0
network.bind_host: 192.168.0.1
  
# 设置其它节点和该节点通信的ip地址,如果不设置它会自动设置,值必须是个真实的ip地址
network.publish_host: 192.168.0.1
  
# 同时设置bind_host和publish_host上面两个参数
network.host: 192.168.0.1
  
# 设置集群中节点间通信的tcp端口,默认是9300
transport.tcp.port: 9300
  
# 设置是否压缩tcp传输时的数据,默认为false,不压缩
transport.tcp.compress: true
  
# 设置对外服务的http端口,默认为9200
http.port: 9200
  
# 设置请求内容的最大容量,默认100mb
http.max_content_length: 100mb
  
# ------------------------------------ translog -------------------------------------
#当事务日志累积到多少条数据后flush一次。
index.translog.flush_threshold_ops: 50000
  
# --------------------------------- discovery --------------------------------------
# 这个参数决定了要选举一个master至少需要多少个节点,默认值是1,推荐设置为 n/2 + 1,n是集群中节点的数量,这样可以有效避免脑裂
discovery.zen.minimum_master_nodes: 1
  
# 在java里面gc是很常见的,但在gc时间比较长的时候。在默认配置下,节点会频繁失联。节点的失联又会导致数据频繁重传,甚至会导致整个集群基本不可用。
  
# discovery参数是用来做集群之间节点通信的,默认超时时间是比较小的。我们把参数适当调大,避免集群gc时间较长导致节点的丢失、失联。
discovery.zen.ping.timeout: 200s
discovery.zen.fd.ping_timeout: 200s
discovery.zen.fd.ping.interval: 30s
discovery.zen.fd.ping.retries: 6
  
# 设置集群中节点的探测列表,新加入集群的节点需要加入列表中才能被探测到。 
discovery.zen.ping.unicast.hosts: ["10.10.1.244:9300",]
  
# 是否打开广播自动发现节点,默认为true
discovery.zen.ping.multicast.enabled: false
 
indices.store.throttle.type: merge
indices.store.throttle.max_bytes_per_sec: 100mb