欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Elasticsearch TermFacet 耗内存问题 博客分类: Elasticsearch elasticsearchfacetOOM 

程序员文章站 2024-03-18 20:42:10
...

解决方案有下:

 1.设置cache大小和过期时间。

   index.cache.field.max_size

   index.cache.field.expire

 

例如设置:

  index.cache.field.max_size: 50000 //index中每个segment中可包含的最大的entries数目

 index.cache.field.expire: 10m //过期时间为10分钟

 

 2.改变cache类型。

 index.cache.field.type: soft

 默认类型为resident, 字面意思是常驻(居民), 一直增加,直到内存 耗尽。 改为soft就是当内存不足的时候,先clear掉 占用的,然后再往内存中放。设置为soft后,相当于设置成了相对的内存大小。resident的话,除非内存够大。

 

 3.对数据进行处理。

 文章中提到的是减小字段值长度,如将大写转成小写。

 这点上,实际中可能将数据精炼。当然, 也可以把要做facet的字段做一个转化,用int型代替。

 关于string转化int呢, 可以参考M大神的: https://github.com/medcl/elasticsearch-analysis-string2int

 

 

 

当然, 实际中采用方式2基本上没有问题。 如果根据自己的实际情况结合使用效果会更好。

 

可参考如下文章:

http://blog.sematext.com/2012/05/17/elasticsearch-cache-usage/