Elasticsearch store属性理解

程序员文章站 2022-05-12 19:07:38

...

在Elasticsearch创建mapping的时候，需要制定store属性和index属性，对于刚入门es的学者，通常对lucene又不熟悉的人，通常不知道如何设置这两个值。

先来看需求：

在做搜索时，经常会需要对一个分类进行分组，比如搜索"ipad",需要在平板电脑分类下面统计有多少个商品，在电脑配件下面统计有多少个商品，这种统计数量的需求，我们通常会在document里面添加一个分类ID，然后对所有的分类做facet。那么问题出来了，如果分类ID是个整数的话，store属性应该设置true or false?这种整数是否还需要索引？

这个问题，在ES的文档中怎么也找不到，个人一开始又对lucene不熟悉，所以花时间看了一下lucene。通过学习lucene及实际的实践得出，以上需求的设置store应该为no，而index应该设置为not_analyzied。

下面我们来仔细理解一下这两个设置项。

其中index的含义还比较容易理解，一共3个值，no,analyzied，not_analyzied，分别对应'不对该字段进行索引（无法搜索）'，'分词后索引'，'以单个关键词进行索引'。就是说，如果这个字段不需要搜索，一般不需要设置为analyzied，但是如果不搜索，针对以上的需求，index应该设置为no吗？请继续往下看。

通常分类在索引的时候都是一个整数或长整数，对应lucene的IntField或LongField，而这两个类在lucene中的第一行注释是：Field that indexes int values for efficient range filtering and sorting.(Field that indexes long values for efficient range filtering and sorting)，也就是说，IntField是被索引的，并且这种索引在范围过滤和排序的时候性能非常高。那么问题就很明确了，因为，我们的分类字段也是作为filter项的，因此如果要做过滤，必须进行索引。否则可能无法作为过滤条件。

实际上，我们在创建mapping的时候，如果设置了数据类型为integer，其他的都未指定，默认的index即为no_analyzied。至于store，采用默认值也是合适的（默认为no)，实际上这些默认值都是lucene的默认值。因为一般我们是用不到store='yes'的功能的，除非，我们需要对某个域（就是字段）进行高亮显示。

你可能会问，如果设置store:"no"，会不会影响facet的性能。答案为不会，因为做facet的时候并不会使用store的字段，而是使用的索引表的词。也就是后面设置的index:'not_analyzied"。

我自己做过一个测试，如果设置分类ID不索引，则无法进行facet，可见任何需要facet的字段，必须进行索引。

请支持原创：

http://donlianli.iteye.com/blog/1975727

对这类话题感兴趣？欢迎发送邮件至donlianli@126.com

关于我：邯郸人，擅长Java，Javascript，Extjs，oracle sql。

更多我之前的文章，可以访问我的空间

上一篇： docker与直接运行本地程序的区别

下一篇： dubbo中的Filter顺序

Elasticsearch store属性理解

http://donlianli.iteye.com/blog/1975727

深入理解css中vertical-align属性

BootStrap框架中的data-[ ]自定义属性理解(推荐)

html5指南-1.html5全局属性(html5 global attributes)深入理解

C#属性方法构造函数（不知道自己理解的对不对）

简单理解vue中track-by属性

简单理解vue中Props属性

深入理解Vue Computed计算属性原理

深入理解css中vertical-align属性

从零学Python之引用和类属性的初步理解

理解Linux文档属性、拥有者、群组、权限、差异知识点小结

Elasticsearch store属性理解

http://donlianli.iteye.com/blog/1975727

深入理解css中vertical-align属性

BootStrap框架中的data-[ ]自定义属性理解(推荐)

html5指南-1.html5全局属性(html5 global attributes)深入理解

C#属性方法 构造函数（不知道自己理解的对不对）

简单理解vue中track-by属性

简单理解vue中Props属性

深入理解Vue Computed计算属性原理

深入理解css中vertical-align属性

从零学Python之引用和类属性的初步理解

理解Linux文档属性、拥有者、群组、权限、差异知识点小结

C#属性方法构造函数（不知道自己理解的对不对）