Elasticsearch的基本概念和指标
背景
在13年的时候,我开始负责整个公司的搜索引擎。嗯……,不是很牛的那种大项目负责人。而是整个搜索就我一个人做。哈哈。
后来跳槽之后,所经历的团队都用elasticsearch,基本上和缓存一样,是项目必备的工具。目前静儿在做的项目中也在用,正好系统学习一下。毕竟静儿的梦想就是打造自己的搜索引擎。
目录
1.近实时(nrt nearrealtime)
2.集群(cluster)
3.节点(node)
4.索引(index)
5.文档(document)
6.分片和副本(shards & replicas)
7.缓存数据(fielddata)
8.文档值(doc values)
9.行为模式(norms)
10.召回率(recall rate)
11.准确率(precision)
正文
1.近实时(nrt nearrealtime)
es是一个近实时的搜索平台,就是说从开始创建索引到能被搜索到只有很少的延时(通常是1s)。
2.集群(cluster)
集群是一个或者多个节点(node)协同工作来承载所有的数据,并提供跨所有节点的索引和搜索能力。一个集群有一个唯一名称作为标识,默认叫「elasticsearch」。因为在有多个节点的情况下,节点都是通过集群名来确定被安装到哪个集群,所以集群名很重要。
3.节点(node)
节点是集群的一部分,就是集群里的一个服务器。它存储着数据,给提供集群的索引和搜索能力。像集群一样,一个节点也是用名称来做标识。它默认是一个在节点启动时被指定的随机uuid(universally unique ientifier全局唯一标识)。如果不想用默认值,也可以自定义节点名。因为它是作为网络中的服务器和节点关系的纽带,所以这个名字对集群的管理来说很重要。
4.索引(index)
索引是有相同特性的文档集合。举个栗子
推荐阅读