elasticsearchmost_fields策略

程序员文章站 2024-01-27 21:29:58

elasticsearchmost_fields策略 GET /forum/article/_search { "query": { &q...

GET /forum/article/_search
{
   "query": {
        "multi_match": {
            "query":  "learning courses",
            "type":   "most_fields", 
            "fields": [ "sub_title", "sub_title.std" ]
        }
    }
}

stu_title.std是什么哪？

POST /forum/_mapping/article
{
  "properties": {
      "sub_title": { 
          "type":     "string",
          "analyzer": "english",
          "fields": {
              "std":   { 
                  "type":     "string",
                  "analyzer": "standard"
              }
          }
      }
  }
}

english是一个分词器，ik是大家比较常见或者常听说的分词器，他们会先“还原词”把后缀、变换什么的都去掉，还原词的本来面目，这样也会造成搜索出来的不是咱们想要的，所以上面代码又加了一个分词器：自带的分词器，这个是不分词的
most_fields，综合多个field一起进行搜索，尽可能多地让所有field的query参与到总分数的计算中来，此时就会是个大杂烩，结果不一定精准
某一个document的一个field包含更多的关键字，但是因为其他document有更多field匹配到了，所以排在了前面；所以需要建立类似sub_title.std这样的field，尽可能让某一个field精准匹配query string，贡献更高的分数，将更精准匹配的数据排到前面
优点：将尽可能匹配更多field的结果推送到最前面，整个排序结果是比较均匀的
缺点：可能那些精准匹配的结果，无法推送到最前面

实际的例子：wiki，明显的most_fields策略，搜索结果比较均匀，但是的确要翻好几页才能找到最匹配的结果

上一篇： IBM赖开文：IBM认知计算在中国金融业落地

下一篇：一加10Pro对比红米K50电竞版哪个好一加10Pro对比红米K50电竞版评测

elasticsearchmost_fields策略