elasticsearchmost_fields策略
程序员文章站
2024-01-27 21:29:58
elasticsearchmost_fields策略
GET /forum/article/_search
{
"query": {
&q...
elasticsearchmost_fields策略
GET /forum/article/_search { "query": { "multi_match": { "query": "learning courses", "type": "most_fields", "fields": [ "sub_title", "sub_title.std" ] } } }
stu_title.std是什么哪?
POST /forum/_mapping/article { "properties": { "sub_title": { "type": "string", "analyzer": "english", "fields": { "std": { "type": "string", "analyzer": "standard" } } } } }
english是一个分词器,ik是大家比较常见或者常听说的分词器,他们会先“还原词”把后缀、变换什么的都去掉,还原词的本来面目,这样也会造成搜索出来的不是咱们想要的,所以上面代码又加了一个分词器:自带的分词器,这个是不分词的
most_fields,综合多个field一起进行搜索,尽可能多地让所有field的query参与到总分数的计算中来,此时就会是个大杂烩,结果不一定精准
某一个document的一个field包含更多的关键字,但是因为其他document有更多field匹配到了,所以排在了前面;所以需要建立类似sub_title.std这样的field,尽可能让某一个field精准匹配query string,贡献更高的分数,将更精准匹配的数据排到前面
优点:将尽可能匹配更多field的结果推送到最前面,整个排序结果是比较均匀的
缺点:可能那些精准匹配的结果,无法推送到最前面
实际的例子:wiki,明显的most_fields策略,搜索结果比较均匀,但是的确要翻好几页才能找到最匹配的结果