记一次ES查询数据突然变为空的问题

程序员文章站 2022-05-07 08:37:22

基本环境 elasticsearch版本：6.3.1 客户端环境：kibana 6.3.4、Java8应用程序模块。其中kibana主要用于数据查询诊断和查阅日志，Java8为主要的客户端，数据插入和查询都是由Java实现的。案例介绍使用elasticsearch存储订单的主要信息，docum ......

基本环境

elasticsearch版本：6.3.1
客户端环境：kibana 6.3.4、java8应用程序模块。
其中kibana主要用于数据查询诊断和查阅日志，java8为主要的客户端，数据插入和查询都是由java实现的。

案例介绍

使用elasticsearch存储订单的主要信息，document内的field，基本上是long或keyword，创建索引的order.json文件如下：

{
  "doc": {
    "properties": {
      "id": {
        "type": "keyword",
        "index": true
      },
      "status": {
        "type": "byte",
        "index": true
      },
      "createtime": {
        "type": "long",
        "index": true
      },
      "uid": {
        "type": "long",
        "index": true
      },
      "payment": {
        "type": "keyword",
        "index": true
      },
      "commentstatus": {
        "type": "byte",
        "index": true
      },
      "refundstatus": {
        "type": "byte",
        "index": true
      }
    }
  }
}

某天发现有个查询功能（单独使用payment字段查询）没有数据出来，最近未修改此部分代码。对比研发环境，研发环境是正常的，同样的代码在测试环境下无数据返回。

问题定位

程序中使用该字段用的是termquery，如下：

querybuilders.termquery("payment", req.getfilter().getorder().getpayment())

在kibana上用命令诊断查询数据，同样没有结果返回，查询命令如下：

get /order/doc/_search
{
  "query": {
    "bool": {
      "must": [
        {"term": {
          "payment": "alipay"
        }}
      ]
    }
  }
}

查询mapping信息，看是否为keyword：

get /order/_mapping/doc

响应返回（只展示payment字段）：

{
  "order": {
    "mappings": {
      "doc": {
        "properties": {
          "payment": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          }
        }
      }
    }
  }
}

问题原因

按照mapping返回结果来看，字段payment原定义的类型是keyword，现在变成text了，这个是payment字段使用termquery查询导致没有数据的原因。

text与keyword的区别

keyword对保存的内容不分词，也不改变大小写，原样存储，默认可索引。
text对内容进行分词，并且全部小写存储，同时会增加一个text.keyword字段，为keyword类型，超过256字符后不索引。

由于payment字段变成text了，原有的程序使用term查询，用的"alipay"，而text存储的是"alipay"，所以查不到数据了。

尝试排错方法

payment的值改成小写

get /order/doc/_search
{
  "query": {
    "bool": {
      "must": [
        {"term": {
          "payment": "alipay"
        }}
      ]
    }
  }
}

或将term查询改成match查询

get /order/doc/_search
{
  "query": {
    "bool": {
      "must": [
        {
            "match": {
              "payment": "alipay"
            }
        }
      ]
    }
  }
}

查询有数据输出，并且符合预期，尝试方法有效。

问题追溯

明明order.json的对payment字段定义的类型是keyword，怎么变成text了？

由于出现此问题的环境是测试环境，有重删索引数据，然后再全部导入的操作（有点不规范，但仅限于测试环境，生产环境不会这么做），重新导入索引document数据的功能，es创建索引自动mapping时，payment字段的string内容，会变成text。

解决办法：

1.删除索引

delete /order

2.按照order.json重建索引

put /order
{
    "mappings": {
        "doc": {
            "properties": {
              "id": {
                "type": "keyword",
                "index": true
              },
              "status": {
                "type": "byte",
                "index": true
              },
              "createtime": {
                "type": "long",
                "index": true
              },
              "uid": {
                "type": "long",
                "index": true
              },
              "payment": {
                "type": "keyword",
                "index": true
              },
              "commentstatus": {
                "type": "byte",
                "index": true
              },
              "refundstatus": {
                "type": "byte",
                "index": true
              }
            }
        }
    }
}

3.触发程序灌数据（也可以用bulk）

小结

问题虽小，但一定要追溯源头，比如此次测试环境的不规范操作。后期如果有删除索引的操作，应该先手动建立索引后，再灌数据，而不是直接让其自动mapping建立索引，自动mapping建立的字段类型，可能不是我们期望的。

专注java高并发、分布式架构，更多技术干货分享与心得，请关注公众号：java架构社区
记一次ES查询数据突然变为空的问题

上一篇：清热解毒的食物,你们都知道哪些呢

下一篇： oracle数据库不小心删除了数据