欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

ES 22 - Elasticsearch中如何进行日期(数值)范围查询

程序员文章站 2022-06-28 13:12:03
Elasticsearch中如何进行数值范围查询? 日期范围查询又是怎么实现的?关于日期的数学表达式、四舍五入规则都是什么? 还有怎样根据不同的时区查询?本篇文章告诉你答案O(∩_∩)O~ ......

目录

1 范围查询的符号

符号 含义
gte greater-than or equal to, 大于或等于
gt greater-than, 大于
lte less-than or equal to, 小于或等于
lt less-than, 小于

2 数值范围查询

需求: 查询商品中40 <= price <= 80的文档:

get book_shop/_search
{
    "query": {
        "range": {
            "price": {
                "gte": 40,
                "lte": 80,
                "boost": 2.0    // 设置得分的权重值(提升值), 默认是1.0
            }
        }
    }
}

3 时间范围查询

3.1 简单查询示例

需求: 查询网站中最近一天发布的博客:

get website/_search
{
    "query": {
        "range": {
            "post_date": {
                "gte": "now-1d/d",  // 当前时间的上一天, 四舍五入到最近的一天
                "lt":  "now/d"      // 当前时间, 四舍五入到最近的一天
            }
        }
    }
}

3.2 关于时间的数学表达式(date-math)

elasticsearch中时间可以表示为now, 也就是系统当前时间, 也可以是以||结尾的日期字符串表示.

在日期之后, 可以选择一个或多个数学表达式:

  • +1h —— 加1小时;
  • -1d —— 减1天;
  • /d —— 四舍五入到最近的一天.

下面是elasticsearch支持数学表达式的时间单位:

表达式 含义 表达式 含义
y m
w 星期 d
h 小时 h 小时
m 分钟 s

说明: 假设系统当前时间now = 2018-10-01 12:00:00 :

  • now+1h: now的毫秒值 + 1小时, 结果是: 2018-10-01 13:00:00.
  • now-1h: now的毫秒值 - 1小时, 结果是: 2018-10-01 11:00:00.
  • now-1h/d: now的毫秒值 - 1小时, 然后四舍五入到最近的一天的起始, 结果是: 2018-10-01 00:00:00.
  • 2018.10.01||+1m/d: 2018-10-01的毫秒值 + 1月, 再四舍五入到最近一天的起始, 结果是: 2018-11-01 00:00:00.

3.3 关于时间的四舍五入

对日期中的日、月、小时等 进行四舍五入时, 取决于范围的结尾是包含(include)还是排除(exclude).

向上舍入: 移动到舍入范围的最后一毫秒;

向下舍入: 一定到舍入范围的第一毫秒.

举例说明:

"gt": "2018-12-18||/m" —— 大于日期, 需要向上舍入, 结果是2018-12-31t23:59:59.999, 也就是不包含整个12月.

"gte": "2018-12-18||/m" —— 大于或等于日期, 需要向下舍入, 结果是 2018-12-01, 也就是包含整个12月.

"lt": "2018-12-18||/m" —— 小于日期, 需要向上舍入, 结果是2018-12-01, 也就是不包含整个12月.

"lte": "2018-12-18||/m" —— 小于或等于日期, 需要向下舍入, 结果是2018-12-31t23:59:59.999, 也就是包含整个12月.


4 日期格式化范围查询(format)

格式化日期查询时, 将默认使用日期field中指定的格式进行解析, 当然也可以通过format参数来覆盖默认配置.

示例:

get website/_search
{
    "query": {
        "range": {
            "post_date": {
                "gte": "2/1/2018", 
                "lte": "2019",
                "format": "dd/mm/yyyy||yyyy"
            }
        }
    }
}

注意: 如果日期中缺失了部分年、月、日, 缺失的部分将被填充为unix系统的初始值, 也就是1970年1月1日.

比如, 将dd指定为format, 像"gte": 10将转换为1970-01-10t00:00:00.000z.


5 时区范围查询(time_zone)

如果日期field的格式允许, 也可以通过在日期值本身中指定时区, 从而将日期从另一个时区的时间转换为utc时间, 或者为其指定特定的time_zone参数.

示例:

get website/_search
{
    "query": {
        "range": {
            "post_date": {
                "gte": "2018-01-01 00:00:00",
                "lte": "now",
                "format": "yyyy-mm-dd hh:mm:ss",
                "time_zone": "+1:00"
            }
        }
    }
}

es中的日期类型必须按照utc时间格式存储, 所以, 上述的2018-01-01 00:00:00将被转换为2017-12-31t23:00:00 utc.

另外需要注意的是, now是不受time_zone影响的.

参考资料

elasticsearch官方文档 - range query

版权声明

作者:

出处: 博客园

感谢阅读, 如果文章有帮助或启发到你, 点个[