欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Redis中统计各种数据大小的方法

程序员文章站 2022-06-24 22:53:28
如果 mysql 数据库比较大的话,我们很容易就能查出是哪些表占用的空间;不过如果 redis 内存比较大的话,我们就不太容易查出是哪些(种)键占用的空间了。 有一些工具...

如果 mysql 数据库比较大的话,我们很容易就能查出是哪些表占用的空间;不过如果 redis 内存比较大的话,我们就不太容易查出是哪些(种)键占用的空间了。

有一些工具能够提供必要的帮助,比如 可以直接分析 rdb 文件来生成报告,可惜它不能百分百实现我的需求,而我也不想在它的基础上二次开发。实际上开发一个专用工具非常简单,利用 scan debug 等命令,没多少行代码就能实现:

复制代码 代码如下:

<?php

$patterns = array(
    'foo:.+',
    'bar:.+',
    '.+',
);

$redis = new redis();
$redis->setoption(redis::opt_scan, redis::scan_retry);

$result = array_fill_keys($patterns, 0);

while ($keys = $redis->scan($it, $match = '*', $count = 1000)) {
    foreach ($keys as $key) {
        foreach ($patterns as $pattern) {
            if (preg_match("/^{$pattern}$/", $key)) {
                if ($v = $redis->debug($key)) {
                    $result[$pattern] += $v['serializedlength'];
                }

                break;
            }
        }
    }
}

var_dump($result);

?>

当然,前提是你需要提前总结出可能的键模式,简单但不严谨的方法是 monitor

复制代码 代码如下:

shell> /path/to/redis-cli monitor |
       awk -f '"' '$2 ~ "add|set|store|push" {print $4}'

此外,需要注意的是:因为 debug 返回的 serializedlength 是序列化后的长度,所以最终计算的值小于实际内存占用,但考虑到相对大小依然是有参考意义的。