Redis不是一直号称单线程效率也很高吗，为什么又采用多线程了？

程序员文章站 2022-07-09 08:18:28

redis是目前广为人知的一个内存数据库，在各个场景中都有着非常丰富的应用，前段时间redis推出了6.0的版本，在新版本中采用了多线程模型。因为我们公司使用的内存数据库是自研的，按理说我对redis...

redis是目前广为人知的一个内存数据库，在各个场景中都有着非常丰富的应用，前段时间redis推出了6.0的版本，在新版本中采用了多线程模型。

因为我们公司使用的内存数据库是自研的，按理说我对redis的关注其实并不算多，但是因为redis用的比较广泛，所以我需要了解一下这样方便我进行面试。

总不能候选人用过redis，但是我非要问人家阿里的tair是怎么回事吧。

所以，在redis 6.0 推出之后，我想去了解下为什么采用多线程，现在采用的多线程和以前版本有什么区别？为什么这么晚才使用多线程？

redis不是已经采用了多路复用技术吗？不是号称很高的性能了吗？为啥还要采用多线程模型呢？

本文就来分析下这些问题以及背后的思考。

redis为什么最开始被设计成单线程的？

redis作为一个成熟的分布式缓存框架，它由很多个模块组成，如网络请求模块、索引模块、存储模块、高可用集群支撑模块、数据操作模块等。

很多人说redis是单线程的，就认为redis中所有模块的操作都是单线程的，其实这是不对的。

我们所说的redis单线程，指的是"其网络io和键值对读写是由一个线程完成的"，也就是说，redis中只有网络请求模块和数据操作模块是单线程的。而其他的如持久化存储模块、集群支撑模块等是多线程的。

所以说，redis中并不是没有多线程模型的，早在redis 4.0的时候就已经针对部分命令做了多线程化。

那么，为什么网络操作模块和数据存储模块最初并没有使用多线程呢？

这个问题的答案比较简单！因为："没必要！"

为什么没必要呢？我们先来说一下，什么情况下要使用多线程？

多线程适用场景

一个计算机程序在执行的过程中，主要需要进行两种操作分别是读写操作和计算操作。

其中读写操作主要是涉及到的就是i/o操作，其中包括网络i/o和磁盘i/o。计算操作主要涉及到cpu。

而多线程的目的，就是通过并发的方式来提升i/o的利用率和cpu的利用率。

那么，redis需不需要通过多线程的方式来提升提升i/o的利用率和cpu的利用率呢？

首先，我们可以肯定的说，redis不需要提升cpu利用率，因为redis的操作基本都是基于内存的，cpu资源根本就不是redis的性能瓶颈。

所以，通过多线程技术来提升redis的cpu利用率这一点是完全没必要的。

那么，使用多线程技术来提升redis的i/o利用率呢？是不是有必要呢？

redis确实是一个i/o操作密集的框架，他的数据操作过程中，会有大量的网络i/o和磁盘i/o的发生。要想提升redis的性能，是一定要提升redis的i/o利用率的，这一点毋庸置疑。

但是，提升i/o利用率，并不是只有采用多线程技术这一条路可以走！

多线程的弊端

我们在很多文章中介绍过一些java中的多线程技术，如内存模型、锁、cas等，这些都是java中提供的一些在多线程情况下保证线程安全的技术。

线程安全：是编程中的术语，指某个函数、函数库在并发环境中被调用时，能够正确地处理多个线程之间的共享变量，使程序功能正确完成。

和java类似，所有支持多线程的编程语言或者框架，都不得不面对的一个问题，那就是如何解决多线程编程模式带来的共享资源的并发控制问题。

虽然，采用多线程可以帮助我们提升cpu和i/o的利用率，但是多线程带来的并发问题也给这些语言和框架带来了更多的复杂性。而且，多线程模型中，多个线程的互相切换也会带来一定的性能开销。

所以，在提升i/o利用率这个方面上，redis并没有采用多线程技术，而是选择了多路复用 i/o技术。

小结

redis并没有在网络请求模块和数据操作模块中使用多线程模型，主要是基于以下四个原因：

1、redis 操作基于内存，绝大多数操作的性能瓶颈不在 cpu
2、使用单线程模型，可维护性更高，开发，调试和维护的成本更低
3、单线程模型，避免了线程间切换带来的性能开销
4、在单线程中使用多路复用 i/o技术也能提升redis的i/o利用率

还是要记住：redis并不是完全单线程的，只是有关键的网络io和键值对读写是由一个线程完成的。

redis的多路复用

多路复用这个词，相信很多人都不陌生。我之前的很多文章中也够提到过这个词。

其中在介绍linux io模型的时候我们提到过它、在介绍http/2的原理的时候，我们也提到过他。

那么，redis的多路复用技术和我们之前介绍的又有什么区别呢？

这里先讲讲linux多路复用技术，就是多个进程的io可以注册到同一个管道上，这个管道会统一和内核进行交互。当管道中的某一个请求需要的数据准备好之后，进程再把对应的数据拷贝到用户空间中。