Redis面试总结
https://www.cnblogs.com/jiahaojava/p/6244278.html
1 什么是redis?
redis 是一个基于内存的高性能key-value数据库。 (有空再补充,有理解错误或不足欢迎指正)
2 reids的特点
redis本质上是一个key-value类型的内存数据库,很像memcached,整个数据库统统加载在内存当中进行操作,定期通过异步操作把数据库数据flush到硬盘上进行保存。因为是纯内存操作,redis的性能非常出色,每秒可以处理超过 10万次读写操作,是已知性能最快的key-value db。
redis的出色之处不仅仅是性能,redis最大的魅力是支持保存多种数据结构,此外单个value的最大限制是1gb,不像 memcached只能保存1mb的数据,因此redis可以用来实现很多有用的功能,比方说用他的list来做fifo双向链表,实现一个轻量级的高性 能消息队列服务,用他的set可以做高性能的tag系统等等。另外redis也可以对存入的key-value设置expire时间,因此也可以被当作一 个功能加强版的memcached来用。
redis的主要缺点是数据库容量受到物理内存的限制,不能用作海量数据的高性能读写,因此redis适合的场景主要局限在较小数据量的高性能操作和运算上。
3 redis支持的数据类型
redis通过key-value的单值不同类型来区分, 以下是支持的类型:
strings
lists
sets 求交集、并集
sorted set
hashes
4 为什么redis需要把所有数据放到内存中?
redis为了达到最快的读写速度将数据都读到内存中,并通过异步的方式将数据写入磁盘。所以redis具有快速和数据持久化的特征。如果不将数据放在内存中,磁盘i/o速度为严重影响redis的性能。在内存越来越便宜的今天,redis将会越来越受欢迎。
如果设置了最大使用的内存,则数据已有记录数达到内存限值后不能继续插入新值。
5 redis是单进程单线程的
redis利用队列技术将并发访问变为串行访问,消除了传统数据库串行控制的开销
6 虚拟内存
当你的key很小而value很大时,使用vm的效果会比较好.因为这样节约的内存比较大.
当你的key不小时,可以考虑使用一些非常方法将很大的key变成很大的value,比如你可以考虑将key,value组合成一个新的value.
vm-max-threads这个参数,可以设置访问swap文件的线程数,设置最好不要超过机器的核数,如果设置为0,那么所有对swap文件的操作都是串行的.可能会造成比较长时间的延迟,但是对数据完整性有很好的保证.
自己测试的时候发现用虚拟内存性能也不错。如果数据量很大,可以考虑分布式或者其他数据库
7 分布式
redis支持主从的模式。原则:master会将数据同步到slave,而slave不会将数据同步到master。slave启动时会连接master来同步数据。
这是一个典型的分布式读写分离模型。我们可以利用master来插入数据,slave提供检索服务。这样可以有效减少单个机器的并发访问数量
8 读写分离模型
通过增加slave db的数量,读的性能可以线性增长。为了避免master db的单点故障,集群一般都会采用两台master db做双机热备,所以整个集群的读和写的可用性都非常高。
读写分离架构的缺陷在于,不管是master还是slave,每个节点都必须保存完整的数据,如果在数据量很大的情况下,集群的扩展能力还是受限于单个节点的存储能力,而且对于write-intensive类型的应用,读写分离架构并不适合。
9 数据分片模型
为了解决读写分离模型的缺陷,可以将数据分片模型应用进来。
可以将每个节点看成都是独立的master,然后通过业务实现数据分片。
结合上面两种模型,可以将每个master设计成由一个master和多个slave组成的模型。
10 redis的回收策略
volatile-lru:从已设置过期时间的数据集(server.db[i].expires)中挑选最近最少使用的数据淘汰
volatile-ttl:从已设置过期时间的数据集(server.db[i].expires)中挑选将要过期的数据淘汰
volatile-random:从已设置过期时间的数据集(server.db[i].expires)中任意选择数据淘汰
allkeys-lru:从数据集(server.db[i].dict)中挑选最近最少使用的数据淘汰
allkeys-random:从数据集(server.db[i].dict)中任意选择数据淘汰
no-enviction(驱逐):禁止驱逐数据
11. 使用redis有哪些好处?
(1) 速度快,因为数据存在内存中,类似于hashmap,hashmap的优势就是查找和操作的时间复杂度都是o(1)
(2) 支持丰富数据类型,支持string,list,set,sorted set,hash
(3) 支持事务,操作都是原子性,所谓的原子性就是对数据的更改要么全部执行,要么全部不执行
(4) 丰富的特性:可用于缓存,消息,按key设置过期时间,过期后将会自动删除
12. redis相比memcached有哪些优势?
(1) memcached所有的值均是简单的字符串,redis作为其替代者,支持更为丰富的数据类型
(2) redis的速度比memcached快很多
(3) redis可以持久化其数据
13. redis常见性能问题和解决方案:
(1) master最好不要做任何持久化工作,如rdb内存快照和aof日志文件
(2) 如果数据比较重要,某个slave开启aof备份数据,策略设置为每秒同步一次
(3) 为了主从复制的速度和连接的稳定性,master和slave最好在同一个局域网内
(4) 尽量避免在压力很大的主库上增加从库
(5) 主从复制不要用图状结构,用单向链表结构更为稳定,即:master <- slave1 <- slave2 <- slave3...
这样的结构方便解决单点故障问题,实现slave对master的替换。如果master挂了,可以立刻启用slave1做master,其他不变。
14. mysql里有2000w数据,redis中只存20w的数据,如何保证redis中的数据都是热点数据
相关知识:redis 内存数据集大小上升到一定大小的时候,就会施行数据淘汰策略。redis 提供 6种数据淘汰策略:
voltile-lru:从已设置过期时间的数据集(server.db[i].expires)中挑选最近最少使用的数据淘汰
volatile-ttl:从已设置过期时间的数据集(server.db[i].expires)中挑选将要过期的数据淘汰
volatile-random:从已设置过期时间的数据集(server.db[i].expires)中任意选择数据淘汰
allkeys-lru:从数据集(server.db[i].dict)中挑选最近最少使用的数据淘汰
allkeys-random:从数据集(server.db[i].dict)中任意选择数据淘汰
no-enviction(驱逐):禁止驱逐数据
15. memcache与redis的区别都有哪些?
1)、存储方式
memecache把数据全部存在内存之中,断电后会挂掉,数据不能超过内存大小。
redis有部份存在硬盘上,这样能保证数据的持久性。
2)、数据支持类型
memcache对数据类型支持相对简单。
redis有复杂的数据类型。
3)、使用底层模型不同
它们之间底层实现方式 以及与客户端之间通信的应用协议不一样。
redis直接自己构建了vm 机制 ,因为一般的系统调用系统函数的话,会浪费一定的时间去移动和请求。
4),value大小
redis最大可以达到1gb,而memcache只有1mb
16. redis 常见的性能问题都有哪些?如何解决?
1).master写内存快照,save命令调度rdbsave函数,会阻塞主线程的工作,当快照比较大时对性能影响是非常大的,会间断性暂停服务,所以master最好不要写内存快照。
2).master aof持久化,如果不重写aof文件,这个持久化方式对性能的影响是最小的,但是aof文件会不断增大,aof文件过大会影响master重启的恢复速度。master最好不要做任何持久化工作,包括内存快照和aof日志文件,特别是不要启用内存快照做持久化,如果数据比较关键,某个slave开启aof备份数据,策略为每秒同步一次。
3).master调用bgrewriteaof重写aof文件,aof在重写的时候会占大量的cpu和内存资源,导致服务load过高,出现短暂服务暂停现象。
4). redis主从复制的性能问题,为了主从复制的速度和连接的稳定性,slave和master最好在同一个局域网内
17, redis 最适合的场景
redis最适合所有数据in-momory的场景,虽然redis也提供持久化功能,但实际更多的是一个disk-backed的功能,跟传统意义上的持久化有比较大的差别,那么可能大家就会有疑问,似乎redis更像一个加强版的memcached,那么何时使用memcached,何时使用redis呢?
如果简单地比较redis与memcached的区别,大多数都会得到以下观点:
-
redis不仅仅支持简单的k/v类型的数据,同时还提供list,set,zset,hash等数据结构的存储。
-
redis支持数据的备份,即master-slave模式的数据备份。
-
redis支持数据的持久化,可以将内存中的数据保持在磁盘中,重启的时候可以再次加载进行使用。
(1)、会话缓存(session cache)
最常用的一种使用redis的情景是会话缓存(session cache)。用redis缓存会话比其他存储(如memcached)的优势在于:redis提供持久化。当维护一个不是严格要求一致性的缓存时,如果用户的购物车信息全部丢失,大部分人都会不高兴的,现在,他们还会这样吗?
幸运的是,随着 redis 这些年的改进,很容易找到怎么恰当的使用redis来缓存会话的文档。甚至广为人知的商业平台magento也提供redis的插件。
(2)、全页缓存(fpc)
除基本的会话token之外,redis还提供很简便的fpc平台。回到一致性问题,即使重启了redis实例,因为有磁盘的持久化,用户也不会看到页面加载速度的下降,这是一个极大改进,类似php本地fpc。
再次以magento为例,magento提供一个插件来使用redis作为全页缓存后端。
此外,对wordpress的用户来说,pantheon有一个非常好的插件 wp-redis,这个插件能帮助你以最快速度加载你曾浏览过的页面。
(3)、队列
reids在内存存储引擎领域的一大优点是提供 list 和 set 操作,这使得redis能作为一个很好的消息队列平台来使用。redis作为队列使用的操作,就类似于本地程序语言(如python)对 list 的 push/pop 操作。
如果你快速的在google中搜索“redis queues”,你马上就能找到大量的开源项目,这些项目的目的就是利用redis创建非常好的后端工具,以满足各种队列需求。例如,celery有一个后台就是使用redis作为broker,你可以从这里去查看。
(4),排行榜/计数器
redis在内存中对数字进行递增或递减的操作实现的非常好。集合(set)和有序集合(sorted set)也使得我们在执行这些操作的时候变的非常简单,redis只是正好提供了这两种数据结构。所以,我们要从排序集合中获取到排名最靠前的10个用户–我们称之为“user_scores”,我们只需要像下面一样执行即可:
当然,这是假定你是根据你用户的分数做递增的排序。如果你想返回用户及用户的分数,你需要这样执行:
zrange user_scores 0 10 withscores
agora games就是一个很好的例子,用ruby实现的,它的排行榜就是使用redis来存储数据的,你可以在这里看到。
(5)、发布/订阅
最后(但肯定不是最不重要的)是redis的发布/订阅功能。发布/订阅的使用场景确实非常多。我已看见人们在社交网络连接中使用,还可作为基于发布/订阅的脚本触发器,甚至用redis的发布/订阅功能来建立聊天系统!(不,这是真的,你可以去核实)。
redis提供的所有特性中,我感觉这个是喜欢的人最少的一个,虽然它为用户提供如果此多功能。
上一篇: win下Python2.7+pip+Ipython安装
下一篇: 文件读写