Redis原理揭秘：干货分享！

发表时间: 2018-10-17 00:08

概述

总结一下redis的原理，适合大家以后装逼！

redis单点吞吐量

单点TPS达到8万/秒，QPS达到10万/秒。

redis的5种存储类型

string、list、set、map（hash）、stored-set

redis的string类型

1、能表达3种类型：字符串、整数和浮点数。根据场景相互间自动转型，并且根据需要选取底层的承载方式

2、value内部以int、sds作为结构存储。int存放整型数据，sds存放字节/字符串和浮点型数据

redis的list类型

1、list类型的value对象内部以linkedlist或ziplist承载。当list的元素个数和单个元素的长度较小时，redis会采用ziplist实现以减少内存占用，否则采用linkedlist结构

2、linkedlist内部实现是双向链表。在list中定义了头尾元素指针和列表的长度，是的pop/push操作、llen操作的复杂度为O(1)。由于是链表，lindex类的操作复杂度仍然是O(N)

3、ziplist的内部结构

所有内容被放置在连续的内存中。其中zlbytes表示ziplist的总长度，zltail指向最末元素，zllen表示元素个数，entry表示元素自身内容，zlend作为ziplist定界符

rpush、rpop、llen，复杂度为O(1);lpush/pop操作由于涉及全列表元素的移动，复杂度为O(N)

redis的map类型

1、map又叫hash。map内部的key和value不能再嵌套map了，只能是string类型：整形、浮点型和字符串

2、map主要由hashtable和ziplist两种承载方式实现，对于数据量较小的map，采用ziplist实现

3、hashtable内部结构

主要分为三层，自底向上分别是dictEntry、dictht、dict

dictEntry：管理一个key-value对，同时保留同一个桶中相邻元素的指针，一次维护哈希桶的内部连

dictht：维护哈希表的所有桶链

dict：当dictht需要扩容/缩容时，用于管理dictht的迁移

redis是单线程处理请求，迁移和访问的请求在相同线程内进行，所以不会存在并发性问题

4、ziplist内部结构

和list的ziplist实现类似。不同的是，map对应的ziplist的entry个数总是2的整数倍，奇数存放key，偶数存放value

redis的set类型

1、set以intset或hashtable来存储。hashtable中的value永远为null，当set中只包含整数型的元素时，则采用intset

2、intset的内部结构

2.1、核心元素是一个字节数组，从小到大有序存放着set的元素

2.2、由于元素有序排列，所以set的获取操作采用二分查找方式实现，复杂度O(log(N))。进行插入时，首先通过二分查找得到本次插入的位置，再对元素进行扩容，再将预计插入位置之后的所有元素向右移动一个位置，最后插入元素，插入复杂度为O(N)。删除类似

redis的sorted-set类型

1、类似map是一个key-value对，但是有序的。value是一个浮点数，称为score，内部是按照score从小到大排序

2、内部结构以ziplist或skiplist+hashtable来实现

redis通过watch机制实现乐观锁流程

1、将本次事务涉及的所有key注册为观察模式

2、执行只读操作

3、根据只读操作的结果组装写操作命令并发送到服务器端入队

4、发送原子化的批量执行命令EXEC试图执行连接的请求队列中的命令

5、如果前面注册为观察模式的key中有一个货多个，在EXEC之前被修改过，则EXEC将直接失败，拒绝执行；否则顺序执行请求队列中的所有请求

6、redis没有原生的悲观锁或者快照实现，但可通过乐观锁绕过。一旦两次读到的操作不一样，watch机制触发，拒绝了后续的EXEC执行

redis的持久化机制

redis主要提供了两种持久化机制：RDB和AOF；

1、RDB

默认开启，会按照配置的指定时间将内存中的数据快照到磁盘中，创建一个dump.rdb文件，redis启动时再恢复到内存中。

redis会单独创建fork()一个子进程，将当前父进程的数据库数据复制到子进程的内存中，然后由子进程写入到临时文件中，持久化的过程结束了，再用这个临时文件替换上次的快照文件，然后子进程退出，内存释放。

需要注意的是，每次快照持久化都会将主进程的数据库数据复制一遍，导致内存开销加倍，若此时内存不足，则会阻塞服务器运行，直到复制结束释放内存；都会将内存数据完整写入磁盘一次，所以如果数据量大的话，而且写操作频繁，必然会引起大量的磁盘I/O操作，严重影响性能，并且最后一次持久化后的数据可能会丢失；

2、AOF

以日志的形式记录每个写操作（读操作不记录），只需追加文件但不可以改写文件，redis启动时会根据日志从头到尾全部执行一遍以完成数据的恢复工作。包括flushDB也会执行。

主要有两种方式触发：有写操作就写、每秒定时写（也会丢数据）。

因为AOF采用追加的方式，所以文件会越来越大，针对这个问题，新增了重写机制，就是当日志文件大到一定程度的时候，会fork出一条新进程来遍历进程内存中的数据，每条记录对应一条set语句，写到临时文件中，然后再替换到旧的日志文件（类似rdb的操作方式）。默认触发是当aof文件大小是上次重写后大小的一倍且文件大于64M时触发；

3、当两种方式同时开启时，数据恢复redis会优先选择AOF恢复。一般情况下，只要使用默认开启的RDB即可，因为相对于AOF，RDB便于进行数据库备份，并且恢复数据集的速度也要快很多。

4、开启持久化缓存机制，对性能会有一定的影响，特别是当设置的内存满了的时候，更是下降到几百reqs/s。所以如果只是用来做缓存的话，可以关掉持久化。

redis集群（redis cluster）

1、redis3以后，节点之间提供了完整的sharding（分片）、replication（主备感知能力）、failover（故障转移）的特性

2、配置一致性：每个节点（Node）内部都保存了集群的配置信息，存储在clusterState中，通过引入自增的epoch变量来使得集群配置在各个节点间保持一致

3、sharding数据分片

将所有数据划分为16384个分片（slot），每个节点会对应一部分slot，每个key都会根据分布算法映射到16384个slot中的一个，分布算法为slotId=crc16(key)%16384

当一个client访问的key不在对应节点的slots中，redis会返回给client一个moved命令，告知其正确的路由信息从而重新发起请求。client会根据每次请求来缓存本地的路由缓存信息，以便下次请求直接能够路由到正确的节点

分片迁移：分片迁移的触发和过程控制由外部系统完成，redis只提供迁移过程中需要的原语支持。主要包含两种：一种是节点迁移状态设置，即迁移钱标记源、目标节点；另一种是key迁移的原子化命令

4、failover故障转移

故障发现：节点间两两通过TCP保持连接，周期性进行PING、PONG交互，若对方的PONG相应超时未收到，则将其置为PFAIL状态，并传播给其他节点

故障确认：当集群中有一半以上的节点对某一个PFAIL状态进行了确认，则将起改为FAIL状态，确认其故障

slave选举：当有一个master挂掉了，则其slave重新竞选出一个新的master。主要根据各个slave最后一次同步master信息的时间，越新表示slave的数据越新，竞选的优先级越高，就更有可能选中。竞选成功之后将消息传播给其他节点。

5、集群不可用的情况：

集群中任意master挂掉，且当前master没有slave。

集群中超过半数以上master挂掉。

上面很多内容毫无意义，平时不会怎么用到，也记不住，但是却是大家需要了解的...

说句实在，还是值得收藏的！

后期会分享更多运维DBA和devops内容，感兴趣的朋友可以关注下！