Redis高性能架构详解：打造超快存储系统

发表时间: 2024-06-28 11:35

Redis是大型架构的非常核心的中间件，之所以广泛采用，主要就是“Redis的高性能架构设计”，下面我就全面来详解4大高性能设计@mikechen

本篇已收于mikechen原创超30万字《阿里架构师进阶专题合集》里面。

1.内存存储

Redis将数据存储在内存中，而不是在磁盘上。

为什么磁盘会满非常多呢？看下图：

一次磁盘 I/O 操作，通常需要经历以下三个主要步骤：

1、寻道

磁盘读取、或写入数据前，磁头必须移动到正确的磁道位置，这个过程称为“寻道”。

寻道距离越大、或移动速度越慢，寻道时间越长。

寻道时间是从当前磁头位置移动到目标磁道位置所需的时间。

2、旋转延迟

一旦磁头到达目标磁道，磁盘需要等待正确的扇区旋转到磁头位置，以便读取、或写入数据，这个等待时间称为“旋转延迟”。

比如：一个 7200 RPM 的硬盘，其旋转延迟时间为 1/2 毫秒...到 1/3 毫秒之间。

3、数据传输

一旦磁头在正确的磁道上，数据可以被读取、或写入到磁盘表面上的扇区。

这三个步骤（寻道、旋转、和数据传输），共同决定了磁盘 I/O 操作，总时间。

但是，寻道、和旋转延迟，通常是主要的性能瓶颈，如果每次都是“随机”，将极大的降低数据传输性能。

而内存访问，相比于从磁盘读取数据，减少了磁盘 I/O 的延迟，避免了磁盘寻址、旋转延迟...等带来的性能瓶颈。

所以，内存具有更低的延迟和更高的吞吐量，这使得Redis能够快速响应读取和写入请求。

Redis 使用简单的键值对存储模型、和高效的数据结构，比如：字符串、列表、哈希表、集合...等。

如下图所示：

这些数据结构在内存中进行操作，使用了优化的算法、和数据结构，以提高性能。

例如：Redis的哈希表实现具有O(1)的读写复杂度，列表、和有序集合支持高效的插入、删除和范围查询操作。

所以，这些数据结构，减少了数据处理的复杂性、和计算开销，操作这些数据结构的速度都比较快。

同时，Redis使用了非阻塞I/O和事件驱动模型，充分利用了操作系统的I/O多路复用机制，提高了并发处理能力。

IO多路复用是指通过一个线程来监听多个I/O事件，并在有事件发生时进行处理，以减少线程开销和系统调度的开销。

多路复用主要有三种技术：select，poll，epoll，epoll是最新的也是目前最好的多路复用技术。

Redis使用的IO多路复用机制主要有以下几种：

select：select是最古老的IO多路复用机制，它通过在一个监视文件描述符集合上进行轮询来检查是否有I/O事件发生。但是select有一些缺点，例如效率低下、文件描述符数量有限等。
poll：poll是select的改进版本，它使用链表结构来存储文件描述符集合，并通过遍历链表来检查是否有I/O事件发生。相比于select，poll没有文件描述符数量的限制，但效率仍然有一定的局限性。
epoll：epoll是Linux特有的IO多路复用机制，它使用事件驱动的方式来提供高效的I/O事件监听。epoll通过注册事件，将文件描述符添加到事件集合中，并通过系统调用epoll_wait来等待事件的发生。epoll具有较高的性能，可以处理大量的并发连接。

Redis支持异步操作，可以在后台执行一些耗时的操作。

比如：持久化到磁盘或复制数据到其他节点，通过异步操作，Redis可以更快地响应客户端请求，而不必等待这些操作的完成。

综上所述，Redis之所以快速主要得益于内存存储、单线程模型、高效的数据结构和操作等因素的综合作用。

本篇已收于mikechen原创超30万字《阿里架构师进阶专题合集》里面。