超越Redis!全球最快的内存数据库揭秘

发表时间: 2023-04-04 23:19

Dragonfly 是一种针对现代应用程序负荷需求而构建的内存数据库,完全兼容 RedisMemcached 的 API,迁移时无需修改任何代码。相比于这些传统的内存数据库,Dragonfly 提供了其 25 倍的吞吐量,高缓存命中率和低尾延迟,同时 Dragonfly 还能轻松进行垂直扩展。

设计决策

全新的缓存设计

Dragonfly 采用单一的自适应缓存算法,该算法非常简单且具备高内存效率。 你可以通过使用--cache_mode=true 参数来启用缓存模式。一旦启用了此模式,Dragonfly 将会删除最低概率可能被使用的内容,但这只会在接近最大内存限制时发生。

相对准确的过期期限

过期范围限制最高为约 4 年。此外,对于大于 134217727ms(大约 37 小时)的到期期限,毫秒精度级别(PEXPIRE/PSETEX 等)会被简化到秒级。 这种舍入的误差小于 0.001%。

原生 HTTP 控制台和兼容 Prometheus 的标准

默认情况下,Dragonfly 允许通过其主 TCP 端口(6379)进行 HTTP 访问。可以通过 Redis 协议或 HTTP 协议连接到 Dragonfly - 服务器会在连接初始化期间自动识别协议。

HTTP 控制台仅应在安全网络内访问。如果您将 Dragonfly 的 TCP 端口暴露在外部,则建议使用--http_admin_console=false 或--nohttp_admin_console 禁用控制台。

基准测试

Dragonfly 在 c6gn.16xlarge 上达到了每秒 380 万个查询(QPS),相比于 Redis,吞吐量提高了 25 倍。

在 Dragonfly 的峰值吞吐量下,P99 延迟如下:

内存效率

使用 debug populate 5000000 key 1024 命令向 Dragonfly 和 Redis 分别写入了约 5GB 的数据。 使用 memtier 发送更新流量并使用 "bgsave" 命令启动快照。 下图清楚地展示了这两个服务器在内存效率方面的表现:

在空闲状态下,Dragonfly 比 Redis 节省约 30% 的内存。 在快照阶段,Dragonfly 也没有显示出任何明显的内存增加。 但同时,Redis 在峰值时的内存几乎达到了 Dragonfly 的 3 倍。 Dragonfly 完成快照也很快,仅在启动后几秒钟内就完成了。

配置方法

Dragonfly 支持 Redis 的常见参数。 例如,可以运行:dragonfly --requirepass=foo --bind localhost

目前,Dragonfly 支持以下 Redis 特定参数:

  • port:Redis 连接端口,默认为 6379。
  • bind:使用本地主机名仅允许本地连接,使用公共 IP 地址允许外部连接到该 IP 地址。
  • requirepass:AUTH 认证密码,默认为空""
  • maxmemory:限制数据库使用的最大内存(以字节为单位)。0 表示程序将自动确定其最大内存使用量。默认为 0。
  • dir:默认情况下,dragonfly docker 使用 /data 文件夹进行快照。CLI 使用的是 ""。你可以使用 -v docker 选项将其映射到主机文件夹。
  • dbfilename:保存/加载数据库的文件名。默认为 "dump";

此外,还有 Dragonfly 特定的参数选项:

  • memcache_port:在此端口上启用 memcached 兼容的 API。默认禁用。
  • keys_output_limit:在 keys 命令中返回的最大键数。默认为 8192。

keys 命令是危险命令。我们会截断结果以避免在获取太多 key 时内存溢出。

  • dbnum:select 支持的最大数据库数。
  • cache_mode:请参见下面的 缓存 部分。
  • hz:键到期评估频率。默认为 100。空闲时,使用较低的频率可以占用较少的 CPU 资源,但这会导致清理过期键的速度下降。
  • save_schedule:以 UTC 时间规范保存快照,格式: HH:MM(24 小时制时间)。默认为空""
  • primary_port_http_enabled:如果为 true,则允许在主 TCP 端口上访问 http 控制台。默认为 true。
  • admin_port:如果设置,将在指定的端口上启用对控制台的管理访问。支持 HTTP 和 RESP 协议。默认禁用。
  • admin_bind:如果设置,将管理控制台 TCP 连接绑定到给定地址。支持 HTTP 和 RESP 协议。默认为 any。
  • cluster_mode:支持集群模式。目前仅支持 emulated。默认为空""
  • cluster_announce_ip:集群模式下向客户端公开的 IP。

启动脚本示例,包含常用选项:

./dragonfly-x86_64 --logtostderr --requirepass=youshallnotpass --cache_mode=true -dbnum 1 --bind localhost --port 6379  --save_schedule "*:30" --maxmemory=12gb --keys_output_limit=12288 --dbfilename dump.rdb

要获取更多选项,如日志管理或 TLS 支持,运行 dragonfly --help