Redis 是一个使用内存存储数据的 key-value 数据库,因此常常被用在需要缓存数据的场合,可以减轻许多后端数据库的压力。这篇就来简单介绍一下 Redis 提供哪些好用的东西,以及可以应用在什么地方。
Redis 的官网列出了支持的每一条指令,我们先来看看最简单的:
redis> SET mykey "Hello"redis> GET mykey"Hello"
前面有提到说 Redis 是一个 key-value 结构的数据库,因此最简单的 SET 就是设置某个 key 的值是多少,要取出来的话就用 GET 就可以。
redis> SET mykey "10"redis> DECR mykey(integer) 9redis> INCR mykey(integer) 10
顾名思义就是针对某个 key 加一或减一的意思,像是编程语言里面的mykey++跟mykey--。
还有 INCRBY 与 DECRBY,可以指定你要加减的数量是多少。
redis> HSET mydata name "nick"redis> HSET mydata nickname "nicknick"redis> HGET mydata name"nick"
H 就是 Hash 的意思,所以你可以存取一个 value 底下的 field,让你可以更多元的使用,例如说你可以定义 key 的规则是:POST + 文章 id,里面就可以存这篇文章的赞数、回复数等等,就不用每一次都去数据库里面重新查询。
redis> SADD myset "nick"redis> SADD myset "peter"redis> SADD myset "nick"redis> SCARD myset(integer) 2
SADD 的 S 就是 Set 的意思,这边的 Set 指的是数据结构学过的那个 Set,里面不会有重复的内容。
redis> LPUSH mylist "a"redis> LPUSH mylist "b"redis> RPUSH mylist "c"redis> LRANGE mylist 0 -11) "b"2) "a"3) "c"redis> LSET mylist 0 "d"redis> LRANGE mylist 0 -11) "d"2) "a"3) "c"
这边的数据结构是 List,你可以选择从左边或是右边 push 值进去,对应到的指令就是 LPUSH 与 RPUSH,LSET 则是指定某个 index 的 value 是多少。
LRANGE 可以印出指定范围的值,支持-1这种形式,表示最后一个值。
Redis 好用的地方就在于速度很快,所以若是开发上碰到一些场合需要速度很快的话,你可以先考虑看看 Redis 是不是能够帮助到你,以下就举几个我实际使用过的例子。
其实短网址的原理非常简单,就是一个 对原网址做一系列计算(比如 hash 算法)后得到一个较短的字符串 ,位数或是要有什么符号可以自己决定,接著就把这组对应关系存到数据库里面,别人查询相应的 key 时,你就重定向到相应的网址去就好了。
也因为是这种 key-value 的一对一关系,所以非常适合使用 Redis。
如果你不用像是 Redis 这种的 key-value 缓存,就必须「每一次」都从数据库去查询。若是数据量小还好,但数据量一变大的时候,时间一定会增加,数据库的负担也会增加,因此在数据库跟逻辑层之间引进一层缓存,我认为是很好的选择。
实作的过程也很简单,
若是你的数据有很多的数据,又不想花很多的钱准备一台内存很大的 Redis Server(数据库是用硬盘储存,Redis 是存在内存,以储存成本来说,数据库会便宜许多),你可以使用 Redis 的 Expire 这个功能。
当你在储存数据的时候,你可以新增一个 Expire time 的参数,当这个时间一到之后,这个 key 就会自动被清除。举例来说,短网址的 expire 可以设置成 7 天,当某个网址 7 天内都没有被任何使用者访问的话,就会自动被删除。
这样的好处是你可以减少内存的使用量,只保持某些「热数据」会存在 Redis,其他比较冷门、不常被访问的数据,就存在数据库,等到被访问的时候再写到 Redis 即可。
其实上面讲到的短网址服务,除了缩短网址这个功能,还有另一个重点,那就是:统计数据。例如说 Google 短网址,会提供给你:访问次数、图表、用什么装置等等,这些才是短网址服务的核心。
如果要做这个功能,那你势必要记录每一次 Request,或至少要把请求的内容(用什么手机、时间点、IP)记录下来,才有数据可以给使用者看。
存在数据库,读取也是每次都从数据库读的话,就会造成一些性能上的 问题,例如说每次 refresh 统计页面,你就必须重新:select conut(*) from short_url where一次,才能抓到总共有多少人访问。
还记得我们提过的 INCR 吗?这不是就派上用场了!可以自己定义 key 的格式,例如说:abc123:visit 代表 abc123 这个短网址的总共访问次数,接著,只要在每一次的请求都执行:INCR abc123:visit,这个 key 里面就是你要的数字了,以后都从 Redis 读取就好。
除了这个以外,假设你想要提供「不重复 IP 访问次数」,前面提到的 Set 就很适合。可以把每一个请求的来源 IP 都丢进一个 Set,只要用 SCARD 就可以知道有多少不重复 IP 了,很方便对吧!
我曾经做过一个项目,需求如下:
可以先想一下有哪些地方会需要跟数据库交互
由于这个活动只有前 300 名有奖品,预估使用者有 10000 人的话,可能在 10 秒内这个活动就结束了!
10 秒内你的数据库必须「同时承受」这么多个 查询,可能会有点吃不消,而且仔细检查之后,会发现很多地方其实没有必要用数据库来做,或者是说,用 Redis 来做会更好!
例如说,可以这样规划:
上面的流程就可以改写成:
原本需要三个对数据库的操作,现在缩减到只剩下最必要的一个,其他都可以交给 Redis 处理。而且又因为 Redis 是使用内存存储数据的数据库,处理速度非常快!再加上我们的 key 并不多(一万多个 key 而已),用到的内存很少。
就这样,通过 Redis 的帮助,很顺利的就可以解决原本数据库负载太重可能会很慢甚至挂掉的问题。
若是下次你有些项目使用者很多,或是需要很快的返回数据,但是又怕数据库撑不住,不妨想想是不是能够导入 Redis,或其他也是做缓存的 service。其实在很多场合,如果缓存运用得宜的话,可以减轻很多数据库的负担,同时也加快响应的速度。