redis持久化与可用性

dy83 10年前

  redis对于持久化有快照及aof日志文件两种形式。

  快照db文件,优点是二进制,大小比aof日志文件小。但会丢失最后一次成功备份时间到down机时间的数据。

  aof相比而言文件大小就大了点,但相对快照来讲,不大容易丢失文件。

  目前redis检查数据文件是否有错对于快照及aof都能够支持,但修复则只对aof文件有效。

 

  快照文件每次备份都是全量备份,原理是先fork出一个子进程,父子进程共享数据域。接着子进程开始将共享数据域中的数据写入到一个临时文件,写完之后原子性的替换掉原先的备份db文件。如果在备份过程中,有新的写请求进来,这时创建一个当前写请求对应数据的副本页面,新的写请求更新在副本页上。这就是 copy-on-write。这种方式当文件特别大时,不至于把内存撑爆。

  快照文件可以用bgsave及save来进行触发,当然也可以配置每多少秒有多少写请求就触发备份,如 配置 save 100 1000 表示在100秒中有1000次写就触发备份。

 aof文件,是追加式的加入到aof未尾。每次redis接收到写请求都会先写入到内存中的buffer中,然后刷新到磁盘文件中。什么时刷新到磁盘文件中可以用appendfsync来进行配置。

 appendfsync的值可以是always,second,no。always表示写请求进来时,马上把数据写到磁盘,这种方式当大量写请求时会造成磁盘等待。second表示每秒中操作系统将buffer中的数据写到磁盘。no,表明完全由操作系统控制写入到磁盘的时间(这比较危险,不知道会失多少数据)。

 实际项目中用aof文件,定期做整理,aofrewrite,可以配置当aof文件增加多少倍或者达到最小大小时进行整理。

 

 前面是持久化内容,考虑如果读请求很大,单台redis无法提供高性能服务时。这时可以使用主/备服务,主redis负责接收写请求与读请求,并将写请求同步到从redis。从redis只可读。

 主/从redis同步数据,原理比较简单,步聚如下:

 1.从redis发送一个sync命令给主master (从redis可以对外接受读请求,也可以不接受)

 2.主master执行一个bgsave,生成最新的备份文件,这个过程中如果有新的写请求则将它写入到backlog。

 3.当主master生成最新备份db文件后,主master将它发送到从redis服务器

 4. 从redis服务器接收完备份文件后,替换掉原从redis内存中的数据,然后ack给主master

 5.主master最后将接受sync请求并且开始做bgsave起到从redis发回ack后这段时间的所有数据backlog发回到从redis

 6.从redis解析backlog,并放入到内存当中


 实践过程中发现,当主/从进行同步时,主redis必定会生成一个最新的db后缀的备份文件。而aof文件则是只有当主master配置了appendonly为yes时这会

产生。假如主redis下同时存在aof和db备份文件,这时根据从redis是否支持aof来决定是否同步aof文件。

 还有一点需要特别注意的是,每次从slave重启,那同步的数据文件是主master下整个文件。

 关于这点,可以自己实现解析aof文件来实现增量同步。

故障恢复:
主redis为 10.45.9.114,端口6001
从redis为 10.45.9.111,端口为6002


当主master挂了时,选择slave做为主master,命令如下:
在slave上执行:
bgsave,并执行 slaveof no one
这里的slaveof no one不会序列化到配置文件,重启后还是以配置文件中的设置为准

之后更新客户端,使其指向新的master,即10.45.9.111这台redis

master 10.45.9.114恢复后,将其做为新master的slave

这时查看数据文件是否损坏,这里用的是aof备份,因此使用命令:
./redis-check-aof /home/jbossas/Data/redis/redis-data/appendonly.aof
结果如下:
AOF analyzed: size=245, ok_up_to=245, diff=0
AOF is valid

如果aof文件损坏的坏,则需要使用以下命令来恢复:
./redis-check-aof --fix /home/jbossas/Data/redis/redis-data/appendonly.aof

之后设置10.45.9.114这台机子的redis配置文件 slaveof为 slaveof 10.45.9.111 6002
 
之后重启即可


redis优化

减少内存,redis在对以下集合:
 ZSETS,LISTS,HASHS
 当它们的元素数量及value大小小于某个限值时,会用zipList(数组)来减少内存存储
 设置参数:
 list-max-ziplist-entries 512
 list-max-ziplist-value 64

 对于SETS也当元素个数小于某个限值时,也会存储成一个数组,intSet
 设置参数:
 set-max-intset-entries 512


对于原有的集合,redis存储数据时会比较占空间。

如list集合,redis采用一个链表来存

每个结点存储一个数据,而这个结点需要额外的三个指针。这三个指针分别指向前结点,后结点以及当前数据域