redis持久化与可用性
redis对于持久化有快照及aof日志文件两种形式。
快照db文件,优点是二进制,大小比aof日志文件小。但会丢失最后一次成功备份时间到down机时间的数据。
aof相比而言文件大小就大了点,但相对快照来讲,不大容易丢失文件。
目前redis检查数据文件是否有错对于快照及aof都能够支持,但修复则只对aof文件有效。
快照文件每次备份都是全量备份,原理是先fork出一个子进程,父子进程共享数据域。接着子进程开始将共享数据域中的数据写入到一个临时文件,写完之后原子性的替换掉原先的备份db文件。如果在备份过程中,有新的写请求进来,这时创建一个当前写请求对应数据的副本页面,新的写请求更新在副本页上。这就是 copy-on-write。这种方式当文件特别大时,不至于把内存撑爆。
快照文件可以用bgsave及save来进行触发,当然也可以配置每多少秒有多少写请求就触发备份,如 配置 save 100 1000 表示在100秒中有1000次写就触发备份。
aof文件,是追加式的加入到aof未尾。每次redis接收到写请求都会先写入到内存中的buffer中,然后刷新到磁盘文件中。什么时刷新到磁盘文件中可以用appendfsync来进行配置。
appendfsync的值可以是always,second,no。always表示写请求进来时,马上把数据写到磁盘,这种方式当大量写请求时会造成磁盘等待。second表示每秒中操作系统将buffer中的数据写到磁盘。no,表明完全由操作系统控制写入到磁盘的时间(这比较危险,不知道会失多少数据)。
实际项目中用aof文件,定期做整理,aofrewrite,可以配置当aof文件增加多少倍或者达到最小大小时进行整理。
前面是持久化内容,考虑如果读请求很大,单台redis无法提供高性能服务时。这时可以使用主/备服务,主redis负责接收写请求与读请求,并将写请求同步到从redis。从redis只可读。
主/从redis同步数据,原理比较简单,步聚如下:
1.从redis发送一个sync命令给主master (从redis可以对外接受读请求,也可以不接受)
2.主master执行一个bgsave,生成最新的备份文件,这个过程中如果有新的写请求则将它写入到backlog。
3.当主master生成最新备份db文件后,主master将它发送到从redis服务器
4. 从redis服务器接收完备份文件后,替换掉原从redis内存中的数据,然后ack给主master
5.主master最后将接受sync请求并且开始做bgsave起到从redis发回ack后这段时间的所有数据backlog发回到从redis
6.从redis解析backlog,并放入到内存当中
实践过程中发现,当主/从进行同步时,主redis必定会生成一个最新的db后缀的备份文件。而aof文件则是只有当主master配置了appendonly为yes时这会
产生。假如主redis下同时存在aof和db备份文件,这时根据从redis是否支持aof来决定是否同步aof文件。
还有一点需要特别注意的是,每次从slave重启,那同步的数据文件是主master下整个文件。
关于这点,可以自己实现解析aof文件来实现增量同步。
故障恢复:
主redis为 10.45.9.114,端口6001
从redis为 10.45.9.111,端口为6002
当主master挂了时,选择slave做为主master,命令如下:
在slave上执行:
bgsave,并执行 slaveof no one
这里的slaveof no one不会序列化到配置文件,重启后还是以配置文件中的设置为准
之后更新客户端,使其指向新的master,即10.45.9.111这台redis
master 10.45.9.114恢复后,将其做为新master的slave
这时查看数据文件是否损坏,这里用的是aof备份,因此使用命令:
./redis-check-aof /home/jbossas/Data/redis/redis-data/appendonly.aof
结果如下:
AOF analyzed: size=245, ok_up_to=245, diff=0
AOF is valid
如果aof文件损坏的坏,则需要使用以下命令来恢复:
./redis-check-aof --fix /home/jbossas/Data/redis/redis-data/appendonly.aof
之后设置10.45.9.114这台机子的redis配置文件 slaveof为 slaveof 10.45.9.111 6002
之后重启即可
redis优化
减少内存,redis在对以下集合:
ZSETS,LISTS,HASHS
当它们的元素数量及value大小小于某个限值时,会用zipList(数组)来减少内存存储
设置参数:
list-max-ziplist-entries 512
list-max-ziplist-value 64
对于SETS也当元素个数小于某个限值时,也会存储成一个数组,intSet
设置参数:
set-max-intset-entries 512
对于原有的集合,redis存储数据时会比较占空间。
如list集合,redis采用一个链表来存
每个结点存储一个数据,而这个结点需要额外的三个指针。这三个指针分别指向前结点,后结点以及当前数据域