Keepalived 工作原理及简要安装

gy318318 9年前

来自: http://my.oschina.net/luciamoore/blog/607034


===============================

            高性能集群软件-Keepalived

===============================

  • keepalived 介绍

          >>>-------------------------------------------------------------

          keepalived 是 Linux下一个轻量级的高可用解决方案

          keepalived 主要通过虚拟路由冗余(VRRP)来实现高可用功能

          

          优点:部署及使用简单,只需一个配置文件即可完成

          功能:1. 服务器状态检测和故障隔离功能

                    2. HA(High Available) cluster 

         <<<-------------------------------------------------------------


       

  • keepalived 发展

          >>>--------------------------------------------------------------------------------------------------

            keepalived起初是为LVS(Linux Virtual System)设计,专门监控集群系统中各个服务节点的状态

            根据TCP/IP参考模型 第三、第四、第五层交换机制检测每个服务节点的状态(详细见本页keepalived工作原理


         e.g: keepalived检测WEB服务器的状态;

                如果一台WEB服务器死机/工作出现古装,keepalived检测到此状况后会将故障服务器从系统中剔除;

                直至该服务器工作正常后keepalived自动将该服务器加入到服务器群中;

                以上工作keepalived自动完成,无需人工干涉,人工干预仅是修复出现故障的服务节点;

        <<<----------------------------------------------------------------------------------------------------------


           >>>---------------------------------------------------------------------------------------------------  

            keepalived 后续加入了VRRP功能

            VRRP(Virtaul Router Redunadancy Protocol,虚拟路由器冗余协议)

            目的:解决静态路由出现的单点故障问题,实现网络不间断稳定运行

           <<<------------------------------------------------------------------------------------------------------      



  • VRRP 协议与工作原理 

  ❉   引入VRRP概念

  >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<

                

                         *说明*:图片来源百度百科;左侧图片为局域网组网;右侧图片为VRRP组网

             >>>------------------------------------------------------------------------------------------------------------

               局域网组网 e.g:


                网络内的所有主机会设置一条默认网关(10.100.10.1),当主机发出的目的地址不在本网段(10.100.10.0/24)的报文;

                通过默认网关发往路由器A,从而实现主机与外部网络的通信

              

               该组网缺点:当路由器A坏掉时,本网段内通过以RA为默认网关下一跳的主机将断掉与外界的通信,产生单点故障

           

            ----------------------------------------------------------------------------------------------------------------------------

              VRRP组网 e.g:

              

                 RA:Master 活动路由器  10.100.10.2   

                 RB:Backup 备份路由器  10.100.10.3

              VRIP : 虚拟路由器IP            10.100.10.1

     

              VRRP将局域网中的一组路由器【 RA和RB】组成一个虚拟路由器------>>>备份组

               虚拟路由器拥有自己的IP地址 10.100.10.1

               局域网内的主机仅知道虚拟路由器IP地址为10.100.10.1,不知道具体的Master与Backup路由器IP

               局域网内的主机将默认网关下一跳的地址设置为该虚拟路由器IP地址,通过该地址与其他网络进行通信

  

                该组网优点:当备份组内的Master路由器DOWN掉,会进行选举策略选出一个新的Master路由器,继续往网络内的主机提供路由服务

                                    从而实现网络内的主机不间断地与外部网络进行通信

               <<<----------------------------------------------------------------------------------------------------------------------------------



  ❉    VRRP 协议 ‍‍

               >>>------------------------------------------------------------------------------------------------------------------------------

                          VRRP:解决局域网中配置静态网关出现单点失效的路由协议

                     设计目标:网络发生故障时透明地进行设备切换而不影响主机间的数据通信

                <<<----------------------------------------------------------------------------------------------------------------------------------

            


  ❉    VRRP 工作原理

               >>>------------------------------------------------------------------------------------------------------------------------

                       VRRP协议将两台或多台路由器设备虚拟成一个虚拟路由器,对外提供虚拟路由器IP(一个或多个);

                       而在路由器组内部,如果实际拥有这个对外IP的路由器如果工作正常的话就是MASTER, 或者是通过算法选举产生;

                       MASTER实现针对虚拟路由器IP的各种网络功能,如ARP请求,ICMP,以及数据的转发等;

                       其他设备不拥有该IP,状态是BACKUP,除了接收MASTER的VRRP状态通告信息外,不执行对外的网络功能。

                       当主机失效时,BACKUP将接管原先MASTER的网络功能。

                  

                      ❀  如何判定多个路由器在同一组虚拟路由器中?

                            VRID:每个虚拟路由器都有一个唯一标识(VRID是一个0~255的正整数

                            配置VRRP协议时需要配置每个路由器的虚拟路由器ID(VRID)和优先权值,

                            使用VRID将路由器进行分组,具有相同VRID值的路由器为同一个组


                      ❀  BACKUP 为什么没有发生抢占?

                           VRRP通告:它使用IP多播数据包进行封装,组地址为224.0.0.18,发布范围只限于同一局域网内

                           在一个虚拟路由器中,只有处于MASTER角色的路由器会一直发送VRRP通告信息;

                           处于BACKUP状态的路由器只接收MASTER发过来的报文信息,用来监控MASTER运行状态, 除非它的优先级比MASTER更高

                  

                      ❀  什么时候发生选举?

                            当MASTER不可用时,BACKUP无法收到MASTER发过来的报文信息;

                            认定MASTER出现故障,然后多台BACKUP就开始进行选举;

                    

                       ❀  Master选举

                           虚拟路由器IP=路由器本身配置IP

                           该路由器始终将是MASTER;IP地址所有者自动具有最高优先级:255

                        

                           优先级选举主控路由器(优先级范围是0—255

                           优先级0一般用在IP地址所有者主动放弃主控者角色时使用。可配置的优先级范围为1—254

                           优先级相等,则比较路由器的实际IP,IP值较大的优先权高

                  <<<-----------------------------------------------------------------------------------------------------


  ❉    VRRP 应用实例  

 >>>------------------------------------------------------------------------------------------------------------------------      

            +-----------+      +-----------+              |   Rtr1    |      |   Rtr2    |              |(MR VRID=1)|      |(BR VRID=1)|              |(BR VRID=2)|      |(MR VRID=2)|      VRID=1  +-----------+      +-----------+  VRID=2      IP A ---------->*            *<---------- IP B                      |            |                      |            |    ------------------+------------+-----+--------+--------+--------+--                                         ^        ^        ^        ^                                         |        |        |        |                                       (IP A)   (IP A)   (IP B)   (IP B)                                         |        |        |        |                                      +--+--+  +--+--+  +--+--+  +--+--+                                      |  H1 |  |  H2 |  |  H3 |  |  H4 |                                      +-----+  +-----+  +--+--+  +--+--+       Legend:                ---+---+---+--  =  Ethernet, Token Ring, or FDDI                             H  =  Host computer                            MR  =  Master Router                            BR  =  Backup Router                             *  =  IP Address                          (IP)  =  default router for hosts

 -------------------------------------------------------------------------------------------------------------

    +   VRID 1       |   Rtr1(Master)     |    Rtr2(Backup) +  正常情况下  H1与H2走R1;反之 走R2

    -------------------------------------------------------------------------------------------------------------

     +   VRID 2       |   Rtr1(Backup)    |    Rtr2 (Master) +  正常情况下  H3与H4走R2;反之 走R1

    ------------------------------------------------------------------------------------------------------------


 <<<------------------------------------------------------------------------------------------------------------------------  

  • Keepalived 工作原理

 >>>------------------------------------------------------------------------------------------------------------------------   

          根据TCP/IP参考模型各层所能实现的功能,Keepalived运行机制如下:

          网络层  

                 协议:     IP(Internet Protocol网际协议)  

                             ARP(Address Resolution Protoco 地址转换协议) 

                           RARP(Reverse Address Resolution Protocol  反向地址转换协议 

                           ICMP(Internet Control Message Protocol 网络控制报文协议)  

                 常用:通过ICMP协议向服务器集群中的每个节点发送一个ICMP的数据包(类似ping实现)

                           如果某个节点没有返回响应数据包,那么认为此节点发生了故障

                           keepalived将报告该节点失效,并从服务器集群中剔除故障节点

         传输层

                 协议:  TCP (传输控制协议)(三次握手、安全可靠)

                            UDP (用户数据协议)

                 ------------------------------------------------------------------------------------

                 TCP提供可靠的数据传输服务、IP地址和端口,代表TCP的一个连接端

                 获取TCP服务,需要在发送机的一个端口上和接收机上一个端口上建立连接

                -------------------------------------------------------------------------------------

                 常用:利用TCP协议的端口连接和扫描技术来判断集群节点是否正常

                    e.g: SSH服务默认22端口,WEB服务器80端口····Keepalived在传输层探测某端口没有响应数据

                           判定端口异常,强制将此端口对应的节点从服务器及群组中移除

         应用层

                协议:FTP、TELNET、SMTP、DNS ····

                -----------------------------------------------------------------------

                用户可以通过自定义Keepalived的工作方式

                -----------------------------------------------------------------------

                e.g:用户编辑程序运行Keepalived,而Keepalived 根据用户设定检测各种程序或服务是否允许正常

          

  ❉   keepalived 结构体系


                 图片来源:http://www.keepalived.org/documentation.html

 <<<------------------------------------------------------------------------------------------------------------------------ 




 

  • keepalived  安装

>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<


实验需求:

  • 安装keepalived(仅安装)

实验实现:

  • 服务器:CentOS 6.5-minimal 

  • 软    件:Keepalived ( V_1.2.19 )    

安装过程:


>>>下载安装包并解压,查看相关参数

[root@lucia tmp]# wget http://www.keepalived.org/software/keepalived-1.2.19.tar.gz    # 下载Keepalived安装包  [root@lucia tmp]# tar -zxf keepalived-1.2.19.tar.gz   #解压安装包  [root@lucia tmp]# cd keepalived-1.2.19  [root@lucia keepalived-1.2.19]# ./configure --help    #查看confiure编译参数     #================================================  # 指定安装在/etc/ {--sysconfdir=/etc}  # 指定使用内核源码中的头文件 {--with-kernel-dir}  # 注:使用LVS时,需要用到"--with-kernel-dir"  #===============================================


>>>编译安装

[root@lucia keepalived-1.2.19]# [ -z /usr/src/kernels/ ] && yum -y install kernel-headers kernel-devel || echo "The kernel file already exists"  The kernel file already exists     #===========================  # 判断kernels目录是否存在文件  #===========================     [root@lucia keepalived-1.2.19]# ./configure --sysconfdir=/etc/ --with-kernel-dir=/usr/src/kernels/2.6.32-573.12.1.el6.x86_64     #============================================================================  # ./configure 对即将安装的软件进行配置,检查当前的环境是否满足要安装软件的依赖关系  #============================================================================    configure: error: in `/tmp/keepalived-1.2.19':  configure: error: no acceptable C compiler found in $PATH  See `config.log' for more details     #============================================================================  # 报错:gcc编译器没有安装  # [root@lucia keepalived-1.2.19]# yum -y install gcc  #=============================================================================          继续返回上一步预安装./configure  [root@lucia keepalived-1.2.19]# ./configure --sysconfdir=/etc/ --with-kernel-dir=/usr/src/kernels/2.6.32-573.12.1.el6.x86_64     configure: error:  !!! OpenSSL is not properly installed on your system. !!!  !!! Can not include OpenSSL headers files.            !!!     #=========================================================================  # 报错:OpenSSL 没有安装  # [root@lucia keepalived-1.2.19]# yum -y install openssl*  #=========================================================================    ./configure 成功后,显示是Keepalived 输出的加载模块信息    Keepalived configuration  ------------------------  Keepalived version       : 1.2.19                           Compiler                 : gcc  Compiler flags           : -g -O2  Extra Lib                : -lssl -lcrypto -lcrypt   Use IPVS Framework       : Yes  IPVS sync daemon support : Yes  IPVS use libnl           : No  fwmark socket support    : Yes  Use VRRP Framework       : Yes  Use VRRP VMAC            : Yes  SNMP support             : No  SHA1 support             : No  Use Debug flags          : No    [root@lucia keepalived-1.2.19]# make && make install                     #编译&&安装  [root@lucia keepalived-1.2.19]# ln -s /usr/local/sbin/keepalived /sbin/  #软链接到系统使用的管理程序目录中  [root@lucia keepalived-1.2.19]# chkconfig --add keepalived               #添加到系统服务  [root@lucia keepalived-1.2.19]# chkconfig --level 35 keepalived on       #添加到开机启动

  

  ❉   Keepalived 配置详解

[root@lucia keepalived-1.2.19]# cd /etc/keepalived/  [root@lucia keepalived-1.2.19]# ls  keepalived.conf  samples    # ================================================================  # Keepalived 配置文件路径为/etc/keepalived/keepalived.conf  # samples 目录下存放着keepalived配置的示例  # ================================================================
#============================================================  # keepalived.conf 配置  #------------------------------------------------------------  # 1、Keepalived 配置文件以block形式组织,每个块内容都包含在{}  # 2、“#”   “!” 开头行为注释  # 3、keepalived 配置为三类:  #      全局配置:对整个keepalived都生效的配置   #    VRRPD 配置:核心配置,主要实现keepalived高可用功能  #      LVS配置  #============================================================      ! Configuration File for keepalived             ########################  #  全局配置  ########################       global_defs {                               # global_defs 全局配置标识                                               ------------------------------------------     notification_email {                     # notification_email用于设置报警邮件地址       acassen@firewall.loc                   # 可以设置多个,每行一个       failover@firewall.loc                  # 设置邮件报警,需开启本机Sendmail 服务       sysadmin@firewall.loc                  # yum -y install mailx sendmail     }                                        ----------------------------------------------       notification_email_from Alexandre.Cassen@firewall.loc  # 设置邮件发送地址     smtp_server 192.168.200.1                              # 设置邮件的smtp server地址     smtp_connect_timeout 30                                # 设置连接smtp sever超时时间     router_id LVS_DEVEL                                    # 表示运行keepalived服务器标识,发邮件时显示在邮件主题中的信息  }    ######################  #  VRRPD配置  ######################    vrrp_instance VI_1 {         # VRRPD 配置标识 VI_1是实例名称        state MASTER             # 指定Keepalvied角色 MASTER表示此主机为主服务器 BACKUP则是表示为备用服务器      interface eth0           # 指定 HA 监测网络的接口      virtual_router_id 51     # 虚拟路由标识,标识为数字,同一个VRRP实例使用唯一的标识,即可表示在同一个vrrp_instance下 MASTER_ID = BACKUP_ID      priority 100             # 定义节点优先级,数字越大表示节点的优先级越高,同一个VRRP_instance下,MASTE_PRIORITY > BACKUP_PRIORITY       advert_int 1             # 设定MASTER与BACKUP主机质检同步检查的时间间隔,单位为秒                     authentication {         # 设定节点间通信验证类型和密码,验证类型主要有PASS和AH两种          auth_type PASS       # 同一个vrrp_instance,MASTER验证密码和BACKUP保持一致          auth_pass 1111      }        virtual_ipaddress {      # 设置虚拟IP地址 (VIP),又叫做漂移IP地址          192.168.200.16          192.168.200.17          192.168.200.18      }    #-------------------------------------------------------------------------------  # 问:为什么叫漂移IP地址?  # 答:当Keepalived切换到MASTER状态时,IP地址会自动添加到系统中  #    当Keepalvied切换到BACKUP状态时,IP地址将自动从系统中删除  #      #    keepalived通过“ip address add”命令的形式将VIP添加到系统  #    通过“ip add”查看系统中添加的VIP地址  #--------------------------------------------------------------------------------    }    ######################  # LVS配置  ######################      virtual_server 192.168.200.100 443 {              # virtual_server LVS配置标识                                                     # 格式:virtual_server VIP port [IP 和 port 之间空格隔开]         delay_loop 6                                  # 设置健康检查时间间隔,单位为秒                            lb_algo rr                                    # 设置负载调度算法,可用的调度算法有:rr、wlc、lc、lblc、sh、dh等      lb_kind NAT                                   # 设置LVS实现负载均衡的机制,有NAT、TUN和DR三种模式可选      nat_mask 255.255.255.0                        # NAT子网掩码      persistence_timeout 50                        # 会话保持时间       protocol TCP                                  # 指定转发协议类型  #----------------------------------------------------------------------------------------------------  # persistence_timeout 会话保持时间对动态网页非常有用,为集群系统中的seesion共享提供了一个很好的解决方案  # 用户的请求会一直分发到某个服务节点,直至超过这个会话的保持时间(指最大无响应超时时间)  # =[用户操作动态页面如果在50s没有执行任何操作则被分发到另外的节点]  #----------------------------------------------------------------------------------------------------        real_server 192.168.201.100 443 {                          # 设置real server段开始的标识 [ IP为真实IP地址]                                                                 # 格式:real_server realIP port [IP 和 port 之间空格隔开]                                                                 -----------------------------------------------------------------          weight 1                                               # 用于配置real server节点的权值,权值大小用数字表示,数字越大,权值越高                                                                 # 设置权值大小可以为不同性能的服务器分配不同的负载                                                                 ------------------------------------------------------------------            SSL_GET {                                              # 健康检查 SSL_GET                  url {                                              # 指定SSL检查的URL信息,可以指定多个                path /index.html                                 # 后跟详细的URL路径                digest ff20ad2481f97b1754ef3e12ecd3a9cc          # SSL检查后的摘要信息,可以通过genhash命令工具获取  #-----------------------------------------------------------------  # [root@lucia keepalived]# genhash -s 192.168.201.100 -p 80 -u /index.html  #-----------------------------------------------------------------              }              url {                path /mrtg/                digest 9b3a0c85a887a256d6939da88aabd8cd              }              connect_timeout 3                                  # 表示无响应超时时间,单位为秒              nb_get_retry 3                                     # 表示重试次数              delay_before_retry 3                               # 表示充实间隔          }       }  }     virtual_server 10.10.10.2 1358 {      delay_loop 6      lb_algo rr       lb_kind NAT      persistence_timeout 50      protocol TCP         sorry_server 192.168.200.200 1358                          # 备份节点,在所有real serer失效后,启用备份节点  }

 

#---------------------------------------------------------------------------------------------------------------#

 VRRP原理参考文档如下:

      http://bbs.nanjimao.com/thread-790-1-1.html (此篇写的很好)

      http://blog.chinaunix.net/uid-26575352-id-3529109.html

      keepalived.conf 参考书籍 《高性能Linux服务器构建实战》

本人高度近视,文档手打会出现个别字符错误,请指出

关于VRRP原理 部分为自己理解所拼凑,逻辑出现问题请指出

Lucia   2016/01

#----------------------------------------------------------------------------------------------------------------#