高可用集群Keepalived
一、keepalived部署
1.简介
vrrp 协议的软件实现,原生设计目的为了高可用 ipvs服务
功能: 基于vrrp协议完成地址流动
为vip地址所在的节点生成ipvs规则(在配置文件中预先定义)
为ipvs集群的各RS做健康状态检测
基于脚本调用接口完成脚本中定义的功能,进而影响集群事务,以此支持nginx、haproxy等服务
2、环境准备
KA1:172.25.254.50
KA2:172.25.254.60
RS1:172.25.254.11
RS2:172.25.254.21
安装keepalive
在KA1和KA2中安装keepalived,realserver中安装nginx
[root@KA1 ~]# dnf install keepalived -y[root@KA1 ~]# systemctl start keepalived[root@RS1 ~]# dnf install nginx -y[root@RS1 ~]# systemctl enable --now nginx[root@RS1 ~]# systemctl start nginx
3、全局配置
! Configuration File for keepalived global_defs { notification_email { zcx@zcx.com #keepalived 发生故障切换时邮件发送的目标邮箱,可以按行区分写多个 } notification_email_from keepalived@KA1.timinglee.org #发邮件的地址 smtp_server 127.0.0.1 #邮件服务器地址 smtp_connect_timeout 30 #邮件服务器连接timeout router_id KA1.timinglee.org #每个keepalived主机唯一标识 #建议使用当前主机名,但多节点重名不影响 vrrp_skip_check_adv_addr #对所有通告报文都检查,会比较消耗性能 #启用此配置后,如果收到的通告报文和上一个报文是同一 #个路由器,则跳过检查,默认值为全检查 vrrp_strict #严格遵循vrrp协议 #启用此项后以下状况将无法启动服务: #1.无VIP地址 #2.配置了单播邻居 #3.在VRRP版本2中有IPv6地址 #建议不加此项配置 vrrp_garp_interval 1 #免费 ARP(Gratuitous ARP)报文时间间隔 #免费 ARP用于通知网络中其他设备,某 IP 地址对应的 MAC 地址发生了变化 #帮助网络设备更新 ARP 缓存,确保数据能正确转发到新的主节点 vrrp_gna_interval 1 #用于配置发送 Gratuitous NA(免费邻居通告报文的时间间隔 #通知网络中其他设备,某 IPv6 地址对应的链路层地址(MAC 地址)发生了变化 #帮助网络设备更新邻居缓存(Neighbor Cache) #确保 IPv6 数据包能正确转发到新的主节点 vrrp_mcast_group4 224.0.0.44 #指定组播IP地址范围: }
4、配置虚拟路由器
vrrp_instance WEB_VIP { state MASTER interface ens160 #绑定为当前虚拟路由器使用的物理接口,如:eth0,可以和VIP不在一个网卡 virtual_router_id 51 #每个虚拟路由器惟一标识,范围:0-255,每个虚拟路由器此值必须唯一否则服务无法启动 #同属一个虚拟路由器的多个keepalived节点必须相同 priority 100 #当前物理节点在此虚拟路由器的优先级,值越大优先级越高范围:1-254 advert_int 1 #vrrp通告的时间间隔,默认1s authentication { #认证机制 auth_type PASS #AH为IPSEC认证(不推荐),PASS为简单密码(建议使用) auth_pass 1111 #预共享密钥,仅前8位有效 } virtual_ipaddress { #虚拟IP,生产环境可能指定上百个IP地址 172.25.254.100/24 dev ens160 label ens160:0 } accept #开启vip 对外响应ping包,注意此处功能需要关闭vrrp_strict}#检查[root@KA1 ~]# keepalived -t -f /etc/keepalived/keepalived.conf
测试
5、启用keepalived日志功能
[root@KA1 ~]# vim /etc/sysconfig/keepalived KEEPALIVED_OPTIONS=\"-D -S 6\" #日志级别为0-7 [root@ka1 ~]#vim /etc/rsyslog.conflocal6.* /var/log/keepalived.log [root@ka1 ~]#systemctl restart keepalived.service rsyslog.service
测试
6、实现独立子配置文件
当生产环境复杂时,/etc/keepalived/keepalived.conf 文件中内容过多,不易管理 将不同集群的配置,比如:不同集群的VIP配置放在独立的子配置文件中利用include 指令可以实现包含子配置文件
示例:
[root@KA1 ~]# mkdir /etc/keepalived/conf.d[root@KA1 ~]# vim /etc/keepalived/keepalived.conf! Configuration File for keepalived global_defs { notification_email { zcx@qq.com } notification_email_from keepalived@KA1.timinglee.org smtp_server 127.0.0.1 smtp_connect_timeout 30 router_id KA1.zcx.org vrrp_skip_check_adv_addr #vrrp_strict vrrp_garp_interval 1 vrrp_gna_interval 1 vrrp_mcast_group4 224.0.0.44}include /etc/keepalived/conf.d/*.conf #相关子配置文件[root@KA1 ~]# systemctl restart keepalived
二、Keepalived 企业应用示例
1、单主架构
MASTER配置:
[root@KA1 ~]# mkdir /etc/keepalived/conf.d[root@KA1 ~]# vim /etc/keepalived/keepalived.confvrrp_instance WEB_VIP { state MASTER #status为MASTER模式 interface ens160 virtual_router_id 51 priority 100 advert_int 1 authentication { auth_type PASS auth_pass 1111 } unicast_src_ip 172.25.254.50 unicast_peer { 172.25.254.60 } virtual_ipaddress { 172.25.254.100/24 dev ens160 label ens160:0 #vip设置 }}[root@KA1 ~]# systemctl restart keepalived
BACKUP配置
[root@KA1 ~]# mkdir /etc/keepalived/conf.d[root@KA1 ~]# vim /etc/keepalived/keepalived.confvrrp_instance WEB_VIP { state BACKUP #status为MASTER模式 interface ens160 virtual_router_id 51 #相同id管理同一个虚拟路由 priority 80 #优先级,应低于master advert_int 1 authentication { auth_type PASS auth_pass 1111 } unicast_src_ip 172.25.254.60 #单播 unicast_peer { 172.25.254.50 } virtual_ipaddress { 172.25.254.100/24 dev ens160 label ens160:0 #vip设置 }}[root@KA1 ~]# systemctl restart keepalived
抓包观察
2、抢占和非抢占模式
默认为抢占模式preempt,即当高优先级的主机恢复在线后,会抢占低先级的主机的master角色,这样会使vip在KA主机中来回漂移,造成网络抖动,建议设置为非抢占模式 nopreempt ,即高优先级主机恢复后,并不会抢占低优先级主机的master角色 非抢占模块下,如果原主机down机, VIP迁移至的新主机, 后续也发生down时,仍会将VIP迁移回原主机
非抢占模式:
[root@KA1 ~]# mkdir /etc/keepalived/conf.d[root@KA1 ~]# vim /etc/keepalived/keepalived.confvrrp_instance WEB_VIP { state BACKUP #互为主备,status都为BACKUP interface ens160 virtual_router_id 51 priority 100 nopreempt #非抢占模式,互为主备 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 172.25.254.100/24 dev ens160 label ens160:0 }}[root@KA1 ~]# systemctl restart keepaliv
当vip在线主机宕机后,vip转移至另一台主机,重新上线后,只有在另一台主机宕机时vip才会重新转移回来
抢占模式:
#KA1中设置vrrp_instance WEB_VIP { state MASTER interface ens160 virtual_router_id 51 priority 100 #nopreempt #非抢占模式,互为主备 preempt_delay 10 #抢占模式,可以设定延时抢占 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 172.25.254.100/24 dev ens160 label ens160:0 }}#在KA2中vrrp_instance WEB_VIP { state BACKUP interface ens160 virtual_router_id 51 priority 100 #nopreempt preempt_delay 10 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 172.25.254.100/24 dev ens160 label ens160:0 }}
当master宕机后,vip转移至backup,当master重新上线后待延时后vip重新转移至master
3、vip单播配置
默认keepalived主机之间利用多播相互通告消息,会造成网络拥塞,可以替换成单播,减少网络流量。(注:启用 vrrp_strict 时,不能启用单播)
vrrp_instance WEB_VIP { state MASTER interface ens160 virtual_router_id 51 priority 100 #nopreempt #非抢占模式,互为主备 #preempt_delay 300 #延迟抢占模式 advert_int 1 authentication { auth_type PASS auth_pass 1111 } unicast_src_ip 172.25.254.50 #单播配置,源地址 unicast_peer { 172.25.254.60 #指定接收单播的对方目标主机IP #如果有多个keepalived,再加其它节点的IP } virtual_ipaddress { 172.25.254.100/24 dev ens160 label ens160:0 }}
抓包测试:
4、Keepalived 通知脚本配置
当keepalived的状态变化时,可以自动触发脚本的执行,比如:发邮件通知用户默认以用户
keepalived_script身份执行脚本
如果此用户不存在,以root执行脚本可以用下面指令指定脚本执行用户的身份
keepalived配置文件修改
global_defs { notification_email { zcx@zcx.ogr } notification_email_from zcx@zcx1.org smtp_server 127.0.0.0 smtp_connect_timeout 30 router_id KA1 vrrp_skip_check_adv_addr #vrrp_strict vrrp_garp_interval 1 vrrp_gna_interval 1 enable_script_security #全局安全选项,用于 限制脚本执行权限,防止未经授权的脚本被调用 script_user root #指定所有外部脚本,以root用户执行 vrrp_mcast_group4 224.0.0.44}vrrp_instance WEB_VIP { state MASTER interface ens160 virtual_router_id 51 priority 100 #nopreempt #非抢占模式,互为主备 #preempt_delay 300 #延迟抢占模式 advert_int 1 authentication { auth_type PASS auth_pass 1111 } unicast_src_ip 172.25.254.50 unicast_peer { 172.25.254.60 } virtual_ipaddress { 172.25.254.100/24 dev ens160 label ens160:0 } notify_master \"/etc/keepalived/mail.sh master\" #当前节点成为主节点时触发的脚本 notify_backup \"/etc/keepalived/mail.sh backup\" #当前节点转为备节点时触发的脚本 notify_fault \"/etc/keepalived/mail.sh fault\" #当前节点转为“失败”状态时触发的脚本}
创建通知脚本
[root@KA1 ~]# vim /etc/keepalived/mail.sh#!/bin/bashmail_dest=\'zcx@qq.com\'mail_send(){ mail_subj=\"$HOSTNAME to be $1 vip 转移\" mail_mess=\"`date +%F\\ %T`: vrrp 转移,$HOSTNAME 变为 $1\" echo \"$mail_mess\" | mail -s \"$mail_subj\" $mail_dest}case $1 in master) mail_send master ;; backup) mail_send backup ;; fault) mail_send fault ;; *) exit 1 ;; esac[root@KA1 ~]# chmod +x /etc/keepalived/mail.sh
邮件配置
#安装邮件发送工具[root@KA2 ~]# dnf install sendmail -y#配置邮箱[root@KA1 ~]# vim /etc/mail.rcset smtp=smtp.163.comset smtp-auth=loginset smtp-auth-user=zcx@163.com #163网易邮箱set smtp-auth-password=SZdEcPS2pz8rFbFx #IMAP/SMTP服务验证码set from=zcx@163.comset ssl-verify=ignor[root@KA1 ~]# systemctl enable --now sendmail.service[root@KA1 ~]# echo test message |mail -s test zcx@qq.com #登录自己邮箱即可收到
5、实现 master/master 的 Keepalived 双主架构
master/slave的单主架构:同一时间只有一个Keepalived对外提供服务,此主机繁忙,而另一台主机却 很空闲,利用率低下,可以使用master/master的双主架构,解决此问题。 master/master的双主架构: 即将两个或以上VIP分别运行在不同的keepalived服务器,以实现服务器并行提供web访问的目的,提高 服务器资源利用率
双主机配置:
[root@KA1 ~]# vim /etc/keepalived/keepalived.conf#主vrrp_instance WEB_VIP { state MASTER interface ens160 virtual_router_id 51 priority 100 #nopreempt #非抢占模式,互为主备 #preempt_delay 300 #延迟抢占模式 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 172.25.254.100/24 dev ens160 label ens160:0 }}#备vrrp_instance DB_VIP { state BACKUP interface ens160 virtual_router_id 52 priority 80 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 172.25.254.200/24 dev ens160 label ens160:1 }}KA2[root@KA2 ~]# vim /etc/keepalived/keepalived.conf#备vrrp_instance WEB_VIP { state BACKUP interface ens160 virtual_router_id 51 priority 80 #nopreempt #非抢占模式,互为主备 #preempt_delay 300 #延迟抢占模式 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 172.25.254.100/24 dev ens160 label ens160:0 } }#主vrrp_instance DB_VIP { state MASTER interface ens160 virtual_router_id 52 priority 100 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 172.25.254.200/24 dev ens160 label ens160:1 }}
当一个主机宕机后,vip自动迁移至另一个主机中,重新上线后vip转移为原来的主机中
6、实现IPVS的高可用性
在keepalived中安装ipvsadm
虚拟服务器配置
[root@KA1 ~]# vim /etc/keepalived/keepalived.confvirtual_server 172.25.254.100 80 { delay_loop 6 lb_algo rr lb_kind DR protocol TCP real_server 172.25.254.11 80 { weight 1 TCP_CHECK { connect_timeout 5 retry 3 delay_before_retry 3 connect_port 80 } } real_server 172.25.254.21 80 { weight 1 HTTP_GET { #应用层监测 url { path / status_code 200 } connect_timeout 1 retry 3 delay_before_retry 1 } }}
在realserver中配置vip
[root@RS1 ~]# ip a a 172.25.254.100/32 dev lo#lo的arp抑制[root@RS1 ~]# echo net.ipv4.conf.all.arp_ignore=1 > /etc/sysctl.conf[root@RS1 ~]# echo net.ipv4.conf.all.arp_announce=2 >> /etc/sysctl.conf[root@RS1 ~]# echo net.ipv4.conf.lo.arp_ignore=1 >> /etc/sysctl.conf[root@RS1 ~]# echo net.ipv4.conf.lo.arp_announce=2 >> /etc/sysctl.conf[root@RS1 ~]# sysctl -p
测试:
当有一个主机宕机时,vip转移,访问仍然是正常的
7、实现其它应用的高可用性 VRRP Script
keepalived利用 VRRP Script 技术,可以调用外部的辅助脚本进行资源监控,并根据监控的结果实现优先 动态调整,从而实现其它应用的高可用性功能
vrrp_script:自定义资源监控脚本,vrrp实例根据脚本返回值,公共定义,可被多个实例调用,定 义在vrrp实例之外的独立配置块,一般放在global_defs设置块之后。
通常此脚本用于监控指定应用的状态。一旦发现应用的状态异常,则触发对MASTER节点的权重减至 低于SLAVE节点,从而实现 VIP 切换到 SLAVE 节点
定义 VRRP script
vrrp_script { #定义一个检测脚本,在global_defs 之外配置 script | #shell命令或脚本路径 interval #间隔时间,单位为秒,默认1秒 timeout #超时时间 weight #默认为0,如果设置此值为负数, #当上面脚本返回值为非0时 #会将此值与本节点权重相加可以降低本节点权重, #即表示fall. #如果是正数,当脚本返回值为0, #会将此值与本节点权重相加可以提高本节点权重 #即表示 rise.通常使用负值 fall #执行脚本连续几次都失败,则转换为失败,建议设为2以上 rise #执行脚本连续几次都成功,把服务器从失败标记为成功 user USERNAME [GROUPNAME] #执行监测脚本的用户或组 init_fail #设置默认标记为失败状态,监测成功之后再转换为成功状态}
示例:实现HAProxy高可用
#在keepalived中安装haproxy[root@KA2 ~]# dnf install haproxy -y[root@KA2 ~]# vim /etc/haproxy/haproxy.cfglisten webcluster bind *:80 mode http server web1 172.25.254.11:80 check inter 3 fall 2 rise 1 server web2 172.25.254.21:80 check inter 3 fall 2 rise 1[root@KA2 ~]# systemctl restart haproxy.service#在两个ka1和ka2两个节点启用内核参数[root@KA2 ~]# vim /etc/sysctl.conf net.ipv4.ip_nonlocal_bind = 1[root@KA2 ~]# sysctl -pnet.ipv4.ip_nonlocal_bind = 1#在KA1中编写检测脚本[root@KA1 ~]# vim /etc/keepalived/scripts/haproxy.sh#!/bin/bashkallall -0 haproxy &> /dev/null[root@KA1 ~]# chmod +X /etc/keepalived/scripts/haproxy.sh
在ka1中配置keepalived
vrrp_script CHECK_HAPROXY { script \"/etc/keepalived/scripts/haproxy.sh\" interval 1 weight -30 fall 2 rise 2 timeout 2}vrrp_instance WEB_VIP { state MASTER interface ens160 virtual_router_id 51 priority 100 #nopreempt #非抢占模式,互为主备 #preempt_delay 300 #延迟抢占模式 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 172.25.254.100/24 dev ens160 label ens160:0 } track_script { CHECK_HAPROXY }}