【CentOS実用編】のlvs高可用性
6058 ワード
1概要
lvsのクラスタ設計では,Directorが利用できないとRSが利用できないという2つの点で問題がある.
A)Directorは使用できません
Directorが使用できないシステム全体が使用できません.SPoF Single Point of Failure、単一の障害による
ソリューション:keepalived heartbeat/corosyncによる高可用性
B)あるRSが使用できない場合
バックエンド・サーバにRSが1台存在しても使用できない場合、DirectorはリクエストをこのRSにスケジューリングし、リクエストが処理されず、サービスが失敗します.
解決策:Directorによって各RSの健康状態に対して検査を行って、失敗する時は無効にして、成功する時は有効にする
ツールにはkeepalived heartbeat/corosync,ldirectordがあります
同時に、バックエンドRS監視状態をスクリプトで監視することもできる
検出方式:(a)ネットワーク層検出、icmp(b)伝送層検出、ポート検出(c)アプリケーション層検出、あるキーリソースRSがすべて使用できないことを要求した場合、back serverまたはsorryserverでユーザーに提示することができる
ここではldirectordソフトウェアとスクリプトによるバックエンドサーバの監視について説明します.
2 ldirectord
ldirectord:LVSデーモンプロセスを監視制御し、LVSルールを管理します.このソフトウェアはipvsがバックエンドサーバの状態を監視できない問題を解決します.プロファイルに設定されたルールに基づいて、サーバ側のアプリケーションが正常であるかどうかを確認するのが原理です.コンフィギュレーションファイルコンフィギュレーションサービスにより、ソフトウェアを起動すると設定されたルールに従ってコンフィギュレーションとモニタリングが行われます.
このソフトウェアは、プロファイルのルールに従ってlvsクラスタタイプを作成し、RSサーバを追加し、監視し、バックエンドサービスが失敗した場合、対応するRSを削除し、RSサービスが正常に回復すれば、自動的にRSをスケジューリング計画に追加します.バックエンドがhttpサービスを監視すると、バックエンドサーバが指定したページのキーワードをキャプチャすることで、バックエンドhttpサービスが正常に動作するかどうかを決定します.
.パッケージ名:ldirectord-3.9.6-src 1.1.1.x86_64.rpm、このサービスパッケージはbaseソースにありません.別途ダウンロードする必要があります.依存性があります.ダウンロード後yumでインストールし、依存性を解決します.
・ソフトウェア関連ファイル:
Ldirectordプロファイルの例
例
バックエンドのhttpサービスが正常かどうかを監視し、バックエンドサーバindexをキャプチャする.htmlページのキーワードcentos
3自動化スクリプト
スクリプトの使用上の注意事項:
スクリプトのVIP,RIP,RW(重み)モニタポートVPORT,RPORTの変数は、実際の状況に応じて調整する必要があります.
スクリプトはループモニタリングを設定し、次の文を使用してスクリプトを実行することを推奨します.
スクリプトのデフォルトは3 sでバックエンドのRSをモニタリングし、この値は実際の状況に応じて調整することができ、コマンドはスクリプトの後にsleep 3.数字3を調整すればいいです.
ワンタッチモニタスクリプトは次のとおりです.
4まとめ
本稿では,ツールldirectordと独自に設計したスクリプトを記述してバックエンドのRSをモニタリングするが,モニタリングの方式はいずれもバックエンドRSに対してポーリングアクセスを行い,サーバに一定の圧力を与えるため,使用時に考慮しなければならない.全体的に、LVSを使用してスケジューリングする場合は、バックエンドRSを監視することを推奨します.そうしないと、RSが異常な場合、サービスが使用できなくなります.
lvsのクラスタ設計では,Directorが利用できないとRSが利用できないという2つの点で問題がある.
A)Directorは使用できません
Directorが使用できないシステム全体が使用できません.SPoF Single Point of Failure、単一の障害による
ソリューション:keepalived heartbeat/corosyncによる高可用性
B)あるRSが使用できない場合
バックエンド・サーバにRSが1台存在しても使用できない場合、DirectorはリクエストをこのRSにスケジューリングし、リクエストが処理されず、サービスが失敗します.
解決策:Directorによって各RSの健康状態に対して検査を行って、失敗する時は無効にして、成功する時は有効にする
ツールにはkeepalived heartbeat/corosync,ldirectordがあります
同時に、バックエンドRS監視状態をスクリプトで監視することもできる
検出方式:(a)ネットワーク層検出、icmp(b)伝送層検出、ポート検出(c)アプリケーション層検出、あるキーリソースRSがすべて使用できないことを要求した場合、back serverまたはsorryserverでユーザーに提示することができる
ここではldirectordソフトウェアとスクリプトによるバックエンドサーバの監視について説明します.
2 ldirectord
ldirectord:LVSデーモンプロセスを監視制御し、LVSルールを管理します.このソフトウェアはipvsがバックエンドサーバの状態を監視できない問題を解決します.プロファイルに設定されたルールに基づいて、サーバ側のアプリケーションが正常であるかどうかを確認するのが原理です.コンフィギュレーションファイルコンフィギュレーションサービスにより、ソフトウェアを起動すると設定されたルールに従ってコンフィギュレーションとモニタリングが行われます.
service ldirectord start
このソフトウェアは、プロファイルのルールに従ってlvsクラスタタイプを作成し、RSサーバを追加し、監視し、バックエンドサービスが失敗した場合、対応するRSを削除し、RSサービスが正常に回復すれば、自動的にRSをスケジューリング計画に追加します.バックエンドがhttpサービスを監視すると、バックエンドサーバが指定したページのキーワードをキャプチャすることで、バックエンドhttpサービスが正常に動作するかどうかを決定します.
.パッケージ名:ldirectord-3.9.6-src 1.1.1.x86_64.rpm、このサービスパッケージはbaseソースにありません.別途ダウンロードする必要があります.依存性があります.ダウンロード後yumでインストールし、依存性を解決します.
・ソフトウェア関連ファイル:
/etc/ha.d/ldirectord.cf
/usr/share/doc/ldirectord-3.9.6/ldirectord.cf
/usr/lib/systemd/system/ldirectord.service
/usr/sbin/ldirectord
/var/log/ldirectord.log
/var/run/ldirectord.ldirectord.pidpid
Ldirectordプロファイルの例
checktimeout=3 # , 3s ,
checkinterval=1 #
autoreload=yes # ,
fallback=127.0.0.1:80 # sorry server, RS ,
logfile=“/var/log/ldirectord.log“#
quiescent=no #down yes 0,no
virtual=5# VS FWM IP:port
real=172.16.0.7:80 gate 2 # gate dr ,2
real=172.16.0.8:80 gate 1
fallback=127.0.0.1:80 gate#sorryserver
service=http
scheduler=wrr #
checktype=negotiate #
checkport=80 # , 。 80 。 http , listen8080 , 80 , 8080 ,
request="index.html" #
receive=“Test Ldirectord" # , 。
例
バックエンドのhttpサービスが正常かどうかを監視し、バックエンドサーバindexをキャプチャする.htmlページのキーワードcentos
cp /usr/share/doc/ldirectord-3.9.6/ldirectord.cf /etc/ha.d/ldirectord.cf
vim /etc/ha.d/ldirectord.cf
virtual=192.168.32.66:80
real=192.168.32.63:80 gate
real=192.168.32.73:80 gate
fallback=127.0.0.1:80 gate
service=http
scheduler=wrr
#persistent=600
#netmask=255.255.255.255
protocol=tcp
checktype=negotiate
checkport=80
request="index.html"
receive="centos"
3自動化スクリプト
スクリプトの使用上の注意事項:
スクリプトのVIP,RIP,RW(重み)モニタポートVPORT,RPORTの変数は、実際の状況に応じて調整する必要があります.
スクリプトはループモニタリングを設定し、次の文を使用してスクリプトを実行することを推奨します.
nohup /PATH/TO/script/monitorRS.sh > /root/RSout.file 2>&1 &
スクリプトのデフォルトは3 sでバックエンドのRSをモニタリングし、この値は実際の状況に応じて調整することができ、コマンドはスクリプトの後にsleep 3.数字3を調整すればいいです.
ワンタッチモニタスクリプトは次のとおりです.
#!/bin/bash
#
#******************************************************************************
#Author: Sunny
#Date: 2017-10-23
#FileName: monitorRS.sh
#version: 1.0
#Your change info:
#Description: For auto monitor RS status
#Copyright(C): 2017 All rights reserved
#*****************************************************************************
echo "This is a script to auto monitor RS status,if you want to run the scirpt ,suggest you to excute cmd below"
echo
echo " nohup /PATH/TO/script/monitorRS.sh > /root/RSout.file 2>&1 & "
echo
echo "If you want to stop the script,you should run two cmds below,first you find the PID,then kill it"
echo
echo "ps -ef | grep monitorRS.sh"
echo "kill -9 PID"
VIP=10.10.10.10
VPORT=80
RS=("192.168.32.63" "192.168.32.73")
RW=("3" "1")
RPORT=80
TYPE=g
LOG=/var/log/monitorRS.log
[ -e /var/log/monitorRS.log ] || touch /var/log/monitorRS.log
addrs() {
ipvsadm -a -t $VIP:$VPORT -r $1:$RPORT -$TYPE -w $2
[ $? -eq 0 ] && return 0 || return 1
}
delrs() {
ipvsadm -d -t $VIP:$VPORT -r $1:$RPORT
[ $? -eq 0 ] && return 0 || return 1
}
while true; do
let COUNT=0
for rip in ${RS[*]}; do
if ipvsadm -Ln | grep "$rip:$RPORT" &> /dev/null ; then
RS_status=online
else
RS_status=offline
fi
if $(curl --connect-timeout 1 http://$rip &>/dev/null) ; then
RS_test=yes
else
RS_test=no
fi
case $RS_test in
yes)
case ${RS_status} in
online)
echo "`date +'%F %H:%M:%S'`, $rip is work nice now." >> $LOG
;;
offline)
addrs $rip ${RW[$COUNT]} &>/dev/null;
addstatus=$?
if [ $? -eq 0 ] && RS_status=online ;
then
echo "`date +'%F %H:%M:%S'`, $rip has been added to work." >> $LOG
else
echo "something wrong when add $rip back to work,please check,maybe your should do it manual"
echo "`date +'%F %H:%M:%S'`, $rip is added failed." >> $LOG
fi
;;
*)
echo "Something wrong when read RS_status"
;;
esac
;;
no)
case ${RS_status} in
online)
delrs $rip &>/dev/null;
[ $? -eq 0 ] && RS_status=offline && echo "`date +'%F %H:%M:%S'`, $rip is out of work,it is delete." >> $LOG
;;
offline)
echo "`date +'%F %H:%M:%S'`,$rip is still out of work" >> $LOG
;;
*)
echo "Something wrong when read RS_status"
;;
esac
;;
*)
echo "Something wrong when read RS_test"
;;
esac
let COUNT++
done
sleep 3
done
4まとめ
本稿では,ツールldirectordと独自に設計したスクリプトを記述してバックエンドのRSをモニタリングするが,モニタリングの方式はいずれもバックエンドRSに対してポーリングアクセスを行い,サーバに一定の圧力を与えるため,使用時に考慮しなければならない.全体的に、LVSを使用してスケジューリングする場合は、バックエンドRSを監視することを推奨します.そうしないと、RSが異常な場合、サービスが使用できなくなります.