Pacemaker/Corosyncを用いた冗長化Zabbix Serverの構築


目次

1. 経緯
2. 前提
 2.1. 論理構成
 2.2. 前提条件
3. 初期設定
4. Zabbixのセットアップ
5. mariaDBのレプリケーション用DBユーザ設定
6. クラスタのセットアップ
 6.1. サービスの停止・自動起動無効化
 6.2. ホスト認証
 6.3. クラスタの作成
 6.4. クラスタのプロパティ設定
7. リソースの設定
 7.1. SV02のStandby移行
 7.2. mariaDB
 7.3. Zabbix-server
 7.4. Apache
 7.5. Virtual IP
 7.6. 起動制約設定
8. Zabbix Agentのconfファイル編集
9. 疎通確認(Zabbix-Server ⇔ Zabbix-Agent)

1. 経緯

先日、表題の通り、Pacemaker/Corosyncを用いた冗長化Zabbix Serverの構築を致しました。
様々な方が同様のミドルウェアにて構築していらっしゃるのですが、ServerとAgentとの疎通までを記載した記事が無かったため、自身の備忘録も兼ねて、こちらに掲載させていただくこととしました。

インフラエンジニアになりたててであり、拙い所が多々あるかと思いますので、コメントにてご指摘頂ければ幸いです。

2. 前提

2.1. 論理構成

以下、構築するサーバの論理構成図を示します。
<正常稼働時>

<フェイルオーバ時>

2.2. 前提条件

・ノードはCent OS7で、ESXi上に構成された2台。
・NICは各ノードに一つ。
・ZabbixはActive-Standby構成。
・MariaDBはMaster-Slave構成。
・Virtual IPにて切り替えを行なう。
・Firewall及びSELinuxは無効。

3. 初期設定

hostsファイルにホスト名を追記します。
【SV01/SV02で実施】

# vi /etc/hosts
----------------------------------------------------------------
127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6

192.168.11.13 SV01  #ノード1のホスト名
192.168.11.14 SV02 #ノード2のホスト名

Pacemaker、Corosync、pcsをインストールします。
加えて、pcsサービスを起動させ、自動起動設定にしておきます。
【SV01/SV02で実施】

# yum -y install pacemaker corosync pcs
# systemctl start pcsd
# systemctl enable pcsd

クラスタ認証用ユーザのパスワードを変更します。
haclusterはCorosyncをインストールした際に自動で追加されるユーザです。
【SV01/SV02で実施】

# passwd hacluster
ユーザー hacluster のパスワードを変更。
新しいパスワード: [任意のパスワード]
新しいパスワードを再入力してください: [任意のパスワード]
passwd: すべての認証トークンが正しく更新できました。

4. Zabbixのセットアップ

【SV01/SV02で実施】
以下のサイトを参考にさせていただき、Zabbixを構築します。

「使ってみよう Zabbix① : インストール編」
https://tech-lab.sios.jp/archives/11864

5. mariaDBのレプリケーション用DBユーザ設定

mariaDBのレプリケーション用ユーザを作成します。
【SV01/SV02で実施】

# systemctl start mariadb
# mysql -uroot
> create user 'repl'@'%' identified by '[任意のパスワード]';
> create user 'repl'@'localhost' identified by '[任意のパスワード]';
> grant replication slave on *.* to 'repl'@'%';
> grant process, super, replication slave, replication client, reload on *.* to 'repl'@'localhost';
> flush privileges;
> quit;

mariaDBのレプリケーション機能を利用するための設定を実施します。
【SV01で実施】

my.cnf
# vi /etc/my.cnf
----------------------------------------------------------------
[mysqld]
log-bin=mariadb-bin #追記
server-id=1 #追記
log-basename=SV01 #追記

【SV02で実施】

my.cnf
# vi /etc/my.cnf
----------------------------------------------------------------
[mysqld]
log-bin=mariadb-bin #追記
server-id=2 #追記
log-basename=SV02 #追記

Master(SV01)のDBデータをSlave(SV02)に移行します。
初めに、Slave(SV02)のDBデータを削除しておきます。
【SV02で実施】

# systemctl stop mariadb
# rm -rf /var/lib/mysql

続いて、Master(SV01)のDBデータをSlave(SV02)にSSH接続でファイル転送します。
【SV01で実施】

# systemctl stop mariadb
# tar cf - -C /var/lib mysql | ssh 192.168.11.14 tar xpf - -C /var/lib
Are you sure you want to continue connectiong (yes/no)? yes
[email protected]'s password:[SV02のrootユーザのパスワード]

6. クラスタのセットアップ

6.1. サービスの停止・自動起動無効化

クラスタのセットアップ前にリソースとして追加するサービスを停止・自動起動無効にしておきます。
【SV01/SV02で実施】

# systemctl stop zabbix-server
# systemctl stop mariadb
# systemctl stop httpd
# systemctl disable zabbix-server
# systemctl disable mariadb
# systemctl disable httpd

6.2. ホスト認証

クラスタに各ホストを認証させます。
【SV01で実施】

# pcs cluster auth SV01 SV02
Username: hacluster
Password: [haclusterのパスワード]
SV01: Authorized
SV02: Authorized

6.3. クラスタの作成

Zabbix用クラスタを作成します。「zabbix_cluster」の箇所は任意です。
【SV01で実施】

# pcs cluster setup --name zabbix_cluster SV01 SV02

クラスタを起動し、自動起動も設定しておきます。
【SV01で実施】

# pcs cluster start --all
# pcs cluster enable --all

6.4. クラスタのプロパティ設定

STONITHを無効化します。
【SV01で実施】

# pcs property set stonith-enabled=false

クォーラム動作の変更。
【SV01で実施】

# pcs property set no-quorum-policy=ignore

自動フェールバックを無効とします。(Warningは無視します)
【SV01で実施】

# pcs resource defaults resource-stickiness=INFINITY
Warning: Defaults do not apply to resources which override them with their own defined values

エラー発生時、即時にフェールオーバするようにします。(Warningは無視します)
【SV01で実施】

# pcs resource defaults migration-threshold=1
Warning: Defaults do not apply to resources which override them with their own defined values

7. リソースの設定

7.1. SV02のStandby移行

SV02のクラスタノード状態を強制的にStandby状態にしておきます。
【SV01で実施】

# pcs cluster standby SV02

7.2. mariaDB

mariaDBをリソースに追加します。
【SV01で実施】

# pcs resource create mariadb \
> ocf:heartbeat:mysql \
> binary=/usr/bin/mysqld_safe \
> datadir=/var/lib/mysql \
> log=/var/log/mariadb/mariadb.log \
> pid=/run/mariadb/mariadb.pid \
> replication_user=repl \
> replication_passwd=[replユーザのパスワード]  \
> op monitor interval=10s timeout=10s

追加したmariaDBのリソースをMaster-Slaveで構成します。
【SV01で実施】

# pcs resource master mariadb-clone mariadb \
> master-max=1 master-node-max=1 clone-max=2 clone-node-max=1 notify=true

優先的にSV01がMasterとして起動するようにしておきます。
スコア値が高いほど優先的に起動する模様です。
-INFINITY<-100<0<100<INFINITY
【SV01で実施】

# pcs constraint location mariadb-clone prefers SV01=100

7.3. Zabbix-server

Zabbix-serverをリソースに追加します。
【SV01で実施】

# pcs resource create zabbix-server \
> systemd:zabbix-server \
> op monitor interval=10s timeout=10s

7.4. Apache

Apacheのstatus.confファイルを作成します。
【SV01/SV02で実施】

status.conf
# vi /etc/httpd/conf.d/status.conf
----------------------------------------------------------------
ExtendedStatus On

<Location /server-status>
    SetHandler server-status
    Require local
</Location>

Apacheをリソースに追加します。
【SV01で実施】

# pcs resource create apache \
> ocf:heartbeat:apache \
> configfile=/etc/httpd/conf/httpd.conf \
> statusurl="http://localhost/server-status" \
> op monitor interval=10s timeout=10s

7.5. Virtual IP

Virtual IPをリソースに追加します。
【SV01で実施】

# pcs resource create vip \
> ocf:heartbeat:IPaddr2 \
> ip=192.168.11.200 \
> cidr_netmask=24 \
> nic=eno16777736 \
> op monitor interval=10s timeout=10s

7.6. 起動制約設定

初めに、設定をし易いようにリソースをグループとしてまとめておきます。
【SV01で実施】

# pcs resource group add zabbix_group vip apache zabbix-server

続いて、各リソースの起動制約を設定します。
【SV01で実施】

# pcs constraint order start zabbix_group then promote mariadb-clone
# pcs constraint colocation add zabbix_group with master mariadb-clone INFINITY
# pcs constraint colocation add master mariadb-clone with zabbix_group INFINITY
# pcs constraint colocation add zabbix-server apache INFINITY
# pcs constraint colocation add zabbix-server vip INFINITY

この時点で、statusコマンドを実行し、下記結果が出力されていることを確認します。
Faild Resource Action等のエラーが出ていれば、各コンフィグファイルや、設定値の見直しをして下さい。

# pcs status
Cluster name: zabbix_cluster
Stack: corosync
Current DC: SV01 (version 1.1.23-1.el7-9acf116022) - partition with quorum
Last updated: Wed Nov 25 18:46:14 2020
Last change: Wed Nov 25 18:35:46 2020 by root via cibadmin on SV01

2 nodes configured
5 resource instances configured

Online: [ SV01 SV02 ]

Full list of resources:

 Master/Slave Set: mariadb-clone [mariadb]
     Masters: [ SV01 ]
     Slaves: [ SV02 ]
 Resource Group: zabbix_group
     vip        (ocf::heartbeat:IPaddr2):       Started SV01
     apache     (ocf::heartbeat:apache):        Started SV01
     zabbix-server      (systemd:zabbix-server):        Started SV01

Daemon Status:
  corosync: active/enabled
  pacemaker: active/enabled
  pcsd: active/enabled

8. Zabbix Agentのconfファイル編集

zabbix_agentd.confファイルを、下記のように書き換えます。
その後、Zabbix Agentサービスを再起動します。
【SV01/SV02で実施】

zabbix_agentd.conf
# vi /etc/zabbix/zabbix_agentd.conf
----------------------------------------------------------------
No.|
98 | Server=192.168.11.13, 192.168.11.14, 192.168.11.200
114| ListenIP=0.0.0.0
139| ServerActive=192.168.11.13, 192.168.11.14, 192.168.11.200
150| # Hostname=Zabbix server
----------------------------------------------------------------
# systemctl restart zabbix-agent

9. 疎通確認(Zabbix-Server ⇔ Zabbix-Agent)

Zabbix ServerのWebUIへアクセスします。
ブラウザに「192.168.11.200/zabbix」と入力し、【Sign in】を押下します。

【設定】→【ホスト】→【ホストの作成】の順に押下します。

「ホスト名」、「表示名」(任意)、「グループ」(任意)、「IPアドレス」の欄に、SV01の情報を入力後、【追加】を押下します。
同様の操作で、SV02も追加しておきます。

この時点では、テンプレートがホストに割り当てられていないため、エージェントの状態はグレーアウトです。

適当にテンプレートを作ってあげます。
【設定】→【テンプレート】→【テンプレートの作成】の順に押下します。

今回は、CPU使用率の監視をしてみることにします。
「テンプレート名」、「表示名」、「グループ名」を埋めた後、【追加】を押下します。

「CPU監視」のテンプレートが作成されていることを確認し、【アプリケーション】を押下します。

【アプリケーションの作成】を押下します。

「名前」の欄を埋めた後、【追加】を押下します。

「アイテム」タブへ移動し、【アイテムの作成】を押下します。

次の表のように設定後、【追加】を押下します。

項目 設定値
名前 CPU使用率
タイプ Zabbixエージェント
キー system.cpu.util[,idle,avg1]
データ型 数値(浮動小数)
アプリケーション CPU

「トリガー」タブに移動し、【トリガーの作成】を押下します。

次の表のように設定後、【追加】を押下します。

項目 設定値
名前 CPU使用率80%超過,{HOST.NAME}
深刻度 重度の障害
条件式 {Template_CPU:system.cpu.util[,idle,avg1].last()}<20

【設定】→【ホスト】→【SV01】の順に押下します。

「テンプレート」タブに移動します。作成した「CPU監視」を追加した後、【追加】→【更新】の順に押下します。

ホスト一覧に戻り、エージェント状態の「ZBX」が緑色で表示されていることが確認できます。

以上で、Pacemaker/Corosyncを用いた冗長化Zabbix Serverの構築が完了です。
監視対象ホストを追加する場合は、Zabbix-Agentを導入した上で、8章に記載した内容でzabbix_agent.confファイルを編集します。