OpsRamp 監視エージェントのWatchdog機能


2021年OpsRampアドベントカレンダー12月3日分の投稿です。

概要

OpsRampの監視エージェントをインストールすると"opsramp-agent"と"opsramp-shield"の2つのプロセスが起動します。これはWindowsとLinuxで共通です。Version 8.0から"opsramp-shield"が追加されて、監視エージェント本体である"opsramp-agent"の稼働監視をするようになってます。なお、クライアント(OpsRamp用語でクライアント≒テナント)ごとに有効にする必要があり、デフォルトでは無効になってました。

それではWatchdog機能が本当に動作するのか確認してみます。

試験結果

Windows

  • プロセスを強制停止した場合

Process Explorerを起動して"opsramp-agent.exe"を強制停止します

"OK"をクリック

"opsramp-agent.exe"が停止していることを確認しました。

2分位経過すると自動で起動してきました。

  • サービスを手動停止した場合

サービスの管理ウインドウで"opsramp-agent"を手動で停止してみます

停止しました(状態がブランクになってます)

こちらも2分ほど経過すると自動で起動してきました。

  
と、いうことでまずはWindowsで正常に動作することが確認できました。
Windowsの場合、サービスの設定でエラーが発生した場合に再起動するとか設定できるのでそちらもで良いような気がします。また、何かメンテナンス作業中に監視を一時停止したい場合には"opsramp-shield"も一緒に停止しないと勝手に起動してくるので注意が必要です。
  
  

Linux

"opsramp-agent"のプロセスIDを確認します

"opsramp-agent"をkillします

プロセスIDが"9479"となって自動起動しています

と、いうことでLinuxでも正常に動作していることが分かりました。

opsramp-shieldの実行周期

だいたい1~2分で検知しているようですが、実際どうなのかWindowsで確認してみました。
結果は下のキャプチャのとおり、"opsramp-shield.exe"が1分周期で実行されていることが分かりました。

おわり。