Linux学習ノート13
9571 ワード
Linux学習ノート13
Nagiosの構成
基本的な紹介
オープンソースソフトウェアで、ネットワークデバイスのネットワークトラフィック、Linux/windowsホストの状態を監視したり、プリンタを監視したりすることができます.
Linuxまたはwindowsで実行できます
ブラウザベースのWebインタフェースは、メンテナンス担当者が監視項目のステータスを表示するのに便利です.
Webインタフェースの構成、管理操作をサポート
メール、メール通知のサポート
カスタムスクリプトによるカスタム化モニタリング
Nagios公式サイトhttp://www.nagios.org/
Nagiosインストール-サービス側
サービス側
yum install -y httpd nagios nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe
nagiosバックグラウンドにログインするユーザーとパスワードの設定:
htpasswd -c /etc/nagios/passwd nagiosadmin
プロファイル:vim /etc/nagios/nagios.cfg
、デフォルトのままにしておきます.検出プロファイル:
nagios -v /etc/nagios/nagios.cfg
次のように表示されます.Total Warnings: 0
Total Errors: 0
起動サービス:
service httpd start; service nagios start
ブラウザアクセス:http://ip/nagios
アカウントは:nagiosadmin
、パスワードは:あなたが設定したNagiosインストール-クライアント
クライアント
rpm -ivh http://www.lishiming.net/data/attachment/forum/month_1211/epel-release-6-7.noarch.rpm
yum install -y nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe
vim /etc/nagios/nrpe.cfg
見つかった
allowed_hosts=127.0.0.1
変更allowed_hosts=127.0.0.1,172.21.96.98
後のipはサービス側ip見つかった
dont_blame_nrpe=0
改称dont_blame_nrpe=1
クライアント起動service nrpe start
監視センタ監視対象ホストの追加
サービス側
vim /etc/nagios/conf.d/nagios1.cfg
構成テンプレート:
define host{
use linux-server
host_name ( )
alias ( )
address IP
}
define service{
use generic-service
host_name ( )
service_description check_ping
check_command check_ping!100.0,20%!200.0,50%
max_check_attempts 5
normal_check_interval 1
}
define service{
use generic-service
host_name ( )
service_description check_ssh
check_command check_ssh
max_check_attempts 5
normal_check_interval 1
}
define service{
use generic-service
host_name ( )
service_description check_http
check_command check_http
max_check_attempts 5
normal_check_interval 1
}
プロファイルの簡単な説明
プロファイルには、3つのサービス:ssh、ping、httpの3つのプロジェクトがローカルのnagiosツールを使用してリモートマシンに接続されていることが監視されています.つまり、クライアントがnagios-pluginsおよびnrpeをインストールしていなくても監視できます.負荷、ディスク使用などの他のサービスでは、nrpeを介してサービス側がリモートホストに接続して情報を取得する必要があるため、リモートホストにnrpeサービスをインストールし、対応する実行スクリプト(nagios-plugins)をインストールする必要があります.
max_check_attempts 5#nagiosで問題が検出された場合、合計5回検出を試みても問題が発生しなければ警告しません.この数値が1の場合、問題が検出されたらすぐに警告します.
normal_check_interval 1#再検出の間隔、単位は分、デフォルトは3分
notification_interval 60#サービスに異常が発生した後、障害は解決されず、nagiosが再び利用者に通知した時間.単位は分です.すべてのイベントが1回の通知で十分だと思う場合は、ここのオプションを0に設定します.
サービス側がnrpeでリモートホストに接続して情報を取得するサービスを追加し続ける
サービス側
vim /etc/nagios/objects/commands.cfg
追加:
define command{
command_name check_nrpe
command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
}
PS:クライアントは必ず
service nrpe start
サービスを開始する.作成したばかりのモニタホストプロファイルの編集を続行
vim /etc/nagios/conf.d/nagios1.cfg
構成テンプレート:define service{
use generic-service
host_name switch_client1
service_description check_load
check_command check_nrpe!check_load
max_check_attempts 5
normal_check_interval 1
}
define service{
use generic-service
host_name switch_client1
service_description check_disk_hda1
check_command check_nrpe!check_hda1
max_check_attempts 5
normal_check_interval 1
}
define service{
use generic-service
host_name switch_client1
service_description check_disk_hda2
check_command check_nrpe!check_hda2
max_check_attempts 5
normal_check_interval 1
}
PS:構成完了後使用
nagios -v /etc/nagios/nagios.cfg
構成が正しいかどうかを検出します.構成の説明
check_nrpe!check_load
:ここのcheck_nrpe
はcommands.cfg
定義したばかり、check_loadはリモートホスト上の検出スクリプトですリモートホスト上
vim /etc/nagios/nrpe.cfg
検索check_load
この行がサービス側で実行するスクリプトです.このスクリプトは手動で実行できますcheck_hda1
変更:/dev/hda1
変更/dev/sda1
もう1行加えるcommand[check_hda2]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% -p /dev/sda2
クライアントでnrpeサービスを再起動:
service nrpe restart
サービス側もnagiosサービスを再起動:service nagios restart
PS:表示出现(Return code of 255 is out of bounds)
错误提示,现在解决不能,后面遇到再办法.メールアラートの設定
vim /etc/nagios/objects/contacts.cfg
次のコードを追加します.
define contact{
contact_name switch
use generic-contact
alias switch
email [email protected]
}
最も重要なのはemailというパラメータです
定義されたサービスについては、ここでアラートポリシーを定義できます.
vim /etc/nagios/objects/templates.cfg
検索
generic-service
このファイルには、次のような重要なパラメータを持つ多くの監視アラートポリシーが定義されています.>notifications_enabled
:アラーム機能をオンにしているか.1はオン、0はオフです.一般的に、このオプションはメインプロファイルnagios.cfg
で定義され、効果は同じです.notification_interval
:アラームメッセージを繰り返し送信する最短間隔を示す.デフォルトの間隔は60分です.この値が0に設定されている場合、重複アラートは送信されません.notification_period
:アラーム送信期間.非常に重要なホスト(サービス)は、7と定義されています.×24は1日24時間ヒントを表示します.一般的なホスト(サービス)は勤務時間として定義されます.定義された期間内でなければ、どんな問題が発生しても、アラートは送信されません.notification_options
:このパラメータは、送信アラートが含む場合を定義している:d=状態がDOWN
、u=状態がUNREACHABLE
、r=状態回復がOK
、f=flapping
.n=アラートは送信されません.メール送信にはメールサービスのインストールが必要
yum install -y sendmail
nagiosサービスの再起動:service nagios restart
Zabbixの構成
基本的な紹介
Webベースのオープンソースソフトウェアでは、オープンソース監視システムの状態もネットワークデバイスを監視することができます.
nagiosとは異なりzabbixは取得したデータをデータベースに保存するのでzabbixはデータベースサポートが必要です
Zabbixはホストとネットワークデバイスを自動的に発見することもできます
メールとメールの警告をサポート
Zabbixのほとんどの構成はwebインタフェースの構成で公式サイトを完成することができますhttp://www.zabbix.com/
zabbixのインストール
rpm -ivh http://www.lishiming.net/data/attachment/forum/month_1211/epel-release-6-7.noarch.rpm
rpmパッケージをインストールするlamp環境:
yum install -y httpd mysql mysql-libs php php-mysql mysql-server php-bcmath php-gd php-mbstring
zabbixサービスのインストール:
yum install zabbix20 zabbix20-agent zabbix20-server zabbix20-server-mysql zabbix20-web zabbix20-web-mysql net-snmp-devel
service zabbix-server start; service zabbix-agent start
service httpd start; service mysqld start
mysql -uroot -p -e "create database zabbix"
mysql -uroot -p --default-character-set=utf8 zabbix < /usr/share/zabbix-mysql/schema.sql
mysql -uroot -p --default-character-set=utf8 zabbix < /usr/share/zabbix-mysql/images.sql
mysql -uroot -p --default-character-set=utf8 zabbix < /usr/share/zabbix-mysql/data.sql
service httpd restart
Webページのインストールzabbix
ブラウザアクセスhttp://ip/zabbix、デフォルトは
"It is not safe to rely on the system‘s timezone settings..." ,
vim/etc/phpです.ini
date.timezone="Asia/shanghai"`点next関連するエラーメッセージを解決し、ポイントretry(プロファイルで解決
vim /etc/php.ini
)PS:プロファイルの修正はサービス再開が望ましい
service httpd restart
mysqlに関する情報を入力して、まずテストして、もし合格しないならば、デバッグして、テストに合格した後に、nextをクリックしますPS:もし
mysql_connect(): Can't connect to local MySQL server through socket '/var/lib/mysql/mysql.sock'
というエラーメッセージが出た場合は、sockパスが異なることを示し、その場合はソフトリンクで解決できる:mkdir /var/lib/mysql; ln /tmp/mysql.sock /var/lib/mysql/mysql.sock
Name書き込みSwitch
、(カスタマイズ可能)点next、さらに点next、最後点finishデフォルト管理者アカウント:パスワードは
admin:zabbix
このとき"zabbix server is not running"
というエラーが発生しますが、編集する必要がありますvim /etc/zabbix/zabbix_server.conf
、DBUser、DBPasswordを構成します.これはデータベースのユーザー名とパスワードを構成することに相当します.PS:その理由は、ユーザー名とパスワードを記入していないため、エラーがあれば
vim /etc/zabbix/zabbix_server.conf
ログファイルを確認してください.PS:zabbixは中国語対応で検索できます.
監視するホストへのアクセス
クライアント上
yum install zabbix20-agent
vim /etc/zabbix_agentd.conf
サーバの変更=サービス側ip;
ServerActive=0.0.0.0:10050; Hostname=switch
(カスタムですが、一意に)クライアント起動
service zabbix-agent start
サービス側コマンドラインテスト:zabbix_get -s IP -p10050 -k "system.hostname"
Webインタフェースの下で、ポイント「configuration」->「hosts」->右上隅ポイント「Create Host」ここでhost name、visible nameはカスタマイズされ、groupsを選択できます.ここではデフォルトで、ip addressはクライアントipに書き込まれます.
モニタリングプロジェクトテンプレートの構成:「templates」、「点add」、ポップアップウィンドウで「Template OS Linux」を選択し、「select」、「最後のsave」をクリックします.
PS:ホスト名の変更
hostname
参考『阿銘とLinuxを学ぶ』