NagiosはDellサーバのハードウェア状態を監視
13150 ワード
nagiosモニタdellサーバ
Server:
check_OpenmanageはNagiosのプラグインで、OpenManagement Server Administrator(OMSA)がインストールされているデルのサーバの動作状態(ストレージシステム、電源、温度など)を検出するためにOMSAに基づいて関連する報道情報を取得します.
公式サイト:http://folk.uio.no/trondham/software/check_openmanage.html
最新バージョンのダウンロードリンク:http://folk.uio.no/trondham/software/files/check_openmanage-3.7.12.tar.gz
nagiosは、モニタリング情報の取得のための2つの方法を提供する.
1、nagiosサーバー側check_nrpeはモニタされたcheckを呼び出すOpenmanageは、監視される側にOMSAとcheckをインストールすることによって実現される.openmanage,check_nrpeはサーバのパフォーマンスを消費し、使用を推奨しません.
2、nagiosサーバー側が直接checkを通過するOpenmanageはリモートモニタリングに来ます.この方式では,nagiosサーバ側にperl−net−SNMP,OMSAを実装する.この方法はzabbixのメンテナンスモニタリング環境を使用するのにも適している.
1、perl-net-SNMPを取り付ける
2、check_Openmanageインストール
3、commandの配置
--onlyとは、ある項目のみを監視することです.-pは図面を描きます.-sはステータス記述です.-bはブラックリストです.私たちのサーバーのファームウェアのバージョンが低いため、他の監視項目に影響を与えないように、ここでブラックリストに追加して削除します.
4、監視サービスの構成
エラー1:
ERROR: You need perl module Net::SNMP to run check_openmanage in SNMP mode
理由:
SNMPモニタモードでcheck_Openmanageではperl-net-SNMPサポートが必要です
ソリューション:
perl-net-SNMPパッケージのインストール
# yum install -y perl-Net-SNMP
エラー2:
ERROR: (SNMP) OpenManage is not installed or is not working correctly
SNMP TABLE ERROR : Requested table is empty or does not exist
理由:
snmpが構成されていないためです.先にsnmpをインストールすると、omsaをインストールするときに自動的にsnmpを構成してくれます
ソリューション:
1、net-snmpをインストールしてからomsa(すなわちsrvadmin-all)をインストールする
or
2、手動構成情報は以下の通りである.
vim/etc/snmp/snmpd.conf
view all included .1
access notConfigGroup ""any noauth exact all none none
smuxpeer .1.3.6.1.4.1.674.10892.1一般的にsrvadminをインストールすると自動的に追加されます
エラー3:
SNMP CRITICAL: No response from remote host 'X.X.X.X'
理由:
モニタ側にはsnmpサービスがインストールされていません
ソリューション:
snmpサービスのインストール
# yum install -y net-snmpd
Client:
DellサーバのハードウェアモニタリングにはDELLのOMSAをインストールする必要があります.DELL OMSAはDell Openmanage Server Administratorと呼ばれています.デルが独自の研究開発力に基づいて開発したITシステム管理ソリューションです.
nagiosモニタDell linuxシステム
1、snmpサービスのインストール
2、dellのyumソースをインストールする
wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash
または
wget -q -O - http://linux.dell.com/repo/hardware/OMSA_7.2/bootstrap.cgi | bash
注意:rhelシステムのみ適用され、CentOSシステムはインストールできません
3、dell osmaのインストール
yum -y install OpenIPMI srvadmin-all
または
yum install-y srvadmin-base srvadmin-storageservices推奨、必要なソフトウェアのインストール、速度が速い
このポートがある場合は、srvadminのインストールに成功したことを示します.インストールに問題がある可能性がない場合は、dsm_om_connsvcサービスは、TCPプロトコルの1311ポートを傍受し、httpアクセス機能を提供する.また、インストール後初めて起動用/opt/dell/srvadmin/sbin/srvadmin-services.sh start、そうでない場合service dataeng startで起動すると問題があり、omsaが完全に起動しない可能性があります.dsm_om_connsvcサービスは、TCPプロトコルの1311ポートを傍受し、httpアクセス機能を提供する.
注意:
(1)必ずsnmpサービスをインストールしてからomsaをインストールしてください.これにより、omsaは自動的にあなたのsnmpサービスを構成し、順序が逆になるとエラーを報告する可能性があります.
ERROR: (SNMP) OpenManage is not installed or is not working correctly
これは私たちの/etc/snmp/snmpd.confプロファイルの変更漏れは、主に以下の点である:(修正後は以下の通り)
view all included .1
view systemview included .1.3.6.1.2.1.1
view systemview included .1.3.6.1.2.1.25.1.1
access notConfigGroup ""any noauth exact all all none
(2)エラー「SNMP CRITICAL:No response from remote host'X.X.X.X」を報告した場合、被監視側にsnmpサービスがインストールされていないことを示します
4、本機のハードウェア状態を確認する
1)システムの主要部品の温度を確認する
2)仮想ハードディスクの状態を確認する
3)コントローラ(RAIDカード)の属性を確認する
5、ファイアウォールの配置
SNMPを使用して監視しているので、被監視側でnagiosサーバに対してsnmpポートudp 161をオンにする必要があります.
/sbin/iptables -A INPUT -i em1 -p udp -s 10.10.5.89 --dport 161 -m comment --comment "nagios snmp"-j ACCEPT
OMSAのWindowsサーバへのインストール導入
Dellテクニカルサポートの公式Webサイトにアクセスするには、次の手順に従います.http://www.dell.com/support/home/cn/zh/cnbsd1?c=cn&l=zh&s=bsdi、sn番号によってドライバのオプションバーの中で統一的にラベルの下で対応するバージョンをダウンロードします
具体的なインストール手順は、このページを参照してください.http://zh.community.dell.com/techcenter/systems-management/w/wiki/559.omsawindows
Server:
check_OpenmanageはNagiosのプラグインで、OpenManagement Server Administrator(OMSA)がインストールされているデルのサーバの動作状態(ストレージシステム、電源、温度など)を検出するためにOMSAに基づいて関連する報道情報を取得します.
公式サイト:http://folk.uio.no/trondham/software/check_openmanage.html
最新バージョンのダウンロードリンク:http://folk.uio.no/trondham/software/files/check_openmanage-3.7.12.tar.gz
nagiosは、モニタリング情報の取得のための2つの方法を提供する.
1、nagiosサーバー側check_nrpeはモニタされたcheckを呼び出すOpenmanageは、監視される側にOMSAとcheckをインストールすることによって実現される.openmanage,check_nrpeはサーバのパフォーマンスを消費し、使用を推奨しません.
2、nagiosサーバー側が直接checkを通過するOpenmanageはリモートモニタリングに来ます.この方式では,nagiosサーバ側にperl−net−SNMP,OMSAを実装する.この方法はzabbixのメンテナンスモニタリング環境を使用するのにも適している.
1、perl-net-SNMPを取り付ける
[root@localhost src]# yum install -y perl-Net-SNMP
2、check_Openmanageインストール
[root@localhost src]# tar zxvf check_openmanage-3.7.12.tar.gz
[root@localhost src]# cd check_openmanage-3.7.12
[root@localhost check_openmanage-3.7.12]# cp check_openmanage /usr/local/nagios/libexec
[root@localhost check_openmanage-3.7.12]# cd /usr/local/nagios/libexec
[root@localhost libexec]# chown nagios:nagios check_openmanagenew
[root@localhost libexec]# ./check_openmanage --help
【 】
-f,--config #
-p,--perfdata # , --only , -d
-t,--timeout # check_openmanage
-c,--critical # critical
-w,--warning # warning
-F,--fahrenheit #
-d,--debug #
-h,--help # check_openmanage
-V,--version # check_openmanage
【SNMP 】
-H,--hostname # snmp , ip
-C,--community # snmp , public
-P,--protocol # snmp , 2c
--port # snmp , 161
-6,--ipv6 # ipv6 ipv4, no
--tcp # TCP UDP , no
【 】
-i,--info # SN
-e,--extinfo #
-s,--state # , warning critical
-S,--short-state # , W C
-o,--okinfo # ( )
-B,--show-blacklist # , , -B
-I,--htmlinfo # html
【 】
-a,--all #
-b,--blacklist component=ID # , ID 。ID ./check_openmanage -d 。 -d
--only #
--check component=[0|1],esmlog=[0|1] # ,0 ,1 ,
--no-storage #
--vdisk-critical # critical
【 】
--postmsg ' ' #
,
%m #
%s # SN
%b # BIOS
%d # BIOS
%o #
%r #
%p #
%l #
%n #
%% # %
[root@localhost libexec]# ./check_openmanage "Storage Error", --no-storage , warning critical
[root@localhost libexec]# ./check_openmanage -s
[root@localhost libexec]# ./check_openmanage -s -b ctrl_fw=0 Firmware
[root@localhost libexec]# ./check_openmanage -s -b pdisk_cert=all
[root@localhost libexec]# ./check_openmanage -b ctrl_fw=0\/pdisk=0:0:1:0 ID 0 Firmware ID 0:0:1:0
[root@localhost libexec]# ./check_openmanage -b ctrl_fw=0\/pdisk=ALL ID 0 Firmware
[root@localhost libexec]# ./check_openmanage -d
[root@localhost libexec]# ./check_openmanage -i SN
[root@localhost libexec]# ./check_openmanage --no-storage
[root@localhost libexec]# ./check_openmanage -e -b ctrl_fw=0\/pdisk=ALL Firmware ,
3、commandの配置
[root@localhost libexec]# vim /usr/local/nagios/etc/objects/commands.cfg
#
define command {
command_name check_storage
command_line $USER1$/check_openmanage -H $HOSTADDRESS$ --only storage -p -s -b ctrl_fw=0
}
# cpu
define command {
command_name check_cpu
command_line $USER1$/check_openmanage -H $HOSTADDRESS$ --only cpu -p -s -b ctrl_fw=0
}
#
define command {
command_name check_memory
command_line $USER1$/check_openmanage -H $HOSTADDRESS$ --only memory -p -s -b ctrl_fw=0
}
#
define command {
command_name check_power
command_line $USER1$/check_openmanage -H $HOSTADDRESS$ --only power -p -s -b ctrl_fw=0
}
#
define command {
command_name check_temp
command_line $USER1$/check_openmanage -H $HOSTADDRESS$ --only temp -p -s -w $ARG1$ -c $ARG2$ -b ctrl_fw=0
}
--onlyとは、ある項目のみを監視することです.-pは図面を描きます.-sはステータス記述です.-bはブラックリストです.私たちのサーバーのファームウェアのバージョンが低いため、他の監視項目に影響を与えないように、ここでブラックリストに追加して削除します.
4、監視サービスの構成
define service{
use local-service
host_name usvr-131,usvr-119,usvr-70,usvr-71,usvr-72,usvr-73,usvr-82,usvr-83,usvr-84,usvr-85,usvr-86,usvr-87
service_description omsa_storage
check_command check_storage
service_groups dell-openmanage
notifications_enabled 1
}
define service{
use local-service
host_name usvr-131,usvr-119,usvr-70,usvr-71,usvr-72,usvr-73,usvr-82,usvr-83,usvr-84,usvr-85,usvr-86,usvr-87
service_description omsa_cpu
check_command check_cpu
service_groups dell-openmanage
notifications_enabled 1
}
define service{
use local-service
host_name usvr-131,usvr-119,usvr-70,usvr-71,usvr-72,usvr-73,usvr-82,usvr-83,usvr-84,usvr-85,usvr-86,usvr-87
service_description omsa_memory
check_command check_memory
service_groups dell-openmanage
notifications_enabled 1
}
define service{
use local-service
host_name usvr-131,usvr-119,usvr-70,usvr-71,usvr-72,usvr-73,usvr-82,usvr-83,usvr-84,usvr-85,usvr-86,usvr-87
service_description omsa_power
check_command check_power
service_groups dell-openmanage
notifications_enabled 1
}
define service{
use local-service
host_name usvr-131,usvr-119,usvr-70,usvr-71,usvr-72,usvr-73,usvr-82,usvr-83,usvr-84,usvr-85,usvr-86,usvr-87
service_description omsa_temp
check_command check_temp!"0=30/15"!"0=40/10"
service_groups dell-openmanage
notifications_enabled 1
}
エラー1:
ERROR: You need perl module Net::SNMP to run check_openmanage in SNMP mode
理由:
SNMPモニタモードでcheck_Openmanageではperl-net-SNMPサポートが必要です
ソリューション:
perl-net-SNMPパッケージのインストール
# yum install -y perl-Net-SNMP
エラー2:
ERROR: (SNMP) OpenManage is not installed or is not working correctly
SNMP TABLE ERROR : Requested table is empty or does not exist
理由:
snmpが構成されていないためです.先にsnmpをインストールすると、omsaをインストールするときに自動的にsnmpを構成してくれます
ソリューション:
1、net-snmpをインストールしてからomsa(すなわちsrvadmin-all)をインストールする
or
2、手動構成情報は以下の通りである.
vim/etc/snmp/snmpd.conf
view all included .1
access notConfigGroup ""any noauth exact all none none
smuxpeer .1.3.6.1.4.1.674.10892.1一般的にsrvadminをインストールすると自動的に追加されます
エラー3:
SNMP CRITICAL: No response from remote host 'X.X.X.X'
理由:
モニタ側にはsnmpサービスがインストールされていません
ソリューション:
snmpサービスのインストール
# yum install -y net-snmpd
Client:
DellサーバのハードウェアモニタリングにはDELLのOMSAをインストールする必要があります.DELL OMSAはDell Openmanage Server Administratorと呼ばれています.デルが独自の研究開発力に基づいて開発したITシステム管理ソリューションです.
nagiosモニタDell linuxシステム
1、snmpサービスのインストール
[root@BETA6 yum.repos.d]# yum -y install net-snmp net-snmp-devel net-snmp-utils
2、dellのyumソースをインストールする
wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash
または
wget -q -O - http://linux.dell.com/repo/hardware/OMSA_7.2/bootstrap.cgi | bash
注意:rhelシステムのみ適用され、CentOSシステムはインストールできません
[root@BETA6 src]# wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash
Cleaning up Everything
Done!
[root@BETA6 src]#
3、dell osmaのインストール
yum -y install OpenIPMI srvadmin-all
または
yum install-y srvadmin-base srvadmin-storageservices推奨、必要なソフトウェアのインストール、速度が速い
[root@BETA6 yum.repos.d]# yum -y install OpenIPMI srvadmin-all
[root@BETA6 yum.repos.d]# /opt/dell/srvadmin/sbin/srvadmin-services.sh start
[root@BETA6 yum.repos.d]# /etc/init.d/dataeng stop
[root@BETA6 yum.repos.d]# /etc/init.d/dataeng start
[root@BETA6 yum.repos.d]# chkconfig dataeng on
[root@BETA6 yum.repos.d]# /opt/dell/srvadmin/sbin/srvadmin-services.sh enable
instsvcdrv 0:off 1:off 2:on 3:on 4:on 5:on 6:off
dataeng 0:off 1:off 2:on 3:on 4:on 5:on 6:off
dsm_om_shrsvc 0:off 1:off 2:on 3:on 4:on 5:on 6:off
ipmi 0:off 1:off 2:on 3:on 4:on 5:on 6:off
[root@BETA6 yum.repos.d]# /opt/dell/srvadmin/sbin/srvadmin-services.sh status
dell_rbu(module) is running
ipmidriver is running
dsm_sa_datamgrd(pid 1331 1197) is running
dsm_sa_eventmgrd(pid 1381) is running
dsm_sa_snmpd(pid 1440) is running
dsm_om_shrsvcd(pid 1508) is running...
dsm_om_connsvcd(pid 1562) is running...
[root@BETA6 yum.repos.d]# netstat -antlp|grep :1311
このポートがある場合は、srvadminのインストールに成功したことを示します.インストールに問題がある可能性がない場合は、dsm_om_connsvcサービスは、TCPプロトコルの1311ポートを傍受し、httpアクセス機能を提供する.また、インストール後初めて起動用/opt/dell/srvadmin/sbin/srvadmin-services.sh start、そうでない場合service dataeng startで起動すると問題があり、omsaが完全に起動しない可能性があります.dsm_om_connsvcサービスは、TCPプロトコルの1311ポートを傍受し、httpアクセス機能を提供する.
注意:
(1)必ずsnmpサービスをインストールしてからomsaをインストールしてください.これにより、omsaは自動的にあなたのsnmpサービスを構成し、順序が逆になるとエラーを報告する可能性があります.
ERROR: (SNMP) OpenManage is not installed or is not working correctly
これは私たちの/etc/snmp/snmpd.confプロファイルの変更漏れは、主に以下の点である:(修正後は以下の通り)
view all included .1
view systemview included .1.3.6.1.2.1.1
view systemview included .1.3.6.1.2.1.25.1.1
access notConfigGroup ""any noauth exact all all none
(2)エラー「SNMP CRITICAL:No response from remote host'X.X.X.X」を報告した場合、被監視側にsnmpサービスがインストールされていないことを示します
4、本機のハードウェア状態を確認する
1)システムの主要部品の温度を確認する
[root@BETA6 yum.repos.d]# /opt/dell/srvadmin/bin/omreport chassis temps
Temperature Probes Information
------------------------------------
Main System Chassis Temperatures: Ok
------------------------------------
Index : 0
Status : Ok
Probe Name : System Board Inlet Temp
Reading : 27.0 C
Minimum Warning Threshold : 3.0 C
Maximum Warning Threshold : 42.0 C
Minimum Failure Threshold : -7.0 C
Maximum Failure Threshold : 47.0 C
......
2)仮想ハードディスクの状態を確認する
[root@BETA6 yum.repos.d]# /opt/dell/srvadmin/bin/omreport storage vdisk controller=0
Virtual Disk 0 on Controller PERC H710 Mini (Embedded)
Controller PERC H710 Mini (Embedded)
ID : 0
Status : Ok
Name : Virtual Disk 0
State : Ready
Hot Spare Policy violated : Not Assigned
Encrypted : No
Layout : RAID-5
Size : 1,675.50 GB (1799054426112 bytes)
Device Name : /dev/sda
......
3)コントローラ(RAIDカード)の属性を確認する
[root@BETA6 yum.repos.d]# /opt/dell/srvadmin/bin/omreport storage controller
Controller PERC H710 Mini (Embedded)
Controllers
ID : 0
Status : Ok
Name : PERC H710 Mini
Slot ID : Embedded
State : Ready
Firmware Version : 21.2.0-0007
Latest Available Firmware Version : Not Applicable
Driver Version : 00.00.06.15-rh
Minimum Required Driver Version : Not Applicable
Storport Driver Version : Not Applicable
Minimum Required Storport Driver Version : Not Applicable
Number of Connectors : 2
Rebuild Rate : 30%
......
5、ファイアウォールの配置
SNMPを使用して監視しているので、被監視側でnagiosサーバに対してsnmpポートudp 161をオンにする必要があります.
/sbin/iptables -A INPUT -i em1 -p udp -s 10.10.5.89 --dport 161 -m comment --comment "nagios snmp"-j ACCEPT
OMSAのWindowsサーバへのインストール導入
Dellテクニカルサポートの公式Webサイトにアクセスするには、次の手順に従います.http://www.dell.com/support/home/cn/zh/cnbsd1?c=cn&l=zh&s=bsdi、sn番号によってドライバのオプションバーの中で統一的にラベルの下で対応するバージョンをダウンロードします
具体的なインストール手順は、このページを参照してください.http://zh.community.dell.com/techcenter/systems-management/w/wiki/559.omsawindows