NagiosはDellサーバのハードウェア状態を監視


nagiosモニタdellサーバ
Server:
check_OpenmanageはNagiosのプラグインで、OpenManagement Server Administrator(OMSA)がインストールされているデルのサーバの動作状態(ストレージシステム、電源、温度など)を検出するためにOMSAに基づいて関連する報道情報を取得します.
公式サイト:http://folk.uio.no/trondham/software/check_openmanage.html
最新バージョンのダウンロードリンク:http://folk.uio.no/trondham/software/files/check_openmanage-3.7.12.tar.gz
nagiosは、モニタリング情報の取得のための2つの方法を提供する.
1、nagiosサーバー側check_nrpeはモニタされたcheckを呼び出すOpenmanageは、監視される側にOMSAとcheckをインストールすることによって実現される.openmanage,check_nrpeはサーバのパフォーマンスを消費し、使用を推奨しません.
2、nagiosサーバー側が直接checkを通過するOpenmanageはリモートモニタリングに来ます.この方式では,nagiosサーバ側にperl−net−SNMP,OMSAを実装する.この方法はzabbixのメンテナンスモニタリング環境を使用するのにも適している.
1、perl-net-SNMPを取り付ける
 [root@localhost src]# yum install -y perl-Net-SNMP

2、check_Openmanageインストール
[root@localhost src]# tar zxvf check_openmanage-3.7.12.tar.gz 
[root@localhost src]# cd check_openmanage-3.7.12
[root@localhost check_openmanage-3.7.12]# cp check_openmanage /usr/local/nagios/libexec
[root@localhost check_openmanage-3.7.12]# cd /usr/local/nagios/libexec
[root@localhost libexec]# chown nagios:nagios check_openmanagenew 
[root@localhost libexec]# ./check_openmanage --help 
【    】
-f,--config         #       
-p,--perfdata       #       ,  --only  ,   -d  
-t,--timeout     #   check_openmanage       
-c,--critical       #       critical  
-w,--warning        #       warning  
-F,--fahrenheit     #             
-d,--debug          #         
-h,--help           #   check_openmanage    
-V,--version        #   check_openmanage     
【SNMP  】
-H,--hostname       #   snmp  ,        ip        
-C,--community      #    snmp    ,   public
-P,--protocol       #    snmp     ,   2c
--port               #    snmp    ,   161
-6,--ipv6           #   ipv6  ipv4,   no
--tcp                #   TCP    UDP  ,   no
【    】
-i,--info           #              SN     
-e,--extinfo        #       
-s,--state          #              , warning critical
-S,--short-state    #                , W C
-o,--okinfo         #        (  )
-B,--show-blacklist #          ,            ,    -B          
-I,--htmlinfo       #          html    
【        】
-a,--all            #              
-b,--blacklist component=ID   #    ,         ID     。ID    ./check_openmanage -d    。 -d      
--only               #          
--check component=[0|1],esmlog=[0|1]  #            ,0    ,1   ,    
--no-storage         #        
--vdisk-critical     #                   critical
 
【       】
--postmsg '     '  #               
       ,          
       %m  #     
       %s  #   SN 
       %b  # BIOS  
       %d  # BIOS    
       %o  #       
       %r  #         
       %p  #       
       %l  #       
       %n  #      
       %%  #   %   
 [root@localhost libexec]# ./check_openmanage       "Storage Error",     --no-storage  ,              warning critical     
 [root@localhost libexec]# ./check_openmanage -s                 
 [root@localhost libexec]# ./check_openmanage -s -b ctrl_fw=0     Firmware        
 [root@localhost libexec]# ./check_openmanage -s -b pdisk_cert=all              
 [root@localhost libexec]# ./check_openmanage -b ctrl_fw=0\/pdisk=0:0:1:0       ID 0 Firmware         ID 0:0:1:0           
 [root@localhost libexec]# ./check_openmanage -b ctrl_fw=0\/pdisk=ALL      ID 0 Firmware                   
[root@localhost libexec]# ./check_openmanage -d           
[root@localhost libexec]# ./check_openmanage -i        SN            
[root@localhost libexec]# ./check_openmanage --no-storage        
[root@localhost libexec]# ./check_openmanage -e -b ctrl_fw=0\/pdisk=ALL      Firmware                ,       

3、commandの配置
[root@localhost libexec]# vim /usr/local/nagios/etc/objects/commands.cfg
#      
define command {
    command_name check_storage
    command_line $USER1$/check_openmanage -H $HOSTADDRESS$ --only storage -p -s -b ctrl_fw=0
}
#  cpu
define command {
    command_name check_cpu
    command_line $USER1$/check_openmanage -H $HOSTADDRESS$ --only cpu -p -s -b ctrl_fw=0
}
#    
define command {
    command_name check_memory
    command_line $USER1$/check_openmanage -H $HOSTADDRESS$ --only memory -p -s -b ctrl_fw=0
}
#    
define command {
    command_name check_power
    command_line $USER1$/check_openmanage -H $HOSTADDRESS$ --only power -p -s -b ctrl_fw=0
}
#    
define command {
    command_name check_temp
    command_line $USER1$/check_openmanage -H $HOSTADDRESS$ --only temp -p -s -w $ARG1$ -c $ARG2$ -b ctrl_fw=0
}

--onlyとは、ある項目のみを監視することです.-pは図面を描きます.-sはステータス記述です.-bはブラックリストです.私たちのサーバーのファームウェアのバージョンが低いため、他の監視項目に影響を与えないように、ここでブラックリストに追加して削除します.
4、監視サービスの構成
define service{
    use                     local-service    
    host_name               usvr-131,usvr-119,usvr-70,usvr-71,usvr-72,usvr-73,usvr-82,usvr-83,usvr-84,usvr-85,usvr-86,usvr-87
    service_description     omsa_storage
    check_command           check_storage
    service_groups          dell-openmanage
    notifications_enabled   1  
    }   
define service{
    use                     local-service    
    host_name               usvr-131,usvr-119,usvr-70,usvr-71,usvr-72,usvr-73,usvr-82,usvr-83,usvr-84,usvr-85,usvr-86,usvr-87
    service_description     omsa_cpu
    check_command           check_cpu
    service_groups          dell-openmanage
    notifications_enabled   1  
    }   
define service{
    use                     local-service    
    host_name               usvr-131,usvr-119,usvr-70,usvr-71,usvr-72,usvr-73,usvr-82,usvr-83,usvr-84,usvr-85,usvr-86,usvr-87
    service_description     omsa_memory
    check_command           check_memory
    service_groups          dell-openmanage
    notifications_enabled   1  
    }   
define service{
    use                     local-service    
    host_name               usvr-131,usvr-119,usvr-70,usvr-71,usvr-72,usvr-73,usvr-82,usvr-83,usvr-84,usvr-85,usvr-86,usvr-87
    service_description     omsa_power
    check_command           check_power
    service_groups          dell-openmanage
    notifications_enabled   1  
    }   
define service{
    use                     local-service    
    host_name               usvr-131,usvr-119,usvr-70,usvr-71,usvr-72,usvr-73,usvr-82,usvr-83,usvr-84,usvr-85,usvr-86,usvr-87
    service_description     omsa_temp
    check_command           check_temp!"0=30/15"!"0=40/10"
    service_groups          dell-openmanage
    notifications_enabled   1  
    }

エラー1:
ERROR: You need perl module Net::SNMP to run check_openmanage in SNMP mode
理由:
SNMPモニタモードでcheck_Openmanageではperl-net-SNMPサポートが必要です
ソリューション:
perl-net-SNMPパッケージのインストール
# yum install -y perl-Net-SNMP
エラー2:
ERROR: (SNMP) OpenManage is not installed or is not working correctly
SNMP TABLE ERROR : Requested table is empty or does not exist
理由:
snmpが構成されていないためです.先にsnmpをインストールすると、omsaをインストールするときに自動的にsnmpを構成してくれます
ソリューション:
1、net-snmpをインストールしてからomsa(すなわちsrvadmin-all)をインストールする
or
2、手動構成情報は以下の通りである.
vim/etc/snmp/snmpd.conf
view all included .1    
access notConfigGroup ""any noauth exact all none none
smuxpeer .1.3.6.1.4.1.674.10892.1一般的にsrvadminをインストールすると自動的に追加されます
エラー3:
SNMP CRITICAL: No response from remote host 'X.X.X.X'
理由:
モニタ側にはsnmpサービスがインストールされていません
ソリューション:
snmpサービスのインストール
# yum install -y net-snmpd
Client:
DellサーバのハードウェアモニタリングにはDELLのOMSAをインストールする必要があります.DELL OMSAはDell Openmanage Server Administratorと呼ばれています.デルが独自の研究開発力に基づいて開発したITシステム管理ソリューションです.
nagiosモニタDell linuxシステム
1、snmpサービスのインストール
[root@BETA6 yum.repos.d]# yum -y install net-snmp net-snmp-devel net-snmp-utils

2、dellのyumソースをインストールする
wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash
または
wget -q -O - http://linux.dell.com/repo/hardware/OMSA_7.2/bootstrap.cgi | bash
注意:rhelシステムのみ適用され、CentOSシステムはインストールできません
[root@BETA6 src]# wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash
Cleaning up Everything
Done!
[root@BETA6 src]#

3、dell osmaのインストール
yum -y install OpenIPMI srvadmin-all
または
yum install-y srvadmin-base srvadmin-storageservices推奨、必要なソフトウェアのインストール、速度が速い
[root@BETA6 yum.repos.d]# yum -y install OpenIPMI srvadmin-all
[root@BETA6 yum.repos.d]# /opt/dell/srvadmin/sbin/srvadmin-services.sh start
[root@BETA6 yum.repos.d]# /etc/init.d/dataeng stop
[root@BETA6 yum.repos.d]# /etc/init.d/dataeng start
[root@BETA6 yum.repos.d]# chkconfig dataeng on
  
[root@BETA6 yum.repos.d]# /opt/dell/srvadmin/sbin/srvadmin-services.sh enable    
instsvcdrv     	0:off	1:off	2:on	3:on	4:on	5:on	6:off
dataeng        	0:off	1:off	2:on	3:on	4:on	5:on	6:off
dsm_om_shrsvc  	0:off	1:off	2:on	3:on	4:on	5:on	6:off
ipmi           	0:off	1:off	2:on	3:on	4:on	5:on	6:off
[root@BETA6 yum.repos.d]# /opt/dell/srvadmin/sbin/srvadmin-services.sh status
dell_rbu(module) is running
ipmidriver is running
dsm_sa_datamgrd(pid 1331 1197) is running
dsm_sa_eventmgrd(pid 1381) is running
dsm_sa_snmpd(pid 1440) is running
dsm_om_shrsvcd(pid 1508) is running...
dsm_om_connsvcd(pid 1562) is running...
[root@BETA6 yum.repos.d]# netstat -antlp|grep :1311

このポートがある場合は、srvadminのインストールに成功したことを示します.インストールに問題がある可能性がない場合は、dsm_om_connsvcサービスは、TCPプロトコルの1311ポートを傍受し、httpアクセス機能を提供する.また、インストール後初めて起動用/opt/dell/srvadmin/sbin/srvadmin-services.sh start、そうでない場合service dataeng startで起動すると問題があり、omsaが完全に起動しない可能性があります.dsm_om_connsvcサービスは、TCPプロトコルの1311ポートを傍受し、httpアクセス機能を提供する.
注意:
(1)必ずsnmpサービスをインストールしてからomsaをインストールしてください.これにより、omsaは自動的にあなたのsnmpサービスを構成し、順序が逆になるとエラーを報告する可能性があります.
ERROR: (SNMP) OpenManage is not installed or is not working correctly
これは私たちの/etc/snmp/snmpd.confプロファイルの変更漏れは、主に以下の点である:(修正後は以下の通り)
view  all included   .1
view  systemview  included       .1.3.6.1.2.1.1
view  systemview  included      .1.3.6.1.2.1.25.1.1
access notConfigGroup ""any noauth exact all all none
(2)エラー「SNMP CRITICAL:No response from remote host'X.X.X.X」を報告した場合、被監視側にsnmpサービスがインストールされていないことを示します
4、本機のハードウェア状態を確認する
1)システムの主要部品の温度を確認する
[root@BETA6 yum.repos.d]# /opt/dell/srvadmin/bin/omreport chassis temps
Temperature Probes Information

------------------------------------
Main System Chassis Temperatures: Ok
------------------------------------

Index                     : 0
Status                    : Ok
Probe Name                : System Board Inlet Temp
Reading                   : 27.0 C
Minimum Warning Threshold : 3.0 C
Maximum Warning Threshold : 42.0 C
Minimum Failure Threshold : -7.0 C
Maximum Failure Threshold : 47.0 C
......

2)仮想ハードディスクの状態を確認する
[root@BETA6 yum.repos.d]# /opt/dell/srvadmin/bin/omreport storage vdisk controller=0
Virtual Disk 0 on Controller PERC H710 Mini (Embedded)

Controller PERC H710 Mini (Embedded)
ID                        : 0
Status                    : Ok
Name                      : Virtual Disk 0
State                     : Ready
Hot Spare Policy violated : Not Assigned
Encrypted                 : No
Layout                    : RAID-5
Size                      : 1,675.50 GB (1799054426112 bytes)
Device Name               : /dev/sda
......

3)コントローラ(RAIDカード)の属性を確認する
[root@BETA6 yum.repos.d]# /opt/dell/srvadmin/bin/omreport storage controller
 Controller  PERC H710 Mini (Embedded)

Controllers
ID                                            : 0
Status                                        : Ok
Name                                          : PERC H710 Mini
Slot ID                                       : Embedded
State                                         : Ready
Firmware Version                              : 21.2.0-0007
Latest Available Firmware Version             : Not Applicable
Driver Version                                : 00.00.06.15-rh
Minimum Required Driver Version               : Not Applicable
Storport Driver Version                       : Not Applicable
Minimum Required Storport Driver Version      : Not Applicable
Number of Connectors                          : 2
Rebuild Rate                                  : 30%
......

5、ファイアウォールの配置
SNMPを使用して監視しているので、被監視側でnagiosサーバに対してsnmpポートudp 161をオンにする必要があります.
/sbin/iptables -A INPUT -i em1 -p udp -s 10.10.5.89 --dport 161 -m comment --comment "nagios snmp"-j ACCEPT
OMSAのWindowsサーバへのインストール導入
Dellテクニカルサポートの公式Webサイトにアクセスするには、次の手順に従います.http://www.dell.com/support/home/cn/zh/cnbsd1?c=cn&l=zh&s=bsdi、sn番号によってドライバのオプションバーの中で統一的にラベルの下で対応するバージョンをダウンロードします
Nagios监控Dell服务器硬件状态_第1张图片具体的なインストール手順は、このページを参照してください.http://zh.community.dell.com/techcenter/systems-management/w/wiki/559.omsawindows