Freeware und Plugins

Freewaregruppe Monitoring/Nagios-Plugins

check_arcconf.pl

Linux-Plugin: Prüft den Zustand von Adaptec Raid Controllern

Beschreibung

check_arcconf.pl ist ein Linux-Plugin für Nagios, welches den Zustand von Adaptec Raid Controllern überprüft (kann auch für ICP Vortex bzw. PMC-Controller verwendet werden).
Das Plugin ermittelt den Zustand von Raid-Verbunden, vom Raid-Controller und von einzelnen Platten (S.M.A.R.T), dabei werden alle Stripe-Typen unterstützt.

Voraussetzungen

Das Adaptec Commandline Tool ist installiert (arcconf.pl).

Dokumentation

Aufgerufen wird das Script normalerweise immer mit Pfadangabe zum CLI:

# check_arcconf.pl path=<path_to_adaptec_cli>

Zu Debuggingzwecken kann es aber auch mit einer ausführlicheren Ausgabeoption aufgerufen werden (dieser Modus eignet sich nicht für den Dauerbetrieb, sondern dient nur Testzwecken!).
Es werden dann detailliert die Stati der einzelnen Komponenten ausgegeben:

OMD[le]:~$ local/lib/nagios/plugins/check_arcconf.pl debug

Path: /usr/StorMan/arcconf
 Args: getconfig 1 al
 Timeout: 15

 Controllers found: 1
 ----------------------------------------------------------------------
 Controller information
 ----------------------------------------------------------------------
   Controller Status                       : Optimal
   Channel description                     : SAS/SATA
   Controller Model                         : Adaptec 6405E
   Controller Serial Number                 : 12345678901
   Physical Slot                           : 3
   Temperature                             : 60 C/ 140 F (Normal)
   Installed memory                         : 128 MB
   Copyback                                 : Disabled
   Background consistency check             : Disabled
   Automatic Failover                       : Enabled
   Global task priority                     : High
   Performance Mode                         : Default/Dynamic
   Stayawake period                         : Disabled
   Spinup limit internal drives             : 0
   Spinup limit external drives             : 0
   Defunct disk drive count                : 0
   Logical devices/Failed/Degraded         : 1/0/0
   NCQ status                               : Enabled
   Statistics data collection mode         : Enabled
   --------------------------------------------------------
   Controller Version Information
   --------------------------------------------------------
   BIOS                                     : 5.2-0 (19109)
   Firmware                                 : 5.2-0 (19109)
   Driver                                   : 7.1-0 (30034)
   Boot Flash                               : 5.2-0 (19109)

 ----------------------------------------------------------------------
 Logical device information
 ----------------------------------------------------------------------
 Logical device number 0
   Logical device name                     : RAID1
   RAID level                               : 1
   Status of logical device                 : Optimal
   Size                                     : 953334 MB
   Read-cache setting                      : Enabled
   Read-cache status                       : On
   Write-cache setting                     : Enabled
   Write-cache status                       : On
   Partitioned                             : Yes
   Protected by Hot-Spare                  : No
   Bootable                                 : Yes
   Failed stripes                           : No
   Power settings                           : Disabled
   --------------------------------------------------------
   Logical device segment information
   --------------------------------------------------------
   Segment 0                               : Present (Controller:1,Connector:0,Device:0)             
ABCABC

   Segment 1                               : Present (Controller:1,Connector:0,Device:1)             
ABCDAB

 ----------------------------------------------------------------------
 Physical Device information
 ----------------------------------------------------------------------
       Device #0
         Device is a Hard drive
         State                             : Online
         Supported                         : Yes
         Transfer Speed                     : SATA 6.0 Gb/s
         Reported Channel,Device(T:L)       : 0,0(0:0)
         Reported Location                 : Connector 0, Device 0
         Vendor                             :
         Model                             : ST1000NM0011
         Firmware                           : SN03
         Serial number                     : ABCABC
         Reserved Size                     : 538264 KB
         Used Size                         : 953344 MB
         Unused Size                       : 64 KB
         Total Size                         : 953869 MB
         Write Cache                      : Enabled (write-back)
         FRU                               : None
         S.M.A.R.T.                         : No
         S.M.A.R.T. warnings               : 0
         Power State                       : Full rpm
         Supported Power States             : Full rpm,Powered off
         SSD                               : No
         NCQ status                         : Enabled
       Device #1
         Device is a Hard drive
         State                             : Online
         Supported                         : Yes
         Transfer Speed                     : SATA 6.0 Gb/s
         Reported Channel,Device(T:L)       : 0,1(1:0)
         Reported Location                  : Connector 0, Device 1
         Vendor                             :
         Model                             : ST1000NM0011
         Firmware                           : SN03
         Serial number                     : ABCDAB
         Reserved Size                     : 538264 KB
         Used Size                         : 953344 MB
         Unused Size                       : 64 KB
         Total Size                         : 953869 MB
         Write Cache                      : Enabled (write-back)
         FRU                               : None
         S.M.A.R.T.                         : No
         S.M.A.R.T. warnings               : 0
         Power State                       : Full rpm
         Supported Power States             : Full rpm,Powered off
         SSD                               : No
         NCQ status                         : Enabled

 Command completed successfully.

RAID OK: Ctrl: Adaptec 6405E - Slot: 3 (Optimal) - Drive: RAID1 [RAID1] (Optimal) - Disk: Device #0 (Online) - SMART: No - Disk: Device #1 (Online) - SMART: No

Installation

Vorzugsweise wird das Plugin in das Skriptverzeichnis kopiert, in dem man seine Prüfskripte unter Windows ablegt.

Bei Einsatz von NRPE wird in der Initialisierungsdatei (bspw. nrpe.cfg) ein Eintrag ähnlich diesem erzeugt, der auf das Adaptec Commandline Tool verweist:

...
[check_arcconf.pl]=/usr/local/nagios/libexec/check_arcconf.pl –-path /usr/local/StorMan/arcconf.pl
...

Beispiele

Prüfung ICP-Controller, alles in Ordnung:

OMD[le]:~$ local/lib/nagios/plugins/check_arcconf.pl

RAID OK: Ctrl: ICP 5405 - Slot: 4 (Optimal) - Drive: RAID10 [RAID10] (Optimal) - Disk: Device #0 (Online) - SMART: No - Disk: Device #1 (Online) - SMART: No - Disk: Device #2 (Online) - SMART: No - Disk: Device #3 (Online) - SMART: No

Defekte Platte wurde ausgetauscht:

OMD[le]:~$ local/lib/nagios/plugins/check_arcconf.pl

RAID WARNING: Ctrl: Adaptec 6405 - Slot: 4 (Warning) - Drive: RAID10 [RAID10] (Warning) - Disk: Device #0 (Rebuilding 65%) - SMART: No - Disk: Device #1 (Online) - SMART: No - Disk: Device #2 (Online) - SMART: No - Disk: Device #3 (Online) - SMART: No

Störung eines der Raidverbunde nach Smart-Errors der HDD 1 und anschl. Ausfall derselben:

OMD[le]:~$ local/lib/nagios/plugins/check_arcconf.pl

RAID CRITICAL: Ctrl: Adaptec 6445 - Slot: 6 (Optimal) - Drive: RAID-1 [RAID1] (Optimal) - Drive: RAID-0 [RAIDSimple_volume] (Optimal) - Drive: RAID-5 [RAID5] (Failed) - Disk: Device #0 (Online) - SMART: No - Disk: Device #1 (Offline) - SMART: Yes - Disk: Device #2 (Online) - SMART: No - Disk: Device #3 (Online) - SMART: No - Disk: Device #4 (Online) - SMART: No - Disk: Device #5 (Online) - SMART: No

Changelog

2019-06-16
Bugfix Release

2018-17-02
1.5 – Handling for devices in mode Raw (Pass Through)

2016-23-07
1.41 – more features (new controllers)

2015-10-09
1.4 – more features (dedicated Hot-Spare and JBOD Support)

2015-30-08
1.3 – Bugfixes for Series 7 & 8 Controllers

2014-11-15
1.2 – more features (newer controllers) – Handling for Global Hot-Spares

2013-21-02
1.1 – more features (newer controllers)

2010-29-04
1.0 – First public version

Copyright

check_arcconf.pl wird unter der GNU General Public License zur Verfügung gestellt.

Autor

Joachim Luft beantwortet gerne Ihre Fragen zu diesem Plugin und freut sich natürlich auch über eine kleine Spende!

 

Freeware-Name

check_arcconf.pl

  • System: Nagios Plugins und Addons
  • Datum: 16.Juni 2019
  • Autor: Joachim Luft
  • Version: 1.5

Kategorie: Monitoring/Nagios-Plugins

Tags: Linux-Plugin

Download