Mit Nagios Festplatten "Gesundheit" überwachen
Heutige Festplatten kommen von Haus aus mit Diagnoseeinrichtung daher. Leider werden die nur selten genutzt und dann ärgert man sich dass die Platte kaputt geht. Nutzt man die Diagnosemöglichkeiten zum Beispiel mit smartmontools kann man die Vorwarnzeit deutlich verlängern und hat somit Zeit, ein Backup zu machen. Für Nagios gibt es ein Plugin das diesen Dienst "anzapft" Check SMART status und auf die Service Übersicht bringt und den Nagios Warnungsmechanismus integriert. Hier meine persönliche Doku:
Die Datei downloaden und auf den Nagios Sever kopieren. (Ich halte alle meine "nicht Standard Plugins" in einem anderen Ordner)
cp check_smart /opt/c/nagios
cd /opt/c/nagios
chown nagios:nagios check_smart
Check_smart braucht root rechte: also Sudo
vi /etc/sudoers
nagios ALL=(ALL) NOPASSWD:/opt/c/nagios/check_smart
Erstmal unter der User nagios auf der Kommandozeile testen. Dann in
/etc/nagios/checkcommands.cfg
define command{
command_name check_smart
command_line sudo /opt/c/nagios/check_smart -i $ARG1$ -d $ARG2$
}
und in
/etc/nagios/services.cfg für die verschiedenen Platten den Service definieren.
define service{
use generic-service-important
host_name mail
service_description SMARTD-SDC
normal_check_interval 360
check_command check_smart!scsi!/dev/sdc
}
define service{
use generic-service-important
host_name mail
service_description SMARTD-HDA
normal_check_interval 360
check_command check_smart!ata!/dev/hda
}