Fehlersuche bei Icinga2

Einer meiner Icinga2 Client Checks hat sich leider nicht so verhalten wie von mir gewünscht :-(

Ich wollte die Aktualität eines Backups prüfen. Ich dachte, ich hätte die richtigen Syntax aber leider wurde auf dem Master immer ein falscher Alarm ausgegeben. Wie sich später herausstellte wurden nicht die von mir gewünschten Werte geprüft sondern die Standartwerte.

Durch Hinweise im Monitoring-Portal bin ich auf die Troubleshooting Tips verwiesen worden.

Also beim nächsten Mal gehe ich so vor

Debugging auf dem Icinga2 Server einschalten

dann kann man schön sehen was auf dem Server passiert. (Dank an Christoph Stöttner für die Fehlerkorrektur)

 icinga2 feature disable debuglog
 Disabling feature debuglog. Make sure to restart Icinga 2 for these changes to take effect.

Dann viel mir auch schnell auf was geprüft worden ist:

 tail -f /var/log/icinga2/debug.log
 .......
 notice/Process: PID 4515 ('/usr/lib/nagios/plugins/check_file_age' '-f' '/home/user/backup/databases.tar.gz' ) terminated with exit code 2

Es wurden gar nicht die Warn und Critical Werte verwendet ich die in meiner Service Definition angegeben hatte.

Service Konfiguration gegen Template Doku prüfen

Dann gab es den nächsten Hinweis auf die Dokumentation der Plugings die ich trotz Suche nicht gefunden habe. Aber das kann auch mein Problem sein. Vielleicht hat mit der Titel “Icinga Template Library” nicht so richtig angesprochen. Dort stehen dann auch die Namen der Variablen die zu verwenden sind. In meinem Fall waren es einfach andere Namen.

Und dann klappte es auch.

 notice/Process: PID 4903 ('/usr/lib/nagios/plugins/check_file_age' '-c' '270000' '-f' '/home/user/backup/databases.tar.gz' '-w' '90000') terminated with exit code 1

Dann natürlich das debugging wieder ausschalten.