Einführung
Wenn Nagios passive Host-Prüfungen von entfernten Quellen erhält (d.h. andere Nagios-Instanzen in verteilten oder Failover-Umgebungen), gibt der von der entfernten Quelle gelieferte Host-Status ggf. nicht genau den aus Nagios' Sicht zutreffenden Zustand wieder. Weil verteilte und Failover-Überwachungs-Installationen ziemlich identisch sind, ist es wichtig einen Mechanismus anzubieten, um exakte Host-Zustände zwischen verschiedenen Nagios-Instanzen sicherzustellen.
Verschiedene Sichten
Das folgende Bild zeigt eine vereinfachte Sicht für ein Failover-Überwachungsaufbau.
- Nagios-A ist der primäre Überwachungsserver, der aktiv alle Switches und Router überwacht.
- Nagios-B und Nagios-C sind Backup-Überwachungsserver, die passive Prüfergebnisse von Nagios-A erhalten.
- Sowohl Router-C als auch Router-D sind fehlerhaft und daher offline.
In welchem Status sind Router-C und Router-D gerade? Die Antwort hängt davon ab, welche Nagios-Instanz Sie fragen.
- Nagios-A sieht Router-D als DOWN und Router-C als UNREACHABLE
- Nagios-B sollte Router-C als DOWN und Router-D als UNREACHABLE sehen
- Nagios-C sollte beide Router als DOWN sehen.
Jede Nagios-Instanz hat eine unterschiedliche Sicht des Netzwerks. Die Backup-Überwachungsserver sollten nicht blind passive Host-Zustände vom primären Überwachungsserver akzeptieren oder sie werden inkorrekte Informationen über den aktuellen Zustand des Netzwerks haben.
Ohne die Übersetzung von passiven Host-Prüfergebnissen vom primären Überwachungsserver (Nagios-A) würde Nagios-C den Router-D als UNREACHABLE sehen, obwohl dieser vom eigenen Standpunkt eigentlich DOWN ist. Ähnliches gilt für die DOWN/UNREACHABLE-Zustände von Router-C und Router-D (vom Standpunkt von Nagios-A aus), die aus Sicht von Nagios-B umgedreht werden sollten.
Anmerkung: Es kann einige Situationen geben, in denen Sie nicht möchten, dass Nagios die DOWN/UNREACHABLE-Zustände von entfernten Quellen in ihre "korrekten" Zustände vom Standpunkt der lokalen Nagios-Instanz aus umsetzt. Zum Beispiel möchten Sie vielleicht in verteilten Überwachungsumgebungen, dass die zentrale Nagios-Instanz weiß, wie verteilte Instanzen ihre jeweiligen Teile des Netzwerks sehen.
Status-Übersetzung aktivieren
Per Default wird Nagios nicht automatisch die DOWN/UNREACHABLE-Zustände von passiven Prüfergebnissen übersetzen. Sie müssen dieses Feature aktivieren, wenn Sie es benötigen und nutzen wollen.
Die automatische Übersetzung von passiven Host-Prüfzuständen wird durch die translate_passive_host_checks-Variable kontrolliert. Durch die Aktivierung wird Nagios automatisch DOWN- und UNREACHABLE-Zustände von entfernten Quellen in die korrekten Zustände für die lokale Instanz übersetzen.
Siehe auch: Host-Prüfungen, Netzwerk-Erreichbarkeit, Passive Prüfungen, Verteilte Überwachung, Redundante/Failover-Überwachung