Einführung
Das nagiostats-Utility erlaubt Ihnen zusammen mit MRTG, verschiedene Nagios-Performance-Statistiken über eine bestimmten Zeitraum grafisch darzustellen. Das ist wichtig, weil es Ihnen helfen kann
- dass Nagios effizient arbeitet
- um Problembereiche im Überwachungsprozess zu lokalisieren
- um die Einflüsse von Änderungen in Ihrer Nagios-Konfiguration zu beobachten
MRTG-Beispielkonfiguration
Schnipsel von MRTG-Beispieldateien zur Darstellung von verschiedenen Nagios-Performance-Statistiken finden Sie in der mrtg.cfg-Datei im sample-config/-Unterverzeichnis in der Nagios-Distribution. Sie können auch Graphen von anderen Performance-Informationen erstellen, wenn Sie wollen - die Beispiele liefern Ihnen dazu einen guten Ausgangspunkt.
Sobald Sie diese Beispieleinträge in die MRTG-Konfigurationsdatei (/etc/mrtg/mrtg.cfg) kopieren, sollten Sie einige neue Graphen haben, wenn MRTG das nächste Mal läuft.
Beispielgraphen
Ich werde beschreiben, welche Bedeutung einige der Beispielgraphen haben und wofür sie benutzt werden können...
Aktive Host-Prüfungen - Dieser Graph zeigt, wie viele aktive Host-Prüfungen (regelmäßig geplant und nach Bedarf) über die Zeit auftraten. Nützlich zum Verstehen von:
- Host-Prüfungen
- voraussschauende Host-Abhängigkeitsprüfungen
- zwischengespeicherten Prüfungen (cached checks)
Aktive Service-Prüfungen - Dieser Graph zeigt, wie viele aktive Service-Prüfungen (regelmäßig geplant und nach Bedarf) über die Zeit auftraten. Nützlich zum Verstehen von:
- Service-Prüfungen
- voraussschauende Service-Abhängigkeitsprüfungen
- zwischengespeicherten Prüfungen (cached checks)
Zwischengespeicherte Host- und Service-Prüfungen - Dieser Graph zeigt, wie viele zwischengespeicherte Host- und Service-Prüfungen (regelmäßig geplant und nach Bedarf) über die Zeit auftraten. Nützlich zum Verstehen von:
- zwischengespeicherten Prüfungen (cached checks)
- voraussschauende Host- und Service-Abhängigkeitsprüfungen
Passive Host- und Service-Prüfungen - Dieser Graph zeigt, wie viele passive Host- und Service-Prüfungen (regelmäßig geplant und nach Bedarf) über die Zeit auftraten. Nützlich zum Verstehen von:
aktive Host-/Serviceprüfungen - Dieser Graph zeigt, wie viele (die Gesamtzahl von) Hosts und Service aktiv über die Zeit geprüft wurden. Nützlich zum Verstehen von:
passive Host-/Serviceprüfungen - Dieser Graph zeigt, wie viele (die Gesamtzahl von) Hosts und Service passiv über die Zeit geprüft wurden. Nützlich zum Verstehen von:
durchschnittliche Service-Prüfungs-Latenz- und Ausführungszeiten - Dieser Graph zeigt die durchschnittlichen Service-Prüfungs-Latenz- und Ausführungszeiten über die Zeit. Nützlich zum Verstehen von:
Konstant hohe Latenzzeiten können ein Anzeichen dafür sein, eine oder mehrere der folgenden Variablen zu ändern:
durchschnittliche Service-Zustandsänderungen - Dieser Graph zeigt die durchschnittliche prozentuale Service-Zustandsänderung (ein Maßstab für die Sprunghaftigkeit) von Services über die Zeit, heruntergebrochen auf Services, die in der letzten Zeit aktiv oder passiv geprüft wurden. Nützlich zum Verstehen von:
durchschnittliche Host-Prüfungs-Latenz- und Ausführungszeiten - Dieser Graph zeigt die durchschnittlichen Host-Prüfungs-Latenz- und Ausführungszeiten über die Zeit. Nützlich zum Verstehen von:
Konstant hohe Latenzzeiten können ein Anzeichen dafür sein, eine oder mehrere der folgenden Variablen zu ändern:
durchschnittliche Host-Zustandsänderungen - Dieser Graph zeigt die durchschnittliche prozentuale Host-Zustandsänderung (ein Maßstab für die Sprunghaftigkeit) von Services über die Zeit, heruntergebrochen auf Services, die in der letzten Zeit aktiv oder passiv geprüft wurden. Nützlich zum Verstehen von:
externe Befehle - Dieser Graph zeigt, wie viele externe Befehle von Nagios über die Zeit verarbeitet wurden. Solange Sie nicht eine große Zahl von externen Befehlen verarbeiten (wie im Fall von verteilten Überwachungsumgebungen), sollte dieser Graph nahezu leer sein. Die Überwachung von externen Befehlen kann nützlich sein zum Verstehen von Einflüssen durch:
externe Befehlspuffer - Dieser Graph zeigt, wie viele externe Befehlspuffer über die Zeit benutzt wurden. Wenn die Zahl von benutzten Befehlspuffern regelmäßig nahe an der Zahl von verfügbaren Puffern ist, dann sollten Sie wahrscheinlich den Wert der external command buffer slots erhöhen. Puffer werden benötigt, um temporär die externen Befehle zu speichern in der Zeit, wo sie vom external command file gelesen werden bis zur Verarbeitung durch den Nagios-Daemon.
Siehe auch: Nagiostats-Utility, Leistungsoptimierung