Nagios

序論


監視されたサービスとホストの現在の状態は2つのコンポーネントで決定します:

2つの状態タイプがNagiosにあります - 不安定状態(SOFT)と安定状態(HARD)。 これらの状態のタイプは監視ロジックの重要な部分です、何時にイベントハンドラーが実行するか、また警告が何時送られるかを決めるのに使われます。

このドキュメントでは不安定(SOFT)と安定(HARD)状態の違いと、その起こる原因、起こって以降を説明します。

サービスとホスト・チェック再試行


過渡状態での誤った警告を防ぐため、Nagosは本当の誤りとする前に何回サービスやホストのチェックを行うかを指定できます。 これはホストとサービス定義の max_check_attempts オプションで制御されます。 ステータス・タイプが働いて、実際の障害があるかどうかを決定するためどの様にホストやサービスが(再)チェックされるかを理解することは重要です。

不安定状態


不安定状態は以下の状況で起こります…

ホストかサービスが不安定(SOFT)状態に変わると、以下事が起こります:

log_service_retries または log_host_retries をメイン設定ファイルで可能にした場合にだけ、不安定状態が登録されます。 不安定状態で起こる唯一重要なことが、イベントハンドラの実行です。 安定状態に変わる前に、問題の先を見越して修正してみたいなら、イベントハンドラを使用するのは有用な場合があります。 イベントハンドラが実行されるとき、$HOSTSTATETYPE$$SERVICESTATETYPE$マクロに、「不安定(SOFT)」の値があります(あなたのイベントハンドラ・スクリプトは、それらがいつ修正措置を取るべきであるかを知ることができます)。 ここでイベントハンドラに関する詳しい情報を見つけることができます。

安定状態


安定状態は以下の状況でホストとサービスに起こります:


ここに状態変化が起こってどの様に状態タイプが決められるかを書いています。そしてイベントハンドラーや通知が行われるかを書いています。 以下のテーブルは、時間経過とともに起こる連続したサービスのチェックを示しています。 サービスは、max_check_attempts に 3 の値です。

時間 チェック # 状態 状態のタイプ 状態変更 注意
0 1 OK 安定 いいえ サービスの初期状態
1 1 重要 不安定 はい 最初の、OKでない状態の検出。イベントハンドラを実行します。
2 2 警告 不安定 はい サービスがOKでない状態にずっとあります。 イベントハンドラを実行します。
3 3 重要 安定 はい マックス・チェックを行ったので、サービスは安定(HARD)状態に入ります。 イベントハンドラは実行されます、そして、障害通知を出します。 これが起こる直後チェック#は1にリセットされます。
4 1 警告 安定 はい サービスは注意で安定した(HARD WARNING)状態に変化します。 イベントハンドラは実行されます、そして、問題通知を出します。
5 1 警告 安定 いいえ サービスは安定した(HARD)障害状態です。 サービスのための通知間隔が何であるかによって、別の通知を出すかもしれません。
6 1 OK 安定 はい サービスはHARD回復になります。 イベントハンドラは実行されます、そして、回復通知を出します。
7 1 OK 安定 いいえ サービスはまだOKです。
8 1 未知 不安定 はい サービスは不安定な(SOFT) OKでない状態に変化すると検出されます。 イベントハンドラを実行します。
9 2 OK 不安定 はい サービスは不安定回復になります。 イベントハンドラは実行されますが、これが「本当」の障害でなかったので、通知は送られません。 状態のタイプは安定に設定されます。そして、これが起こるって直後チェック#は1にリセットされます。
10 1 OK 安定 いいえ サービスはOK状態で安定しています。

参照 参照: ホスト・チェック, サービス・チェック, イベントハンドラ, 通知

English Deutsch 日本語

目次