序論
Nagiosがリモート・ソース(すなわち、分散かフェイルオーバーセットアップのインスタンス)からパッシブ・ホスト・チェックを受け取った時、Nagiosの視点からホストの状態を正確に反映していないかも知れません。 分散とフェイルオーバー監視のインストールはかなり一般的なのでNagiosの異なったインスタント間で正確なホスト・ステータスを確認するメカニズムを提供するのは重要です。
異なった世界のビュー
以下のイメージは、フェイルオーバー監視・設定の簡略化した見方を示しています。
- Nagios-Aはプライマリー監視サーバであり、全てのスイッチとルータを実際監視しています。
- Nagios-BとNagios-Cは、バックアップ・監視サーバであり、Nagios-Aからパッシブ・チェック結果を受け取っています。
- Router-CとRouter-Dの両方、障害のためオフラインです。
Router-CとRouter-Dは今、どんなステータスですか? 答えはどのNagiosにインスタンスを尋ねるかによります。
- Nagios-AはRouter-DをDOWNと見なし、Router-CをUNREACHABLEと見なします。
- Nagios-BはRouter-CをDOWNとRouter-DをUNREACHABLEと見なすべきです。
- Nagios-Cは両方のルータをDOWNであるとみなすべきです。
それぞれのNagiosインスタンスには、異なったネットワークの視点があります。 バックアップ・監視サーバがプライマリ・監視サーバからパッシブ・ホスト・ステータスを盲目的に受け入れるべきではありません、また、現在のネットワーク状態に誤った情報があることがあります。
最初の監視しているサーバ(Nagios-A)からのパッシブ・ホストチェック結果を解釈せずに、その視点では本当にDOWNベースでも、Nagios-CはRouter-DがUNREACHABLEと見なすでしょう。 同様に、Router-C と Router-D について(Nagios-Aの視点からは)DOWN/UNREACHABLE 状態、Nagios-B からの視点ではフリップと成ります。
注意: Nagiosにリモート・ソースからのDOWN/UNREACHABLEのステータスをローカルNagiosインスタンスの視点で正しい状態と解釈してほしくない幾つかの状況があります。 例えば、分散監視環境で、分配されたインスタンスがどのようにネットワーク部分で見えるかを知るために中央のNagiosインスタンスが欲しいと思うかもしれません。
ステータスの解釈を許可します。
デフォルトで、Nagiosはパッシブ・チェック結果からDOWN/UNREACHABLEステータスを自動的に解釈しません。 それが必要で欲しいと思うなら、この特徴を許可する必要があります。
パッシブ・ホスト・チェックステータスに関する自動解釈がtranslate_passive_host_checks 変数で制御されます。 それを許可すると、NagiosはNagiosのローカルのインスタンスのためにリモート・ソースからのDOWNやUNREACHABELE状態を自動的に正しい状態に解釈します。
参照: ホスト・チェック, ネットワーク到達性, パッシブ・チェック, 分散監視, 冗長系/フェイルオーバー監視