Nagios

序論


Nagiosは監視しているサービスやホストの計画された停止時間をスケジュールできます。 これはアップグレードなどでサーバが停止する時などに便利です。

停止時間のスケジューリング


予定されている休止時間

ホストやサービスの停止時間は追加情報CGI(ホストやサービス情報もみられる)を通して設定します。 "Schedule downtime for this host/service"リンクをクリックして停止時間を設定します。

ホストやサービスがスケジュールされたら、Nagiosは設定した期間停止すると言うことをホスト/サービスのコメントとして追加します。 停止時間で設定した期間が過ぎたら、Nagiosは自動的にそのコメントを削除します ね?いいでしょ?

固定 vs フレキシブル 停止時間


Webインタフェイス経由でホストやサービスの停止時間をスケジュールする時、停止時間が"固定"なのか"フレキシブル"なのか尋ねられます。 どのように"固定"と"フレキシブル"停止時間の違いがあるかを説明します:

"固定"停止時間の開始と終了はスケジュールした通りに正確に開始と終了が行われます。 はい、これは簡単ですよね・・・。

"フレキシブル"停止時間はホストやサービスがX分(または時間)停止する事が分からない時を考えています。 フレキシブル停止時間をスケジュールしたら、 Nagiosはあなたの指定した開始と終了時間の間のいつかに停止時間を開始します。 停止時間はあなたが停止時間をスケジュールした時と同じくらい長い間続くでしょう。 フレキシブル停止時間が設定されたホストやサービスが停止する(もしくは通信不可になる)か、指定した開始と終了時刻にOKでない状態に入っているとします。 ホストやサービスが問題状態に遷移する時にNagiosは実際に停止時間を開始させます。 ホストやサービスが停止時間が過ぎる前に回復した時でもあなたが指定した時刻まで停止時間が続きます。 非常良い理由があってこれを行います。 誰もが知っている通り、障害が修復されたが、正しく実際に稼動する前には、何回もサーバを再起動しなければなりません。 ね?スマートでしょ?

停止時間のトリガー


ホストやサービスの停止時間をスケジュールする時、"triggered"停止時間オプションを使う事が出来ます。 triggered停止時間とは何であるかと尋ねますか? 停止時間の開始にtriggered停止時間を指定すると、ホストやサービスの停止時間スケジュール開始のトリガーが出来ます。 これは多数のホストやサービスの停止時間をスケジュールするなら非常に役立ちます。停止時間期間の開始時間は別の停止時間エントリーの開始時間に依存します。 例えば、特定のホストに(メンテナンスなどで停止している為) フレキシブル停止時間をスケジュールすると、ホストの"子"全てが停止時間のトリガーにした方がよいです。

スケジュールされた停止時間による通知への影響


ホストやサービスがスケジュール停止時間の時間に入ったら、 Nagiosはそのホストやサービスの通知は行いません。 ホストやサービスのために"DOWNTIMESTART"通知が送られますが、どんな管理者も受け取りたくない復旧の通知も送ります。。。

予定されている停止時間が終わったとき、再度通常通りホストやサービスの通知が行われます。 予定されている停止時間が終わったとき管理者に"DOWNTIMEEND"通知を出します、そして、再び警戒を受け始めます。

早まって予定されている停止時間を取り消すと(期限が切れる前に)、"DOWNTIMECANCELLED"通知を適切な管理者に出します。

スケジュール停止時間のオーバーラップ


私はこれを"あらっ!うごかねーぞ!"症候群と呼ぶのが好きです。 私が何が言いたいか分かると思います。 "定期的な"ハードウェアアップグレードを行ったけども、OSのドライバがうごかなかったわ、RAIDアレイは壊れるわ、ハードディスクイメージは失敗するわで世の中に残されているのはオリジナルディスクのみと言う状況です。 こうなってしまっては、最初に想定していた時間を3時間も4時間もオーバーしてこの作業を行わなくてはならなくなります・・・

以下のシナリオで考えてみます:

  1. ホストAの停止時間を月曜日の7:30pm-9:30pmに設定した
  2. 月曜日の7:45pmにそのサーバーを停止してハードディスクのアップグレードを開始した
  3. 1時間半SCSIエラーとドライバに悩まされて、ようやく機器を稼働させた。
  4. 9:15にあるパーティーションがドライブのどこにも見あたらないと気づく
  5. 長い夜になる事を認識して戻り、ホストAの停止時間の設定を月曜日9:20pm から火曜日の1:30amまで追加した

もしサービスやホストのスケジュールがオーバーラップした時(この場合7:40pm-9:30pmと 9:20pm-1:30am)、Nagiosは最後に設定した停止時間の期間まで待ちます。 この例では、通知はホストAのために火曜日の朝の午前1時30分まで止められるでしょう。

参照 参照: 通知

English Deutsch 日本語

目次