2011-10-21 20:51:46 ~ 23:06:37 に障害が発生しました。
障害から解決までの経緯
- 20:51:46 障害検知(非確定)
- 20:56:46 障害検知(確定→スタッフに緊急通報)
- 23:06:37 障害解消(確定)
影響を受けた範囲
- seeck.jp
- 一部のbiz サービスを含む
- www.seeck.jp は含みません
※非公開サーバーを除く
障害の原因
- No.9 予備電源の状態を監視しているNo.132 サーバーが、予備電源の状態変化を検知した
- 予備電源の状態が変更された時、停電時に規定された時間の保護ができるかを再チェックした
- その結果、仮に停電した場合、既定の時間を下回ると判定し、緊急事態であると定義した
- 緊急事態に定義された処理に従い、No.132 上に展開するすべてのサーバーに緊急時の停止命令を発した
- 停止信号がすべてに行き渡り、停止したことを確認してサーバー自らも安全のために自己停止した
- 外部からサーバーを監視しているシステムが異常を検知した(未確定)
- 外部からサーバーを監視しているシステムが異常を検知して、異常と確定した
- 外部からサーバーを監視しているシステムはスタッフに緊急事態通報を行った
- 緊急事態通報を受け取ったスタッフは外出先からサーバーとの通信を試行し、現状の確認を行った
- この結果異常事態が発生していると確認した
- スタッフはサーバーを手動起動し、状態を確認した
- スタッフはNo.9 予備電源をNo.8 予備電源系の配線に変更した
- スタッフはサーバーを起動し、正常に起動するかを確認した
- 外部からサーバーを監視しているシステムから通信できることを確認したとの通報が到着した