遠隔保守サービスのサーバー側プログラムで、別のサーバーに情報を送出できない障害が発生しましたので、サーバー側プログラムを修正しました。
調査の結果、サーバーからサーバーへ情報を伝達する際に経由する負荷分散通信部分で障害が発生していることがわかりましたので、通信の手段を別のものに変更しました。
障害発生日時
- 2013-07-27 05:20:34
障害認識日時
- 2013-08-08 18:00 ごろ
復旧確認日時
- 2013-08-09 13:30 ごろ
障害発生場所
遠隔保守に必要な一連の処理は以下のようになっています。
クライアントプログラム
遠隔保守クライアントプログラムは、以下のような処理を行なっています。
<フェーズ1>
- 正常: クライアントからサーバー1を見つける
- 正常: クライアント → サーバー1
サーバープログラム
遠隔保守サーバープログラムは、以下のような処理を行なっています。
<フェーズ2-1>
- 正常: サーバー1からサーバー2を見つける
- 異常: サーバー1 → サーバー2
- 正常: サーバー2が情報を解析してデータベースに格納
<フェーズ2-2>
- 正常: サーバー1からサーバー3を見つける
- 異常: サーバー1 → サーバー3
- 正常: サーバー3が情報を解析してデータベースに格納
バージョン変更
2009-12-10 Ver.1.58
今回、障害が発生したバージョンです。
2013-08-09 Ver.1.61
サーバーからサーバーからへ通信する方式を変更したバージョンです。