2012年6月29日金曜日

レンタルサーバー ファーストサーバーのWEB・メール等のデータ消失障害について提供する側・受ける側からリスクを考える

6月20日(水)レンタルサーバー ファーストサーバーが障害となり、保管されていたWEB・メール等のデータが消失する事態となりました。徐々に状況がわかってきました。

レンタルサーバー社の発表によると下記3点が障害の原因と主張しています。
========================================

原因1:脆弱性対策のための更新プログラムの不具合
脆弱性対策のためのメンテナンスが必要となる都度、メンテナンスのための更新プログラムを作成しており、今回も更新プログラムを作成しています。
そのプログラムの記述において、ファイル削除コマンドを停止させるための記述漏れと、メンテナンスの対象となるサーバー群を指定するための記述漏れが発生していました。

原因2:メンテナンス時の検証手順
メンテナンスに際しては、検証環境でまず動作確認を行うという手順が定められていましたが、プログラム実行後の動作確認を行う対象は、あくまでも当該メンテナンス対象サーバー群を確認すれば足りるとされていたため、検証環境下で対象サーバー以外に影響が及んだことの確認がないまま、動作確認上は問題なしと判定され本番環境での実施が行われました。

原因3:メンテナンス仕様
システムを含むデータのバックアップは毎朝6時に取得しております。
しかしながら、脆弱性対策のためのメンテナンスはバックアップをしてあるシステムについても実施しておかないと、メンテナンス実施後にハードウェア障害が発生してバックアップに切り替えた途端に脆弱性対策が講じられていないシステムに戻ってしまうことが過去に発生し、脆弱性対策がなされていないシステムが動き続けていたという反省に立ち、脆弱性対策のメンテナンスに関しては対象サーバー群とそのサーバー群のバックアップ領域に対して同時に更新プログラムを適用するという構造に修正して実施しました。

そのため、今回のメンテナンス実施において、対象サーバー群のデータ消失と同時にバックアップ領域のデータも消失したという事象に至っています。
========================================

サービスを提供する立場としては、ヒューマンエラーによって簡単に全ハードディスクが消失する状況に至る設計そのものに根本的な問題があり、結果論になってしまいますが物理的にサーバーを分ける等の処置が必要であったと考えます。どんなに完全なシステムであっても、人が介在する為、人がミスすることを前提にした仕組みを導入すべきと考えるからです。創業間もない際にコストを下げる為にリスクを受動する事は必要と思いますが成熟した企業においては、リスクを転嫁できる方法を考えるべきです。そうでなければ一瞬にして信頼と会社存続の危機に面してしまいます。

サービスを受ける側の立場としては、完全なサービスが無いことを、今一度認識しておく必要があります。特にオンラインの情報が重要になればなる程、自社でバックアップを行うことも必要です。また、しっかりとサービスの内容を理解すべきです。安いサービスほど疑うことも大切です。








0 件のコメント: