カテゴリ キャリア情報
KDDI、先日のシステム通信障害について調査結果を発表:原因は手順ミスと対策不足
2013/04/25 14:44
KDDIは、4月16日(火)から19日(金)に発生した大規模なシステム通信障害について調査結果を発表しました。
この障害は4月16日(火)から発生。au版iPhone/ iPad/ iPad miniにおいて、Eメールの送受信や連絡先の一部にアクセスできないという不具合が生じました。障害は大きく分けて3度発生し、最大で288万人のユーザーに影響が及びました。障害は19日(金)深夜に復旧しています。
発生の原因については、auのEメール送受信システムに新機能を追加する際の“手順書ミスによるコマンド誤り”としています。サーバのバージョンアップを行う際、現行ユーザ認証サーバ(マスタ)を停止する必要があったのですが、停止後もサービスを継続させるため、レプリカを用意し、事前に切り替える作業を行いました。その作業の途中、手順書ミスによるコマンド入力の誤りでレプリカのサーバとマスタのサーバとを誤って接続した結果、ユーザー情報の一部が欠損となってしまったそうです。
KDDIはPDF形式の発表文で10ページにわたり原因について解説した上で、今後の対策についても触れています。それによると、「手順書チェック、リハーサルプロセスの総点検」は4月末まで、「社内の全システムのディスク処理能力の点検」は5月末、「二重障害時でも十分なメールサーバ/ストレージの増強対策」は8月末までに完了させるとしています。
⇒ KDDI:ニュースリリース
ライター:いっしー