
Amazon Web Servicesの大規模障害がQuora、Foursquareなどに大混乱を引き起こす
ジョン・クック著
Amazon.comは今朝、Elastic Compute CloudをはじめとするWebサービスで深刻な障害が発生しており、HootSuite、Reddit、Foursquareといった主要サイトでダウンタイムが発生しています。現在、この問題の追跡調査を進めており、詳細が分かり次第、この投稿を更新いたしますが、Twitterでは苦情が相次いでいます。
「空が落ちてくる!Amazonのクラウドがダウンしている(雨が降っている?)ようで、こちらも問題が発生しています。すぐに復旧します!」と、モバイルソーシャルゲームサイトSCVNGRのツイートに書かれていた。
Amazon Web Servicesの「ヘルスダッシュボード」は、バージニア州北部のElastic Compute Cloudサーバーに問題が発生していることを示しており、同社は「インスタンスの接続性、遅延、エラー率」を報告している。AWSのElastic BeanstalkとRelational Database Serviceにも問題が発生している。
この問題が太平洋岸北西部のサイトに影響を与えているかどうかは不明ですが、Amazon Web Services のお客様で問題が発生している場合は、コメントでお知らせください。
多くのサードパーティ企業はアプリケーションのホスティングに Amazon.com を利用しています。AWS サービスが停止すると、数百または数千のサービスも停止する可能性があります。
問題は午前1時41分、AmazonがElastic Compute Cloudに関するアラートを発したことから始まりました。午前6時9分の時点で、同社は「影響を受けたアベイラビリティゾーンにおけるEBS APIエラーとボリュームレイテンシーは依然として発生しています。解決に向けて引き続き取り組んでいます」と発表していました。
AM10:26 AM AMAZON.COMからの更新:
影響を受けたEBSコントロールプレーンサービスの安定化において、大きな進展がありました。影響を受けたアベイラビリティゾーンのEBSリソースに関係しないEC2 APIコールでは、障害とレイテンシーが大幅に減少し、回復が続いています。また、影響を受けたアベイラビリティゾーンで追加キャパシティをオンライン化し、スタックしていたEBSボリューム(再ミラーリング中だったもの)の回復も始まっています。これらのボリュームが完全に回復する時期はまだ予測できませんが、回復を予測するのに十分なデータが得られ次第、予測をお知らせします。当社は、利用可能なすべてのリソースを投入し、可能な限り速やかにサービス機能をフル稼働状態に復旧させるよう取り組んでいます。今後も、最新情報が入り次第、お知らせいたします。