
アマゾンはAWSの大規模障害について沈黙しているが、近いうちに説明が出るかもしれない
ナット・レヴィ著

更新: Amazon は今週発生した大規模な障害の原因についての説明を発表し、再発防止のための安全対策を講じ始めました。
原文は以下
アマゾン ウェブ サービスが、火曜日にインターネットのかなりの部分を麻痺させた Simple Storage Service (略して S3) の問題を修正してから 24 時間以上が経過したが、同社はいまだに障害の原因について何も発表していない。
関連: AWSクラウドストレージ、人気サイトへの障害発生後オンラインに復帰
Amazon は今回の障害について公式声明を発表しておらず、GeekWire からのコメント要請にも応じていない。
アマゾンがまだ何も発表していないことは、ある観察者にとってはさほど驚きではない。サンフランシスコに拠点を置くネットワークインテリジェンス企業、サウザンドアイズの製品マーケティング担当シニアディレクター、ニック・ケファート氏は、火曜日の終日、障害を監視していた。彼はGeekWireに対し、アマゾンは伝統的に、大規模な障害が発生した場合、発生から数日以内に原因と説明を公表することに積極的だと語っている。

「これまでのケースでは、Amazonは通常1週間以内に根本原因を明らかにしています。このような重大な問題ではこれまでもそうでしたので、おそらく同様の期間になると思います」とケファート氏は述べた。「同社がこれほどの規模の障害を最後に経験したのは2015年6月で、詳細な根本原因分析を発表するまでに数日かかりました。」
見逃した方、あるいはインターネットをあまり利用しない方のために、何が起きたのかご説明します。火曜日の太平洋時間午前9時30分過ぎから4時間以上にわたり、バージニア州のデータセンターにあるS3で「高エラー率」が発生し始めました。この問題により、Expedia、Slack、Medium、米国証券取引委員会など、AWS上で稼働する多数のウェブサイトやアプリへのアクセスが遮断されました。この障害は、障害やイベントを表示するAWSサービスヘルスダッシュボードにも一時的に影響を及ぼしました。AWSの多くの主要機能は相互に連携して構築されているため、この障害は他のサービスにも影響を及ぼしました。
Amazonは一日中ダッシュボードを更新しました。AWSは最初の障害から約2時間後に問題の解決に着手し、太平洋標準時午後1時50分頃にはすべてがオンラインに戻りました。
関連:アマゾンウェブサービスの障害は、インターネット全体の冗長性の重大な欠如を明らかにした
この障害は、AWSがいかに大きな存在になったかを如実に示しました。AWSはAmazonにとって大きな収益源であり、2016年の売上高は120億ドルを超え、2015年比55%増となり、2016年に売上高100億ドルを達成するという目標を大きく上回りました。また、最近のレポートによると、AWSはクラウドコンピューティング市場の40%以上のシェアを獲得しています。
複数の専門家は、この事件は、複数の地域にデータを分散させるか、複数の異なるプロバイダーを使用するかを問わず、クラウドコンピューティングにおける冗長性の必要性を浮き彫りにしたとも述べた。