
クラウドの警鐘:Amazon Web Servicesの障害はオンラインインフラの落とし穴を浮き彫りにする
トッド・ビショップ著

Amazon Web Services は、パブリック クラウドにおける先行者としての優位性を活かして、企業が独自に構築できない機能を提供し、その過程で自社にとっても収益性の高いビジネスを生み出した、現代のビジネスとテクノロジーにおける最大の成功例の 1 つです。
火曜日は確かにそれほど夢のような気分ではありませんでした。
障害は目新しいものではなく、今回がこれまでで最悪のものというわけではありませんでしたが、広く利用されている AWS US-EAST-1 リージョンで発生した問題は、その影響範囲が広く、クラウドの驚異的な範囲を示すものとして注目に値します。
これはウェブサイトがダウンしただけの問題ではありません。デイトレーダーは取引ができなくなり、ゲーマーはゲームができなくなりました。アデルは、なんと次のツアーのチケットを販売できなくなってしまいました。
マクドナルドのキオスクからTinderの出会い系、NPRのポッドキャストまで、その影響はあらゆるところで明らかだった。シアトルのスタートアップ企業Intelusは、AWSでホスティングされたウェブサイトで火曜日の朝に会社を設立するという不運に見舞われた。
アマゾン自身も、こうした困難から逃れることはできなかった。同社の従業員は、コンピューター上のコミュニケーションアプリ「Chime」を数時間使用できなかった。Amazon Musicは多くのユーザーが利用できなかった。同社の郵送検査サービスでは、COVID-19の検査結果に数時間アクセスできなかった。
同社の子会社であるリングの顧客はカメラにアクセスできなくなった。
事態はさらに悪化した。同社の中核事業であるeコマースでは、商品ページが読み込まれず、注文も通らなかった。顧客は食料品を注文できなかった。配送ドライバーはカラオケを歌い、障害によって配送を調整するアプリとの接続が切断されたため、結局その日は帰宅した。
サプライチェーンのボトルネックによってすでに困難に直面していたホリデーシーズン中、これはアマゾンにとって最悪のタイミングで起こった。
これらすべてから、明白な疑問が浮かび上がります。世界は Amazon のクラウドに依存しすぎているのではないか?
「そうだと思います」と、ダックビル・グループのチーフクラウドエコノミスト、コーリー・クイン氏は、火曜日の夜にTwitterのダイレクトメッセージで私が同じ質問をしたところ、答えた。彼は、事態はもっと悪化する可能性があったと指摘し、「(今日のような部分的なものではなく)その地域全体の停電は、甚大な経済的打撃となるでしょう」と述べた。
クイン氏はツイッターのスレッドで自身の考えを詳しく述べており、全文を読む価値がある。
https://twitter.com/QuinnyPig/status/1468442903773024256
何ができるでしょうか?冗長性はどうなったのでしょうか?
AWSの障害に関する投稿で、フォレスターのシニアアナリスト、ブレント・エリス氏は、企業が脆弱性を最小限に抑えるための戦略を提示しました。彼のアドバイスの一部は、「サービスに障害が発生した場合に複数のクラウドプロバイダーまたはプライベートインフラストラクチャ間で自動的に移行できるアプリケーションとサービスを構築することで、リスクを分散させる」というものです。
AWS への世界の依存に対するより広範な解決策という点では、現時点では明確な答えはないかもしれないが、Quinn 氏が指摘するように、これらは問うべき重要な質問である。
最終的には、解決策はアマゾン自身から出てくる可能性があり、元AWS最高責任者のアンディ・ジャシー氏が現在アマゾンのトップに立っているため、アマゾンはこの課題に対処する上でこれまで以上に有利な立場にあるはずだ。