Watch

Amazon.comの本当の問題はサービス停止ではなく、コミュニケーションだ

Amazon.comの本当の問題はサービス停止ではなく、コミュニケーションだ

キース・スミス

キース・スミス

ゲスト解説: Amazon Web Services(AWS)を利用する多くの企業と同様に、BigDoorも本日発生したAWSの障害の影響を受けました。多くのスタートアップ企業と同様に、私たちは悪いことが起きる可能性を覚悟しており、苦い経験から学ぶよう最善を尽くしています。影響を受けた250社以上のパブリッシャーの皆様には、Twitter、メール、電話を通して謝罪と最新情報の共有に一日の大半を費やしました。本日は多くの教訓を得ることができました。透明性はシアトルのスタートアップコミュニティにとって急速に生命線となりつつあるため、いくつかお伝えしたいと思います。

BigDoorでは、早い段階ですべての業務をAmazon Web Servicesでホスティングすることを決定しました。私たちはAWSの大ファンで、誰にでもAWSの素晴らしさを熱く語っています。AWSのおかげで、複雑なシステムを迅速かつ非常にコスト効率よく拡張することができました。

常時、12台のデータベースサーバー、45台のアプリケーションサーバー、6台の静的サーバー、6台の分析サーバーが稼働しています。トラフィックや処理能力の急増時にはシステムが自動拡張され、不要な場合はコスト削減のため自動的に縮小されます。

[関連:2日目:Amazonはクラウドの不具合に関して進展があると述べているが、全員がそれを見ているわけではない]

無料のセルフサービス型ゲーミフィケーションプラットフォームのパブリックベータ版をリリースしてから10ヶ月で、10億回以上のAPIコールを処理しました。AWSがなければ、私たちのような小規模なチームと限られた予算では到底実現できませんでした。多くの企業がクラウドのメリットを実感しており、AWSは急速にスタートアップエコシステムの重要な一部となっています。

すべてが完璧だったというわけではありません。

私たちが経験した最も顕著な継続的な問題は、信頼性の低いディスクIO、特にディスク書き込み速度が定期的に低下する問題でした。これはクラウドコンピューティングの性質上、当然の技術的な複雑さですが、Amazonが問題の深刻さを公に認め、議論することを躊躇したため、この問題が深刻化していることに早い段階で気付きました。

技術的な課題については、なんとか回避策を見つけることができました。しかし、Amazonの素晴らしいシステムが損なわれていることは、私たちにとって不安でした。一時的な技術的問題というよりも、透明性を受け入れようとしない姿勢に見られる問題です。

今日でもその透明性の欠如は続いています。

一日中問題が続き、システム障害による明らかなフラストレーションを感じました。しかし、Amazonのコミュニケーション障害はさらに憂慮すべきものでした。

太平洋標準時午前1時30分頃から、API、メインウェブサイト、パブリッシャー管理サービスはほぼ完全にオフラインになっており、一時的にアクセスできた時間帯もありました。このため、お客様へのサービス提供が事実上不可能な状態となっております。

太平洋標準時午前 1 時 41 分以降の Amazon のアップデートは、技術者が他の技術者を助けようとして書いたものではなく、明示された SLA を回避する弁護士や会計士によって書かれたかのように読めます。

システムの復旧をただ待っているわけではありません。AWSクラウド内の実際に機能している領域にインスタンスを積極的に移動しています。Amazonが現状をもっと率直に伝えてくれていれば、システムの復旧はもっと早くできたはずです。

どのスタートアップでも、単一のクラウド プロバイダーに全面的に依存することを避けるために実行できる、実に明白で比較的簡単なことはたくさんあります。しかし、それらのことは追加の時間費用がかかります。この 2 つは、すべてのスタートアップが制約を受ける最も重要な要素です。

AWSは、イノベーションのスピードとスケールアップによって実現してきた成果を心から愛しています。しかし、今日のエピソードが終わった後、私たちは大きな決断を迫られることになります。

将来このような大規模な失敗を回避するのに役立つテクニカルなベルトとサスペンダーの設計と構築に時間を費やすこともできますし、単一の巨大なパートナーに依存し続け、猛烈なペースで反復と製品開発を続けることもできます。

どちらの選択肢を選ぶかは、今日お伝えできません。しかし、全国の多くのスタートアップ企業が、この疑問を抱くことになるのは間違いありません。

良い答えが見つかったら、透明性を保ち、解決策を共有することで、シアトルのスタートアップエコシステムの良き一員となることを確信しています。他のスタートアップにも同様の行動を促し、これがAmazonへの参加要請となることを願っています。

キース・スミスは、オンラインパブリッシャーのウェブサイトにゲームメカニクスを組み込むシアトルのスタートアップ企業BigDoorのCEOです。Twitter(@bigdoormedia)で同社をフォローできます。