
Netflixは新たな技術でクリスマスイブの惨事を防ぐことを目指す
ブレア・ハンリー・フランク著
昨年のクリスマスイブ、Amazon Web Servicesの障害によりNetflixのプラットフォームがダウンし、家族で映画を楽しむ夜が突然中断されたことに不満を抱いた顧客がSNSで不満を訴えました。しかし今、Netflixは新たな機能のおかげで、さらに大きな規模の災害にも耐えられると確信しているようです。
同社は新しいブログ投稿で、同社が行ったいくつかの新しいエンジニアリング作業のおかげで、現在、システムですべてのトラフィックを 1 つの AWS リージョンに統合できるようになったと発表した。
現在、Netflixのサービスは複数のAWSリージョンに分散されているため、東海岸のお客様はバージニア州にあるAmazonの米国東部1データセンター、西海岸のお客様はオレゴン州にある米国西部2データセンターといった具合に、サービスを受けています。本日発表された新機能は、クリスマスイブに発生したような規模の災害を再び防ぐための重要な武器となります。1つのリージョンで障害が発生した場合、Netflixはすべてのトラフィックを稼働中のリージョンにルーティングするだけです。
このシステムはすでに実戦で実証されています。Netflixは今年初めにクラスタの1つに問題が発生しましたが、大規模な障害を回避し、必要なトラフィックを稼働中のリージョンにルーティングしました。この障害は気づかれずに済んだわけではありませんが、Netflixの新しいシステムは被害を食い止めることができたようです。
さらに、Netflix は大規模なテストを実施し、同社によれば、サービスが中断することなく、米国内のサービス全体を 1 つの AWS リージョンだけで実行できることが示されたという。
クリスマスイブの大惨事を引き起こしたような Elastic Load Balancer の障害を回避してサービスが機能することを可能にする Isthmus と合わせて、Netflix は Amazon の障害によってもたらされるであろう多くの事態に対処する準備ができているようだ。
同社の新システムに関するより詳細な技術的詳細に興味がある方は、Netflix のブログをご覧ください。