
マイクロソフト Azure、欧州とインドで障害拡大

マイクロソフトのAzureクラウドサービスは海外で大規模な障害に見舞われており、現地の顧客から怒りのツイートが殺到しています。問題は西ヨーロッパと北ヨーロッパで始まり、午前中にはインドにも広がりました。太平洋時間午前10時2分時点で、一部の顧客から問題が解決したとのツイートがありましたが、マイクロソフトのブログやステータス報告サイトには解決状況が反映されていません。
本日の障害は午前8時10分頃(すべて太平洋時間)に発生しました。複数のリージョンを持つことによる冗長性が、本当に障害に対する効果的な保護を提供できるのか疑問視する声も上がっています。
午前 8 時 50 分頃、ある顧客が「Azure の西 EU/北 EU で多くの問題が発生しています :-(。Azure の冗長性を 2 つのリージョンに分割すると、あまり良くありません...」とコメントしました。午前 9 時 9 分には、別の顧客が「西ヨーロッパと北ヨーロッパの Azure が壊れています。すべてを輝く英国に押し込む時が来たのでしょうか?」と書き込みました。
クラウドコンピューティングにおいて、信頼性の高い稼働時間は最も重視される要素の一つであり、今回のような不具合は、活況を呈するクラウドサービス市場において競合他社に打撃を与える可能性があります。マイクロソフトは市場第2位であり、圧倒的なシェアを誇るAmazon Web Services(AWS)とシェア拡大を競っています。AWS自身も、サービス停止の問題から影響を受けていないわけではありません。
Azureの問題は、Microsoftの開発者サービスブログで詳細が報じられている昨日のmy.visualstudio.comの障害にまで遡る可能性があります。ブログによると、午後6時までに問題は「完全に緩和」されたとのことです。
しかし、本日午前8時16分、同ブログの別の投稿で、マイクロソフトが西ヨーロッパにおけるVisual Studio Team Servicesの問題を「積極的に調査中」であると報じられました。同投稿は「お客様はサービス中断を経験する可能性がある」と警告し、回避策はないと述べ、午前9時までにアップデートを提供すると約束しました。
また、今朝のAzureステータスブログでは、北ヨーロッパと西ヨーロッパ地域で、9月7日午前5時から9月8日午後2時37分までの間、Azure管理ポータルのサイト回復タイルの読み込みに「断続的な問題」が発生していたことが示されていた。投稿では、問題は解決したと示唆されている。
しかし、本日午前8時47分現在、IsTheCloudUp.comのサイトでは、SHD Banner East US 2、SHD Banner North Europe、SHD Banner West Europeに問題が発生していることが示されていました。「SHD」とはサービスヘルスダッシュボードの略で、AzureサブスクライバーがAzureサービスの可用性を監視できるサービスです。つまり、SHD Bannerに問題が発生しているというだけでは、問題の本質について何も説明できません。
わずか数分後の午前9時、IsTheCloudUp.com は障害が拡大したことを示しました。北ヨーロッパと西ヨーロッパ地域では、App Service、Cloud Services、SQL Database、Virtual Machines、そして西ヨーロッパではVisual Studio Team Servicesが障害に見舞われていると表示されました。午前9時36分までに問題はさらに拡大し、西ヨーロッパと北ヨーロッパではApp Service、Cloud Services、Virtual Machines、SQL Database、西ヨーロッパ ではAutomation、Azure Search、Data Catalog、HDInsight、Media Services 、 Redis Cache 、Service Bus、Visual Team Services、そして西インドではService Busが障害にまで拡大しました。
北ヨーロッパリージョンはアイルランドを拠点としています。西ヨーロッパリージョンはオランダを拠点としています。マイクロソフトは各リージョンにいくつのデータセンターが設置されているかを明らかにしていません。西インドリージョンはムンバイを拠点としています。同社は英国に2つのリージョンを開設したばかりですが、これらのリージョンは今回のトラブルの影響を受けていないようです。
本日の問題に関する最初のツイートは午前8時10分頃に始まり、Visual Studio Team Services(旧Visual Studio Online)がダウンしているという内容でした。あるユーザーは、西ヨーロッパにある自分のサーバーの1つに接続できないと投稿しました。別のユーザーは、西ヨーロッパのSQLデータベースサービスに接続できないと報告しました。「すべてのデータベースがダウンしている」と別のユーザーが投稿し、「DNSがクラッシュしているようだ」とさらに別のユーザーが投稿しました。あるユーザーは、「@Azureがダウンしている時に、月額187ポンドを払ってサポートを受けられるというメリットがあるのは素晴らしい。こんなことでいいのか、この世に!」と不満を漏らしました。
マイクロソフトはコメント要請にすぐには応じませんでした。この件については、本日中に更新します。
午前10時55分更新:Microsoftはメールで、「西ヨーロッパおよび北ヨーロッパにリソースを展開している一部のお客様に、一部のサービスで問題が発生している可能性があります。現在、弊社チームで解決に取り組んでいます。その間、お客様は Microsoft Azureサービス正常性ダッシュボードで最新情報をご確認いただけます。」とコメントしました。
更新、午前11時14分: Azureステータスサイトによると、全サービスが全リージョンで稼働中とのことです。IsTheCloudUpは、インドの障害が復旧した以外は状況に変化はないと報告しています。また、Microsoft自身のAzureステータスサイトでは、依然として多数の障害が発生していると報告されています。「@ svneeは現在稼働中ですが、@ Azureの代替手段を検討するのは明らかです」と、ある顧客が午前11時11分にツイートしました。
更新、午前11時57分:すべての監視サイトで、西ヨーロッパのVisual Studio Team Servicesを除くすべてのサービスが復旧したと報告されています。しかし、Microsoftは慎重な姿勢を維持しています。「現時点では、西ヨーロッパのユーザーはVS Team Servicesアカウントにアクセスして通常の操作を実行できますが、カスタム拡張機能には引き続き問題が残ります。当社のエンジニアは、この問題の完全な解決に向けて懸命に取り組んでいます」とMicrosoft Developer Blogは述べています。
午後2時10分更新:ヨーロッパで発生した問題はすべて解決しました。しかし、今度は米国中南部と米国東部で問題が発生しています。Microsoftはブログで、「 2016年9月9日15時(UTC)[太平洋標準時午前8時]より、米国中南部と米国東部でVisual Studio Team Services \ Build & Deployment/Build (XAML) をご利用のお客様は、ビルドの待ち時間が通常より長くなります。エンジニアは潜在的な根本原因を調査し、緩和策を実施しています。」と発表しました。
更新、午後 10:00:すべての問題は解決されましたが、しばらく前から解決されていた可能性があります。ブログには解決がいつ達成されたかは記載されていません。