Vision

マイクロソフト、オンラインサービスの不具合と大規模なメール遅延について謝罪

マイクロソフト、オンラインサービスの不具合と大規模なメール遅延について謝罪

トッド・ビショップ

マイクロソフトは今夜、クラウドベースの Microsoft Exchange Online サブスクリプション サービスで大量のメール バックログを引き起こした一連の不具合について詳細を述べ、謝罪した。この不具合により、場合によってはメッセージが 3 ~ 9 時間も遅延した。

このサービスを運営する同社の Business Productivity Online Services (BPOS) チームも、Outlook Web Access サービスと Outlook 電子メール プログラムへのアクセスを妨げ、Exchange ActiveSync デバイスに問題を引き起こした別の問題を認めた。

これは、大手クラウドコンピューティングサービスで発生した最新の注目度の高い問題です。ただし、Amazon Web Servicesで最近発生した障害(複数の主要ウェブサイトに影響を及ぼした)ほど、外部に公表されておらず、目立った問題ではありませんでした。MicrosoftのBPOS顧客は、フォーラムへの投稿や苦情を通じてこの問題への関心を高め、本日早朝、メディアの注目を集めました。

マイクロソフトは今夜、影響を受けた顧客に対してサービスクレジットを提供することを約束し、根本的な技術的問題に対処することを誓約し、今後インシデントが発生した際にはコミュニケーションを改善すると述べた。

「以前にも申し上げたとおり、BPOSチームとマイクロソフトの全員が、お客様へのサービスプロバイダーとしての重大な責任を認識しており、サービスに関するいかなる問題もお客様のビジネスに支障をきたすものであり、決して許されるものではないと認識しています」と、マイクロソフト オンライン サービス担当コーポレートバイスプレジデントのデイブ・トンプソン氏は、今回の事態を説明するブログ記事で述べています。(:元の投稿から氏名を修正しました。)

問題の背景については、ZDNetのMary Jo Foleyによる以前の投稿で詳しく説明されています。Microsoftが今夜投稿した記事の技術的な詳細は以下の通りです。

火曜日午前9時30分(太平洋夏時間)に、BPOS-S Exchangeサービスにおいて、ハブコンポーネントの1つに問題が発生しました。これは、サービス上の不正なメールトラフィックが原因です。Exchangeにはこのようなトラフィックを処理する機能が組み込まれていますが、その機能が正常に動作しないという稀なケースが発生しました。その結果、メールのバックログが増大しました。午前0時(太平洋夏時間)までに、不正なトラフィックは隔離され、メールキューはクリアされました。お客様が経験した遅延は、6~9時間程度と、状況によってばらつきがありました。短期的な緩和策が実施され、修正プログラムの開発が進められています。

本日午前9時10分(太平洋夏時間)に、サービス監視によってサービス上で不正なメールトラフィックが再度検出されました。この問題は午前10時3分に解決されましたが、この間、お客様には最大45分間のメール遅延が発生しました。午前11時35分(太平洋夏時間)には、監視によって2つ目の関連する問題が検出され、一部のエンドユーザーの送信トレイにメールが滞留する問題が発生しました。この問題は午後12時4分(太平洋夏時間)に解決されました。この間、150万件を超えるメッセージがサービス上で配信待ちの状態でした。午後4時12分までにバックログは90%解消されましたが、この大量のメールバックログにより、お客様には最大3時間もの遅延が発生した可能性があります。現在、両方の問題に対する包括的な修正を実施中です。

午前1時4分(太平洋夏時間)から、別のインシデントが発生しました。サービス監視により、http://mail.microsoftonline.com ドメインをホストするドメインネームサービス (DNS) に障害が発生しました。この障害により、南北アメリカでホストされている Outlook Web Access へのアクセスが停止し、Microsoft Outlook および Microsoft Exchange ActiveSync デバイスの一部機能に影響が出ました。チームは、http://mail.microsoftonline.com ドメインのドメインネームサービス (DNS) をホストするサーバーに根本的な問題があることを診断・修正し、午前4時52分(太平洋夏時間)にサービスを復旧しました。チームは、DNS 関連の問題への対応において多くの改善点を確認しました。このインシデントに関する詳細な事後分析は、Microsoft サポートを通じて提供する予定です。