Vision

デルタ航空の継続的なクラウドストライク問題は、脆弱な技術とプランBの不在が災害の原因であることを明らかにしている。

デルタ航空の継続的なクラウドストライク問題は、脆弱な技術とプランBの不在が災害の原因であることを明らかにしている。

ボブ・サリバン

先週のCrowdStrikeの障害発生後、金曜日の朝、シアトル・タコマ国際空港のデルタ航空カウンターでチェックインするマイクロソフト社員の隣に、リカバリモードのWindowsマシンがモニターに映し出されている。(GeekWire Photo / Taylor Soper)

編集者注:この分析は、ボブ・サリバンのニュースレター「レッドテープ・クロニクルズ」に掲載されたものです。

CrowdStrikeの惨事については、既に多くの辛辣な意見が出ているので、私の意見を述べる必要はないと思います。しかし、このたった一つの欠陥コードがインターネットを蝕んでからわずか5日後も、デルタ航空が乗客に対して*いまだに*何をしているのかを見れば、もはやCrowdStrikeを責めることはできません。これは単一障害点ではなく、一連の事象でした。

デルタ航空のバックアッププランは失敗することだった。それに慣れろ。デジタル時代は「単一障害点」問題と呼ばれるものが蔓延しており、多くの大企業は現実的なバックアッププランに投資を怠っている。だから、バックアッププランは失敗する。そして、定義上、もはや単一障害点ではなく、イベントカスケード(連鎖的な事象)が存在する。多くの場合、これは予防可能なイベントカスケードだ。

これには構造的な理由があり、それを解決しようという強い政治的意志がない限り、解決することはできないのです。

問題は単純です。真に実行可能な「プランB」は非常に高価で、それを維持していくのはさらに費用がかかります。ウォール街主導の企業は、何らかの規制によって強制されない限り、そのような資金を投資することはありません。一方、アメリカ人の約半数は「規制」という言葉を聞くと即座に嫌悪感を抱きます。それで、今の状況はこうなっているのです。

福島原発事故後にNBCニュースに寄稿した「プランBが往々にして失敗に終わる理由」という記事以来、私は15年近くもの間、バックアッププランの問題に関心を寄せてきました。このケーススタディは多くの教訓を提供してくれます。また、米国企業や米国規制当局の破綻とは無関係であるため、責任の所在を明確に把握しやすいようにも思えます。

簡単に説明すると、地震で大規模な停電が発生し、原子力発電所の冷却能力が脅かされました。さらに津波が来て、非常用発電機も機能を停止しました。予備バッテリー(いわばプランC)はありましたが、数時間しか持たず、津波後のような過酷な状況下での修理には全く足りませんでした。こうして、原子力発電所は大惨事に見舞われたのです。

この話が重要なのは、「単一障害点」という言葉がしばしば少々誤解を招くものであることを示しているからです。福島で起こったことは、複数のものが同時に故障するという連鎖的な出来事でした。そして、それが現実です。確かにデルタのコンピューターはブルースクリーンに見舞われました。しかし、その後すぐに修正が行われました。

それでも、デルタ航空は数日間、乗務員の航空機への割り当てといった基本的な業務が不可能な状態に陥りました。公式な説明を待ちたいところですが、デルタ航空のプランBは明らかに惨憺たる失敗に終わりました。そして今、デルタ航空は最初の問題発生から1週間近く経った今、空港が乗客で溢れかえっているという状況に陥っています。

公平に言えば、人生で起こりうるすべての出来事を予測することは不可能です。極めて稀なブラックスワン現象が発生する可能性は常に存在します。しかし、ソフトウェアの不具合によるアップデートは、ブラックスワン現象とは言い難いでしょう。

より一般的な制限関数は、プランBへの支出は無限にはできないということです。冗長性のあるオフサイトデータストレージ、追加の消火設備、バッテリーバックアップ容量への投資には、常にリスク計算が伴います。

そして、訓練の問題もあります。「机上」の火災訓練を実施したことがある人なら誰でも言うように、想像力だけでは限界があります。すべての主要生産コンピュータが同時にオフラインになるという状況をシミュレートすることは現実的に不可能です。そんなことをすれば、会社を閉鎖せざるを得なくなります。別の世界や素晴らしいシミュレーターが近くにない限り、実施している火災訓練では、本番を想定した訓練には到底及ばないでしょう。前回会社で実際の火災訓練を実施したとき、多くの重要な従業員が鳴り響く警報を無視して退避したことを経験したあなたは、きっとこのことに気づいたはずです。

では、CrowdStrikeの影響はどうなるのでしょうか? どうなるべきでしょうか? 確かに、同社の株価は下落するでしょう。もしかしたら、一部の企業は新しいソフトウェアに切り替えるかもしれませんが、それは考えにくいでしょう。デルタ航空は多くの払い戻しをせざるを得なくなるでしょう(FAAの新しい規制のおかげです!)。四半期報告書にも何らかの一時的な影響が出るはずです。 

それでどうする?本当に次のソフトウェア不具合への備えを強化できるのだろうか?航空業界に真の競争が生まれ、怒った消費者が他の企業に利益をもたらすことで、自らの行動で投票できるなら、状況は改善するかもしれない。しかし、ほとんどの消費者は航空券を予約する際に、実質的な選択肢がほとんど、あるいは全くない。だから、私は同じことがまた起こると確信している。

それを変える政治的意志がない限り。なぜなら、次のソフトウェアの不具合は、あなたの航空会社、銀行、あるいはインターネット接続された自宅に、すぐにやってくると約束するからです。