
Facebookはデータセンターの需要増加に対応するために新しいネットワークアーキテクチャを開発し、OCPに寄付する予定だ。
トム・クレイジット著

Facebook は、自社データ センター内のサービスに対する需要に応えるため、数十年前にサーバー業界に革命をもたらしたスケールアウト原理と同じ原理に基づく新しいネットワーク アーキテクチャを開発し、火曜日に Open Compute Project の一環としてそのアーキテクチャをリリースしました。
Facebookは、ハードウェアやデータセンターインフラの設計をオープンソースソフトウェアが業界全体で共有されるのと同様の方法で共有する業界団体OCPに、「Fabric Aggregation Layer」と呼ばれるレイヤーを寄贈します。FacebookはOCPの設立において重要な役割を果たし、OCPは火曜日にサンノゼで年次サミットを開催します。
Facebookのインフラ担当ソフトウェアエンジニアリングディレクター、オマール・バルドナド氏によると、この新しいアーキテクチャは、Facebookが既存のデータセンター複合施設の一部を拡張するために開発されたという。クラウドベンダーと同様に、Facebookは世界各地にデータセンターを運営しており、それぞれの拠点は「リージョン」と呼ばれている。そして、各リージョン内には、Facebookの複合施設には通常、サーバーを収容する建物が複数ある。

過去1年ほどの間に、同社はこれらの拠点の一部で拠点を拡大し、最大6棟の建物に対応できるようにする必要性を認識していた。しかし、2棟の建物を接続する際には有効な大型で強力なスイッチは、地域内のより多くの建物を接続するとなると、高価で扱いにくくなると同氏は述べた。
そこでFacebookは、数年前に設計したカスタムスイッチ「Wedge100」をベースに、Wedge100のような小型スイッチを多数使用し、より洗練された配線戦略によってデータセンター地域内の複数の建物を接続する新しいネットワークアーキテクチャを設計しました。これにより、データセンターとエンドユーザー間の接続も改善されると同氏は述べています。
1990年代後半から2000年代初頭にかけてインターネットが誕生した頃、データセンター運営者は、IBMやSun Microsystemsのような巨大で高価なマシンを1台購入する代わりに、比較的安価なサーバーをネットワークに繋げることで、パフォーマンスを向上させ、容量をはるかに迅速に拡張できることにすぐに気づきました。ファブリック・アグリゲーション・レイヤーもほぼ同じ考え方です。ネットワーク管理者は、将来の需要に対応するために高価な機器に多額の投資をすることなく、必要に応じてネットワーク機器ラックに安価なスイッチを追加できます。
このアーキテクチャには他にも利点がある。「実際の設計においては、電力効率が大幅に向上しています」とバルドナド氏は述べた。大規模データセンター運営者にとって電力は大きな考慮事項であり、Facebookがかつて各施設間の接続に使用していた大型ネットワークスイッチを稼働させるには膨大な電力が必要になる。
バルドナド氏は、「大型スイッチを使ってこれだけのデータ量で信号の整合性を保つには、ますます多くの電力が必要になります」と述べた。「実現は可能ですが、そのコストはどうなるでしょうか?ネットワークに費やされる電力は、計算を行うサーバーに費やされる電力ではないのです」と彼は付け加えた。
Facebook は、一部のデータ センター内の実稼働ワークロードに Fabric Aggregation Layer を使用しており、最終的にはすべてのインフラストラクチャがこの方式に移行する予定です。