
AIチップ競争の内幕:重要なハッピーアワーがAmazonのクラウド戦略をどう変えたのか
アンナプルナ・ラボの共同創業者であるナフェア・ブシャラは半導体に精通しており、良質の赤ワインを好みます。アマゾンの著名なエンジニアであるジェームズ・ハミルトンは、業界を変革するアイデアに親しみ、賢明な起業家との出会いを好みます。
こうして彼らは、10年前の2013年秋、シアトルのパイク プレイス マーケットにある歴史あるレストラン兼バー、バージニア インに集まり、最終的に Amazon のクラウド ビジネスの方向性を変えることになる会話を交わしたのである。
彼らの会合、そしてアマゾンによるアンナプルナの買収は、このテクノロジー大手による独自のプロセッサ開発の取り組みを加速させ、現在の人工知能戦略の重要な要素の基礎を築いた。
アマゾンウェブサービスがラスベガスで開催されるre:InventカンファレンスでAIの新時代における自社の主張を表明する中、高度な人工知能用のチップを含むアマゾンのカスタムシリコンが今週注目を集めるだろう。
このイベントは、ChatGPTメーカーの最近の騒動の前に、MicrosoftがOpenAIの協力を得て設計されたMaia AI Acceleratorを含む独自のカスタムチップ2種を発表してから2週間後に行われました。Microsoftは、このカスタムチップを、クラウドインフラストラクチャのパフォーマンスを最適化し最大化するための最後の「パズルのピース」と表現しています。
AI アプリケーションでは、特に OpenAI のチャットボットを Alexa 音声アシスタントの会話機能と比較すると、ChatGPT が Amazon を追い抜いています。
Amazon CEO のアンディ・ジャシー氏が AI の「中間層」と呼ぶこの領域において、Amazon は複数の大規模言語モデルへのアクセスを提供する AWS Bedrock で存在感を確立したいと考えています。

しかし、Amazon の戦略の基盤となっているのは、大規模な AI モデルのトレーニングと実行を目的としたカスタム AI チップの Trainium と Inferentia です。
これらは、大手クラウドプラットフォームが自社のチップを開発し、世界中の自社データセンターでより高性能かつ低コストで動作するように最適化するというトレンドの一環だ。マイクロソフトはつい先日計画を公表したばかりだが、GoogleはGoogle Cloudで機械学習ワークロードに使用されているTensor Processing Unit(TPU)を複数世代開発しており、さらに独自のArmベースチップの開発にも取り組んでいると報じられている。
AI分野において、これらのチップは汎用シリコンの代替となる。例えば、AWSの顧客は、ディープラーニングや高性能コンピューティング向けに、広く利用されているNVIDIAのH100 GPUをAmazon EC2 P5インスタンスの一部として採用していると、ジャシー氏は8月の四半期決算発表の電話会議で述べた。
「しかし、これまで市場には誰にとっても実現可能な選択肢が一つしかなく、供給も不足していました」とジャシー氏は当時付け加えた。「この状況と、ここ数年で培ってきたチップの専門知識が相まって、数年前から独自のカスタムAIチップの開発に着手しました。」
Amazon の AI チップは、10 年前に隅のブースで Bshara 氏と Hamilton 氏が交わした会話にまで遡るカスタム シリコンの系譜の一部です。
「それが未来だ」
ハミルトン氏は広く尊敬されているエンジニアで、2010年にマイクロソフトからこのクラウド大手に入社したアマゾンの上級副社長である。同氏は2021年にアマゾンの上級リーダーシップチームに指名され、引き続きジャシー氏に直接報告している。
GeekWireの最近のインタビューでバージニア・インに戻ってきたハミルトン氏は、オンラインサービスにおけるAmazon S3(Simple Storage Service)の可能性を認識したことが、Amazonに惹かれたきっかけだったと語った。皮肉なことに、その認識は、Microsoftのビル・ゲイツ氏とレイ・オジー氏からS3を使ったアプリを開発して実験してみるよう依頼された後に生まれた。
「会議の直前に請求書が届いたんです。7ドル23セントでした。コンピューター代、アプリの開発、そして徹底的なテストに7ドル23セントも費やしたんです」と彼は振り返る。「あれで人生が変わりました。これが未来なんだと悟ったんです」
これは、クラウドが開発者や企業にもたらす価格とパフォーマンスの優位性を早期に示唆するものでした。しかし、Amazonで数年勤務した後、ハミルトンは会社が更なる飛躍を遂げる必要があることに気づきました。

2013年にブシャラと会うわずか数週間前、ハミルトンはジェフ・ベゾスと当時AWSの最高責任者だったジャシーのために、AWSが独自のカスタムシリコンの開発を始めるべきだと主張する社内文書をアマゾンが「6ページ」と呼ぶ文書として執筆していた。
「チップを製造しなければ、イノベーションをコントロールできなくなります」とハミルトン氏は当時考えていたことを回想し、サーバーがシステムオンチップ設計に移行する中で、この動きは同社にとって自然な次の進化だったと説明した。
彼の見解では、Amazon は、インフラストラクチャとコストを管理し、重要なサーバー コンポーネントを他社に依存することを避け、セキュリティやワークロードの最適化などの機能をハードウェアに直接組み込むことで顧客にさらなる価値を提供するために、シリコン レベルで革新を起こす必要がありました。
Arm プロセッサがモバイルや IoT デバイスに大量に搭載されるようになると、ハミルトン氏は、研究開発への投資を増やすことで、より優れたサーバー用プロセッサが生まれると信じていました。
早起きで仕事に励むハミルトンは、夕方になると地元のパブやレストランでスタートアップ企業や顧客、サプライヤーと会い、彼らの仕事内容を聞くことがよくありました。当時、世界中を旅し、ボートで仕事をすることで知られていた彼は、オフィスとマリーナの間にバイクを停められる場所を選んでいました。
ブシャラ氏は、2011年に、フルボイェ(ビリー)ビリッチ氏や、チップ設計会社ガリレオ・テクノロジーズ社の創業者アヴィグドール・ウィレンツ氏などのパートナーとともに、イスラエルに拠点を置くアンナプルナ・ラボを設立した。

彼は共通の友人からハミルトンを紹介され、ハミルトンの伝統に従ってハッピーアワーで会うことにした。ブシャラは、地元のUPSストアでスライドを印刷し、ブース内でハミルトンに見せる際に、レストランの他の客に内容が漏れないよう位置取りをしていたことを覚えている。
ハミルトン氏は、イスラエルの新興企業の取り組みにすぐに感銘を受け、その設計がアマゾンの主力製品であるニトロ・サーバー・チップの第2世代の基礎となる可能性を認識したことを思い出す。ニトロ・サーバー・チップの最初のバージョンは、カビウム半導体会社の既存の設計を採用したものだった。
ブシャラは、最初の会議でハミルトンがアンナプルナにさらなる飛躍、Armベースのサーバープロセッサの開発を依頼したことを覚えています。アンナプルナの共同創業者であるハミルトンは当時、市場はまだ準備ができていないと断言しました。
これは彼が現実的であり、アマゾンのシニアエンジニアが聞きたがっていることをただ言っただけではないことを示す兆候だった。ブシャラは会議後、当時の考えを詳しく説明したメールを送ってきた。
これがNitroにおける両社の最初の提携のきっかけとなり、最終的には2015年にAmazonがAnnapurnaを3億5000万ドルで買収するに至りました。Amazonによると、現在2000万個以上のNitroチップが使用されているとのことです。
AWSは2018年に、アンナプルナが開発したArmベースのCPU「Graviton」を発売した。このチップの製造を決定したとき、ハミルトン氏はブシャラ氏と初めて会った際にArmサーバーについて語ったことを思い出させた。
「私は彼に、あなたの言うとおりだと言いました」とブシャラ氏は振り返り、市場の準備が整ったと説明した。
Amazonの利点と課題
アンナプルナは、綱渡りのように感じられる分野でアマゾンに早い段階での優位性を与えた。
チップの設計は「非常に難しい。ソフトウェアとはまるで違う」とブシャラ氏は説明する。「ミスは許されない。バグがあってもチップを製造すれば、9ヶ月も無駄になる。ソフトウェアなら、バグがあれば新しいバージョンをリリースする。でも、今回は新しいバージョンを印刷し直さなければならないんだ」
Amazonがこの歴史について熱心に語る理由の一つは、生成型人工知能(GAI)の台頭に不意を突かれたという広く信じられている認識に反論するためだ。今週ラスベガスで開催されるre:Inventでは、AWSのCEOアダム・セリプスキー氏とチームが最新の製品と機能を発表するため、このテーマが繰り返し取り上げられることになるだろう。
「私たちは、生成型AIを実行するための最高の場所になることを強く望んでいます」と、Amazonのクラウドコンピューティングプラットフォームの中核サービスであるAWS EC2(Elastic Cloud Compute)を統括する副社長、デイブ・ブラウン氏は述べた。「顧客が何をしようとしているかを考えると、これは非常に広範な領域です。」
同氏によると、アマゾンのAIチップを使用しなくても、同社のNitroプロセッサは、AIトレーニングでよく使用されるNvidiaベースのEC2 P5インスタンスのネットワークスループットを大幅に向上させる上で重要な役割を果たしているという。
しかし、カスタム AI チップにより、さらにきめ細かな制御が可能になります。

「TrainiumとInferentiaを全て所有しているので、ハードウェアに至るまでデバッグできないという問題はありません」と彼は述べた。「カスタムシリコンを使用することで、非常に安定したシステムを大規模に構築できます。」
CCS Insightの主席アナリスト、ジェームズ・サンダース氏は、AWS、Azure、Google Cloudなどの主要なクラウドプラットフォームでは、関連するワークロードの規模が巨大であるため、カスタムチップが不可欠だと述べた。
「データセンターの計画という観点から言えば、サーバーラックにできるだけ多くのGPUを詰め込むだけで、多くの問題に直面する可能性があります」と彼は述べた。「それは放熱の問題となり、消費電力の問題にもなります。」
カスタムチップは、コモディティチップと比較して、ワークロードの最適化、消費電力の低減、セキュリティの向上を実現します。消費電力の高いGPUには、AIワークロードには不要な機能もいくつか含まれています。Amazonはこの事実を早くから認識し、TrainiumとInferentiaによってカスタムAIチップ分野で先行しています。
しかしサンダース氏は、ソフトウェア面が重要な課題であると述べた。
NVIDIAは、GPU上で汎用コンピューティングを実現するソフトウェアプラットフォームであるCUDAによって、AI分野で強力な地位を築いています。これがNVIDIAに有利な条件をもたらしました。Amazonにとっての課題の一つは、NVIDIA GPU上のCUDAで稼働するAIワークロードをAmazonのチップに移植することだと彼は述べました。これには、開発者の多大な努力とAmazonからの働きかけが必要です。
開発者がCUDAというプログラミング言語に縛られている場合、既存のワークロードをNVIDIA GPUから移行するのは困難になる可能性があると、Moor Insights & StrategyのCEO兼チーフアナリストで、元AMD戦略担当副社長のパトリック・ムーアヘッド氏は同意した。同氏はこの見通しを「非常に困難な課題」と表現した。
同氏は、アマゾンのソフトウェア抽象化レイヤーと統合開発ツールにより、新しいワークロードを開始する際の移行が容易になると述べた。
アンナプルナの共同創業者であるブシャラ氏は、アマゾンは長期的な成長にはソフトウェアの習熟が重要だと認識しており、同社はAIチップ用のソフトウェアツールチェーンの構築に多大なリソースを投入していると語った。
「多くのお客様は、Trainiumの導入を戦略的優位性として捉えています」とBshara氏はメールで述べています。「お客様がこれらのチップを急速に導入していることに大変興奮しており、ツールとサポートが、お客様がこれまで使用してきたチップアーキテクチャと同じくらい使いやすく、使い慣れたものになると確信しています。」
同社のAIチップは、AirBnB、Snap、Sprinklrなどの企業で、パフォーマンスとコスト面で明らかなメリットを伴って大規模に使用されていると同氏は述べた。
アンスロピックは、最近発表された提携に基づき、アマゾンのAIチップも使用する予定だ。アマゾンはこの提携で、マイクロソフトとOpenAIの2社に対抗するため、この新興企業に最大40億ドルを投資する予定だ。
ムーアヘッド氏は、今後アマゾンの最大の課題は、AIモデルのニーズが飛躍的に拡大し続ける中で、最新のチップアーキテクチャで技術的に一歩先を行くこと、そして、NVIDIAやAMDのような専用チップ企業と競争するために研究開発に多額の投資を続けることだと述べた。
ムーアヘッド氏は、アマゾンは自社製チップの開発に大きなリスクを負ったものの、半導体業界を刷新し、主要クラウドプラットフォーム間で新たな競争を巻き起こすことでその成果を上げたと述べた。「彼らは挑戦し、そしてそれを成し遂げたのです」とムーアヘッド氏は述べた。「そして、文字通り他のすべての企業に追随するきっかけを与えたのです。」