Ipad

「Nova Act」によりアマゾンはAIエージェント競争にさらに参入する

「Nova Act」によりアマゾンはAIエージェント競争にさらに参入する

トッド・ビショップ

アマゾンは月曜日、ウェブブラウザ内でタスクを自律的に実行できるエージェントを作成するための新しいAIモデルおよび開発者ツールキットであるNova Actを発表した。この動きにより、このテクノロジー大手はAIエージェントの商用化をめぐる新たな競争において、より有利な立場に立つことになる。 

同社はまた、開発者や一般ユーザーが 12 月に導入された Nova 基盤モデルを試すことができる新しい Web サイトも公開しています。

Nova Act の研究プレビューは、サンフランシスコの Amazon AGI ラボからの最初のリリースであり、OpenAI、Salesforce、Microsoft、Google、Amazon のパートナーである Anthropic などのライバル企業や、増加するスタートアップ企業が AI チャットの域を超え、ユーザーに代わって実際のタスクを完了できる自律システムの開発を競う中で登場しました。

「私たちは、エージェントこそが汎用知能への道の最後の欠けているピースだと考えています」と、アマゾンのAGIオートノミー担当副社長、デビッド・ルアン氏はGeekWireとのインタビューで語った。

Amazon の AGI 自律性担当副社長、デビッド・ルアン氏。(Amazon の写真)

元OpenAI副社長兼Google Researchディレクターのルアンは、昨年、企業のワークフローを自動化するエージェントを開発するサンフランシスコのスタートアップ企業Adeptの面々と共にAmazonに入社しました。ルアンは、Amazonのロボット工学研究員であるピーター・アビールと共にAmazonラボを率いています。

Nova Actは、APIに依存せずにブラウザ上で段階的にタスク(休暇申請の提出や定期的なオンライン注文の発行など)を実行できるエージェントを開発者が構築できるように設計されています。Amazonによると、このモデルはドロップダウンメニュー、日付選択、ポップアップダイアログなど、他のシステムでしばしば問題となるインターフェース要素も処理できるように設計されているとのことです。

Python ソフトウェア パッケージとして利用できるこのツールキットを使用すると、開発者は自然言語の指示に従って Web ブラウザーでタスクを完了できるエージェントを作成できます。 

これらのエージェントはバックグラウンドで静かに動作し、開発者は大規模なワークロードを処理するために複数のエージェントを同時に実行できます。また、画面に何も表示せずに動作させることも可能です。これは、より高度なビジネス用途や自動化されたビジネス用途向けに設計されたバックグラウンドモードです。

同社によれば、初期の社内テストでは既存のシステムよりも信頼性が向上していることが示されたが、AGI ラボではシステムのパフォーマンスや使用方法を注意深く観察していく予定だという。  

「これは開発者の参加を促すための手段です」とルアン氏は述べ、Nova Actは初期段階の研究プレビューだと説明した。「開発者がこれを使ってどう行動するのかを見たいのです」

これは同社のNova AIイニシアチブの延長であり、テキスト、画像、ビデオなど、さまざまなメディアや入力形式に重点を置いた、さまざまなサイズの基礎モデルが含まれています。 

AmazonのNovaモデルは、生成型AIの新時代において競合他社との差を縮めるための、同社による広範な取り組みの一環です。Novaモデルは、自社サービスと緊密に連携し、低価格で提供される、いわばストアブランドのような機能を備えています。

同時に、AmazonはBedrockサービスを通じて幅広いサードパーティモデルを提供しています。同社は外部オプションに多額の投資を行っており、Claudeチャットボットを開発するAIスタートアップ企業Anthropicに最大80億ドルを投資しています。