
Alexa vs. ChatGPT: Amazonがアシスタントをよりプロアクティブで会話的なものとするため、新たなAIモデルを構築
トッド・ビショップ著

新しい形式の生成AIがテクノロジーの世界全体に広がるにつれ、OpenAIのChatGPTとの洗練されたテキストベースの会話と比べて、AlexaユーザーにとってAmazonの音声アシスタントからの基本的な応答を受け入れることが難しくなってきている。
数か月前のシンプルだが啓発的な例として、テックモニターの技術ジャーナリスト、ライアン・J・モリソン氏が当時喉の痛みに悩まされ、気分が良くなるためのレシピを教えてほしいとアレクサに頼む自身のTikTok動画を投稿した。
「もちろんです」とAmazonの音声アシスタントは、レシピの問い合わせに対する標準的な返答を返した。「料理名と材料で検索できます。何にしますか?」
「体調が悪いときに気分を良くしてくれるもの」とモリソン氏は答えた。
アレクサは彼に料理の名前と材料を教える様に再度頼みました。
彼は苛立ちで目を見開いた。「喉が痛いんです」と彼は言った。「何か効くものがあれば教えてください」
Alexa は 3 回連続で同じ応答を返しました。
ChatGPTに切り替わる。「気分が悪いんです」とモリソンは入力した。「気分が良くなるレシピを教えてください」
OpenAIの大規模言語モデルは、彼の病気に同情を表明しただけでなく、「気分が良くなるかもしれない、心温まるスープの簡単なレシピ」を提供し、非常においしそうなチキンヌードルスープの材料と調理手順をリストアップした。
なぜAlexaは同じことができないのでしょうか?簡単に答えると、Amazonが取り組んでいるからです。
これは、アマゾンCEOのアンディ・ジャシー氏が木曜日午後に行われた第1四半期決算発表の電話会議で述べた内容だ。ジャシー氏は、AIの新時代がAlexa音声アシスタントとEchoスマートスピーカーへのアマゾンの投資優先順位にどのような影響を与えているかという、モルガン・スタンレーのアナリスト、ブライアン・ノワック氏からの質問に答えていた。

ジャシー氏はまず、Amazonのビジョンはスマートスピーカーの開発だけでなく、「世界最高のパーソナルアシスタント」の創出にあると述べた。大規模言語モデルと生成AIの台頭は、その実現の可能性を「飛躍的に加速させる」と彼は述べた。
同氏は、アマゾンは「Alexaでかなり良い位置からスタートしている」とし、エンターテインメント、ショッピング、スマートホーム技術、情報などのアプリケーション向けに「数億のエンドポイント」のインストールベースを持っていると述べた。
「これまでも大規模な言語モデルを基盤として構築してきました。しかし、現在、さらに大規模で、より汎用的で、より高性能なモデルを構築しています」とジャシー氏は述べた。「これにより、世界最高のパーソナルアシスタントになるという私たちのビジョンが急速に加速するでしょう。その背後には、重要なビジネスモデルが潜んでいると考えています。」
Amazonに対し、ジャシー氏のコメントについて、このより高度な大規模言語モデルの開発期間や、一般公開時期などの詳細を尋ねたところ、広報担当者は次のように回答した。
Alexaは既にAlexa Teacher Modelと呼ばれる大規模な言語モデルの恩恵を受けており、このモデルは長年にわたり、サービスの基盤となる機械学習システムの強化に役立ってきました。アンディが述べたように、私たちはさらに大規模で、より汎用性が高く、高性能な新しいモデルも構築しています。これにより、既に世界最高のパーソナルアシスタントであるAlexaは、よりプロアクティブで会話的なアシスタントへと進化していくでしょう。
電話会議でジャシー氏はまた、最近の株主への書簡でも強調した、AWSクラウド部門における生成AIへのアマゾンの取り組みを改めて強調した。
Alexaへの継続的な投資が注目されるのは、EchoとAlexaを含むAmazonのデバイス&サービス部門が、1月に始まったAmazonの最初の一連の人員削減の影響を受けた部門だったからだ。