Iphone

Alexaは、夕食と映画から始めて、AIスキルを組み合わせることで賢くなります

Alexaは、夕食と映画から始めて、AIスキルを組み合わせることで賢くなります

アラン・ボイル

Amazonの副社長兼Alexa担当主任科学者であるロヒット・プラサド氏が、バーチャルアシスタントが夜の外出に向けて様々なアクティビティを計画する仕組みを解説する。(GeekWire Photo / Alan Boyle)

ラスベガス — アマゾンの仮想アシスタント「Alexa」は、夜の外出に必要なあらゆる要素を手配することから始まり、まもなく数千ものスキルを巧みに使いこなせるようになる。

クロススキルアクション予測は、Amazon の re:MARS カンファレンスで本日発表された Alexa のアップグレードの 1 つです。

アマゾンの副社長でAlexaの主任科学者であるロヒット・プラサド氏は、Echo Showのユーザーがシームレスな対話を通じて『ダーク・フェニックス』の上映作品を選び、Atom Ticketsで座席を予約し、近くのおいしい中華料理店を探し、Open Tableでディナーの予約をし、Uberの配車を手配し、映画の予告編を見ることができるというシナリオを説明した。

「この体験をすぐにお客様に提供していきます」とプラサド氏は本日午前の基調講演で述べた。

アマゾンのデバイスおよびサービス担当上級副社長デイブ・リンプ氏はプラサド氏のプレゼンテーションの後、夜の外出の計画はアマゾンの推奨エンジンの取り組みを活用したアップグレードされたAIモデルを使用してAlexaの開発者が取り組んだ最初のシナリオであると語った。

このモデルは、ユーザーが以前にチェックした内容に基づいて、どの映画や本が好みかを判断するのではなく、Alexa がすでに使用したスキルをフォローアップするためにどのスキルが最も必要になるかを予測します。

「私たちは『夜遊び』体験から始めました」とリンプ氏は記者団に語った。「現在、社内でいくつか別の体験に取り組んでいます。今後数ヶ月でそれらを公開する予定です。しかし、いずれはAlexaが目指す方向がそこになると思います。Alexaは音声科学の聖杯であり、エンドツーエンドでプログラム的に考えなくても会話を繋げられる技術なのです。」

リンプ氏は、複数のスキルを組み合わせることができれば、夜の外出の予約など一連の複雑な作業を手配するのにかかる時間が、40分から数分間のスムーズな会話にまで短縮されるはずだと述べた。

プラサド氏によると、クロススキルトレーニングに加え、AmazonはAlexa Conversationsと呼ばれるソフトウェアアップグレードのプライベートプレビューを提供する予定だ。これにより、開発者は「より少ない労力、より少ないコード行数、より少ないトレーニングデータ」で自然な音声体験を開発できるようになる。対話フローの手作業によるコーディングは、開発者の入力から会話をモデル化するリカレントニューラルネットワークに置き換えられる。

Alexa Conversationsにより、構造化された音声エクスペリエンスの開発が「約半分ほど容易になる」はずだとリンプ氏は語った。

Amazon はまた、Alexa をロボットではなく人間らしく見せようとしている。

「私たちには専任のチームがいて、毎日起きてはAlexaの性格のことだけを考えます」とリンプ氏は語った。「そして、そのチームは世界中で複製されています。ですから、ドイツでのAlexaの性格は日本での性格とは少し異なります。共通点もあります。彼女は非常に知的で、非常に共感力があります。しかし、日本で彼女から返答を得るとしたら、それは少し違うでしょう。」

リンプ氏によると、AmazonはAlexaに意見を提供するところまで行っているという。「意見のないディナーパーティーに行ったことがあるなら、そのディナーパーティーから立ち去りたいなんて思わず、逃げ出したくなるでしょう。つまらないディナーパーティーですからね」とリンプ氏は語った。「だから、Alexaに好きなビールは何かと尋ねることができるのです。そして、彼女がアメリカで好きなビールは、ドイツで好きなビールとは違います。これはグローバルな取り組みであり、多くの人々が常に取り組んでいます。」

リンプは、まるでアレクサと一緒に夜の外出を計画する価値があるかのように言った。