Airpods

Cortanaの未来?Microsoftの特許はメールの読み取りと要約における新たな進歩を示している

Cortanaの未来?Microsoftの特許はメールの読み取りと要約における新たな進歩を示している

ナット・レヴィ

Cortana は、さまざまなアプリからユーザーが知りたい情報をすべて簡単に提供します。(USPTO の写真)

Microsoft の Cortana に対するビジョンは進化を続けており、新しい特許によると、デジタル アシスタントの次のステップには、外出中のユーザー向けに電子メール、テキスト メッセージ、その他の種類の通信をより適切に読み取って要約する新しい機能が含まれる可能性がある。

Windows United が最初に発見した特許の図面には、ジョギングをしている人がヘッドフォン (おそらく Surface Headphones か、近日発売予定の Surface Earbuds) を通じて Cortana からの重要なメッセージの概要を受け取っている様子が描かれている。メッセージには、上司からのメッセージ、フライトのチェックインのリマインダー、履歴書を依頼するテキスト メッセージなどが含まれている。

レビュー:iPhoneでメールを読み上げるMicrosoft Cortanaは、ある意味驚くほど便利だ

Microsoftは、Outlook向けの新機能「Play My Emails」により、Cortanaのメッセージ読み取り・中継機能において既に進歩を遂げています。しかし、特許に記載されている情報は、Cortanaに長いメッセージから重要なポイントを抽出し、要約する新機能を提供することで、Cortanaの能力をさらに向上させます。

マイクロソフトは特許の中で、人間の脳は長くて複雑なメッセージを音声で読み上げると理解しにくいため、短い要約が必要だと述べています。

現在、「Play My Emails」はiOSのみで利用可能ですが、Microsoftは当時、Androidにも近日中に対応予定と発表していました。現在はOutlookのみで利用可能ですが、特許取得済みアプリからは、Microsoftが将来的にデジタルアシスタントに他のソースのコンテンツを読み取り、要約する機能を持たせたいと考えていることが分かります。

特許によると、Cortanaは機械学習と人工知能を用いて、Microsoft Teams、Skype、WhatsApp、Twitter、メール、通話、テキストメッセージなど、様々なソースからのメッセージデータを分析し、各メッセージの意味を学習します。これらのソースはすべて図に示されています。Cortanaはメッセージにスコアを付け、テキストサマリーを生成し、それを音声に変換してリスニングデバイスに送信します。リスニングデバイスは、スマートフォン、車、ヘッドフォン、スマートスピーカーなどです。

私たちは Microsoft にコメントを求めて連絡しており、返答があればこの投稿を更新します。

GeekWireエディターのトッド・ビショップ氏は先月、「Play My Emails」機能を試用し、「メール管理に驚くほど便利で、よくできたツール」と評しました。ただし、音声コマンドでメッセージを転送したり、ラベルや分類を付けたりできないなど、いくつか明らかな制限があります。基本的な使い方は以下のとおりです。

メッセージを読むとき、Cortana は次の一般的なパターンに従います。「[この期間]、[人の名前] が [件名] に関するメールをあなたと [他の受信者の数または名前] に [送信/返信/転送] しました。」

Cortanaは、メッセージを読む前に、その長さを概算で知らせてくれます。「長いですね」は、読むのに30秒以上かかるメッセージの前に使われるフレーズです。1分以上かかる場合は、「 とても 長いですね」と警告してくれます。(私の同僚でGeekWireの共同創設者でもあるジョン・クックからのメッセージには、この警告がよく付いてきます。)

Cortanaがメールの本文を読み上げている間、画面には音楽アプリのようなシンプルなオーバーレイが表示されます。件名の下に再生/一時停止、アーカイブ、フラグボタン、そして送信者の写真またはイニシャルが表示され、音声コマンドの代わりに使用できます。スマートフォンを手に持っている場合は、画面を前後にスワイプしてメッセージ間を移動できます。スマートフォンを持っていない場合でも、音声コマンドでメッセージキュー内を前後に移動できます。

マイクロソフトによると、「メール再生」は「Office 365のコアエクスペリエンスに不可欠な要素」としてリリースされる最初のCortana機能です。これは、SiriやAlexaといった汎用音声アシスタントと真っ向から競合するという構想を断念し、Cortanaを様々なデバイスでの生産性向上に重点を置くというマイクロソフトの幅広い取り組みの一環です。

サティア・ナデラCEOの指揮下、マイクロソフトは成果が出ていない分野を軽視したり、停滞している製品を活性化させるために大胆な方向転換をしたりすることをためらっていません。そして今、Cortanaもまさにその最中にあります。今年初めのWindowsアップデートでは、Cortanaを検索機能から分離し、セットアップ時にCortanaをミュートするオプションを追加しました。

特許で示された新機能は、同社が今年初めにBuild開発者会議で初めて発表したCortanaのビジョンと一致しています。マイクロソフトは、人間とバーチャルアシスタントの間で、従来の単一のコマンドと応答にとどまらない、より自由な会話を披露しました。スケジュールの変更や外出先での新規会議作成なども含まれています。

マイクロソフトが昨年買収した「会話型AI」スタートアップ企業Semantic Machinesは、Cortanaの進化に重要な役割を果たしています。Semantic Machinesは、音声ベースのAIを、単一のコマンドの理解と応答から完全な会話へと進化させることを目指しています。同社は、経験豊富なスタートアップ起業家、AppleのSiriの元チーフ音声科学者、そしてスタンフォード大学とカリフォルニア大学バークレー校の著名なAI研究者や教授陣によって設立されました。

今日のデジタルアシスタントは機能に限界があり、「新しいことのやり方を学習したり、既存の知識を組み合わせて新しいコンテキストに対応したりすることに重点を置いていない」と、Semantic Machinesの共同創設者でMicrosoftテクニカルフェローのダン・クライン氏は5月のブログ記事で述べている。クライン氏はさらに、Semantic Machinesはバーチャルアシスタントにコンテキストを学習させることで、単純な質問と回答を超えて成長できるようにすると付け加えた。