
Tayから1年経った今も、マイクロソフトはボットに注力している。そして今、同社は何に注力しているのか?

マイクロソフトは、短命に終わったチャットボット「Tay」のリリースから1年が経ちました。当時、インターネットユーザーがTayに人種差別的・女性蔑視的な発言を教え込むことができたという、残念な結果に終わりました。以来、チャットボット技術について多くのことを学んできました。今週末、マイクロソフトはこの経験から得た教訓と、現在マイクロソフトが取り組んでいる膨大な人工知能関連プロジェクトについて、洞察を発表しました。
CEOサティア・ナデラ氏の後押しを受け、同社の人工知能(AI)チームはTayから脱却し、昨年末にミレニアル世代をターゲットとした新しいチャットボット「Zo」の提供を開始した。Zoは、同社の人気中国語ボット「XiaoIce」(マイクロソフトが2014年にWeChatで展開)をベースにしている。
「Tayは去りました。私たちが受け入れ、サポートしているのはZoです」と、マイクロソフトの人工知能(AI)テクニカルフェロー、シュエドン・フアン氏は、ワシントン州ベルビューで開催されたAI NEXT技術カンファレンスでの土曜日のプレゼンテーションで述べた。「AIはデータから学習します。私たちは起こったことから学びました。(Tayでは)私たちはそれほど素晴らしい仕事をしたわけではありませんでした。Zoでは、はるかに良い仕事をしています。」
マイクロソフトは昨秋、5,000人規模のAI・研究グループを新たに結成し、人工知能への取り組みを強化した。
フアン氏は、マイクロソフトのAIとチャット技術の主要な応用例をいくつか紹介しました。その中には、マイクロソフトが現在全社的なサポートウェブサイトで使用している新しい実装も含まれていました。「開始する」ボタンをクリックするだけで、すぐにチャットボットセッションが開始される様子を披露しました。チャットに入ると、「Windows 8からアップグレードするにはどうすればよいですか?」といった質問をすることができます。
デモンストレーションでは、すべての回答が質問に対する最適な解決策を提供したわけではないが、これは進行中の作業であり、このテクノロジの可能性と、マイクロソフトがボットを使用して主流のエンタープライズ ビジネス要件を満たすことに注力していることを示していると Huang 氏は述べている。

マイクロソフトの人工知能担当主任科学者である Li Deng 氏は、今日の AI とチャット ソリューションは人工知能の数十年にわたる進化の集大成であり、AI の各段階が新しい世代のソリューションを生み出している、とカンファレンスで語った。
鄧氏は、第一世代の AI は 1990 年代初めから 1990 年代の変わり目頃まで続き、主にルールとテンプレートに重点を置いていたと述べた。
このようなシステムは、入力と出力の点で機能が限られており(初期の音声ベースの列車運行情報システムを思い浮かべてください)、設計は専門知識を持つ専門家に依存していました。複数の専門分野、つまりドメインに拡張することは困難でした。例えば、航空券予約システムのフレームワークをテレフォンバンキングシステムの設計に利用することはできませんでした。データはシステムを構築するルールを設計するためにのみ使用され、システムの運用方法を学習して進化させることには使用されませんでした。
「このアプローチの問題は、非常に脆弱だったことです」と彼は述べた。「結果の解釈が容易なため、今日でもこのアプローチに基づいたシステムが数多く存在します。」
次世代AIは1990年代後半に登場し、「データ駆動型の浅い学習」を基盤とし、音声認識と組み合わせて利用されたと彼は述べた。その真の目的は、データを活用して複雑な対話を手作業で作成するコストを削減し、音声認識エラーに対するシステムの感度を低下させることだった。また、データの活用をさらに進めようとした。
「大量のデータがあれば、多くのことを自動的に学習します」と彼は述べた。「データ駆動型だったため、最先端の技術を非常に良い方向に押し進めました。」
しかし、鄧氏は、この第二世代のAIが生み出す結果は、必ずしも解釈やデバッグが容易ではなく、システムの更新も困難だと説明した。また、第二世代のAIは第一世代のシステムを置き換えるのではなく、むしろ並行して動作していた。
これらすべてが今日の第3世代人工知能へとつながり、マイクロソフトの現在のチャットソリューションはそこから生まれました。Deng氏によると、これらのシステムにおける重要な違いは、データ駆動型のディープラーニングです。
Deng 氏によると、このディープラーニングのアプローチにより、今日の会話型ボットは、ソーシャル チャットボット (Microsoft の Zo や XiaoIce など)、InfoBot (主に情報の検索を目的としたもの)、タスク完了ボット (フライトの予約や技術的な問題のトラブルシューティングなど、特定のタスクの達成を支援するもの)、パーソナル アシスタント ボット (情報の検索とタスクの完了を推奨と組み合わせて、近くにある最高のイタリアン レストランを提案するなど) の 4 つのカテゴリに分類されるようになります。
マイクロソフトは、ボット技術の活用において、上記のすべての分野において厳しい競争に直面しており、特に音声AIの活用が顕著です。デン氏は、Amazon Echo、Apple Siri、Google Now、VocalIQ、IBM Watson Analyticsといった、マイクロソフトのCortanaと同分野で競合する製品を挙げ、競争の激しさを認識しました。
鄧氏はまた、マイクロソフトがAIと音声認識技術および機械翻訳技術をどのように組み合わせているかについても説明しました。音声認識技術を用いて発話された言葉をテキストに変換することで、マイクロソフトは機械翻訳ツールを用いてそれらの言葉をある言語から別の言語に翻訳することが可能になります。
音声合成技術により、新たに翻訳された単語は別の言語の音声に変換されます。これらの機能はすべて、昨年末にAndroid、Amazon、iOS、Windowsデバイス向けにリリースされたMicrosoft Translatorの最新機能に組み込まれています。