Watch

マイクロソフトはXbox、Windows Phone、その他ほぼすべての製品に音声機能を追加

マイクロソフトはXbox、Windows Phone、その他ほぼすべての製品に音声機能を追加

トッド・ビショップ

マイクロソフトのTellmeグループの音声技術は、Xbox LiveとWindows Phoneの今後の刷新を皮切りに、同社製品において急速に大きな位置を占めるようになっています。ユーザーは、音声コマンドを使って画面上の体験を操作したり、コントロールしたりする機会が増えるでしょう。例えば、Windows Phoneでテキストメッセージを聞き、音声で返信するといったことが考えられます。

Ilya Bukshteyn 氏、Microsoft Tellme シニア ディレクター

そして、音声認識機能は以前よりもかなり向上していることが人々に分かるはずだと、マイクロソフトの Tellme シニアディレクターのイリヤ・ブクシュテイン氏は、同社レドモンドキャンパスで今日会った際に語った。

その理由は、モバイル端末のBingなどのアプリケーションを通じて提供される音声検索の多様性によって、この技術が向上したからです。さらに、Microsoftはさまざまな音声アプリケーションで統合されたクラウドベースのサービスを提供しています。より多くのデータを扱うことで、統合システムはより迅速に学習することができます。

「過去18カ月から2年の間に、それ以前の10年間よりも大きな改善が見られました」とブクシュテイン氏は語った。

上のビデオでは、Bukshteyn氏がXbox 360のMicrosoft Kinectセンサーの拡張音声機能を紹介しています。Xbox Liveメニューへのよりシームレスなアクセスや、ゲームへの音声統合などが含まれます。これらの改善は、Xbox Liveのより広範なアップグレードと合わせて、今秋に展開される予定です。

Windows Phone とのより緊密な統合は、同じく今秋の Mango アップデートのリリースで実現される予定です。

これは、キーボードとマウスを補完する「自然なユーザー インターフェイス」に向けた広範な取り組みの一環です。

マイクロソフトは長期的に、音声技術を、現在使用されているコマンドではなく、機械とのより自然な会話へと転換することを目指しています。同社は先週、今後3~5年で目指す方向性を示す「未来の姿」を垣間見るためのビデオを公開しました。

詳細については、ブクステイン氏が本日述べた内容の抜粋をご覧ください。

改善の経緯:「音声科学は、機械学習と膨大なデータという2つの要素によって進化しています。クラウドでは、利用状況から学習し、サービスを即座に改善するフィードバックループを構築しました。これにより、今日よりも明日の方が、より良い体験を提供できるようになります。」

ウェブ検索が音声認識の向上にどのように役立つか:「多くの人が『エージェント』や限られた単語を発話しても、そこから得られる情報には限界があります。Bingの音声検索の素晴らしい点は、非常に多様な発話が見つかることです。そして、それが急速に普及していくのを目の当たりにしました。業界全体では、モバイル検索の25~30%が音声で行われています。私たちにとって興味深いのは、Windows Phoneではこの割合がはるかに高いことです。これは、音声認識が(Windows Phoneの)ユーザーインターフェースの中核を成していることが要因だと考えています。」

クラウドへの移行:「音声認識のための単一のクラウドは、非常に重要かつ強力です。私たちの目標は、単一のフィードバックループと、ドメインを横断して学習する単一のクラウドを実現することです。重要なのは、多様な発話に対応できることです。現在、私たちのクラウドには年間約110億の発話が記録されています。業界で最も利用されている音声認識クラウドだと考えています。統計を取るのは少し難しいのですが。つまり、文字通り1秒間に複数の発話が処理され、一つひとつの発話が学習と向上の機会となるのです。」

Internet Explorerの音声機能について:「発表はまだありません。業界では、将来的にHTMLに音声タグを導入するために、標準化団体と協力しているという話を耳にしたことがあると思います。まだ合意には至っていませんが、私たちは標準化団体に積極的に参加しています。それが実現すれば、多くの可能性が開けます。現在議論されている内容から判断すると、タグはローカルエンジンまたはクラウドエンジンを指すことができるようになります。つまり、HTML5アプリであればローカル音声エンジンを利用できるようになり、アプリのどの部分でもクラウドを指すことができるようになるということです。」

Windowsについてはどうでしょうか?「Windows 8アプリがHTML5ベースであることはご存知でしょう。まだ発表や具体的なことは何もしていませんが、将来どのように展開していくのか、その方向性をある程度想像できるでしょう。それがまさに私たちの将来のビジョンです。マイクロソフトの開発者も社外の開発者も、誰でも利用できるクラウドサービスが提供されます。このサービスは、スマートフォンやXboxなどのWindowsマーケットプレイスにあるアプリケーション、Azureなどの基幹業務アプリケーション、あるいはデバイス上で動作するWebアプリケーション(Windows 8のような方法で動作するものでも、どこでも動作するものでも)で利用できます。」