Watch

マイクロソフトは、よりスマートなAIの構築を目指し、機械に文脈を読み取って理解することを教えている。

マイクロソフトは、よりスマートなAIの構築を目指し、機械に文脈を読み取って理解することを教えている。

ナット・レヴィ

Maluubaの共同創設者、カヒール・スールマン氏とサム・パスパラク氏。(Maluuba Photo)

Microsoft は、画像認識や機械学習の概念を超えて人工知能をさらにスマートにし、テキストを読み取り、その背後にある文脈を理解し、さらには質問したり回答したりできるシステムを構築しています。

この取り組みは、1月に同社がモントリオールに拠点を置き、ディープラーニングを用いて自然言語理解を開発するMaluubaを買収したことによる成果の一つです。マイクロソフトのブログ記事によると、ワシントン州レドモンドにある本社と中国・北京にある研究所の2つの研究チームが、スタンフォード大学が主催するコンテストに参加しています。このコンテストでは、Wikipediaの情報を用いてAIシステムが質問にどれだけ正確に答えられるかをテストします。

「私たちは、いわゆる『リテラシーマシン』の開発に取り組んでいます。つまり、文章を読んで理解し、書き言葉か口頭かを問わずコミュニケーションの取り方を学習できるマシンです」と、Maluubaの共同創業者であるカヒール・スールマン氏はブログ記事で述べている。

この種の知識は、法律文書、自動車マニュアル、医学研究などの密度の高い資料を素早く理解するのに役立ちます。

ブログ記事の中で、マイクロソフトのアリソン・リン氏は、機械による読み取りは、システムが解釈しようとしている特定のデータセット以外の知識も必要となるため、画像認識などの概念よりも難しいと書いている。

マイクロソフトは、この種の技術が現代の検索エンジンに革命をもたらす可能性があると述べた。また、マイクロソフト、アマゾン、グーグル、アップルなどが注力している音声アシスタント開発にも応用できる可能性がある。こうしたコンテキスト重視の学習は、デジタル音声市場でアマゾンの地位を奪おうとするCortanaの躍進を後押しする可能性がある。

ブログ記事によると、マイクロソフトの現在の機械読み取りへの取り組みは20年以上前に遡ります。クラウドコンピューティングによるパワーの向上、テストに利用可能な膨大なデータ、そしてディープラーニングアルゴリズムの進歩が、この分野における飛躍的な進歩を可能にしています。

マイクロソフトは、自社のAIが知識豊富な人間の理解力にはまだ及ばないと警告しているものの、大きな進歩を遂げている。同社は昨年秋、研究者らが人間の音声を人間と同等の精度で認識するソフトウェアをテストし、過去最低の6.3%というエラー率を達成したと発表した。20年前の最高エラー率は43%を超えていた。