
「こんにちは、コンピューター!」ワシントン大学の教授と学生が枠にとらわれない探求を
ウィル・マリ著

ワシントン大学の著名なコンピューター科学者とその研究チームによると、スタートレックのスコッティのように、コンピューターにただタイプするのではなく、コンピューターと会話する日が間もなくやってくるという。
8月、シアトルがまだ晴れていた頃、ティム・バーナーズ=リーが設立した alt.hypertext ニュースグループの20周年に、ワシントン大学チューリングセンター所長のオーレン・エツィオーニ氏は、オンライン検索の新しい方法を求めました。
Natureに寄稿したエッセイの中で、エツィオーニ博士は、コンピューター科学者が数年前から認識していることを繰り返した。それは、古いテキスト ボックスの外側で考えるべき時が来ている、ということだ。
エツィオーニ氏は、いわゆる「野心と想像力の奇妙な欠如」を強調し、ソフトウェア業界の勢いは新しい手法ではなく、これまでうまくいっていた方法に支えられてきたと語る。
彼は2003年からワシントン大学のKnowItAll研究グループと共に、この停滞に抗い続けてきた。彼らの研究は、オープン情報抽出、つまり特定の用語や用語群を追跡するルールベースの「キーワード」探索システムではなく、文を掘り下げて「統語的手がかり」を探す探索プロセスに焦点を当てている。彼の手法は、「文中の動詞を見つけ出し、動詞に関連する実体を特定し、それらを用いて事実の記述を作成すること」を目的としていると彼は記している。
Etzioni氏は、Bingの航空運賃予測サービス「Farecast」の頭脳です。Farecastが航空券の価格を集計するのと同様に、オープン情報抽出(OIS)は数百万ものクエリを積み重ねて、質問の背後にある直感的な意味を解明しようとします。7月のデモでは、Etzioni氏がその詳細をいくつか解説しています。オープンコード化された詳細な内容をご覧になりたい方は、こちらをご覧ください。
最初のステップは「文書から重要な情報を取り出す」ことであり、AppleのSiri(および、例えば、自宅の暖炉を制御するためにSiriを使っている人たち)が取ったいくつかのステップを基に構築することだと同氏は語る。
インターネットの「機械読解」は確かに野心的です。国防高等研究計画局(DARPA)もこの取り組みに参入し、コンピューターを少しでも人間のように考えさせるという多くの課題に関連するプロジェクトに資金を提供しています。IBMのWatsonは、より限定的ではありますが、別のアプローチであり、クイズ番組「Jeopardy!」に登場したことで有名です。
しかし、これから到来するウェブベースの知識の波に飲み込まれないようにするためには、「学術界、GoogleやBingのような大企業、そしてスタートアップ企業によるこのテーマに関するさらなる研究が必要だ」とエツィオーニ氏は言う。彼自身のスタートアップ企業であるDecide.comは、家電製品関連の検索でこの研究に取り組んでいる。

ジェフ・フアンやアラン・リッターなど、彼の博士課程の学生の何人かも、機械読み取りの危険性と可能性について熱心に研究している。
「これまでの検索は文書分析が中心でしたが、最近ではユーザーの行動が中心になっています」と Huang 氏は言います。
地元のレストランについて質問することの意味を人間レベルで理解するには、レストランがどこにあり、何時まで開いているかを把握するだけでは不十分だと、Twitter などのサイトで見つかるリアルタイムのトレンドの意味を探ることを専門とするリッター氏は付け加える。
「人はただ座ってウェブ全体を読むことはできません」と彼は言う。ワトソンは注目を集めているものの、多くの人にとって必ずしも未来ではない。人々は自宅だけでなく、タブレットやタブレット端末、スマートフォンでますます多くの情報を検索するようになるだろう。
テキスト検索においては「Google が長い間トップの座を占めるだろう」と Huang 氏は言うが、Bing やその他の検索エンジンは、非キーワード検索ツールがますます洗練されていく中でも、こうしたツールに重点的に投資することでより多くの利益を得ることができる。
今後は、検索エンジンに投げ込んで役立つことを期待するだけの「単語の羅列」ではなく、推測による自然言語検索に基づいて、より高速でランク付けされた結果を提供する方向へ進んでいくと、フアン氏は言う。
黄氏は、今日のオンライン検索の約4分の1は従来のキーワード検索では容易に答えが得られないと指摘し、ウェブが拡大し、より深く掘り下げられるにつれて、その数はさらに増加するだろうと指摘しています。つまり、より優れた、より直感的な答え探しツールへのニーズもますます高まるということです。
では、データ クラウドとの会話はどのくらい遠いのでしょうか?
「まだ道のりは長いですが、かなり近づいてきています」とエツィオーニ氏は言う。
GeekWire寄稿者のウィル・マリ は、ワシントン大学コミュニケーション学部の博士課程に在籍し、テクノロジーとジャーナリズムの歴史を研究しています。連絡先は[email protected]です。