
AI2のSemantic Scholarは、ブログや動画などを活用して学術検索エンジンを充実させます
アラン・ボイル著

猫の動画を探すのに学術検索エンジンを使う人はいないでしょう。しかし、学術論文に付随する猫が登場する動画があれば、最新バージョンの Semantic Scholar でその動画を見つけられるかもしれません。
Semantic Scholar は、シアトルに拠点を置く Allen Institute for Artificial Intelligence (AI2) によって開発された AI ベースの検索エンジンで、特に研究をふるいにかけて最も関連性の高い結果を得ることを目的としている。
このプロジェクトは過去3年間で4000万件以上の研究論文をインデックス化してきました。現在、AI2の研究者たちは、アルゴリズムを駆使して、これらの論文を関連するプレゼンテーションスライド、GitHubのコードライブラリ、臨床試験の概要、ニュース記事、ブログ、ソーシャルメディアの投稿、動画にリンクさせています。
これには、「サイクル一貫性のある敵対的ネットワークを使用した非対画像間翻訳」というタイトルの論文に関連付けられた、猫と犬の写真が写っているビデオが含まれています。
Semantic Scholar の最新の機能強化の目的は、よりオタクっぽい猫の動画を見つけることではないということを言っておかなければなりません。
「根本的な問題は、いわゆる情報過多だ」と、AI2のセマンティック・スカラー部門ゼネラルマネージャー、ダグラス・レイモンド氏はGeekWireに語った。
レイモンド氏は、第二次世界大戦以降、科学文献の量は9年ごとに倍増していると指摘した。現在、その量は年間250万本のペースで増加している。
情報専門家たちは、膨大な情報量を削減するため、最も影響力とインパクトのある論文を特定するための幅広いアルゴリズムを設計してきた。これらのアルゴリズムは、他の論文による引用数だけでなく、後続の研究における中心性といったより繊細な要素も考慮する。「このアプローチの難しさは、新しい科学には通用しないことです」とレイモンド氏は述べた。
Semantic Scholar が提供するボーナス リソース (あの猫と犬のビデオも含む) は、特に科学界でまだ十分に理解されていない研究に対して、追加のコンテキストを提供できます。
ある論文が多くのニュース記事やブログ投稿のきっかけになったとしても、Semantic Scholarによるその論文の科学的質の評価には影響しません。しかし、こうした追加リソースは、Semantic Scholarを利用する研究者が論文の科学的論点をより深く理解するのに役立つ可能性があります。
例えば、最近発表された研究では、砂糖と人工甘味料が脳卒中や認知症に及ぼす影響を調査しました。この研究はまだ発表から時間が経っていないため、その後の研究は行われていませんが、Semantic Scholarではこの研究結果に関する数十件のレポートを提供しています。
「私たちは学術論文とより一般的なメディアとの間の溝を乗り越え、科学を行うための新しくよりスマートな方法を促進しています」とAI2のCEO、オーレン・エツィオーニ氏はニュースリリースで説明した。
このプロジェクトは、先月逝去したマイクロソフトの共同創業者であり慈善家でもあるポール・アレン氏の遺志の一つです。Semantic Scholarは、人工知能を公共の利益のために活用するというアレン氏の理念に基づき、無料でご利用いただけます。
「人工知能を用いて情報過多をふるいにかけることで、科学の影響力を高める上での大きな障壁を取り除きます」とレイモンド氏は述べた。「そして、私たちは一人ひとりの科学者の影響力を高めようと努めています。」