
AI2のSemantic Scholar検索エンジンは、科学論文全体を網羅するようになりました。
アラン・ボイル著

シアトルのアレン人工知能研究所は、同研究所の学術検索エンジン「セマンティック・スカラー」が、マイクロソフトからの支援により科学のあらゆる分野にその範囲を広げ、現在、好調に推移していると発表した。
わずか数ヶ月で、Semantic Scholarのデータベースは、コンピュータサイエンスと生物医学分野の4,000万件の研究論文を索引付けしていた状態から、1億7,500万件以上の論文を収録するまでに成長しました。このデータベースは、伝統的な物理科学だけでなく、政治学、社会学、芸術、哲学も網羅しています。
「これにより、AIを科学における情報過多を克服するためのツールにするための研究を、世界中のほぼすべての学者が使用できるツールに変えることができるようになりました」と、セマンティック・スカラーのゼネラルマネージャー、ダグ・レイモンド氏はGeekWireに語った。
レイモンド氏によると、アレン人工知能研究所(AI2)もImpactstoryおよびUnpaywallと提携し、オープンアクセス出版物の掲載範囲を拡大しているという。これらの提携により、AI2はオープンアクセス出版物が科学研究成果の配信方法にどのような変化をもたらしているかを分析できるようになった。
Semantic Scholarは今年初めから徐々に拡張計画を進めてきたが、使用統計に基づくと、検索エンジンのファンはすでに違いに気づいている。
「2018年の月間アクティブユーザー数は200万人をわずかに上回り、過去最高を記録しました」とレイモンド氏は述べた。「現在は600万人を超えています。これは、科学の他の分野への進出に加え、AI研究でサポートできる革新的な機能も寄与していると考えています。そのため、年間を通して利用率が着実に増加しており、これは科学全体の進歩に貢献するサービスを提供するという私たちの目標が実証されていることを示しています。」

レイモンド氏は、マイクロソフトを主要パートナーとして昨年末に事業拡大の基盤が築かれたと述べた。
「これは、Microsoft Academic Graphと、それを開発したMicrosoftの研究グループから始まった、質の高い範囲の拡大に向けた私たちの取り組みの成果です」と彼は述べた。「それが、1年か2年前にはこれをやらなかった理由の一つです。当初カバーしていた分野において、同等かそれ以上の優れた体験を提供したいと考えていたのです。」
AI2は、コンピュータサイエンスと生物医学に関する論文を、特定の検索に対して最も関連性の高いコンテンツとしてランク付けするよう訓練したコンピュータモデルが、12以上の他の研究分野でも同様に機能することを確認する必要がありました。また、AI2は12以上の学術出版社と提携し、これまで閉ざされていた分野にも検索エンジンのリーチを拡大しました。
関連する研究論文の検索に加えて、Semantic Scholar では、それらの論文から生まれたニュース レポート、ブログ記事、ビデオへのリンクも提供されるようになりました。これは、もともと学術的な読者向けに書かれたテキストをよりわかりやすい言葉に置き換える場合に特に便利です。
レイモンド氏は、本日の発表はAI2の数ヶ月にわたるキャンペーンの集大成となると述べた。「私たちは、あらゆる領域において、高品質な体験を提供できるという目標に到達しました」と彼は述べた。
Semantic Scholarは、独自の研究を行うツールとしてだけでなく、過去に発表された研究を見つけるツールとしても利用できます。以下にいくつか例を挙げます。
- ある調査によれば、女性のコンピューター科学者がコンピューターサイエンスの論文発表において男性の科学者と同等になるまでには 118 年かかる可能性があるという。
- 別の研究では、43,000件を超える発表された論文と13,000件の臨床試験記録のデータ分析に基づき、臨床研究における性別に基づく偏見の証拠が報告されました。
- さらに別の調査によると、中国は発表されたAI研究の量では既に米国を上回っており、2025年までに高品質のAI研究でも米国を追い抜く勢いにあることがわかった。
最近では、Semantic ScholarがAI2のオープンアクセス研究の増加の追跡を支援しています。レイモンド氏によると、オープンアクセス研究論文の総数は過去10年間で年平均9.9%増加しており、現在では出版論文全体の29%を占めています。
AI2の分析では、オープンアクセス出版の採用状況も学問分野によって差があることがわかった。レイモンド氏によると、生物学に関する研究論文の45%がオープンアクセスで公開されているのに対し、人文科学に重点を置いた論文では約15%だという。
この検索エンジンは、新しいアプリケーションやオンラインサービスの足掛かりとしても活用できます。初期の例としては、Supp.AIがあります。これは、医師や消費者が薬と栄養補助食品の相互作用を調べるのに役立つ検索ツールです。
「今日、すべての大学、すべての科学者は、AIとディープラーニングが研究と科学の進歩を促進できるさまざまな方法を検討する必要がある」とAI2のCEO、オーレン・エツィオーニ氏はニュースリリースで述べた。
AI2で開発された他のソフトウェアツールと同様に、Semantic Scholarは、2013年にマイクロソフトの共同創業者で慈善家の故ポール・アレン氏が同研究所を設立した際に掲げたオープンサイエンスの理念に沿って、一般向けに無料で公開されている。
「これまで一度も料金を請求したことはなく、今後もサブスクリプション制にしたり、有料化したりするつもりはありません」とレイモンド氏は述べた。「Semantic Scholarは、あらゆる大学や研究者が無料で利用できるツールだと考えています。…私たちは非営利団体であり、科学をより身近なものにすることが使命です。」