
学術界で注目されているのは誰か?Semantic Scholarがデータをさらに深く掘り下げる
アラン・ボイル著

野球選手は、打率、打点、防御率など、スコアカードになるほど膨大な統計データで評価されます。しかし、研究者はどのように評価するのでしょうか?
古典的な評価基準は引用数、つまり研究論文で誰が誰を引用しているかです。しかし、野球と同じように、統計はより微妙なニュアンスを持つようになってきています。シアトルのアレン人工知能研究所が開発した科学検索エンジン「Semantic Scholar」が、全く新しい統計を導入しました。
「出版するか、さもなくば滅びるか」というゲームに身を置いているなら、加速と速度でどれだけのスコアを獲得できるか、ぜひご確認ください。あなたの作品に影響を与えているのは誰なのか、そしてあなたが誰に影響を与えているのか、すべてマウスをクリックするだけで分かります。
「私たちは、あなたが何を望んでいるのかを把握するために、細かく分析するためのツールを提供します」と、アレンAI研究所(AI2)のCEO、オーレン・エツィオーニ氏は語った。
エツィオーニ氏とその同僚たちは数ヶ月にわたってSemantic Scholarの開発に取り組んできましたが、本日公開されたベータ版はこれまでで最も野心的なリニューアル版です。今日、Google Scholarは幅広い学術研究をスキャンし、整理するための標準を確立しています。検索の構築方法を知っていれば、自分が書いている内容に最も関連性の高い研究に焦点を絞ることができます。
他の指標も登場しています。たとえば、特定の研究者やジャーナルの生産性と影響力を測定する h 指数と呼ばれる統計があります。
エツィオーニ氏は、Semantic Scholarの尺度がよりユーザーフレンドリーなものとなることを期待している。例えば、Velocityは、ある論文が過去3年間にどれだけ引用されたかを測定する。
Accelerationは、引用がどれだけ速く行われているかを追跡しています。「最近の論文ではないかもしれませんが、注目を集めています」とエツィオーニ氏は説明しました。「人々がそれを発見しているのです。」

著者にはプロフィールページが用意され、自分の作品に最も影響を与えた人物と、自分が最も影響を与えている人物がグラフで表示されます。エツィオーニ氏によると、影響力は測りにくいものであり、アルゴリズムを微調整する必要があるとのことです。
結果は調整によって変化します。例えば、引用数のみで判断すると、コンピュータサイエンス分野のトップ研究者はバークレー大学のスコット・シェンカーです。しかし、Semantic Scholarは、影響力ではバークレー大学の同僚であるマイケル・ジョーダンがトップであると示唆しています。
その男が世界で最も有名なバスケットボール選手の一人と同じ名前を持っているという事実は、エツィオーニ氏にとっても明らかだ。「彼を『機械学習界のマイケル・ジョーダン』と呼ぶ人もいるんですよ」と彼は冗談めかして言った。
いわば、この問題は単なる学問上の問題ではない。
「採用や昇進の決定を下す際には、人々はデータを求めています」とエツィオーニ氏は述べた。「私たちは、誰かの影響力に関するより良いデータをコミュニティに提供し始めています。」
学術界で関連性を解明するために用いられるアルゴリズムは、より広い分野にも応用可能です。例えば、Google Scholarの分析ツールは、Googleが検索エンジンの検索結果の評価に用いるPageRankアルゴリズムと関連しています。Semantic Scholarが開拓した新しいアプローチは、将来、Webやソーシャルメディアで何が話題になっているかを判断するのに役立つかもしれません。
現時点では、Semantic Scholarはコンピュータサイエンスの研究にのみ焦点を当てていますが、エツィオーニ氏によると、11月には神経科学も対象に加え、今後数年間で他の分野も対象に拡大する予定です。エツィオーニ氏は、このプロジェクトは、人工知能を科学コミュニティに役立てるというアレン研究所の目標に合致するものだと述べています。
「これはまさに『公共の利益のためのAI』という私たちの使命の一部なのです」とエツィオーニ氏は語った。