
AI2はSemantic Scholar検索エンジンを拡張し、生物医学研究を網羅する
アラン・ボイル著

何千万もの生物医学研究を追加する、セマンティック・スカラー検索エンジンの最新拡張機能の着想は、マリー・ハグマンさんの痛む胃から生まれたのかもしれない。
シアトルのアレン人工知能研究所(AI2)のシニアプロダクトマネージャーとして、ハグマン氏はPubMedやその他の生物医学データベースの文書を学術検索ツールに組み込む方法を考える上で重要な役割を果たした。
彼女は15年前、ソフトウェアエンジニアとして2度の胃潰瘍と胃炎に悩まされていた時の自身の経験を思い出しました。専門医は彼女に症状に対処するための処方箋を出しましたが、おそらく一生薬を飲み続けなければならないだろうと告げました。
「『うーん…私は若くて健康なのに、それはおかしい』と思っていました」とハグマンさんは振り返る。「それでも、なぜ私がこんな問題を抱えているのか説明してもらえませんでした。だから、自分で自分を弁護しようと決めたんです」
彼女は胃潰瘍に関する医学文献を調べ、ヘリコバクター・ピロリと呼ばれる細菌が原因の可能性があるとする研究を見つけました。その知識を基に、彼女は別の専門医を説得し、2週間の抗生物質投与を受けました。
「それ以来、ずっと治っています」とハグマン氏はGeekWireに語った。
現在、彼女の目標は、研究者、そして一般の人々が、答えを求めている医学的な疑問を解決する最も関連性の高い研究を見つけられるように支援することです。
「文献はそこら中に出回っています」とハグマン氏は言った。「私たちは研究にお金を払っているんです。税金がこの研究に使われているんです。人々が文献を見つけられるようにするのは本当に理にかなっていると思います。でも何よりも重要なのは、この分野にキャリアを捧げている研究者たちが、より簡単に文献を見つけられるようにすることです。」
AI2は、マイクロソフトの共同創業者であるポール・アレンの支援を受け、2年前にコンピュータサイエンス研究に特化した検索ツールとしてSemantic Scholarを立ち上げました。このソフトウェアは、テキスト分析と機械学習を活用し、人間の索引作成者では気づかない可能性のある関連用語を抽出します。
昨年、データベースは神経科学研究も取り込めるよう拡張されました。それ以来、ハグマン氏とその同僚たちは、新たなアルゴリズムの開発とデータベースの全面的な改修を行い、収録文書数を1,200万件から4,000万件に拡大しました。
「私たちにとっての課題は、実際にこれを80を超える医療分野すべてに拡張することでした。…全く新しいアプローチを考え出す必要がありました」とハグマン氏は述べた。AI2の研究者たちは、近日中に発表される論文で、その具体的な方法を説明する予定だと彼女は述べた。
ハグマン氏は、アップグレードされた検索ツールは、初心者だけでなく、専門用語にあまり詳しくない分野に参入しようとしている研究者にも役立つはずだと述べた。
「『胃潰瘍』と入力すると、『胃潰瘍』が表示されます。どうやらこれがその症状の医学用語らしいのですが、私は全く知りませんでした」とハグマン氏は語った。「また、トピックの概要も提供しているので、特定のトピックを詳しく調べることができます。他にどのような関連情報があるかを確認したり、情報収集を始めるのに最適な論文を探したりできます。」
ハグマン氏は、ユーザーフレンドリーな点が、専門家ユーザー向けの Google Scholar や PubMed などの他の学術検索エンジンと Semantic Scholar の違いだと述べた。
AI2が他の機関と競合しているわけではありません。むしろ、AI2はGoogle、Microsoft、Baiduと連携し、「Open Academic Search」と呼ばれるイニシアチブを展開しています。その目的は、基礎レベルでのデータ共有を促進し、参加者が真のイノベーションの創出により多くのリソースを投入できるようにすることです。
Semantic Scholar にとって、それは幅広さだけでなく深さも追求することを意味します。
「コンピューターサイエンスとバイオメディカルの両方をさらに深く掘り下げ、私たちが実現できる興味深いことについての仮説を証明したいと考えています」とハグマン氏は述べた。「しかし、コンピューターサイエンスと数学と物理学、あるいは医学と化学の間にも多くの共通点があります。ですから、いずれは私たちの研究領域も拡大していくつもりです。」