
ポール・アレンのAI専門家チームがロボットを使ってSATを制覇した
ジェイコブ・デミット著

アレン人工知能研究所は、SATの幾何学の問題を平均的なアメリカの11年生と同程度に解くことができる機械を開発したと発表した。
これはコンピューターにとって想像以上に大きな偉業であり、マイクロソフトの共同創業者であるポール・アレンが設立したアレン研究所によるAI研究における大きな進歩を表しています。
GeoSと呼ばれるこのシステムは、約49%の正解率を誇り、SATの数学試験では満点800点中約500点を獲得する計算になります。これはロボットの中でもかなり高い数値であり、2015年には人間の平均点でした。
こちらのオンラインテストで、GeoSと直接対決する数学スキルを試すことができます。このデモでは、テストに必要な基本的な概念でさえ、人間の脳で解釈できないと、どれほど難しくなるかが強調されています。
たとえば、次の質問を考えてみましょう。
左の図では、三角形ABCは中心O、直径ACの円に内接しています。AB=AOのとき、角ABOの度数はいくらですか?
まず、GeoS はテキストで使用されている自然言語を理解できる必要があります。
次に、コンピュータービジョンを使って図を理解し、2つの図を比較することで、テストの意図を推測します。質問を理解した後、コンピューターは最終的に計算を行い、その答えを多肢選択式の選択肢と比較します。
試験を受ける人にとっては自動的に理解できる概念を、コンピュータにとって意味のある数式に変換する必要があります。例えば、「ABO角の度数は?」は「Is(MeasureOf(ABO), What)」となります。

「文章や図から理解できることの多くは明確に示されておらず、私たちが認識しているよりもはるかに多くの知識を必要とします」と、アレン研究所のCEO、オーレン・エツィオーニ氏は結果を発表する声明で述べた。「これらのテストを問題なく受けられるシステムを構築することは困難であり、このような前例のない結果を達成できたことを誇りに思います。」
この研究は、「幾何学問題の解決:テキストと図の解釈の融合」と題された論文としてオンラインで公開されました。これは、アレン研究所とワシントン大学コンピュータサイエンス・エンジニアリング学部の共同研究でした。