
AIソフトウェアが囲碁をマスターし、世界トップの棋士を目指す

機械の台頭における新たな画期的な出来事が起きた。グーグル・ディープマインドが開発した人工知能プログラムは、囲碁の打ち方を学習し、公正な試合で人間のチャンピオンに決定的に勝てるほどに熟達した。
これは人工知能にとって飛躍的な進歩だ。囲碁は「AI研究の聖杯」とみなされていると、本日ネイチャー誌に掲載されたこのプロジェクトに関する研究論文の主任著者であるデミス・ハサビス氏は語った。
囲碁は一見シンプルに見えます。19マス×19マスのマス目に白と黒の石を交互に置くだけです。目的は、自分の石が相手の石に四方から囲まれないようにすることだけです。しかし、数千年前に中国で生まれた囲碁は、世界で最も複雑なゲームと考えられています。「囲碁には10の170 乗通りの盤面があり、これは宇宙に存在する原子の数よりも大きいのです」とハサビス氏は指摘します。
つまり、コンピュータープログラムはチェッカーやチェスと同じようなアプローチでは人間に勝つことはできないということです。これらのゲームのプログラムは、可能な手の総当たり方式による探索と、手の中のパターンの重み付け評価を組み合わせています。しかし、Google DeepMindの研究者たちは、AlphaGoと呼ばれる同社のソフトウェアは異なるアプローチを採用していると述べています。
AlphaGoは、囲碁の達人の指し手のデータベースを精査し、数百万回も自身と対戦することでパフォーマンスを向上させるようにプログラムされています。研究者たちはこの部分を「ポリシーネットワーク」と呼んでいます。プログラムの別の部分は、モンテカルロシミュレーションを実行して盤面の位置を評価します。
政策ネットワークと価値ネットワークの組み合わせにより、「はるかに人間らしい」意思決定プロセスが生まれると、研究の主執筆者の一人であるデビッド・シルバー氏は述べた。
AlphaGoは、他のトップクラスのゲームプログラムを99.8%の確率で破ることができました。そして昨年10月、このコンピューターは、過去3年間ヨーロッパ囲碁選手権で優勝している樊輝(ファン・フイ)と対戦しました。しかし、このコンピューターは5戦全敗に終わりました。
「負けてしまう哀れな人間を応援せずにはいられない」と、試合を観戦したネイチャー誌の上級編集者タンギー・シュアール氏は語った。
これは、囲碁のコンピュータプログラムが、コンピュータに優位性を与えることなく、人間のプロ棋士をフルゲームで破った初めてのケースでした。しかし、最大の試合はまだこれからです。3月には、AlphaGoがソウルで、世界最高の囲碁棋士として広く認められているイ・セドルと対戦する予定です。
「彼は囲碁界のロジャー・フェデラーだと思ってください」とハサビス氏はスイスのテニススターについて語った。
試合結果がどうであれ、ロンドンを拠点とするGoogle DeepMindの研究者たちは、彼らのアプローチは勝利を収めるだろうと述べている。多くの専門家は、AIプログラムがプロの囲碁棋士に勝つには10年以上かかると予想していた。
AI界における悪口とも言えるシルバー氏は、IBMのワトソンコンピューターがAlphaGoに勝つ可能性は「ゼロ」だと述べた。ワトソンは幅広い知識を扱うように最適化されているが、その深さはAlphaGoより浅い。また、Facebookの囲碁プログラムの現行バージョンは、AlphaGoにとって「明らかに脅威にはならない」とも述べた。
一方、フェイスブックの創業者マーク・ザッカーバーグ氏は、自身のAIチームが人間に勝てる囲碁プログラムの開発に「近づいている」と語った。
アレン人工知能研究所のCEO、オレン・エツィオーニ氏は、アルファ碁は「傑出した技術的成果であり、目標が極めて明確で、ゲームのルールが単純な場合には、コンピューターが優位に立つことを示している」と述べた。
「同時に、問題が『明確に定義されていない』場合、例えば文章の理解、記事の執筆、あるいは友人を慰めるといった場合、それは依然として私たちの能力をはるかに超えています」とエツィオーニ氏はGeekWireへのメールで述べている。AIプログラムは、扱うデータが限られている場合や、人とのコミュニケーションや共同作業が関わる分野でも苦戦する傾向があるとエツィオーニ氏は述べた。
「チェスや囲碁といった限られたタスクにおける超人的なパフォーマンスは、機械に『汎用知能』を組み込むためのほんの一歩に過ぎないというのが真実です」とエツィオーニ氏は述べた。「私たちの4歳児は、AlphaGoを含むあらゆるコンピュータプログラムよりも『賢い』のは事実です。」
Google DeepMindのハサビス氏はGeekWireに対し、AlphaGoから得られる知見は、スマートフォンのバーチャルアシスタントをはじめとする、より実用的なアプリケーションの改善に活用されると語った。囲碁用に開発されたのと同じ種類のディープラーニングネットワークが、近い将来、Androidスマートフォンにおすすめを尋ねた際に、より良いレストランを教えてくれるようになるかもしれない。
中期的には、ディープニューラルネットワークが医療診断においてより重要な役割を果たす可能性があります。IBMのWatsonはすでにこの分野に参入しています。
「長期的に見て、私が最も期待しているのは、こうした汎用的な学習システムを科学研究に役立てることです」とハサビス氏は述べた。「AI科学者、あるいはAI支援科学が、人間の専門科学者と協力し、補完的な方法で科学研究におけるより迅速なブレークスルーを実現する、といった具合です。」
しかし、研究者たちがAIで行わないことがいくつかあります。ハサビス氏によると、Googleが2014年にDeepMindを買収した際、両社は「DeepMindが開発した技術を軍事目的に利用することは決してない」と合意しました。
彼は、合意が遵守され、ディープマインド社のAIが人間に優位に立つことがないようにするために、社内倫理委員会が設置したと述べた。また、自律型兵器の禁止を求める公開書簡に署名した一人であることも指摘した。
Googleが買収したボストン・ダイナミクスが開発中の軍用ロボットが、スーパー脳を搭載してアップグレードされるのではないかと心配していたなら…まあ、安心してください。今のところは。
シルバー氏とハサビス氏は、「ディープニューラルネットワークとツリー探索による囲碁の攻略」と題されたネイチャー誌論文の20名の著者の一人です。Google DeepMindのアジャ・フアン氏もシルバー氏と共に筆頭著者を務めています。