News

人工知能が囲碁をマスター

Nature ダイジェスト Vol. 13 No. 3 | doi : 10.1038/ndigest.2016.160302

原文:Nature (2016-01-28) | doi: 10.1038/529445a | Google masters Go

Elizabeth Gibney

人間の思考をまねた人工知能が、囲碁でプロの棋士に勝利した!

人工知能が囲碁をマスターするのは10年以上先のことだと思われていた。 | 拡大する

NATURE VIDEO

チェス、チェッカー、バックギャモンにおいて、コンピューターはすでに人間のチャンピオンに勝利している。しかし、囲碁では、大きなハンデがなければプロ棋士に勝つことはできなかった。今回、グーグル(米国カリフォルニア州マウンテンビュー)の傘下にあるディープマインド社(DeepMind;英国ロンドン)が、機械学習によって人工知能(AI)が囲碁をマスターしたとNature 2016年1月28日号で発表した1

その論文によると、ディープマインド社のプログラム「アルファ碁(AlphaGo)」は、囲碁の欧州チャンピオンである樊麾(Fan Hui)二段とハンデなしで5回対局し、全勝したという。また、現時点で最高レベルの複数の囲碁ソフトとも対局し、その勝率は実に99.8%(495戦494勝)という高さだった。3月には、世界最強クラスの韓国人棋士、李世(Lee Sedol)九段と対局予定だ。ディープマインド社の共同設立者Demis Hassabisは、「自信があります」と言う。

市販の囲碁ソフト「クレイジー・ストーン」を開発したフランス・リール在住のプログラマーRemi Coulomは、「途方もなく大きい成果といえるでしょう」と言う。彼は、コンピューターが囲碁をマスターするには後10年はかかると考えていたからだ。

1997年にチェスのグランドマスターGarry Kasparovに勝利したことで有名なIBMの「ディープ・ブルー」は、チェス専用にプログラムされたコンピューターだった。けれどもアルファ碁は、囲碁のためにプログラムされたわけではない。汎用アルゴリズムに対局パターンの情報を大量に読み取らせて囲碁を学習させたのだ。ディープマインド社のAIは、同じ方法でAtari 2600の49種類のアーケードゲームのプレイを学習している2Nature ダイジェスト 2015年5月号29ページ「知覚情報をもとに自ら学習する人工知能」参照)。

複雑なパターンの認識や長期的な計画策定、意思決定では、AIの活躍が期待されている。アルファ碁の勝利は、こうした他の領域にも同様の技術を応用できることを意味するとHassabisは言う。医学画像を使って診断を行ったり治療計画を立てたりすることや、気候変動モデルを改良するなど、「私たちが世界で実現しようとしていることの多くが、同じ範疇に入ります」とHassabis。

囲碁は、その複雑さゆえに以前からAI研究者の興味をかき立て続けてきた。ルールは比較的単純で、19×19の格子が描かれた碁盤の上で黒と白の碁石を交互に打ち、相手の石を取るなどして、相手より広い領域(地)を囲んだ方が勝ちとなる。けれども、囲碁の一局の平均手数は150で、考えられる手の数は10170通りであり、これは宇宙に存在する原子の数より多い。そのため、最良の手を網羅的に探索するアルゴリズムでは解くことができなかった。

抽象的な戦略

チェスは囲碁ほど複雑ではないが、それでも考えられる局面が多過ぎて、網羅的な探索では解けない。このためチェスプログラムは、数手先を読んでどちらのプレーヤーが有利かを判断することで探索を減らしている。一方、囲碁は、勝ちの局面や負けの局面を認識することがチェスよりもはるかに難しい。どの碁石にも同じ価値があり、盤面全体に微妙な影響を及ぼすからだ。

アルファ碁には、脳神経回路を模倣したニューラルネットワークと呼ばれる情報処理プログラムが搭載されている。これに、実例や経験を蓄積させて、何層にも重ねられたネットワーク間の結合を強固にしていった。この手法はディープラーニング(深層学習)と呼ばれる。アルファ碁は、まずプロ棋士同士の対局の3000万通りの局面を調べ、盤面のデータから形勢に関する抽象的な情報を抽出した。その後、コンピューター上で自己対局を行って、対局のたびに改良を重ねていった。これは、強化学習と呼ばれ、画素から画像を分類するプログラムの機械学習に用いられたのと同様の手法である(Nature 505, 146-148; 2014)。アルファ碁は、こうして盤面の意味を読み取って最良の一手を選択する術を学んだ。

アルファ碁はこの段階で、市販の囲碁プログラム(手筋のシミュレーションにより最良の手を選択する)と同等の強さになっていた。Hassabisらは次に、この探索アプローチを、次に打つ手を選択して碁盤を読む能力と組み合わせた。これによってアルファ碁は、どの戦略がうまくいきそうかを、より正確に判断できるようになった。2007年に「チヌーク(Chinook)」というソフトウエアでチェッカーを解いた3、アルバータ大学(カナダ・エドモントン)のコンピューター科学者Jonathan Schaefferは、この技術は「驚異的」だと言う。過去30年間、コンピューター科学者たちはコンピューターの圧倒的な計算力にものを言わせてゲームを解こうとしてきたが、ディープマインド社はこの方法は採らず、トレーニングにより人間のような思考を模倣することを目指したのだ。今回の偉業は、快進撃を続けるディープラーニングの威力を示すものでもあるとCoulomは言う。「ディープラーニングは現在、AIが抱えるあらゆる問題を解決し続けています」。

対局した樊は「相手がコンピューターだと聞かされていなければ、少々変わっているけれど、非常に強い人間の棋士だと思っていたでしょう」と言う。若い頃から囲碁に親しみ、今回の対局で審判を務めたToby Manningは、アルファ碁の棋風は穏健で、攻撃的ではないと言う。

フェイスブック社も、囲碁を打つ機械学習AIソフトウエア「ダークフォレスト」を開発しているが、市販されている最新の囲碁AIシステムにはまだ及ばないようだ4

囲碁はマスターしたものの、汎用AIシステムの開発を目指すディープマインド社には挑むべき難題がまだ多く残っているとHassabisは言う。例えば、人間なら1つのシステム(例えば囲碁)について学んだことを新しい課題にスムーズに応用できるが、同社のプログラムにはまだそれができないのだ。「どうすればできるのか分かりません。今の段階では、ということですが」とHassabis。

囲碁について説明するときに「コンピューターにはできないゲーム」という決まり文句は使えなくなったが、Manningは、「一部のソフトウエアが信じられないような強さになったからといって、私が囲碁をやめる理由にはならないでしょう」と言う。

(翻訳:三枝小夜子)

関連動画:The computer that mastered Go

参考文献

  1. Silver,D. et al. Nature 529, 484–489 (2016).
  2. Mnih,V. et al. Nature 518, 529–533(2015).
  3. Schaeffer,J. et al. Science 317, 1518–1522(2007).
  4. Tian,Y. & Zhu, Y. Preprint at arXiv http://arxiv.org/pdf/1511.06410.pdf (2015).

キーワード

Nature ダイジェスト Online edition: ISSN 2424-0702 Print edition: ISSN 2189-7778

プライバシーマーク制度