企画書後半 ~ 2011年7月時点の認識
前回の続きで、企画書後半です。
文中、いくつかURLが出てきますが、2011年に書いたものなので、今(2014/02)チェックするといくつかはリンク切れになっているようです。リンク切れが確認できた記事には'(*)'をつけておきます。
-------------------------------------------------
付録2 現状強さ分析
2005年に、プロ棋士の団体である日本将棋連盟がコンピュータ将棋との
対局に強い制限を課したため、それ以降プロとコンピュータ将棋の対局
はほとんど実例がなく、両者の棋力を直接比較するデータは非常に少ない。
そこで間接的なデータから棋力を比較・推定することになる。
現在のトップクラスのコンピュータ将棋の棋力は、男性のプロ棋士の
下位~中位レベル程度に相当すると推測できる。
この根拠をいくつか例を挙げて説明する。
・棋士レーティング
将棋の強さの指標としては段・級がよく知られているが、実はプロの
段というのは一度上がったら二度と下がらないなど、ある時点での
正確な棋力の指標としてはあまり正確ではない。より正確なのは、
直近の対局結果をすべて反映して計算する「レーティング」と呼ばれる
ものである。日本将棋連盟として公式にはレーティングを算出しては
いないが、非公式に有志が算出しているレーティングは以下のURLに
ある。非公式とはいえ、レーティングの算出は対局結果から機械的に
計算するだけなので、ほぼ信頼できると考えて差し支えない。
http://homepage3.nifty.com/kishi/ranking2.html
これによると、2011年7月現在、トップの羽生二冠が約1900、
奨励会員(プロ棋士養成の組織)約1500、アマチュア約1300、
女流約1200、となっている。7/14現在このページには棋士は158人
記載されており、メジアンは1526である。
※レーティングとは相対的な強さをあらわすものである。
このページの中での棋士どうしの比較には有効だが、
他のレーティング(たとえばfloodgateのそれ)と直接
比較できるものではない。
・将棋倶楽部24
今年のWCSC直後の5月中旬、大会で5位だったソフトのponanzaが
将棋倶楽部24に参戦し、レーティングでトップになって話題を
集めた。戦績92勝8敗。関連ネット情報は、たとえば
http://toybox.tea-nifty.com/memo/2011/05/ponanza-daa0.html
から多くたどれる。
付録1にも書いたとおり、将棋倶楽部24の最上位はプロのはずなので、
トップになったということはプロにも勝って(それも大幅に勝ち越して)いる
はずである。ちなみにこのときponanzaが勝った相手には id:"yonekuni"も
含まれている。(米長会長のidと言われている)
ただ、ponanzaはほとんど早指し(短い持ち時間)条件で
指している。早指しだと人間が間違えるケースが多く、対してコンピュータ
は早指しでもそれなりに正しく指せるため、一般には早指しはコンピュータ
に有利と言われている。この点を考慮に入れる必要はあるが、少なくとも
早指しではコンピュータの強さはトッププロレベルに近いとは言える。
時間の十分ある条件ではもう少し人間が有利だろうと思われるが、それでも
下位~中位のプロレベルの実力があるだろうとは予想できる。
・あから
2010年10月、「あから」というコンピュータ将棋システムが、女流の
トッププロである清水市代女流王将に勝利した。1局だけではあるが、
少なくとも女流より大幅に弱くはないとは言える。なお「あから」は
「合議」制を採用したクラスタ構成だったが、単体(1ノード、スレッド並列)
の将棋ソフトと比べてそれほど強くなっていない。以下のURLには、
「合議システムが勝率73%、(単体の)Bonanzaが62%」とあり、単純に計算
するとレーティングで80程度しか上がっていないことになる。
http://kifu.exblog.jp/15389770/
・対アマチュア
以下のURLに、コンピュータ将棋対人間の対戦記録がまとめられている。
http://www.junichi-takada.jp/computer_shogi/comvshuman.html
ここに載っているアマチュア側はほとんどがアマトップレベル(タイトル
保持者級)である。2008年あたりからはっきりコンピュータが勝ち越して
いる。サンプル数は少ないながら、傾向としてはアマチュアよりレーティング
で200程度は強そう、と推測できる。
以上の状況証拠から総合して推測すると、現状のコンピュータ将棋は
棋士レーティングで1500程度、プロ棋士の下位~中位程度であろうと考えられる。
付録3 強さ向上度予測
付録2で、現在のコンピュータ将棋がプロの下位~中位レベル(棋士レーティング
で1500程度相当)の強さを持つことを示した。つまり、名人に追いつくにはあと
レーティングで400ポイント程度強くなればよいことになる。
現ボンクラーズを、大規模クラスタ化によって400ポイント程度の向上が可能と
予想している。ここではその根拠を示していく。
まず探索ノード数と読みの深さの関係について。
1手深く読むごとに、探索ノード数がだいたい2~5倍に増えることが
わかっている。たとえば次の論文:
http://www.geocities.jp/bonanza_shogi/gpw2006.pdf
(これは2006年の論文で、ここでは「序盤3^n、終盤5^n」と
なっているが、その後bonanzaは探索効率が強化され、もっと
ノード数は減っている)
また伊藤の今までの経験からもこのことは実証されている。
次に読みの深さと強さの関係について。
コンピュータチェスにおいては、1手深く読むとレーティングで約200ポイント
強くなることが知られている。たとえば以下の論文:
DarkThought Goes Deep
http://people.csail.mit.edu/heinz/dt/node46.html
将棋においてはチェスほどのデータはないが、ほぼそれに近い挙動を示すことが
ある程度経験的にわかっている。たとえば激指の報告(やや古いが):
http://www.logos.ic.i.u-tokyo.ac.jp/~gekisashi/strength.html
また PPL2011招待講演「将棋プログラムの大規模並列実行」でも
8coreでレーティング+200、とある。
※この講演のスライドは一時DL可能だったが、現在DLできない模様。
伊藤はDLして持っている。
また、floodgateで対戦させれば簡単に追試もできる。
仮に「1手深く読むのに3倍」とすると、名人に追いつくには
レーティングで約400ポイントアップ
<-> 2手深く読む
<-> 探索速度(処理ノード数)を9倍にする
ができればよいことになる。
残るはクラスタ並列によって探索速度をどれだけ上げられるか、である。
実はこの点についてはまだ良いデータがない。GPS将棋、Bonanza、Rybka
等はあまりうまくいっていない。これは、クラスタ並列の技術がまだ未熟な
せいと考えられる。ボンクラーズはまだ3、4ノード程度までしか実験して
(できて)いない。
ただ予想としては、「クラスタ並列の技術が成熟すれば、スレッド並列と
同じ程度の性能向上は達成できるだろう」とは考えられる。スレッド並列
での実績としては、いくつかの実験結果から「コア数のルート(平方根)
程度以上は向上するらしい」という感触が得られている。たとえば
http://d.hatena.ne.jp/LS3600/20100114#p1
などからいくつかの結果やリンクが見られる。
スレッドの場合は規模に制限があるためデータがあるのはせいぜい8コア
程度までである。これをクラスタ並列に適用して百数十ノードまで同様に
平方根のペースで向上するかどうかは現状推測の範囲を出ないが、そう
なる可能性を否定する根拠もない。「やってみなくちゃわからないので、
やってみる」価値は十分あるレベルと考える。
仮に「平方根のペースで向上」が実現するとすると、探索速度を9倍にする
ためにはノード数は81倍必要になる。11年大会版のボンクラーズは3コア16CPU
で出たが、これは6+6+4コアだった。8コアx2ノードよりは弱いはずである。
8コア換算にすれば、2x81=162ノードあれば探索速度が9倍にでき、名人に
追いつける、というシナリオは十分実現可能性があると思われる。
付録4 対プロ挑戦のビジネス側面
コンピュータ将棋とプロ棋士の対戦を実現するにあたって
最大のボトルネックは、実は技術的な側面よりも
「スポンサーがつくか」である。
収入にならないなら、プロ棋士サイドが対局を受けることは
ありえない。日本将棋連盟現会長の米長元名人がこの辺の
事情をストレートに語った以下の記事が参考になる。
http://www.chuokoron.jp/2010/12/post_49.html
以下、棋戦/対戦とその対局料・イベント料の例をいくつか
挙げる。
・Bonanza vs 渡辺竜王
上記URLによると、2007年にBonanzaが渡辺竜王と対局した際は
大和証券が1億円を出した模様。
・あから
あからの際は大赤字だったとやはり上記URLにあるが、正確な対局料は不明。
一方、3億円出してもらえる話があったがつぶれた、との情報も上記URLにある。
・今年末(?)の対戦
上記中央公論のページや米長会長のページ
http://www.yonenaga.net/taisenroku.html (*)
によると、今年末に米長会長が市販ソフトと対戦する模様である。
中央公論が1千万円出すらしい?ただ人間側もソフト側も最強者では
ないため、イベントとして盛り上がるかはかなり微妙と思われる。
・人間のプロの棋戦
http://dosiroto92.dtiblog.com/blog-date-20070408.html によると、
> これは最近公表されて明らかになった 棋戦契約金 の例だが
> 竜王戦で3億4150万円 名人戦で3億3400万円
> 棋聖戦1億4650万円 王位戦1億2380万円 王座戦1億960万円
とのこと。王将戦は7800万。これらはおおむね新聞社が日本将棋連盟に支払って
いる。なお金額は年額。この中から、連盟が対局者に支払う対局料が出る。
対局者の賞金は
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1021348650
に
> 優勝賞金は、総額の1割前後です。
> 竜王戦 3200万
> 朝日オープン 1000万
とある。
・Deep Blue vs カスパロフ
http://whyfiles.org/040chess/main1.html (*) によると、対局料は
勝者 $700k, 敗者 $400kだったらしい。
ただし払ったのはIBMのはずで、片方はDeep Blueなので、
実質払うのは最大$700kということになる。
なおIBMは対局料以外に、6名のチーム x 8年の人件費、ASIC開発費等で
$10M以上かけている。しかし以下のURLによると、この対局による
宣伝効果は$500M相当で、この勝利でIBMの株価は史上最高値をつけたという。
http://www.academicchess.org/Focus/DeepBlue/IBMbillwall.shtml
また別の記事でも、宣伝効果を"millions of dollars worth"と評している:
http://www.btimes.co.za/97/0601/tech/tech9.htm (*)
[以上]
« 企画書前半 ~ 名人超えのアクションプラン | トップページ | 異端のアプローチ »
「電王戦記録」カテゴリの記事
- Money Changes Everything(2015.05.02)
- 第2回電王戦における対局ルール決定プロセス(2015.04.22)
- マイナビ社のこと(2015.02.24)
- もし人生がジャンプのマンガだったら(2014.05.01)
- 対局後、再度の会議(2014.04.14)
プロ棋士のレーティングですが、今の数値と比べてもそれほど違いはないですね。引退棋士は低レーティングの場合が多いはずなので、平均値は少しずつ上昇すると思いますが。(平均値1500点になる様に補正計算後比較すべきか。)
この分布、正規分布(形だけ見ると、ポアソン分布?)によく乗っています。人間は、レーティングが高くなるにしたがって、さらにそれを上げるのが大変になってきます。(1500点からの+100点と、1900点からの+100点では意味がまったく異なります。
コンピュータの場合、計算速度をn倍にすると、レーティングで+何点のような記述が見られますが、今の速度からn倍と、n倍になった時点からさらにn倍になった時のレーティングの上昇は同じと仮定できるのでしょうか。(技術的な難易度は当然後者の方が高いでしょうが。)
クラスタ化によって、速度の上昇に限界がないのであれば、人間が勝てなくなるのは、当然の帰結の様に思えます。
投稿: | 2014年2月11日 (火) 15時10分
論文のイントロを読んでる気分になりました。
投稿: | 2014年2月11日 (火) 18時34分
冷静な見解。
ところで伊藤さん、囲碁もやられます?
何故かは分かりませんが強く応援したい気持ちです。
投稿: | 2014年2月11日 (火) 19時22分
米長さんとの対局の後でさえ「名人を超えた」という発言はなかなかショックでした。
それを対局前にそれなりに想定して企画書を作れるのですからすごいものです。
で、今回の囲碁電王戦。
あの9路盤勝負をみれば武宮9段が「人間には勝てない。」と豪語する気持ちもよくわかります。
それでも開発者の皆さんはきっと「死亡フラグ」ととらえるのでしょうね。
「何年かかろうがきっと超えてみせる。」と。
そのこころいき。
武宮さんを超えてすごいものですね。
投稿: samurai | 2014年2月12日 (水) 11時24分
記事はとても面白かったです。
「棋力を上げるには、クラスタ並列の他にも、評価関数だとか探索の深さ制御だとかいくつか考えられるのですが、いずれも、何をどうすれば強くなるのかが具体的にはわかっていない。答えのない世界で膨大な試行錯誤を必要とするわけです。これはスケジュールも読めないし、工数(コスト)もどれだけ膨らむかわからない。」
優れた技術でも競合より先に製品化・商業化できなければ意味がない。
もしかしたらの「僥倖」を雨乞いよろしく待っていられない。
時期と数量を明確に定めローンチして成果するマーケターの自負心が溢れていますね。
伊藤さんは趣味でもプロ志向なんですよね(笑)
↓の保木特任助教の学術的なアプローチと好対照です。これはこれで、学者としてプロ志向でしょう。両方を認めるべき。
「私は、多くの場合、何の役に立つか分からないものを対象に、研究者が「遊ぶ」ことで将来のブレークスルーや画期的製品が生まれるのではないかと考えています。「まずマーケティングありき」の製品開発では、大発明・大発見は望めないのではないでしょうか。その意味で、『ボナンザ』に組み込んだアルゴリズム、あるいは進展著しい将棋ソフトの開発技術そのものが、将来きっと何かに応用されると確信しています。」
http://news.goo.ne.jp/article/senkei/bizskills/senkei-20130825-04.html
ただ、これだけ目的志向のはっきりした伊藤さんが、
危険を承知し、対策しながら(本業でもないのに神経使いながら)
このブログを連載する目的はなんでしょう?
連盟と電王戦に、より多くのダメージを与えるのが目的としか理解できませんね。
伊藤さんは、趣味でもマーケターだし、常に最大効力を志向してるんですから。
勿論、ダメージを与えるのが目的でも、それは一概に否定されるべきとは思えません。
ただ、なぜ伊藤さんと将棋連盟は、蛇蝎の如く忌み嫌うようになったのでしょう?
そこに、納得できる説明がないと、八百長依頼メールを晒したら暴走すぎますよね。
今のところ連載途中なので判断できません。
何があったんでしょう? 楽しみでもあり、見たくないような気もします。
でも、読みます。怖いもの見たさですね(笑)
いずれにせよ、評価はすべての連載が終わってからですね。
伊藤さんは信じたことを貫けばいいです。
途中、妨害や困難も懸念されますが、完結してください。
投稿: | 2014年2月18日 (火) 22時03分