第2回電王戦も始まりまして、インタビューもまた最近けっこう受けましたし、このブログのアクセス数もだいぶ増えてきました。せっかく来てくださった方に1年近く放置プレイの状態をお見せするのもあれですし、開発者サイドの見解を知りたがっている方もそこそこいらっしゃるようなので、少し現時点で考えていることをまとめてみます。
【コンピュータ将棋の棋力推定】
PV等での「名人越えました」発言がいろいろ物議をかもしているようですが、現状そういう認識でいます。そう考える根拠を示しておきます。
基本は、棋士レーティングと将棋倶楽部24のレーティングを組み合わせて推定しています。まず24の方ですが、bonkrasが指していた11年末の時点で人間の歴代最高レーティングが3200ちょい。これはピークの値なので、ふだんは3100ちょいくらいだったと思います。これに対してbonkrasがピークで3364、ふだんが3300くらい。24の人間トップより約200上でした。(以下、レーティングの数字には"R"をつけて、"R3300"のように表記します。)
24の人間トップは、棋士レーティングでどのくらいか?24は匿名なので詳しいことはわかりませんが、光瑠さんや遠山さんは24で指していたと明言しています。4/3現在、お二人のレーティングは1625/1543。なので、24の人間トップ=R1600くらい、と考えてよさそうです。そうすると、24のbonkrasは棋士レーティングで約1800相当、と推定できます。
#細かい話をすると、24のレーティングと棋士レーティングは同じものではなく、計算方法が異なります。ですが、ここではあまり細かいことは考えず、えいやで同じ基準として計算しています。
ボンクラーズ/ Puella αは、5月の選手権ごとにバージョンアップしています。24でやっていた(≒第1回電王戦)バージョンは11年5月のものベース。入玉周りとか多少手は入れましたが、大きくは変わってません。12年5月のバージョンは、その前のバージョンに対して(同じマシン同士で対戦して)ほぼ2勝1敗ペースで勝ち越します。これはレーティングで120差に相当。自己対戦はややあてにならない面があるにしても、100近くは上がっているでしょう。
更に、ハード面の進化があります。12年春にインテルさんが新型CPUを出してきて、CPUコア数、クロック速度共に上がっています。24で指していたのはその2つ前の世代のCPU。(第1回電王戦は1つ前の世代。)2世代でほぼ50程度上がっていると考えられます。そうすると、最新のPuella αはR1950程度、となります。
なおコンピュータの棋力はハードによって大きく変わる、というのは三浦さんが言ってた通りですが、上でR1950と言ってるのは、「第1回電王戦の時のサーバと同クラスの最新マシンを使った場合」になります。
さて、今の棋士レーティングを見ると、最高は渡辺3冠の1975。…あれ?何か月か前に見たときは、確か最高が1900ちょっとだったと思いましたが。1975だと、わずかですがまだ及ばないですね。このマシン構成でもわずかながら越えたと思っていましたが、ここは訂正しておきます。
ただし、まだ変身第二段階があります。GPS将棋は700台構成ですが、Puella αが700台使えたらどうなるか?GPS将棋は、700台構成で確実に棋力が上がることを示しました。Puella αだと、おそらく200?300程度上がるでしょう。するとR2200近辺。こうなると確実に人間トップを越えています。もっとも今のPuella αのプログラムは、4台程度の並列化に特化してチューンされているので、現状をそのまま700台に載せてもすぐ強くなるわけではありませんが、700台向けにチューンしなおすのはそう難しい話ではなく、やれば確実にできるレベルの作業です。
以上が、私が現時点で「名人を越えている」と考える根拠です。
これに対していろいろ反論はあるでしょう。代表的なのは、「24は本気じゃない」とか、「長時間だと違う」とか。これらに対して、私も100%否定しきることはできません。そもそも、究極的にはどちらが強いか決めるには、最低でも数十回対戦しないと確実にはわかりません。ですがそんなのはいつまでも実現しないので、現時点では入手可能なデータからの推定で代用する、という考えなわけですから、不確定な面があるのは事実です。
ただ個人的な意見を言うと、上の2つの反論はどちらも成り立たないだろうと思っています。「本気でない」に関しては、24の対局者は皆さん真剣に対していたと思いますし(対局された皆さん、改めてありがとうございました)、また「長時間だと人間の間違いが少なくなる」は勝手読みというものです。時間が伸びればそのぶんコンピュータも深く読めて更に強くなるので、長時間だと人間が有利になると考える根拠はないと思います。
ちなみに今度の電王戦は、自作PC3台程度を使うことになりそうです。去年の電王戦よりはかなり落ちますのでR1800-1900くらいでしょうか。塚田さんは現在R1496。少なくとも300は差があるだろう、と考えています。
【勝敗予想:Puella α】
勝敗予想もインタビューでよく聞かれました。レーティングで300上と言うと「じゃあ、絶対負けないってことですね?」などと言われるのですが、これは違います。
そもそもレーティングとは、ざっくり言うと「予想される勝率」を表したものです。このページ に、レーティングと勝率の換算表があります。英語のページですが、気にせずずっと下の方に行くと、レーティング差がいくつのときに(強い方の)勝率がいくつ、という表があります。これによると、レーティング300差ならば勝率84.9%。6,7回に1回は負ける計算になります。言ってみれば、「サイコロを振って、2以上の目が出ればこちらの勝ち、1が出たら負け」という感じです。サイコロで1が出る(=確率1/6)というのは、起こって不思議はないですよね。なので、塚田さんが勝つ可能性も十分あると言えます。
正義のヒーロー・塚田九段が、侵略者・コンピュータと戦うために立ち上がった!絶対絶命のピンチに陥りながらも、最後には悪の首領・伊藤を倒し、棋界に平和を取り戻す…というドラマティックな展開も十分あり得ますので、期待して見ていていいのではないでしょうか。
【勝敗予想:他チーム】
もう2戦は終了していますが、ツツカナとGPSはどうか?コンピュータ側の棋力は、おそらくどちらもPuella αとあまり変わらないと思います。人間側は棋士レーティングの数字を見て、あとは先ほどの勝率表から予想勝率を導きだすことができます。自分でちゃんと計算はしてないですが、ざっくりGPS 6割、ツツカナ7割くらいかな?
ただしこれは、習甦戦のように特別なソフト対策がない場合、の話。あんなふうに特定のソフト向けに対策をするなら、人間側の勝率はもっと上がる可能性がありますので、なんとも言えないです。GPSはオープンソースなのでその点苦しいかも。ツツカナは「1年前のバージョン」を貸したと言ってましたが、それがどの程度最新版と同じか違うか、によりますね。
【ソフト貸し出しについて&勝敗に対するスタンスの違いについて】
ソフト貸し出しの是非もかなり議論されているようですが、私としては貸し出ししてしまうと「イベントとしてつまらなくなる」のであまり賛成できないな、というのが現在の考えです。阿部-習甦戦って、事前の研究を再現してただけですよね。あれではスリルがないと思う。もちろん、研究したプロ棋士を批判するつもりは毛頭ありません。「無理を言うつもりはないが、可能なら貸してもらえるとありがたい」と言ったのに応じて貸してもらってるわけで、借りた以上、できる全てのことをやるのはプロとしては当然です。その点は批難すべき点はまったくないし、今後の対局者の方も、存分に研究していいと思う。ただ、イベントをやる側として、この点はきちんと決めておくべきだったなとは思います。
仮に第3回電王戦みたいなものがあるとしたら、今回のように「棋士側だけ自宅で研究できて、ソフト開発者側に何もフィードバックがない」のはやはりアンフェアだと思います。やるとしたら、たとえば24にソフトを常駐させて、棋士側も実名出したうえでそこで対戦する、とか。これならソフト開発者も研究の棋譜が見えて、「対策に対する対策」を考えることができるでしょう。まあこれは単なる案ですが。
まあとは言いつつ、実は開発者側はあまり気にしてないケースも多いんですけどね。というのは開発者というのは、目的が「技術開発」であって「勝負」ではない、人が多いのです。コンピュータを強くする技術を開発することが面白くてコンピュータ将棋をやっているのであって、対局の結果としての勝敗はあくまで技術開発の副産物にすぎない、というスタンス。もちろん開発者にもいろいろいますが、私は勝負には興味がない派です。
勝敗は「技術の到達度の物差し」として気にはするわけですが、その場合でも気にするのはあくまで(強さを表す指標としての)勝率(≒レーティング)であって、強くする=勝率を上げることには熱心だけど、個々の対局の勝敗は実はどうでもよい。1回サイコロを振って、それが1かどうかなんて興味ないわけです。
ちなみにインタビューとかでよく「意気込みを聞かせてください」と言われるんですが、意気込みなんてないです。ゼロです、はい。勝敗は上述の理由で気にしてないですし。開発ももう終わってるし、あとは会場にPC持ってってプログラム流すだけです。単なるオペレータです。4/1の週刊ダイヤモンドで私が「負けませんよ」と言ってたことになってますが、そんなこと言ってないですw おそらく「勝率85%なんでたぶん勝つと思います」とか言ったのが記者さんの脳内でそう変換されたんでしょう。
貸し出しに話を戻すと、事前研究というのは、これも変なたとえかもしれませんがサイコロで言うなら、サイを振る際の速度・角度・離すタイミング等を精密に制御して、思いどおりの目を出す技術、のような感じでしょうか。1を出したいと思って実際そうできれば勝てる、というわけです。ただしこれは、上に書いた技術開発?勝率の観点で言えば「勝率」(=強さ)を変えてるわけではないので、事前研究で勝てることと「棋力」とはリンクしないと思っています。もちろんサイの目を思いどおりに出す技術というのもそれはそれですごいわけですが、開発者サイドから見ると習甦戦みたいなのは「まああれは(棋力とは)関係ないよね~」という感じで見ていた人が多いのではないかと思っています。(少なくとも私はそう)
あの局面(△6五桂あたり)ではたしかに習甦もボンクラーズも、多くのソフトが正しく評価できなかったわけですが、これも「勝率(確率)」の話で、そういう局面の数が十分少なければそれで勝率的には問題ないわけです。bonkrasが24でやってたときも、だいたい序盤はこっちの評価が微妙におかしくて、やや形勢を損ねていた。だけど中終盤で逆転、というのがパターンになっていました。逆転できないほどひどく悪くしてしまうとだめなので、そういう局面は避けるように対策したわけですが、結局対策したのは入玉・冨岡流・脇システムの3つだけでした。あとは、序盤で「やや悪く」はなっても中終盤で逆転できる程度だったので対策しなくても済んだ。まあ習甦とボンクラーズは違うかもしれませんが、ボンクラーズ/Puella αに関して言うならば、そういう(致命的に悪くなるので避けるべき)局面というのは数えるほどしかないことがはっきりしたので、仮に新しく見つかってもその都度対策していけば十分、と思っています。なお、そういう局面で「正しく評価できるように」修正するのはかなり難しいですが、そういう局面を「避ける」ことはそう難しくはありません。
【名人を越えた後】
最後にこの点。羽生さんが対談で「ソフトに負けても何も変わらない」と言ったそうですが、私も同意見です。いくらコンピュータが強くても、人間は人間を応援するんですよ。強いのが見たいだけなら、コンピュータどうしが戦ってるネット対局サーバのfloodgateというのがあってそこで見えるわけですが、あれを見てる人というのはほとんどいない。人間は、同類の人間にだけ感情移入するように、(おそらく生物的に)プログラムされている。コンピュータが人間より強くなったからといって、将棋ファンが名人戦や竜王戦のかわりにコンピュータ将棋選手権を見るかというと、そんなわけはありません。「人間の」将棋界は、今までと変わらず続くと思っています。
車と人の競争、というたとえもよく出ますね。人は走る速さで車に全く勝てないけれど、それでもオリンピックの陸上は人気がある。水泳も然り。北島康介さんがモーターボートに競争心を燃やしている、という話は私は聞いたことがありません。なぜ将棋だけコンピュータに勝とうと思うのか、いまいちわかりません。
PVで「負けても大丈夫」と言ったのは、1時間くらいのインタビューの中でそういう文脈で言っているんですけど、なぜかPVでああいうふうに切り出されると全然違うふうに取られているw まあドワンゴさんも狙ってやってるんでしょうが。
サトシンさんブログ拝見しましたが、ちょっと何というか、コンピュータを意識しすぎではないかな、という印象を受けました。必要以上に自分を追いつめてたような気が。ツツカナ借りてるんだから、名人を越えてるとは思ってなくとも、少なくとも並のプロが負けても全然おかしくない、てことはわかってたはず。それなのに「絶対勝つんだ」みたいになってたのはなんでなのか…。まあいろいろお考えがあったのでしょうから突っ込みませんが、これから出るお三方は、もっと気楽に、もちろん勝つつもりで出るのでしょうけど、「負けたらまあしかたない」くらいに思って出ていただければ、と思います。いやほんと、負けても大丈夫なんですから。
最近のコメント