2024年11月
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30

tweet

  • tweets

« 2012年5月 | トップページ | 2013年8月 »

2013年4月

三浦-GPS戦

GPS将棋のページに電王戦での読み筋と評価値がアップされています。いいですね、これは。いや私もやった方がいいんでしょうが、データ整理するのがけっこう手間がかかるのでできてません。チームGPSはこのあたりのサービス精神が好感度高いなと思います。

せっかくのデータなので、棋譜とつき合せながら少し見てみましょう。

まず竜王ブログ他で触れられている、40-42手め△75歩▲同歩△84銀。新仕掛けか?とのことですが、52手め△64角のところで評価0点。GPS的には、ちょっかい出してはみたものの特にポイントあげられたわけではない、と思っているようです。

ところがこの後じりじりと三浦八段が形勢を損ねていきます。74手め△7一飛のところで-513点。この後は一方的に差が開いていきます。ということは、52手め△64角から74手め△7一飛の間の先手の指し方がどこかまずかったようです。

△6四角  ▲7六銀打 △7二飛  
▲6七金  △8四金  ▲6五歩  △8二角  ▲6六金  △7四飛  
▲7五歩  △7二飛  ▲8六歩  △同 歩  ▲同 銀  △7四歩  
▲同 歩  △6四歩  ▲7五金  △7四金  ▲同 金  △同 飛  
▲7五歩  △7一飛 

このあたりの先手の指し方は、玉頭から金銀盛り上がって入玉を目指そう、という意図ですよね。そもそも矢倉にしたところからみても、やはり対コンピュータということで入玉を目指す、という作戦ではなかったかと思います。ですが、このあたりの指し方がおそらくどこか性急すぎて、そこをGPSに的確にとがめられた、ということではないかと思います。私の棋力では、具体的にどこが悪かったのか、じゃあどうすればよかったのか、まではわかりませんが。

つまり一言でいうと、去年のボンクラーズ~米長戦と同じパターン、ということですね。第4局のPuella α~塚田戦とも、(結果は違いましたが)共通する部分があると思います。

対A級八段戦ということで、コンピュータ将棋の到達点を測る意味で私も注目していたのですが、今回は判断保留かな、という感想です。また「まともな」将棋(ry とか言うと批判されそうなので、ええと何と言うか、彼本来の将棋ではなかったと思うので。

コメントのコメント

なんか異様に反響が大きいですね。ちょっと読み返して説明不足のところもあったかもしれませんので、前記事にコメントいただいた内容に対して少し補足します。

まず、「入玉批判はおかしい」というコメントが山のように来てるんですが、批判してないです。入玉は正当な作戦。記事にはっきり「悪くない」と書いてるんだけど。で、この種のコメントはすみませんが掲載(コメント承認)対象から外していますのでご了承ください。数が多くて、他のコメントが埋もれて見えなくなるので。

「まともな将棋」は、普通に駒がぶつかり合って、見ていて面白い将棋、くらいの意味です。ただ、「そうなってほしかったなぁ」という願望であって、「そうしなかった塚田さんの指し方はおかしい!」と批判してるわけではない。たぶんここを勘違いした人が多いと思います。「今日晴れればよかったのになぁ」「阪神勝ってたらよかったのになぁ」というのと同じレベル。ぼやきです、ぼやき。「今日晴れなかったのはおかしい!」とか「阪神が勝たないのはおかしい!」とか憤ってるんじゃないですよ、と。

「(見ていて)つまらなかった」は率直な感想なんですけど、なんかおかしいですか?あの将棋(の後半)見て「(内容が)おもしろい」という人の方が少数派なんじゃないかと思いますが。

塚田さんの指し方(および諦め悪さっぷり)については、私は悪くないと思ってます。げんなりしてたのは事実ですがw ルールでOKなことはOKなんですよ。それが基本。むしろ、彼の立場としては賞賛されるべきかもしれない。ただ、それを見て「つまんなかった」とか「残念だった」とか思うのも各人の自由、てことです。

「入玉になったのはPuella αの指し方のせいもあるのでは?」は、たしかに言われてみればそうですね。そこは了解です。ただ、「こっちが指してしまった」ことも含めて、そうならなかったらよかったのになぁ、とぼやいてるわけです。これも、塚田さん批判とはとらないでいただきたい。

「ソフトの入玉対策がなってない」は、いやわかってますって。会見でも言ったし記事でも書いたじゃないですか。だから言わないでもう。耳タコだからw

ただ、「入玉局面でも正しく指さないと名人越えたとは言えない」は同意しません。そこはやっぱり勝率で計るべきだと思う。勝率が物差しでないと言うなら、じゃあ代りの物差しは何ですか?勝率以外にいい物差しが思いつかないです。

まあ、「入玉局面でも正しく指すべき(指してほしい)」という気持ちはわかります。というか開発者だってできるもんならそうしたい。だけど、こっちも限られた時間とリソースの中でやりくりしてるわけですよ。何でもかんでもできるわけではない。「最小のコストで、最大限の効果を目指す」が当然だと思ってます。入玉局面でも正しく指すために莫大なコスト/時間をかけるのは、エンジニアリング的には正しい判断とは思えません。

えーと、こんなとこかな。引き続きコメント(批判・反論含めて)歓迎します。ただ、読む人が不快にならない程度の表現を心がけてくださいね。

(4/16追記)
コメント拝見しております。
入玉対策についてまだ誤解が多いようなので再度補足します。

「入玉対策をしない」というわけではありません。前記事に書いたように、
入玉対策には2通りあります:

(1)入玉されても正しく指せるようにする
(2)そもそも入玉させない

本記事で書いたのは、「対策(1)は大変。だから対策(2)をやる」ということです。
対策をまったくしない、ではありません。
対策2)を行なえば、プロが入玉を目指しても成功する確率は低くなります(ゼロではないでしょうが)。つまり、勝率としては問題ない。ただし対策(2)に対しては
「いくら勝率が高くても、入玉されたときに正しく指せないのでは名人を越えたとは言えないのでは?」という批判があったので、それに対して「違います。入玉の確率が十分低くてトータルの勝率が高いなら、名人を超えたと言えるはずです」と私が反論した、という構図になっています。

第2回電王戦

電王戦は皆さんご存知のとおり持将棋引分けでした。観戦してくださった方々、ツイッターに反応してくださった方々、どうもありがとうございました。

まあとにかく、塚田さんの執念がすごかった、の一言に尽きますね。タイムシフトまだ見てませんが、木村さんが「困難に直面したときは、この対局のことを思い出してほしい」とか言ったそうですがwww 冗談か本気なのか知りませんが、将棋でこういう発言が成り立つこと自体普通ないですよね。

「悪の首領」を、倒せはしないまでもぎりぎり追い返せはしたし、ちゃんと(?)絶体絶命のピンチにも陥ったし。観てる方としては盛り上がれる理想的な展開だったのではないでしょうか。

ただドラマとしての内容とは別に、将棋の内容という意味でいうと、やはり正直つまらなかったですね。去年もそうだったけど。いろいろな感じ方はあるでしょうが、私としてはツツカナやポナンザのような「まともな」将棋がやりたかったです。あ、もちろん塚田さんなり米長さんなりが悪いとかいうことは全くありません。勝負なんですから、ルール上OKなことは何やってもよし。ただ、私の個人的願望が実現しなかったので残念に思う、というだけです。まあ塚田さんにせよ米長さんにせよ、「まともに勝負したのでは絶対勝てない」と思われたからこそこうなっているわけで、ある意味喜ぶべきことなのかもしれませんが。

しかし入玉、ねぇ…まともに入玉時の評価を正しくするよりは、やはり入玉を避ける方が簡単そうかな。「強さ=勝率」の観点からすると、弱点をすべてふさぐ必要はなくて、弱点を衝かれる確率を十分小さくできればそれでいいので。「最小のコストで、最大限の効果を目指す」とするとそういう方向になると思います。ぱっと思いつくのは、居飛車対振り飛車にすることでしょう。玉どうしが向かい合っていればまず入玉にはならないので。でもそうすると、居飛車と見せかけて、こっちが振ると相振り飛車にして、…とかになるんでしょうね。そうするとこっちも対策して、たとえば飛車を5筋に置いといて、相手の玉の動いた方へこちらも行く、とか。

でもこうやって、アンチコンピュータ戦略、それに対するアンチ・アンチコンピュータ戦略、…とやっていくと、どんどん将棋としてはつまらなくなっていくような気もします。もちろんプロの研究合戦にも多少そういう傾向はあるでしょうが、対コンピュータだとそれがもっと極端に現われそうな感じがする。…などと考えだすと、いろいろ複雑な気分ではあります。

現状認識@2013年4月

第2回電王戦も始まりまして、インタビューもまた最近けっこう受けましたし、このブログのアクセス数もだいぶ増えてきました。せっかく来てくださった方に1年近く放置プレイの状態をお見せするのもあれですし、開発者サイドの見解を知りたがっている方もそこそこいらっしゃるようなので、少し現時点で考えていることをまとめてみます。

【コンピュータ将棋の棋力推定】

PV等での「名人越えました」発言がいろいろ物議をかもしているようですが、現状そういう認識でいます。そう考える根拠を示しておきます。

基本は、棋士レーティング将棋倶楽部24のレーティングを組み合わせて推定しています。まず24の方ですが、bonkrasが指していた11年末の時点で人間の歴代最高レーティングが3200ちょい。これはピークの値なので、ふだんは3100ちょいくらいだったと思います。これに対してbonkrasがピークで3364、ふだんが3300くらい。24の人間トップより約200上でした。(以下、レーティングの数字には"R"をつけて、"R3300"のように表記します。)

24の人間トップは、棋士レーティングでどのくらいか?24は匿名なので詳しいことはわかりませんが、光瑠さんや遠山さんは24で指していたと明言しています。4/3現在、お二人のレーティングは1625/1543。なので、24の人間トップ=R1600くらい、と考えてよさそうです。そうすると、24のbonkrasは棋士レーティングで約1800相当、と推定できます。
#細かい話をすると、24のレーティングと棋士レーティングは同じものではなく、計算方法が異なります。ですが、ここではあまり細かいことは考えず、えいやで同じ基準として計算しています。

ボンクラーズ/ Puella αは、5月の選手権ごとにバージョンアップしています。24でやっていた(≒第1回電王戦)バージョンは11年5月のものベース。入玉周りとか多少手は入れましたが、大きくは変わってません。12年5月のバージョンは、その前のバージョンに対して(同じマシン同士で対戦して)ほぼ2勝1敗ペースで勝ち越します。これはレーティングで120差に相当。自己対戦はややあてにならない面があるにしても、100近くは上がっているでしょう。

更に、ハード面の進化があります。12年春にインテルさんが新型CPUを出してきて、CPUコア数、クロック速度共に上がっています。24で指していたのはその2つ前の世代のCPU。(第1回電王戦は1つ前の世代。)2世代でほぼ50程度上がっていると考えられます。そうすると、最新のPuella αはR1950程度、となります。

なおコンピュータの棋力はハードによって大きく変わる、というのは三浦さんが言ってた通りですが、上でR1950と言ってるのは、「第1回電王戦の時のサーバと同クラスの最新マシンを使った場合」になります。

さて、今の棋士レーティングを見ると、最高は渡辺3冠の1975。…あれ?何か月か前に見たときは、確か最高が1900ちょっとだったと思いましたが。1975だと、わずかですがまだ及ばないですね。このマシン構成でもわずかながら越えたと思っていましたが、ここは訂正しておきます。

ただし、まだ変身第二段階があります。GPS将棋は700台構成ですが、Puella αが700台使えたらどうなるか?GPS将棋は、700台構成で確実に棋力が上がることを示しました。Puella αだと、おそらく200?300程度上がるでしょう。するとR2200近辺。こうなると確実に人間トップを越えています。もっとも今のPuella αのプログラムは、4台程度の並列化に特化してチューンされているので、現状をそのまま700台に載せてもすぐ強くなるわけではありませんが、700台向けにチューンしなおすのはそう難しい話ではなく、やれば確実にできるレベルの作業です。

以上が、私が現時点で「名人を越えている」と考える根拠です。

これに対していろいろ反論はあるでしょう。代表的なのは、「24は本気じゃない」とか、「長時間だと違う」とか。これらに対して、私も100%否定しきることはできません。そもそも、究極的にはどちらが強いか決めるには、最低でも数十回対戦しないと確実にはわかりません。ですがそんなのはいつまでも実現しないので、現時点では入手可能なデータからの推定で代用する、という考えなわけですから、不確定な面があるのは事実です。

ただ個人的な意見を言うと、上の2つの反論はどちらも成り立たないだろうと思っています。「本気でない」に関しては、24の対局者は皆さん真剣に対していたと思いますし(対局された皆さん、改めてありがとうございました)、また「長時間だと人間の間違いが少なくなる」は勝手読みというものです。時間が伸びればそのぶんコンピュータも深く読めて更に強くなるので、長時間だと人間が有利になると考える根拠はないと思います。

ちなみに今度の電王戦は、自作PC3台程度を使うことになりそうです。去年の電王戦よりはかなり落ちますのでR1800-1900くらいでしょうか。塚田さんは現在R1496。少なくとも300は差があるだろう、と考えています。

【勝敗予想:Puella α】

勝敗予想もインタビューでよく聞かれました。レーティングで300上と言うと「じゃあ、絶対負けないってことですね?」などと言われるのですが、これは違います。

そもそもレーティングとは、ざっくり言うと「予想される勝率」を表したものです。このページ に、レーティングと勝率の換算表があります。英語のページですが、気にせずずっと下の方に行くと、レーティング差がいくつのときに(強い方の)勝率がいくつ、という表があります。これによると、レーティング300差ならば勝率84.9%。6,7回に1回は負ける計算になります。言ってみれば、「サイコロを振って、2以上の目が出ればこちらの勝ち、1が出たら負け」という感じです。サイコロで1が出る(=確率1/6)というのは、起こって不思議はないですよね。なので、塚田さんが勝つ可能性も十分あると言えます。

正義のヒーロー・塚田九段が、侵略者・コンピュータと戦うために立ち上がった!絶対絶命のピンチに陥りながらも、最後には悪の首領・伊藤を倒し、棋界に平和を取り戻す…というドラマティックな展開も十分あり得ますので、期待して見ていていいのではないでしょうか。

【勝敗予想:他チーム】

もう2戦は終了していますが、ツツカナとGPSはどうか?コンピュータ側の棋力は、おそらくどちらもPuella αとあまり変わらないと思います。人間側は棋士レーティングの数字を見て、あとは先ほどの勝率表から予想勝率を導きだすことができます。自分でちゃんと計算はしてないですが、ざっくりGPS 6割、ツツカナ7割くらいかな?

ただしこれは、習甦戦のように特別なソフト対策がない場合、の話。あんなふうに特定のソフト向けに対策をするなら、人間側の勝率はもっと上がる可能性がありますので、なんとも言えないです。GPSはオープンソースなのでその点苦しいかも。ツツカナは「1年前のバージョン」を貸したと言ってましたが、それがどの程度最新版と同じか違うか、によりますね。

【ソフト貸し出しについて&勝敗に対するスタンスの違いについて】

ソフト貸し出しの是非もかなり議論されているようですが、私としては貸し出ししてしまうと「イベントとしてつまらなくなる」のであまり賛成できないな、というのが現在の考えです。阿部-習甦戦って、事前の研究を再現してただけですよね。あれではスリルがないと思う。もちろん、研究したプロ棋士を批判するつもりは毛頭ありません。「無理を言うつもりはないが、可能なら貸してもらえるとありがたい」と言ったのに応じて貸してもらってるわけで、借りた以上、できる全てのことをやるのはプロとしては当然です。その点は批難すべき点はまったくないし、今後の対局者の方も、存分に研究していいと思う。ただ、イベントをやる側として、この点はきちんと決めておくべきだったなとは思います。

仮に第3回電王戦みたいなものがあるとしたら、今回のように「棋士側だけ自宅で研究できて、ソフト開発者側に何もフィードバックがない」のはやはりアンフェアだと思います。やるとしたら、たとえば24にソフトを常駐させて、棋士側も実名出したうえでそこで対戦する、とか。これならソフト開発者も研究の棋譜が見えて、「対策に対する対策」を考えることができるでしょう。まあこれは単なる案ですが。

まあとは言いつつ、実は開発者側はあまり気にしてないケースも多いんですけどね。というのは開発者というのは、目的が「技術開発」であって「勝負」ではない、人が多いのです。コンピュータを強くする技術を開発することが面白くてコンピュータ将棋をやっているのであって、対局の結果としての勝敗はあくまで技術開発の副産物にすぎない、というスタンス。もちろん開発者にもいろいろいますが、私は勝負には興味がない派です。

勝敗は「技術の到達度の物差し」として気にはするわけですが、その場合でも気にするのはあくまで(強さを表す指標としての)勝率(≒レーティング)であって、強くする=勝率を上げることには熱心だけど、個々の対局の勝敗は実はどうでもよい。1回サイコロを振って、それが1かどうかなんて興味ないわけです。

ちなみにインタビューとかでよく「意気込みを聞かせてください」と言われるんですが、意気込みなんてないです。ゼロです、はい。勝敗は上述の理由で気にしてないですし。開発ももう終わってるし、あとは会場にPC持ってってプログラム流すだけです。単なるオペレータです。4/1の週刊ダイヤモンドで私が「負けませんよ」と言ってたことになってますが、そんなこと言ってないですw おそらく「勝率85%なんでたぶん勝つと思います」とか言ったのが記者さんの脳内でそう変換されたんでしょう。

貸し出しに話を戻すと、事前研究というのは、これも変なたとえかもしれませんがサイコロで言うなら、サイを振る際の速度・角度・離すタイミング等を精密に制御して、思いどおりの目を出す技術、のような感じでしょうか。1を出したいと思って実際そうできれば勝てる、というわけです。ただしこれは、上に書いた技術開発?勝率の観点で言えば「勝率」(=強さ)を変えてるわけではないので、事前研究で勝てることと「棋力」とはリンクしないと思っています。もちろんサイの目を思いどおりに出す技術というのもそれはそれですごいわけですが、開発者サイドから見ると習甦戦みたいなのは「まああれは(棋力とは)関係ないよね~」という感じで見ていた人が多いのではないかと思っています。(少なくとも私はそう)

あの局面(△6五桂あたり)ではたしかに習甦もボンクラーズも、多くのソフトが正しく評価できなかったわけですが、これも「勝率(確率)」の話で、そういう局面の数が十分少なければそれで勝率的には問題ないわけです。bonkrasが24でやってたときも、だいたい序盤はこっちの評価が微妙におかしくて、やや形勢を損ねていた。だけど中終盤で逆転、というのがパターンになっていました。逆転できないほどひどく悪くしてしまうとだめなので、そういう局面は避けるように対策したわけですが、結局対策したのは入玉・冨岡流・脇システムの3つだけでした。あとは、序盤で「やや悪く」はなっても中終盤で逆転できる程度だったので対策しなくても済んだ。まあ習甦とボンクラーズは違うかもしれませんが、ボンクラーズ/Puella αに関して言うならば、そういう(致命的に悪くなるので避けるべき)局面というのは数えるほどしかないことがはっきりしたので、仮に新しく見つかってもその都度対策していけば十分、と思っています。なお、そういう局面で「正しく評価できるように」修正するのはかなり難しいですが、そういう局面を「避ける」ことはそう難しくはありません。

【名人を越えた後】

最後にこの点。羽生さんが対談で「ソフトに負けても何も変わらない」と言ったそうですが、私も同意見です。いくらコンピュータが強くても、人間は人間を応援するんですよ。強いのが見たいだけなら、コンピュータどうしが戦ってるネット対局サーバのfloodgateというのがあってそこで見えるわけですが、あれを見てる人というのはほとんどいない。人間は、同類の人間にだけ感情移入するように、(おそらく生物的に)プログラムされている。コンピュータが人間より強くなったからといって、将棋ファンが名人戦や竜王戦のかわりにコンピュータ将棋選手権を見るかというと、そんなわけはありません。「人間の」将棋界は、今までと変わらず続くと思っています。

車と人の競争、というたとえもよく出ますね。人は走る速さで車に全く勝てないけれど、それでもオリンピックの陸上は人気がある。水泳も然り。北島康介さんがモーターボートに競争心を燃やしている、という話は私は聞いたことがありません。なぜ将棋だけコンピュータに勝とうと思うのか、いまいちわかりません。

PVで「負けても大丈夫」と言ったのは、1時間くらいのインタビューの中でそういう文脈で言っているんですけど、なぜかPVでああいうふうに切り出されると全然違うふうに取られているw まあドワンゴさんも狙ってやってるんでしょうが。

サトシンさんブログ拝見しましたが、ちょっと何というか、コンピュータを意識しすぎではないかな、という印象を受けました。必要以上に自分を追いつめてたような気が。ツツカナ借りてるんだから、名人を越えてるとは思ってなくとも、少なくとも並のプロが負けても全然おかしくない、てことはわかってたはず。それなのに「絶対勝つんだ」みたいになってたのはなんでなのか…。まあいろいろお考えがあったのでしょうから突っ込みませんが、これから出るお三方は、もっと気楽に、もちろん勝つつもりで出るのでしょうけど、「負けたらまあしかたない」くらいに思って出ていただければ、と思います。いやほんと、負けても大丈夫なんですから。

« 2012年5月 | トップページ | 2013年8月 »