「浅い評価値を深い評価値に近づける学習法」誕生の背景
もうすぐ電王トーナメントです。私はコンピュータ将棋開発から手を引いてもう4年以上経ちまして、最新の技術動向はあまり追ってなかったのですが、最近どんなふうになってるのだろうかとふと思い、先日アピール文書をざっと眺めてみました。すると「浅い探索の評価値を深い探索の評価値に近づける学習法」が大流行しているようでちょっと驚きました。
これは2013年にNineDayFeverが始めた手法ですが、実はこのアイデアは、F研におけるNDF作者の金澤さんと私の会話から出てきたものです。このアイデアが誕生した時の様子を記しておきます。
最近のコメント