こちらバグ捜査一課
進行度の見直しはまだやってませんがとりあえず初手からX手め以降はFPGA、という形で逃げてます。ほんとはあまりよろしくないのだが、まずはパッチで。プロトコルまわりも修正して、いちおう自動対戦は動くように。
でKShogi初級と対戦させてみましたが、先後とも負けますね。時々明らかな悪手をさすので、どっかにまだバグがあるっぽい。なのでデバッグの日々に戻りました。
まあやっと戻れたというか。結局12月から3か月強、環境立ち上げに費やしました。もう大会まで2か月ないよヲイ。ま仕方ないですな。残り時間でできるとこまでせいぜいがんばりましょう。強さを除けばまあ対戦するだけならいちおう完成なので、かなり気は楽に。一時は参加すら危ぶまれてましたから。あとはボードにコーヒーこぼしておしゃか、とかいうのだけ気をつけないと。なんせむき出しですから。あと定番の静電気とか。
さてデバッグの方ですが、これがかなり手こずってます。今度の容疑者はなかなか吐きませんよ警部。まあわかったものもいくつかありまして、例をあげると:
・読み技23図で▲6四馬△2七歩成でよしと思ってた件。小駒の成りが全く評価に入ってませんでした--; 大駒は入れてたんですが。
まあこれも一応趣旨はあって。終盤でと金量産しないようにするにはどうするか、と考えてて、成り自体を評価するのでなく、成ったことによって増える利きを評価しよう、と。それなら敵玉から遠いと金は評価値が上がらんだろう、と。でもこれ、終盤はそこそこよくても、序中盤はやっぱり成り自体を評価しないとだめだな、というのはそういえば前にもソフトで同じこと考えて同じ間違いしたんでした。ぜんぜん学習できてません。
でこれ入れて:成り駒自体に価値を持たせ、重みが進行度で下がるように、としたら、めちゃくちゃな手を指すようになって今調べだしたところ。評価値は14bitで持ってるのですが、スケーリング間違ってオーバフローしたかも。
・進歩本②第8問
gote motigoma
-
#banmen
ye.....ey
..h..io..
.f..giaff
fHgffff..
Y.f....FF
...FF.I..
E....FF..
...AG.GO.
.....I.EY
# sente motigoma
f3
# teban
s
いつもの見づらいフォーマットですみません。私にはこっちが見やすいんです。
正解は▲7三歩。△同飛に▲8五桂以下飛頭に歩を連打します。でAリーグの指し手は…正解の▲7三歩。いやちょっと待て。お前そんなに深く読んでないだろうわかるはずねーじゃん。警察をなめるんじゃねぇぞコラ。で見てみると、案の定▲7三歩△同飛の後▲8六飛となってました。まだその先調べてませんがおそらく△7二飛の横利きが自玉へ行ってるのが歩の値より大きいと思ってるんでしょう。評価値のチューニング不足と思われ。はたまた何かの水平線かも。採点スクリプトは正解と返すんですが、う呑みにすると「今、痛い目に会いにいきます」になります。
ちなみにDeep Purpleでは、この第8問を(正しく読んで)正解できたことは未だかつてありません。だいたい▲8六飛くらいなら「んー まOK」にしてた。全幅8手+静止だと行くのかな。やってみたいところ。理論上行きそうな気はしますが。
いずれも、まアホなといえばアホなバグですが、ソフト開発の初期にはたぶん皆さん似たようなことやられたんじゃないかと思います。ある程度やってるとだんだんバグが取れてくるんですが。でも何しろこっちは一から作り直し、が6度めですから。12月初めの時点では、エンジンのコーディングが終わって多少SIMLしてやっと最初の一例が動いた、というレベルでした。ここで「プレスリリース」するのはまあ業界では基本でしょう。そこからエンジンの方は今までほとんど進んでないので、これから血と汗と涙のバグ取りフェーズです。♪思い込んだら試練の道を~ 経験からすると、このフェーズが大体2、3か月くらいでしょうか。あれ大会終わってるな。ハードだともうちょいかかるかな。
プロの開発だと何たら曲線が飽和してきて…とかやるとこでしょうが、私は当然そんなことはしてません。そもそもバグの記録つけてないし。D.P.作りだした最初のころは習慣でつけてたのですが、後で1度も見直さないことがわかりやめました。ソースの中に、1か月後には意味不明になるであろうコメントを残していくだけ。
話がそれましたが、デバッグに手こずってて、という話を書こうとしてたんですが、紙面が尽きたのでまた今度。
今週の一曲:
♪ Here comes your 6th nervous breakdown ...(テケテテケテテケテテケテ…)
# ちょっと違う。でも19回やった奴はさすがにいないだろう
« 初スパーリング | トップページ | *UNTER^2 状態に »
「将棋プロセサ」カテゴリの記事
- ボンクラーズの開発過程について書いた記事が掲載されました(2019.03.07)
- 「浅い評価値を深い評価値に近づける学習法」誕生の背景(2016.10.06)
- 塚田九段の対ボンクラーズ練習棋譜を公開します(2013.09.07)
- Puella α ソース公開(2013.08.28)
- クラスタ並列の解説記事を公開します(2013.08.22)
コメント