学習も人工知能も使ってません
電王戦後2週間は各種新聞・TV・Webメディア等の取材がほぼ毎日のようにありました。対戦前もかなりあったし。当然ながら取材の記者さん達はそれほどコンピュータ将棋に詳しくはないので、できるだけわかりやすく誤解のないよう説明し…たかったんですけどこちらもなかなかこういう説明に慣れていませんで、うまく説明できたかあまり自信ありません。で実際掲載された記事を見ると「何か違くね?」という感想を持つこともままあるのですが、まあこっちの説明がまずかったせいだろうとか思ったり。
そういう数ある「すれ違い」の中でもいちばん際立っているなーと思うのが「(機械)学習」です。ちょっとこのことについて書いてみます。
ボナンザが評価関数で機械学習を導入した、ボンクラーズもそれを取り入れてる、というのはまあかなり有名になりまして、記事でも書かれました。でもそのトーンが、専門家でない一般の人向けの記事で「ソフトが学習して強くなった」みたいに書かれると、読者の思い描くものは実態とは全く異なる、非常に過大評価したものになってしまうケースが多い。これは問題かな、と思うわけです。
たとえば24でbonkrasがずっと対戦していて、時間がたつと「学習して強くなってきたんじゃないか?」なんてことを言われる。いやお前そんなわけないだろう、とこちらとしてはツッコミたくなるんですがw やはり「学習」という言葉を一般の人に対して使ってしまうと、そういう印象を持たれてしまう。なので、一般向けの解説では「(機械)学習」という言葉を使うのは避けて誤解を招かないようにすべきではないか、と最近は感じております。
ボナンザが取り入れた機械学習の手法を俗に「ボナンザ・メソッド」と言うんですが(以下「ボナメソ」と略記)、このボナメソは、結論から言ってしまうと、一般の人が思い描く意味での「学習」とは実は全く関係ありません。
ボナメソとは何か、を一言で言うと、「方程式の解法」です。簡単な例を挙げてみます。中学3年の数学ですが、
y = x2 - 4x + 2
という「関数」があるとします。で、この関数で y=0 となる x の値を求めたいとする。この x の値を求めるのが「方程式を解く」ことです。
ボナンザ以前のやり方というのは、たとえて言うなら
「えーと、x=0 なら y=2 だな。x=1 なら y=-1 か。じゃあx=0と1の中間のどこかでゼロになるはずだから、んー x=0.5 くらいかな」という感じで適当に目分量でxを決めていた。それをボナメソでは、解を求めるアルゴリズムをきちんと考え、0.585... という正確な値を求める手順を定式化した、ということです。
大学理系の人なら、数値計算でニュートン法というのを覚えているでしょうか。ああいう風に
x(i+1) = x(i) - (y(i)/y'(i))
みたいな計算を繰り返していって正確な x を求めていく。ボナメソもそんな感じです。
大学理系でない人向けに別の例を挙げると、たとえば割り算の答えを求めるのに
____8_8._2_…_
7 ) 6 1 8
_5_6_
5 8
_5_6_
2
:
のようにして順に計算していって正確な答えを求める。これも一つの「アルゴリズム」です。こんな感じのものだと思えば大体OK。
ボナメソではもちろん関数ももっと複雑だし変数(x)もひとつだけでなくたくさんあるのですが、要は棋譜データの集合に対してある「関数」を定義して、その関数の値を最小にする変数の組が将棋の評価関数になる、というふうに問題を定式化した。「関数を最小にする」というのは、「その関数を微分したものをゼロにする」こととほとんど同じなので、結局方程式を解くことになります。で、その方程式を解く具体的手順を示した。ここで、求める変数というのはたとえば「持ち駒の金の価値(点数)」であったり、「玉飛接近の形のマイナス点」だったりする。ボナメソとはこういうものです。
複雑度こそ違え、要はボナメソというのはニュートン法や割り算の筆算法と同じく、「方程式を数値的に求めるための解法の一種」です。(一般的な意味での)「学習」とか「知能」とか呼ぶべき物ではありません。割り算の筆算を「学習」とは言いませんよね。
もちろん、「学習」でないからと言って、ボナメソの価値をいささかも減じるものではありません。従来「大体 0.5」だったものが、「0.585」にまで精度が上がった。それによってコンピュータ将棋がかなり強くなった、というのは動かしようのない事実です。ただそれを「学習」などと実態にそぐわない言葉で呼ぶのはやめましょう、というだけです。
もうひとつ書いておくと、コンピュータサイエンスの専門の世界では、ボナメソみたいなのものを「機械学習(Machine Learning)」と呼ぶのは専門用語として定着しています。これの良し悪しはともかく、今更言ってもしょうがないというのはあるので、専門家が内容を正確に理解したうえで「(機械)学習」と呼ぶのはまあいいかなとは思います。ですがそれがひとたび専門家集団を離れて、一般向けに「学習」という言葉を使ったとたん大きな誤解を生む、という状況を最近目の当たりにしたので、警鐘の意味で記事を書いてみました。
« 24ログ抜粋(12年1月) | トップページ | FM番組出演情報 »
「将棋プロセサ」カテゴリの記事
- ボンクラーズの開発過程について書いた記事が掲載されました(2019.03.07)
- 「浅い評価値を深い評価値に近づける学習法」誕生の背景(2016.10.06)
- 塚田九段の対ボンクラーズ練習棋譜を公開します(2013.09.07)
- Puella α ソース公開(2013.08.28)
- クラスタ並列の解説記事を公開します(2013.08.22)
コメント
トラックバック
この記事へのトラックバック一覧です: 学習も人工知能も使ってません:
» クローズアップ現代『人間VSコンピューター』 [サイトーブログ]
2/8(水)NHK教育テレビ クローズアップ現代で、電王戦が取り上げられました。 【NHKクローズアップ現代】 http://cgi4.nhk.or.jp/gendai/kiroku/detail.cgi?content_id=3155 番組を見た感想は、将棋について知らない人も興味を持ってもらえる良いつくりだったと思います。 最初に取り上げられたのは、1997年にIBMが作成したディープブルーというソフトが当時のチェスの世界王者であり、歴代チャンピオンのなかでも最強に近いと思われるカスパロフ... [続きを読む]
» [情報]将棋ソフトと機械学習 [大人になってからの再学習]
コンピューターの上で動作する将棋ソフト「ボンクラーズ」が、元名人・米長邦雄永世棋聖に勝利を収めたことは記憶に新しい。コンピュータがトップレベルの人間に勝てるレベルまで到達したことを示した画期的なできごとだと思う。このことは、多くのニュースで取りあげられた... [続きを読む]
ぜひまた24で、レーティング、フリーとも復活してほしいですね。
よろしくお願いします。
お待ちしておりますよw(逃げるのかーww)
また、ボンクラーズを、どうやって強くしていってるのでしょうか。
24での敗局の敗着を1局1局調べて、・・・・直していっているのでしょうか。
この辺、機会があったら、わかりやすくブログでレクチャーしていただければと思います。
次回の世界コンピュータ大会も期待していますよ!
投稿: 打倒ボンクラーズ男 | 2012年2月 1日 (水) 09時37分
人間が経験に基づいてパラメータの最適化をする必要がなくなったため、採用できるパラメータの数も飛躍的に多くなった、と何かで読んだ記憶があります。パラメータの精度と数、どちらの寄与が大きいのでしょう。両方でしょうか。。。
投稿: masa | 2012年2月 1日 (水) 11時24分
これからコンピュータ将棋がマスコミと接する機会も増えますから、この手の誤解対策として、コンピュータ将棋協会(CSA)のHPにボナメソ概説とQ&Aを書くべきですよね。そこに載せる文章は伊藤氏のこの文をベースにしてもいいし、おおざっぱな概説くらいだったらCSAが一声かければ誰でも書いてくれるような気がします。これからソフト開発者がマスコミのインタビューに答えたりする機会も増えるんですから、誤解は無くしていきたいですね。
それからマスコミへの説明ですが個人的には関数という言葉を出しただけでマスコミはパニックになるような気がしています。
【オーソドックスなコンピュータ将棋】
A.ラジオのチューニングと同じような感じで、パラメータの調節をする
B.パラメータの数は100万個以上
C.チューニングは過去の棋譜数十万局を元に行う。
D.チューニングの方法は『棋譜と同じ手を指すケースが増える』ことを目指す
E.チューニングは試合の事前に全て完了する。ソフトが動き始めてからは一切変更しない。
【頭のいいマスコミ向け文章】
F.コンピュータ将棋の強さは、ざっくり言うと2つである。
1.局面を正しく評価する(上記Dの「棋譜と同じ手を指すケースが多い」パラメータ)
2.局面を深く読む
ボンクラーズの名前の由来にもなった『クラスタ』で、局面を深く読んでいる。
G.あずまんがは最高である。
H.よつばとは素晴らしい。
投稿: 茶 | 2012年2月 1日 (水) 14時12分
...それを言い出したら 「将棋ソフトは考えません!ただ、ただ探索するのみです!!」 ...ですね。
投稿: 紫外線 | 2012年2月 1日 (水) 15時11分
資料の公開や、プログラムのていねいな解説ありがとうございます。素人ですけどますます興味がわいてきます。
投稿: メロン | 2012年2月 1日 (水) 16時40分
昔の恩師が「実現しちゃったらアルゴリズム」「実現できてない部分が人工知能」と語ってくれたことを思い出します。
投稿: うさぴょんの育ての親 | 2012年2月 2日 (木) 11時06分
>「将棋ソフトは考えません!ただ、ただ探索するのみです!!」
いや、まさにそうですよw 私はコンピュータ将棋はAIでなくHPCだと思ってるんですが。
投稿: A級 | 2012年2月 2日 (木) 21時46分
一般的な意味での学習、伊藤さんの考える学習、将棋指しが使う学習。
これらが入り混じってる気がしますね、将棋指しの使う言葉は一般の言葉に似てても意味が違うということが多いので誤解を招きやすい。
ソフトにとって弱点となった特定の手に対して
次局ちゃんと対応ができたなら、学習したなと言った具合で使われますね。それをソフト自身が解決したのか、作者が修正したのかは関係なくそう使ったりします。
投稿: | 2012年2月 4日 (土) 11時41分
クローズアップ現代を視聴しましたが、その内容は相当酷かったと思います。もっとボンクラーズのアルゴリズムの概要をまともに解説してほしかったと思います。あれじゃ大学・研究機関の予算取りの宣伝ですよ。
投稿: radish | 2012年2月 8日 (水) 20時15分
「多変数関数の最適化」が実装だよ。というのは激しく技術よりの説明ですよね……
将棋指し専門の人達にはやっぱりチンプンカンプンになってまうかも
大きく言って強いAIと弱いAIの説明から始めないといけないのかなぁって感じでしょうか
投稿: take-w1 | 2012年2月 8日 (水) 20時54分
学者間でどんなわかりにくい用語をつかうのは勝手だと思いますが一般人向け解説なのに学習という言葉をつかうのはよくないです。将棋に限っては一般人が誤解しないような名前に変更統一されるのを希望します。
投稿: | 2012年2月10日 (金) 01時12分
線形探索による全探索から2分探索になった。
その2分探索の中央値取りが方程式で取られるようになった。
結果的に2分探索の回数が減少した。
ただ、精度についてはまだ満足していない。
羽生は通過店であり、目標は先手必勝かどうかの確認。
ここまでOK?
投稿: 星野なな子(これに1票) | 2012年2月10日 (金) 13時45分
ご指摘、同感です。
クローズアップ現代は、間違った情報を発信している情けない番組です。
分からなければ、分かるまで勉強しなければなりません。
それは、マスコミの義務です。それができなければ、放送してはいけません。
投稿: マスコミ | 2012年2月11日 (土) 20時11分
アルゴリズムは変わらない(学習していない)が、評価関数あるいは評価関数の変数の評価が変わっていく(学習≒最適化していく)、ということでしょうか。
全く同一局面で最適化によって異なる答えが出されるようになったら、対戦相手から見たら「学習」しているように見えるように思います。乱数とかを使って異なる答えを出しているなら別ですが。
興味深いです。
投稿: | 2012年2月12日 (日) 12時55分
機械学習をかじっているものですが,機械学習の多くの手法は最適化問題に帰着させて解いていますので,「学習ではなく最適化だ」という表現こそ逆に誤解を招くものだと思います.
むしろ,一般の方が持つ「対戦中に学習しているのではないか」という誤解を解くには,わざわざ最適化を持ちださなくても,単純に「対戦に投入されているのは,事前に,大量の棋譜から学習済み(訓練済み)のプログラムであり,対戦中は学習せず,事前に学習した内容のみを用いる.」と一言説明すれば良いだけなのではないでしょうか.
その理由としては,「対戦中にも学習すると,むしろせっかく覚えさせた技がブレてしまい失敗することが殆どなので,通常は,対戦中は学習しないように設定されている」という表現が適切だと思います.対戦中も学習させることが技術的に不可能なわけではなく,あくまで,無駄だからやらないだけですから.
もうちょっと砕けた表現で言うなら,「対戦は期末試験みたいなもので,期末試験中に勉強(学習)しても遅いだろ,だから事前に学習させておくんだ」といったところでしょうか…
投稿: niam | 2012年2月12日 (日) 19時03分
>2012年2月11日 (土) 20時11分
実利に基づいて放送していいのは民放だけです。
NHKは国民の受信料で放送してます。
ここが重要です。
見なければ良い。は許されないのです。
民放ならかまいません。
でも私の受信料で間違った意見に世論を誘導するのは腹が立ちます。
投稿: このほうがよくね? | 2012年2月15日 (水) 17時22分
niamさんの御意見は人工知能や機械学習の専門家の勝手な(社会の常識や語用に反した)意見だと思います。
>機械学習の多くの手法は最適化問題に帰着させて解いていますので,「学習ではなく最適化だ」という表現こそ逆に誤解を招くものだと思います.
いや、だからこそ、本当は「機械学習」ではなくて「最適化」と呼ぶべきなのですよ。
ブログ主が最後の段落で「専門家がボナメソの類を「機械学習」と呼ぶ事の良し悪しはともかく」と書かれているのは、本来は専門用語としても望ましくないと思うが専門家の間だけで使用が限定されているならば敢えて批判しないでおく、という意味でしょう。
一般社会でもコンピュータサイエンスや数理科学・工学でも最適化という言葉は広く用いられ、比較的安定し、また素朴な直感とはそれほど食い違わない意味で使われています。(まあ、コンパイラ技術者の1人として自戒・自虐を込めて言わせてもらうと、コンパイラの「コード最適化」なんてのはせいぜい「コード改良」とでも呼ぶべき代物なのですが)
ならば、機械学習という当初の大雑把な目的が最適化へと帰着された時点で、最適化問題の一分野と呼ぶのが適切なのですよ。
一般人で少しでも将棋(か類似ゲームの囲碁やチェスなど)を知っているにとって「学習」という言葉で思い浮かべるのは、定跡とその膨大な変化を覚える事です。これこそ正に将棋での学習の典型です。
あるいは、Zのパターンや寄せのパターンを覚えるのも将棋における典型的な学習でしょう。
ですから、将棋ソフトの序盤データベースを充実させるのは一般的な意味での「学習」と呼ぶ事に違和感はありません。
しかし、ボナメソでのパラメタの調整はそういうのとは全く違います。これを「学習」と呼ぶと、少なくとも機械学習や人工知能の中身に多少なりとも明るい人間以外は(例えばソフトウェア技術者であっても)確実に間違ったイメージを抱いてしまいます。
機械学習の方々も、いくら仲間内の語法とは言え、世間の常識から外れた「学習」という言葉の使用は控えたら如何ですか?
まして、その社会的には非常識な自分達の語法を社会に押し付けようとするのは単なる世間知らずの傲慢であり部外者にとっては迷惑なだけです。
投稿: ぷにぷに | 2012年2月23日 (木) 10時48分
ソフトウェア技術者ですが、機械学習や人工知能の中身にはあんまり明るくないです。
ここまでの説明とコメント読みましたが、すみません、いまいちよく理解できていません。
ボナメソが、A級さんの言うように"ニュートン法や割り算の筆算法と同じく、「方程式を数値的に求めるための解法の一種」である" というのであれば、それはたしかに「最適化」ではありますが、一般的な意味での「学習」とは呼べないと思います。
ここで疑問なのは、なぜ、機械学習界隈のひとたちは、こういうのを「機械『学習』」と呼ぶのでしょうか?
素人的には、まったくもって学習でもなんでもないように思えますが、なぜ「学習」という言葉が使われているのでしょうか?
この理由が想像つかない、というのが、私が感じた大きな違和感、というか、理解できなさの原因のように思いました。
ちなみにWikipediaで「機械学習」を調べたんですが、そこには、単なる方程式の解法とか最適化とかという説明は書いてなくて、一般的な意味での「学習」っぽいことが書かれているように思いました。
投稿: Kじゅん | 2012年3月 3日 (土) 06時49分
>Kじゅんさん
なぜなんでしょうね。私もよくわからないんですけどw
しいて言うなら、データをたくさん与えていくとそのデータに応じてパラメタが自動的に調整される、というあたりが「学習」というイメージに少し近いでしょうかね。バスケットのシュートの練習してて、最初下手なのがだんだん入るようになってくる、みたいな。
ただ一般の人に学習というと「新しい概念を自分で覚える」みたいにとられるので、それとは違いますね。既にフレームワークは決まっていて、その中でのパラメタ調整、しかしません。
なぜ専門家が「学習」と言うか?まあすごそうな単語使っとく方が、勝手に誤解して凄いと思ってくれる人もいるし、そうすると研究テーマとして認められやすいし予算もつきやすいし、とか思う人たちがいるのかも(<完璧な邪推)
ちなみに機械学習全般とボナメソは違うかもしれません。私はもともと機械学習全般に詳しいわけではなく、ボナメソだけ必要に迫られてあわてて勉強したくちです。
投稿: A級 | 2012年3月 3日 (土) 19時55分
A級さん、回答ありがとうございます。
先日はどーもでした。
パラメタが動的に(対戦中に)変わるのなら、「学習」と言われたら「まあそうかも」っていう気がしてきました。
パラメタもアルゴリズムも、システムのステートを変えるという意味では、あんまり区別する必要はないのかもしれません。
まあ、脳内は、「プログラム領域」と「データ領域」にわかれているわけじゃないですからね。LISPのS式だってそうだし。
極論すれば、すべてのシステムは、ステートを変えながら動くので、完全ステートレスなサービスみたいなものを除けば「学習」してると言えるのかも(若干言い過ぎですかね)。
投稿: Kじゅん | 2012年3月 4日 (日) 08時00分
そうだろうなーとは思ったけど、やっぱりあのKじゅんさんですね。
「対戦中に」変わる、ではないのですよ。棋譜を大量に食わせるバッチ処理(?)の中ではひとつ棋譜読むごとに変わりますが。なので結局学習っぽくない…
投稿: A級 | 2012年3月 4日 (日) 18時49分
あーそうなのですね。
じゃああれですね、対戦は「テスト」みたいなもので、テストでいい点とるために、テストの合間で「学習」するイメージですね。バッチで学習って、なんか一夜漬けで学習するみたいな感じ(笑)。
まあ、(広義の)学習ってことで、いいんじゃないですかね~。
と、思いました。
あくまでも、素人の意見でございます。
投稿: Kじゅん | 2012年3月 4日 (日) 20時45分
よく見たら niam さんが同じこと書いてましたね。失礼しました。
投稿: Kじゅん | 2012年3月 4日 (日) 20時48分
これから 10年後のプロ棋士の生きる道 将棋界は F1レースみたいになるのでは。 電王戦で コンピュータ側が 最終的に勝利した?後の話だが F1レースのマシンにあたるのが ボンクラーズなどのコンピュータ将棋を改造したもの(指し手を助言できる マシン)。マシンの乗り手がプロのドライバ(プロ棋士)。 局面が詰将棋に入る寸前に 高度の判断をして勝の方向にハンドルをきれる 技量をもった 人 それがプロ棋士。マシンの開発者は将棋プログラマの集団、ドライバは、日本将棋連盟のプロ棋士 ここに日本将棋連盟の存在価値がなければ 寂しい(;一_一) それこそ人は道具を使うのではなく 道具に使われる存在になってしまうw 人類とコンピュータは共存共栄 日本将棋連盟と情報処理学会も共存 共栄 米長会長の ハンドルさばきで うまくいっているようなので(^u^) アマチュアではこのマシンを乗りこなせない。プロでなければ ここにプロ棋士の存在価値を見出したい。こういう時代になるとコンピュータ将棋のソースコードは 秘密になってしまうのだろうか? 今はオープンになっているが。
投稿: 信永算砂 | 2012年3月16日 (金) 10時05分
囲碁ソフトは13?路盤で 全然プロの方が強いみたい
人間が局面の範囲等を指定して ここら辺をサポートしてくれる ソフトがあれば 局部的な 死活、寄せ、攻め合い、定石は コンピュータが旨いだろうし
どのくらいの技量があれば プロと勝負できるか?
コンピュータだけで プロと勝負できるソフトをつくる前段階として 、こういうソフトを開発した方がよいと思うが ご意見 お聞かせください。
自分もコンピュータと碁を打ったことはないが 聖目置かしても負けないと思っているのですが、、、
今年の 東日本大学囲碁OB・OG戦の開会式で 挨拶した人が 強い囲碁ソフトがあると紹介したので
関心をもって調べてみたいとおもっています。
投稿: 信永算砂 | 2012年3月17日 (土) 17時44分
大学時代の仲間達に ボンクラーズ攻略本を書いてみたら、また自分も書いて見たいとメールしたら 次の
返事がきました。
信長算砂さま
皆さま
やはり、この種の話に反応するのは私でしょうね。
かって、私もコンピュータで将棋ソフトにとり組んだことがあります。容量をいかに少なくするか、速度をいかに上げるかが課題でしたが、当時の高性能の パソコンでも無理なので GIVE UPしました。
五目並べの正式競技15*15盤の連珠ならば可能と信じて定年退職したら取りかかろうと思っていましたが
70を超えた今も会社勤めでまだ実現していません。
契約延長を3回して、今年の9末月まで働きますが、
9月は年度途中なので、ボケたり健康を損なわない限り、また延びるのではないかと思います。
さて、本題のボンクラ攻略法ですが、不可能と思います。
序中盤で圧倒的に有利にならないと勝てません。
ボンクラは序中盤はコンピュータが考えると言うよりも、その豊富な記憶容量と驚異的な演算速度で
格納している過去のプロ棋士の対局をを取り出してきて指し手を選びます。
序中盤はくだらない手を含めると平均50通り位あるようで、80手指すと50の80乗と言う気の遠くなる
ような選択肢があります。これをコンピューターに考えさせると時間ばかりかかりますから、過去の棋譜を
参考にするわけです。その戦型で1万局指されていれば1万から選べばよいのです。
さて、将棋の平均手数は100~130手くらいですから、80手を過ぎる段階、すなわち、
終盤に入るとコンピューターはそれまでの過去の棋譜の真似っこでなく、真剣に考え始めます。
と同時に手数が少なくなると、すべての手をしらみつぶしにあたることも可能となります。
詰将棋はコンピューターが最も得意とするところで、9手詰めまでの詰将棋ならば1つの手に20通りあれば
相手は王様が逃げるだけですから逃げと合い駒と中合いと王手のコマをの取り方で20とおりくらいで
20の9乗=512億とおりくらいでしょう。
それでシラミつぶしが終わります。このうちのほとんどは意味の無い手が多いですから実際は極端に少ない数です。
今は、1秒間に10兆回の足し算をするコンピュータが出来ているとか(正確ではない)、500億回の計算は
数秒もかからないでしょう。
渡邊竜王はボンクラに勝ちましたが、途中、人間では絶対に思いつかないコンピュータでしか指さない手に
大長考しました。その後、コンピューターが勝つ手を竜王は気が付き負けを覚悟したそうですが、コンピューターが
違う手を指し、そこからコンピューターに勝ち目が無くなり渡邊竜王が勝ちました。
米長永世棋聖は、コンピュータの不得意な序中盤で有利になりましたが、終盤で間違えて負けました。
終盤に強いコンピュータとの対戦では典型的な負け方です。
私は、コンピューターとオセロをして途中で相手のすべての黒だったか白だったかを私の色にしたことがあります。
その後、何回しても負け続けでした。オセロも終盤はしらみつぶしに入りますから、手の多い序中盤でかたを付けないと勝ち目はなくなります。
今のボンクラに勝つとしたら、序盤で過去の棋譜で現れたことのない手を指して、コンピュータが考えなければ
ならないような局面に引きずりこむことですね。序中盤では、駒の損得や王将の守りの堅さが指し手の判断基準になると思われるので桶狭間の戦いのように誰もが考えつかないような奇襲作戦しかないでしょうね。
まあ、期待しています。
最近はボケ防止に将棋・囲碁ではなく麻雀をしていますがチョンボ-が多くなりました。
おとといは東京八重洲口の雀荘で夜の11時過ぎまで、昨夜は新橋駅ビル内雀荘で10時半まで。
麻雀は、配牌次第ですから、人間も容易にコンピューターに勝てますが多数回するとコンピューターが
トータルして勝つのでしょうか。確率計算だけでは勝てないので、対戦者の癖も考慮しないと
駄目な気がします。
それではまた。
H24/3/16
-----------------------------------
Subject: ボンクラーズに関心ある方は
Date: Fri, 16 Mar 2012 07:04:21 +0900
東日本大震災から一年経過し、寒さも多少 和らいできましたが みな様如何お過ごしですか?
私は 米長棋聖がボンクラーズ負けたというニュースに接して以来 特に ここ1週間は 碁そっちのけで
添付 ブックマーク記載のサイトを関心をもってみてきました。
NHKの放送もあったようですが
ボンクラーズというソフトが 米長 永世棋聖を
負かしました。
碁は まだ人間がつよいようですが・・・ あと
50(碁十年)もすれば人がまけるようになると
10年前に情報処理学会誌に書いた人(松原仁http://www.fun.ac.jp/staff/staff_comp/matsubarahitoshi.html)
がいました。彼はその時将棋は20年とかきましたから予測は早めに実現したわけです。
コンピュータのハード ソフト(IT技術)の進歩が最近更にすごいということでしょか?
少なくも 将棋は 何十年も苦労して手に入れた
技術がボタンひと押しで ロードされる コンピュータ将棋に負けてしまう。
くやしいと 思いませんか? プロの将棋指しという職業は成り立つのでしょうか?
まあ ここまでコンピュータ将棋がつよくなるには コンピュータのハード ソフトのものすごい進化と
ゲームのプログラムを開発してきた 人たちの技術の積み上げが あるわけですが。
ボンクラソフトの開発者の将棋の実力は初段程度とか そこがすごい??? 足の遅い人でも自動車に
のればチータにも負けないと それと同じという見方をする人もいますが・・・
ボンクラソフトは 公開されてるみたいだし、
ボンクラとは インタネット対局http://ja.wikipedia.org/wiki/%E5%B0%86%E6%A3%8B%E5%80%B6%E6%A5%BD%E9%83%A824
もできるようだし
私は ボンクラーズ攻略法本を書いて見たい・・・・
ボンクラと米長棋聖の対局をニコニコ動画http://www.nicovideo.jp/
をみたひともたくさんいるので売れそうです。
みなさんも 攻略本書いてみませんか。
関心あるかた ご感想お聞かせください。
信長算砂という名前で ツイッターもやってます。
Bookmarks
10第21回世界コンピュータ将棋選手権 - ニコニコ生放送
10第1回将棋電王戦、ボンクラーズが米長永世棋聖に勝利 詰将棋メモ
11日本将棋連盟
1コンピュータ将棋協会blog
2007-09-09 - 小宮日記
2A級リーグ指し手1号
3トップ棋士レベルまで来ているボンクラーズに米長永世棋聖の勝ち目はなし « Tsurezure Pentatonic
4NIKKEI 将棋王国
4最高R更新 3357 A級リーグ指し手1号
5人間 VS コンピューター - NHK クローズアップ現代
7チューリング・テスト - Wikipedia
7米長邦雄の家
9将棋倶楽部24 - Wikipedia
FM番組出演情報 A級リーグ指し手1号
http--aleag.cocolog-nifty.com-blog-files-vdec09posterFrame_A0final.pdf
http--minerva.cs.uec.ac.jp-~ta-ito-shoutai2.pdf
uf8e-itu@asahi-net.or.jp - Google 検索
コンピュータ将棋の知識
中国語の部屋 - Wikipedia
女流棋士の対局権利について お知らせ|お知らせ・イベント情報:日本将棋連盟
女流棋士会分裂の経緯・公式見解:日本将棋連盟女流棋士会
女流棋士分裂問題について(8)、(9):日本将棋連盟女流棋士会
女流棋士問題について 女流棋士問題について|お知らせ・イベント情報:日本将棋連盟
将棋の戦法一覧 - フレッシュアイペディア
将棋研究-将棋の囲い一覧
角換わり 同形角換わり腰掛け銀 富岡新手|将棋・序盤のStrategy ~ 矢倉 角換わり 横歩取り 相掛かり 中飛車 四間飛車 三間飛車 向かい飛車 相振り飛車 ~
飯田弘之 - Wikipedia
投稿: 信長算砂 | 2012年3月19日 (月) 05時01分
大学時代の囲碁部OBの仲間と私達の先生に下記のメールを送りました。 さあどんな返事がくるか。
XXXXX先生 他皆様 如何お過ごしですか?
2012年3月17日(土) 19時のNHKのニュースをみていたら
アナウンサーが、『将棋に引き続き、囲碁もコンピュータがプロ棋士に勝った』と
http://www.nishinippon.co.jp/nnp/item/292365
Zenという囲碁ソフトが 武宮正樹九段に4子で勝ちました。ビックリしました。
Google http://www.google.co.jp/に
“Zen 囲碁”と入力すれば解説がでてきます。
天頂 囲碁ということで市販もされているようです。
参考価格: ¥ 13,440
価格: ¥ 9,072 通常配送無料 詳細
OFF: ¥ 4,368 (33%)
武宮正樹九段に4子でかつ もう私達よりつよいかもしれない・・・
チェスのチャンピオン カスパロフhttp://ja.wikipedia.org/wiki/%E3%82%AC%E3%83%AB%E3%83%AA%E3%83%BB%E3%82%AB%E3%82%B9%E3%83%91%E3%83%AD%E3%83%95 が
IBMのDeep Blueに負けたころ
現在、はこだて未来大学(http://www.fun.ac.jp/staff/staff_comp/matsubarahitoshi.html )
松原仁教授が碁のプログラムが人間の名人に勝のは
50年後と言っていたので
私が 生きているあいだは コンピュータに負けることはないと多寡をくくっていたのですが。
発想の転換とは恐ろしいもので
巨大な棋譜データベースを活用し モンテカルロ法を援用し
10の300乗はあるという局面の評価を
ソフトが実用に耐える時間内に終了させることができるようになったようです。
コンピュータに対する人間の優位はどこに残るのだろうか
10年後 Man
コンピュータと人間の 共同作業(チェスの世界ではカスバロフが考案し実際におこなわれているようだ)の持つ能力をC+Manであらわせば
もし Zenafter10=Man+Zenafter10だとしたら Man=0となり人間の存在意義がなくなってしまう
現在 Zen
Man
Zenafter10にひざまづき教えをこわねばならない。
コンピュータは 定石などボタン押すだけで 記憶してしまう・・・・
定石等 五万と記憶している 単なる定石の記憶などは役に立たない
Zenafter10に +する人間能力とは 何なのでしょうか
これが碁に関する本当の人間力 プロの技術と思うのですが
皆様のご意見おきかせください。 もしよろしければXXXXX先生のご意見も聞かせていただければ幸いです。
モンテカルロ法 (モンテカルロほう、Monte Carlo method, MC) とはシミュレーションや数値計算を乱数を用いて行う手法の総称。
元々は、中性子が物質中を動き回る様子を探るためにジョン・フォン・ノイマンにより考案された手法。カジノで有名な国家モナコ公国 ...
マルコフ連鎖モンテカルロ法 - ブートストラップ法 - Category:モンテカルロ法
投稿: 信長算砂 | 2012年3月19日 (月) 05時37分
ニコニコ超会議の対談に出席されるそうですね、生放送拝見する予定です。
クローズアップ現代見ても機械学習とは何なのか良く分からず困っていたのですが、このブログを見て、
その後「閃け!棋士に挑むコンピュータ」という本を読んで、かなり理解することが出来た気がします。
この本はとても良い本でした。人のいじる評価関数では確かに数百程度を考えるのが限界でしょうが、
保木さんが制御工学を利用して、機械がプロ棋士の指し手を元にして万単位にもなる評価関数を制御・調整する様にした、
というのが機械学習という理解でいいのでしょうか。
クローズアップ現代では、今まで人の勘や経験に頼っていた農業の世話のパターンなども機械が学習できるようになる、
みたいな事を言っててイマイチぴんと来ませんでした。
正確には、人間の勘や経験によって導き出されるパターンの相関関係を、機械が考える・学習するという事なんでしょうね。
例えば湿度が▲▲℃・天気が○○の時はこういう世話をする、水を撒く量を変えるなどの人間の経験があった場合
温度が何度上がった時、何%水を撒く量を変えれば良いのか、機械がその間にある相関関係を関数として読み取り学習すれば
機械もまるで人間の様に世話が出来るようになる、という感じに私は理解しました。
囲碁のコンピューターソフトも、モンテカルロ法という新しい考え方が出来てとても強くなったそうですね。
ボンクラーズに興味を持ったので囲碁ソフトについても色々調べて見たのですが、詳しく分からない所もありました。
ZENの作者との対談で、機械学習やモンテカルロ法について分かりやすく話して頂けると嬉しく思います。
コンピューター将棋の大会も近いみたいですし、お忙しいとは思いますが頑張って下さい。
投稿: | 2012年4月28日 (土) 18時39分