【技術】確率を重視した「モンテカルロ法」の採用で急速に進歩、コンピューター囲碁の実力は? トップ級プログラムがプロに挑戦
1 :
依頼スレの297@おっおにぎりがほしいんだなφ ★ :
2009/12/11(金) 16:13:33 ID:??? コンピューター囲碁の実力は、確率を重視した「モンテカルロ法」の採用で近年、
急速に進歩しているといわれる。11月下旬、東京都内で開かれたコンピューター大会で、
トップクラスの2プログラムがプロに6子局で挑んだ。その腕前やいかに。
■強い「三段」、コウ苦手?
「第3回UEC杯コンピュータ囲碁大会」が11月28、29の両日、電気通信大で5カ国・地域の
31プログラムが出場して開催され、優勝した「KCC囲碁」と3位の「Zen」がプロとの
エキシビション対局に臨んだ(準優勝の「勝也」は置き碁への対応が万全でないため辞退)。
「Zen」は今年のコンピューター・オリンピアードで優勝した日本のプログラムで、
秋にそのプログラムを搭載したソフト「天頂の囲碁」が発売され、話題となっている。
青葉かおり四段との6子局が上図。右下黒18までの進行は白に隅を与えて損だったものの、
鄭銘コウ(てい・めいこう、コウは王へんに皇)九段が「その後はほとんど言うことなし」と
評価するほどの打ちぶり。左下白57に手を抜いた右上黒58は小さく見えるが、60、62と攻めた
姿勢が一貫している。最善とは言えないまでも、白63に黒64と反発して66、68で
右辺を召し捕ったのはお見事。上辺を攻めながら地をかせぐ進行も見応えがあった。
だが、「黒が厚そう(勝ちそう)な局面」(鄭九段)でヨセ勝負へ移った時、左上で後手を引いて
左下白149と抜かれたのが大きな失点になった。白165のコウ仕掛けに黒166と逃げるなど
終盤に乱れ、青葉四段の勝利に終わった。
もう1局は北朝鮮の「KCC囲碁」が鄭九段と対戦した。鄭九段は自身でもプログラムを作成する
コンピューター通。変則的な打ち方でコンピューターの腕前を試し、コウの絡む戦いで逆転勝ちした。
2局ともプロの中押し勝ち。昨年は青葉四段がフランスの「Crazy Stone」に7子局で完敗したので、
進歩を続けるコンピューターに対し、人間が踏みとどまった格好だ。どちらもコウをきっかけに
プロが勝機をつかんだ。青葉四段は「プロのような手を打ってくるし、崩れることもあまりない。
強いアマ三段くらいの実力がある」。鄭九段は「コンピューターは確実に強くなっている。
もう一度打ったら、勝てる自信はありません」と振り返った。
>>2 へつづく
ソース:asahi.com
http://www.asahi.com/igo/topics/TKY200912090274.html 6子 Zen 白 青葉かおり四段 1―181手・以下略、白中押し勝ち
153ツグ(74)、168コウ取る(82)、171同(149)、174、177各同、181ツグ(82)
http://www2.asahi.com/igo/topics/images/TKY200912090273.jpg 黒 KCC囲碁 白 Zen 1―75手・以下略、黒中押し勝ち
http://www2.asahi.com/igo/topics/images/TKY200912090271.jpg
2 :
名無しのひみつ :2009/12/11(金) 16:14:40 ID:w3Uj0pPS
オイラのアナルも中押しされそうです。
4 :
名無しのひみつ :2009/12/11(金) 16:21:03 ID:TsepEb/O
トッププロを超えるのは将棋のほうが早いか?
5 :
名無しのひみつ :2009/12/11(金) 16:21:20 ID:KO+T3jKa
囲碁のプログラムでモンテカルロ計算ってどういうことだ? 全数探索させないように使うのか?
6 :
名無しのひみつ :2009/12/11(金) 16:24:56 ID:OnL0B31N
KCCって北朝鮮の奴だろ? 変なところで先端技術もってんな。
7 :
名無しのひみつ :2009/12/11(金) 16:26:13 ID:zNHU3YT1
かっこいいよな〜。 考えすぎて脳にタコがあるってんだから。 特別にこしらえた神経の塊。
8 :
名無しのひみつ :2009/12/11(金) 16:26:46 ID:2mQPYDFd
>>5 枝刈りだと、すぐ速度面で能力が発散するんじゃね?
で、どうせ深く読めないくらいなら、モンテカルロで…w
9 :
名無しのひみつ :2009/12/11(金) 16:28:20 ID:WQw8/Em1
北朝鮮のソフト開発力は日本より優秀なのか?
10 :
名無しのひみつ :2009/12/11(金) 16:29:33 ID:OrKsCTdj
11 :
名無しのひみつ :2009/12/11(金) 16:30:46 ID:2mQPYDFd
>>9 日本では、囲碁をする世代が、まったくコンピュータに無関心なので、
ほとんどソフト開発がなされていない。
一方中華圏では、文化人層の遊びとして、一定の権威がある。
12 :
名無しのひみつ :2009/12/11(金) 16:30:52 ID:UYB7d++J
モンテカルロ法ってことは、 要は完全にPCパワーに頼った力技ってことじゃ…
13 :
名無しのひみつ :2009/12/11(金) 16:31:39 ID:Gv4xioxx
モンテカルロ法w 懐かしいw 30年前の大学での講義思い出。
14 :
名無しのひみつ :2009/12/11(金) 16:33:21 ID:oPACxJgB
>>4 将棋の方が着手可能な局面数が囲碁より少ないからね。
現在のペースでコンピューターの棋力の向上が続けば、
後10年以内でトッププロもヤバイと言われてるな。
囲碁はその意味ではまだまだらしい。
チェスなんかはもう世界のトップを凌駕してるしね。
15 :
名無しのひみつ :2009/12/11(金) 16:33:53 ID:WQw8/Em1
>>11 つまり事業仕分けなんかしてやっているから
北朝鮮にもソフト開発能力で負けるようになったってことですね
16 :
名無しのひみつ :2009/12/11(金) 16:35:14 ID:OrKsCTdj
17 :
名無しのひみつ :2009/12/11(金) 16:35:30 ID:if7CdGPv
あれなんだっけ、ロシアの男だらけのバレエ団
18 :
名無しのひみつ :2009/12/11(金) 16:36:59 ID:UYB7d++J
>>15 事業仕分けは不愉快だが、さすがにそれは関係ないw
19 :
名無しのひみつ :2009/12/11(金) 16:37:21 ID:7pGu4imJ
北朝鮮のソフト開発者は大会があっても来日できないんだよな だから将棋の方のソフト世界選手権でもそれに伴う悲劇があったな 前日の予選まで無敵だったので本国からの指示で 決勝リーグでは設定イジってみたら弱くなってしまい 次の指示が来るまで3連敗くらいしてた
20 :
名無しのひみつ :2009/12/11(金) 16:37:53 ID:2mQPYDFd
ちなみに、僅差だった女流4段と同じ手合いで、9段に対局をさせるのは、ほとんど拷問。 よっぽど馬鹿馬鹿しかったのか、いろいろ遊んでいるみたいだ。w
21 :
名無しのひみつ :2009/12/11(金) 16:39:22 ID:OrKsCTdj
>>19 将棋ソフトで飯が食えるんなら、自分も日がな一日プログラムするが…
食えないからな。それに、最先端のIT技術からは置いてけぼりになるし。
22 :
名無しのひみつ :2009/12/11(金) 16:40:17 ID:OrkNkaOB
去年青葉が負けたときは相手の実力を計るつもりで 無理手は打たず戦って負けたんだよね。 今年は頑張ったな。
23 :
名無しのひみつ :2009/12/11(金) 16:42:09 ID:OrKsCTdj
>>20 相手の出方見て「この程度ならまだまだ囲碁で飯が食えるナ」
とか考えるんだろうか?w
24 :
名無しのひみつ :2009/12/11(金) 16:42:50 ID:lQQ0l8I4
ソフトが進化したのは事実だけどハード(CPU)の進化も大きく貢献しているんじゃないの? あと、GPUを使うメリットはないの?
25 :
名無しのひみつ :2009/12/11(金) 16:46:16 ID:Bruloi6G
銀星囲碁って対北制裁があるのに何で発売できてるのかな? あのソフトだけで数億売り上げてそう。
26 :
名無しのひみつ :2009/12/11(金) 16:46:19 ID:HLPXjfBp
モンテカルロ法とラスベガス法は何が違うのか?
27 :
名無しのひみつ :2009/12/11(金) 16:48:38 ID:WQw8/Em1
拉致してきた人に開発させてるのかな?
28 :
名無しのひみつ :2009/12/11(金) 16:49:10 ID:LD2YKNhd
囲碁のモンテカルロ探索って ある盤面でそれ以降の手をすべてランダムに打ってどちらかが勝つかで 有利不利を評価する方法だっけ?
29 :
名無しのひみつ :2009/12/11(金) 16:56:44 ID:9TwFTSgn
囲碁のことも コンピュータプログラムのことも よくわからんが おそ松くんが関係あるとゆーことはわかった。
30 :
名無しのひみつ :2009/12/11(金) 17:00:11 ID:U2s5IOUo
2年くらいまえの基本情報でこの単語がでて 当時誰もしらなかったためモンテカルロ祭りになったことは覚えてる。
31 :
名無しのひみつ :2009/12/11(金) 17:07:51 ID:KO+T3jKa
KCC でyou is fool を思い出した
32 :
名無しのひみつ :2009/12/11(金) 17:12:41 ID:vgpApRqT
悔しいが,ぼくの棋力を抜かれたようだ。
33 :
名無しのひみつ :2009/12/11(金) 17:15:04 ID:OrkNkaOB
銀星10は定石データデースとモンテのハイブリッドエンジンなんだな。 マジになってるな。
34 :
名無しのひみつ :2009/12/11(金) 17:17:51 ID:2mQPYDFd
モンテカルロだと、序盤・中盤の手順の妙を読み落とす可能性があるから、 この路線では、中堅プロ以上に追いつくことは不可能では?
35 :
名無しのひみつ :2009/12/11(金) 17:25:45 ID:E1ihzd31
北朝鮮制裁に関してはどういう措置をとったのかな? 将棋のほうは参加できなくなったけど
36 :
名無しのひみつ :2009/12/11(金) 17:26:01 ID:BnQu/v02
ウッカリ負けると初めて機械に負けたTOPプロとして情報工学の歴史に残っちゃうから大変だな チェスのカスパロフさんみたいに
37 :
名無しのひみつ :2009/12/11(金) 17:28:16 ID:4nBAnyew
たまたま昨日コンピュータ板のそのへんのスレ見てたよ
38 :
名無しのひみつ :2009/12/11(金) 17:39:06 ID:OrkNkaOB
>>35 旧大会では制裁のため参加できなくなったんじゃなかったかな。
以下はUEC杯の参加要件だけど代理人を立てたんじゃないかと。
--
ただし、何らかの理由で参加者がこられない場合には、 UEC 杯実行委員会は代理人を送ることを許可する場合がある。
39 :
名無しのひみつ :2009/12/11(金) 17:39:49 ID:OllwYZOM
え、モンテカルロ法って・・ 以前はどうやっていたんだ?乱数に頼らず、ある程度パターン決めてたのかな。。
40 :
名無しのひみつ :2009/12/11(金) 17:40:00 ID:i3FmzLIZ
>>1 このままじゃ、日本は北に負けるな。
マジで移住考えよ
41 :
名無しのひみつ :2009/12/11(金) 17:43:02 ID:1h0HBxeg
>>17 トロカデロ・デ・モンテカルロバレエ団だろ。
42 :
名無しのひみつ :2009/12/11(金) 17:43:19 ID:f7QMgwNL
これこそ分散コンピューティングの方が強そうな分野だなw
43 :
名無しのひみつ :2009/12/11(金) 17:44:06 ID:Ex59sLiL
モンテカルロ法って… 次の手はサイコロ振って決めてます。 って感じに思えてしまう。
44 :
41 :2009/12/11(金) 17:44:38 ID:1h0HBxeg
>>17 ついでに言うとロシアじゃなくてアメリカのバレエ団らしい。
45 :
名無しのひみつ :2009/12/11(金) 17:46:44 ID:1GSiSY0a
モンテカルロ法って 要は力技だからなw
46 :
名無しのひみつ :2009/12/11(金) 17:48:28 ID:1GSiSY0a
あ、力技を否定している訳ではないぞ アセンブラ最高!
47 :
名無しのひみつ :2009/12/11(金) 18:03:20 ID:DomKExHs
モンテカルロか。末恐ろしいな。 ムーアの法則で強くなっていくぞ
48 :
名無しのひみつ :2009/12/11(金) 18:05:55 ID:Bruloi6G
>>35 >>38 それよりも、KCC囲碁をつかってる銀星囲碁やマグノリアの囲碁ソフトが発売を続けてるのが謎。
これって経済制裁をひそかにすり抜けてないか。
あうー。
>>2 の分を貼るのを忘れていました(;´Д⊂)
遅くなりましたが、
>>1 のつづきです!
■人間らしく、美しい棋風も
局面の広い囲碁は、石(駒)自体に将棋のような役割の差がなく、石の強弱も刻々と変化する。
プログラマーたちは、局面の評価に苦慮してきた。状況が一変したのは2006年。
モンテカルロ法を使ったプログラム「Crazy Stone」が一躍、脚光を浴びることになる。
モンテカルロ法は、石の配置や強弱などから局面の評価をする代わりに、ランダムに
膨大な数の終局図をつくらせて勝ちやすい(勝率の高い)次の手を選んでいく。
これにより棋力が飛躍的に向上した。今大会でも、決勝トーナメント出場の16プログラム中、
モンテカルロ法をまったく使っていないのは準優勝の「勝也」だけだった。
ただ、棋風はプログラムごとに様々だ。そのなかで「KCC囲碁」と「Zen」は今回、
「人間らしい碁」を打ったという。両プログラムが対戦した本大会準決勝(下図)は、
空中に浮かべた黒9や、左上黒41に手を抜いて右下白42にカカる発想は独特だが、
全局的に美しい棋譜となった。「双方とも石の流れがよく、目立った悪手もない」と鄭九段も
感心していた。
(ソースここまで)
50 :
名無しのひみつ :2009/12/11(金) 18:30:28 ID:xnDmZPI7
ルーマニアモンテカルロ あれ?
51 :
名無しのひみつ :2009/12/11(金) 18:55:56 ID:zTKkGl5O
モンテカルロ法といったら円周率
52 :
名無しのひみつ :2009/12/11(金) 18:59:00 ID:YzMQQUmp
>>51 昔、マイコンで計算したことがあったよ。
乱数の発生の選び方だけで、答えが違って来るんだよな。
ちなみに、内蔵の乱数だと、倍精度の計算で・・単精度くらいまでは出るよ。
ついでに、原子力の世界でも・・モンテカルロ法が使われているらしい。
53 :
名無しのひみつ :2009/12/11(金) 19:26:40 ID:WS1ZvJQP
自分の大学だと言うのにいつの間にこんなことやってたんだ!全く知らなかったぞ!
54 :
名無しのひみつ :2009/12/11(金) 19:51:52 ID:I+zE6K1B
モンテカルロ法=ばくち打ち
乱数で適当に打ってみてよさげなのを選んだりしてるってことか?
枝刈るよりある意味で効率良いのか...分岐が多いからなぁ
>>45 別に力技じゃない気が...
55 :
名無しのひみつ :2009/12/11(金) 19:53:08 ID:PIbvvxLL
抜けない絶対に抜けない
56 :
名無しのひみつ :2009/12/11(金) 19:59:37 ID:/WHepqph
π思い出した。
57 :
名無しのひみつ :2009/12/11(金) 20:11:40 ID:EPp8qkC2
小学生のとき自由研究でモンテカルロ法で円周率導いたら教師に理解されなかったな。
58 :
名無しのひみつ :2009/12/11(金) 20:13:04 ID:I06suXJt
>21 将棋ソフトで飯食ってる大学教授が居るぞ
59 :
名無しのひみつ :2009/12/11(金) 20:56:49 ID:RgEmxIvl
モンテカルロって囲碁とは相性良さそうだな。 良い手を探すんじゃなくて、最悪の結果へと結びつく悪手を避けるのが狙いだし。 目隠しして歩いた結果を計算して、一番ダメージの少ない方向へ進むようなもんか?
60 :
名無しのひみつ :2009/12/11(金) 21:02:57 ID:ZN5tsdYW
61 :
名無しのひみつ :2009/12/11(金) 21:25:30 ID:IQvY9v1H
マルコフ連鎖モンテカルロとかじゃなくて?
62 :
名無しのひみつ :2009/12/11(金) 21:29:08 ID:cG6LCUCx
モンテカルロっつーかUTCでしょ。 普通のランダム着手より遥かに高速に「確からしい」 手の検証が行われるから、ばくち打ちより全然賢いぞ。 俺なんてパチンコでも17/kしか回らない台に4千円投資しても 諦め切れないからな。その点、UTCさんは見込みの無い台には 500円しか使わないでいい台を探すから偉い。
63 :
名無しのひみつ :2009/12/11(金) 21:30:55 ID:/Rp8sg1J
スカイネットになります。
64 :
名無しのひみつ :2009/12/11(金) 21:44:15 ID:68ZOiIGY
要するに乱数。
65 :
名無しのひみつ :2009/12/11(金) 21:58:40 ID:6XKvlf7o
完敗モンテカルロ? 古〜
66 :
名無しのひみつ :2009/12/11(金) 22:04:30 ID:KWmpcNvF
円周率以外の使い方がwww
67 :
名無しのひみつ :2009/12/11(金) 22:05:16 ID:UBfI9FKW
>>57 そうゆう時は、みんなで校舎に向かって石をランダムに投げつけて
ガラスを割った石の数と壁に当たった石の数の比率で壁面に対する
窓の面積を計算できることを教師に教えてあげるべきだろ
68 :
名無しのひみつ :2009/12/11(金) 22:09:26 ID:YzMQQUmp
>>66 解析的に解けない場合には、結構使われる手法だったりする。
数値演算が大流行の時代、非線形方程式の解を求めるプログラムを見ると・
結構入っていたよ。
今も流体関係の方程式を解く場合、一般解を求めるのが不可能な場合に良く使われる。
じゃないと・・降雨予報やら、ナビエストークス解の数値計算は難しいはず。
69 :
名無しのひみつ :2009/12/11(金) 22:13:12 ID:KWmpcNvF
>>68 普通差分でそ
降雨予報は知らんけど、熱流動解析のナビエストークスは
商用ソフトでも差分で解いてる
収束解に早くたどり着きたいときはパラメーターで加速
70 :
名無しのひみつ :2009/12/11(金) 22:13:55 ID:4Wj800y9
>>67 子供がランダムであると証明できなきゃ屁のつっぱりにもならん
71 :
名無しのひみつ :2009/12/11(金) 22:18:28 ID:4Wj800y9
>>69 差分だと間違った解にたどり着く場合があるからある程度モンテカルロで解付近の目星をつけておく必要がある
72 :
名無しのひみつ :2009/12/11(金) 22:28:49 ID:lcVyFa7J
よかったよかった。雪辱をはたした青葉タンの胸も大きく膨らんだことだろう。
73 :
名無しのひみつ :2009/12/11(金) 23:36:05 ID:V3veQcwz
去年たまたまこの大会を眺めてたんだ (学内あるいてたら立て看板があったので何となく) 囲碁のルールを全然知らないのであれだが プロによる解説と参加者持ち込みPCがすごかった記憶が …すまん。それくらいしか書けないおいらは素人だ。 個人的には,囲碁の対戦を遠隔でやり取りするための 標準プロトコルもあるのだと知ってスゲェと思った。
74 :
名無しのひみつ :2009/12/12(土) 01:55:37 ID:kQ0xbMou
6子置いても勝てるプロの方もすごいと思った。 トッププロだったらもう1子置いても勝てるだろうね。
75 :
天使m :2009/12/12(土) 02:50:53 ID:pgKc6RV6
76 :
ぴょん♂ :2009/12/12(土) 03:24:13 ID:hZ2J3Z/X BE:729044674-2BP(1028)
いまどき、金融工学でも 使われてるとか?
77 :
名無しのひみつ :2009/12/12(土) 12:37:41 ID:WUICSo/k
モンテカルロ法のスレが、最古参スレ荒らしによって滅ぼされたのは、悔しい思い出。
78 :
名無しのひみつ :2009/12/12(土) 12:42:02 ID:DwfRCN4D
>>76 そういえば、マレー・ゲルマンなんかが居る、サンタフェ研究所辺りが研究していたような。
そんな話は聴いたことがある。
モーゲージローンの破綻のときだったか、そのモデルで計算していた連中が居るらしい。
79 :
名無しのひみつ :2009/12/12(土) 12:50:01 ID:WUICSo/k
>>75 10万でも小数点二桁までか。3.14159265ぐらいまでだと、何個必要?
80 :
名無しのひみつ :2009/12/12(土) 13:01:01 ID:iTJULIVi
囲碁では囲えば自分の陣地というルールになっているが、その「囲う」の定義が未だによくわからん。 碁石で区切られた範囲の内、面積の小さい方が囲われた方、という定義で良いのか?と何人からの 囲碁に詳しいという人間に聞いたことがあるが、誰も明解な答えは言えなかった。 先生と言われる人と対局した時、直線状に碁石を並べていって2つの領域に別けて、 面積の小さい方がこちらの陣地ということで良いですね?と聞いたら、相手が突然狂ったように盤面の 碁石を手で払いのけ出したくらいだから、よっぽどこれは踏み込んではいけないタブーなんだろうな、くらいには 理解したが。
81 :
名無しのひみつ :2009/12/12(土) 13:03:04 ID:N8RjJlrV
学習しないモンテカルロ法なんて最弱そのもの。 学習していない領域では行動をサイコロで決めるようなもので、 学習してない手順にはまったく論理が無い。 勝利判定アルゴリズムが一定なら行動を人が読み、数手先に依存する判定 アルゴリズムがあれば、それに誘導すらできる。 コンピュータは明らかに何かを誘導するための怪しい行動を怪しいとは 思考できないってこと。つまり概念や観念を扱えない時点で学習に依存する 行動は単純化した行動しか選ばない。具体的にはモンテカルロを使っても わざと不利な一手を打ち出すなんてコンピュータにはできないってこと。 学習に依存した領域では最強でも学習していない領域は最弱になる って話さ。 勝利者は勝利に非常に拘る。なぜなら途中の勝ち=優勢になんの意味もないから 最後に勝つことに拘る。アルゴリズムの判断構造が単純であるほど行動は 予測できてしまう。最強の一手を打つやつは最強意外選択しない。これは予知 する以前に分かりきっている。最終的に勝つ最強と、途中の最強では計りが違う つまり途中の優勢を選ぶことが、間抜けの最強の一手ってことさwwww
82 :
名無しのひみつ :2009/12/12(土) 13:06:07 ID:3ofbjPbN
円の面積みたいな2次元程度の計算ではモンテカルロは効率悪い。 メッシュ切った計算なんてやってられないような多次元とかで真価を発揮する
83 :
名無しのひみつ :2009/12/12(土) 13:12:51 ID:iTJULIVi
ちなみに境界線となる淵に碁石を並べてそれを領域線とすれば、理屈の上では最少の碁石で 盤面の全てを自分の陣地とすることができるが、それに対して、それはこうだから陣地とはならないんだよ、 と論理的に正しい説明をしてくれる有段者は一人もいなかった
84 :
名無しのひみつ :2009/12/12(土) 13:22:15 ID:DwfRCN4D
>>81 確か、「Deep Blue」だったか・・チェスの計算機でも同じようなモデルで計算していたと聞いたことがある。
初期盤面はモンテカルロ法で計算し、その後中盤は学習アルゴリズムで相手の手から、次の手を再計算する。
最終盤面は、定石と呼ばれる方法で詰めていく、システムだったはず。
多分、将棋で同じようなことをするとなると。まったく反対のシステムになるのかもしれない。
将棋の場合には、序盤は定石で計算し駒を動かし、中盤は学習アルゴリズムで相手の手から、次の手を再計算する。
そして、最終盤面はモンテカルロ法で計算すると・・将棋の名人戦と同じような勝負が見られるのかも知れない。
85 :
62 :2009/12/12(土) 13:37:29 ID:toWHb9U1
>>84 将棋は合法手の生成にかかる計算量が多いから、
モンテカルロ系の手法は向いてないといわれている。
・序盤定石。
・中盤は学習による盤面評価関数を用いたα-β
・終盤は詰み探索
これがオーソドックスなやり方。
終盤の詰み探索は既に人間のプロ棋士を超えてると
言われている。問題は中盤の盤面評価関数の精度が十分ではないこと。
>>81 自分が何を言っているか理解できていないなら書き込まないほうがいい。
86 :
名無しのひみつ :2009/12/12(土) 13:40:07 ID:N8RjJlrV
>>84 その中盤の学習アルゴリズムを使う状況では学習アルゴリズムとは違う
行動はできないでしょう。
つまり学習アルゴリズムで学習できていない状況では学習データが無いの
と等価って話だと気がつかない?
途中の優勢を勝ちとするか、かなり先の勝ちを見込んだ一見不利な
手を勝ちとするか、人は観念を扱えるから目の前の合理性を否定して
その先に続く有利な状況を選べる。
これは観念の学習ができないかぎり無理って話になる。
観念の学習ができるなら、人と同じような思考ができることになる。
世界的な大発明ってことになるとおもわれ。
勝利者が拘るのは、目の前の勝利ではない、最終的な勝利ってこと。
故に目の前の勝利を犠牲にするトラップを当然考える。
猿が食らいつきそうなバナナを紐で吊るし。まつ。罠という観念を
学習&理解できてない猿には避けることは不可能ってこと。
これをできるかできないか、コンピュータ学習でできる例があるなら
教えてくれ。
87 :
名無しのひみつ :2009/12/12(土) 13:44:01 ID:N8RjJlrV
>自分が何を言っているか理解できていないなら書き込まないほうがいい。 貴方が何も捉えていないってことがよくわかる。 残念です。故にAIが勝てない。 いま勝っているのは単に読み切りが出来ている範囲てことに気がつかないって(ry 計算不能の領域での勝負の基本すら知らないようだ。貴方が想像できるのは 計算可能なもの、つまり全数計算で勝つ、はじめの1歩で勝敗が決まるという 妄想にしがみついているだけ。反感を持つのはその理由があるから。
88 :
名無しのひみつ :2009/12/12(土) 13:44:38 ID:iTJULIVi
評価関数に精度を求めるとかナンセンスですね そもそも解を現在のリソースでは得られないからこその「評価」関数なので 得られた解の精度自体求めようが無い
89 :
名無しのひみつ :2009/12/12(土) 13:48:49 ID:DwfRCN4D
>>86 分かっているよ。
学習アルゴリズムとして知られているのは、統計学習法と呼ばれているものだね。
哲学者のドレフィスらが、第5世代コンピュータ批判に用いられた方法だったりする。
特に、人間の凄いところは暗黙知の中にあって、形式化できないところに存在する。
そのため、1980年後半に人工知能研究は停まった。
形式知化されたものは、エキスパートシステムとして存在し、
例えば、iコンジェルジェ(ドコモのサービス)や音声認識などに活用されるようになった。
一応、参照しているのは・・「認知科学通論」という古い書籍であり、
その後の発展は知らないけどね。
90 :
名無しのひみつ :2009/12/12(土) 15:44:28 ID:toWHb9U1
>>87 文学や哲学の世界の論理で将棋の勝ち負けを論じたいなら
最初からコンピューター将棋に話を絡めないほうがいい。
91 :
名無しのひみつ :2009/12/12(土) 15:52:59 ID:toWHb9U1
>>88 完全情報ゲームなのだから「真の評価関数」というものは存在する(定理)
真の評価関数と(何らかの方法によって得た)静的な局面評価に基づく
仮の評価関数の値の一致度を便宜的に「精度」と読んでいる。
真の評価関数が未知な以上、正確な「精度」の計算は不可能だが、
棋譜中の勝ち手側の局面の評価値を1、負け手側を-1とするなどで
擬似的に計算する、ぐらいのことはできる。
実際にこの方法で計算する仮の評価関数の「精度」と、それを
用いたプログラムの勝率に有意な相関があれば、評価関数の
良し悪しを測る基準としては十分だろう。
92 :
名無しのひみつ :2009/12/12(土) 15:57:38 ID:toWHb9U1
>>86 あんたの直観的な指摘自体は別に間違っていないが、
ゲーム探索のアルゴリズムについて理解していないから、
問題点の指摘として成立していない。
一応、現状のアルゴリズムでも計算能力が十分高いか、
ゲームの持つ全状態数が十分少なければ
>かなり先の勝ちを見込んだ一見不利な手を
を打つことも可能。
93 :
名無しのひみつ :2009/12/12(土) 16:01:36 ID:toWHb9U1
鬱で卒論が書けない。死ぬ。
94 :
名無しのひみつ :2009/12/12(土) 16:02:59 ID:bEx4gYRJ
え? 技術で日本は北朝鮮に負けてるの?
95 :
名無しのひみつ :2009/12/12(土) 16:25:05 ID:toWHb9U1
>>89 現状のアルゴリズムの問題点の多くはその
「統計的学習」の持つ本質的な弱みに由来する。
統計的学習というのは大雑把に言えばパラメーター推定による
関数近似であり、ある局面の良し悪しを評価する評価関数の学習のために、
多くのプログラムでは『将棋24?』とかいう棋譜データを
学習データとして用いているらしいんだが、学習アルゴリズムにおいては
「学習データに殆ど表れないパラメーターの推定は行えない」という問題がある。
例えば、「歩を犠牲にして飛車を取る手」というのは多く見つかるかもしれないが、
逆に「飛車を犠牲にして歩を取る手」というのはおそらく殆ど出現しないだろう。
そのため、いくらある場面で飛車を犠牲にして歩を取ったほうが良い手
があっても、学習データの少なさからプログラムはそのような手を打ちづらい。
また、そもそもパラメーターとして設定していないような情報は学習に
利用することができない。これは2次回帰で3次曲線の正しい近似を
求めることができないようなもので、このような場合、
アルゴリズムがデータから、いくら最適なパラメーターのフィッティングを行っても
本質的な近似能力に限界があるため、真の値から大きく外れる部分が出てきてしまう。
96 :
名無しのひみつ :2009/12/12(土) 16:25:44 ID:N8RjJlrV
論文書きに韓国に帰ったら?
97 :
名無しのひみつ :2009/12/12(土) 16:27:50 ID:toWHb9U1
>>96 欝で家から一歩も出れない。
あと、ウリの祖国は日本ニダ。
98 :
名無しのひみつ :2009/12/12(土) 16:50:15 ID:x5DBjbTb
>>97 それって症状のせいで日常生活に支障をきたしているってことじゃん
ネットで近所のメンタルクリニック調べて
すぐいって薬もらってこい
99 :
名無しのひみつ :2009/12/12(土) 17:49:29 ID:is6ZauWw
ブリヂストンのモンテカルロに乗ってたぜ。
100 :
名無しのひみつ :2009/12/12(土) 20:28:47 ID:9Hs4LacJ
本当に強い将棋打ちは、常に相手に一手差で勝つ。
101 :
名無しのひみつ :2009/12/12(土) 23:13:11 ID:iTJULIVi
>>91 評価関数を元の英語で何というか知ってる?
思い込みだけで理解した気分にならない方が良いよ
確実な解が出るものなら、わざわざ評価関数とは呼ばない
モンテカルロはマルチコアとすごく相性がいいので これからどんどん精度が上がっていく
>>101 評価関数の英語表現(evaluation function)と
完全情報ゲームに真の評価関数が存在する事実には何の関係もないな。
完全探索によって得られる局面の{先手必勝/後手必勝/引き分け}の状態を
真の評価関数と表現したのが気に食わない訂正するが。
ちなみに、思い込みだけで理解してる部分ってどこ?
俺自身はゲーム情報学の研究やってるわけじゃないんで
一応これでも人工知能研なんで一通りはさらってるつもりだが。
104 :
名無しのひみつ :2009/12/13(日) 00:28:52 ID:4OaLuSqB
>>102 というか、次世代スパコンのようなLINPACK専用機の、唯一の使い道だろ。
せっかく、あれだけは良い仕分けだったというのに、、、
>>102 UTCって探索要素もあるんで、マルチプロセッシング環境で
スケーラビリティを高めるのは意外と難しいらしいよ。
かといって、単純なモンテカルロじゃいくらコア使っても
1コアUTCより精度が劣るし。
>>104 次世代スパコンのようなベクトル型(SIMD)計算に特化した
計算機はゲーム探索にはあんまりむかんはず。
基本的に浮動小数点計算とか全く使わないし。
ああいうのは、物理演算とか向きで計算物理屋さんの世界だから
むしろゲーム探索なんかより遥かに工学的に有用な用途は沢山ある。
>>106 google scholarだとゲーム情報学関係の論文で
evaluation functionのほうが多くヒットするんだが?
っつーか、あんた自分で論文調べたことあるの?
あとヒューリスティクスって人工知能の分野で特別な意味を持つから、
機械学習を用いたものに関しては積極的に使わないのが普通だぜ?
>>97 つらいね。ただこういう経験は誰でもできることじゃない。
>>97 の生涯の糧になるよ。
>>98 に同じく最後の力をふりしぼって精神科いけ。
それから年内休養しろ。
卒研なら新年入ってからの追い込みでなんとかなるよ。
>>108 恥の上塗りになるだけだから、ちゃんと意味調べてから書けよ
せっかくwikiまで教えてやったのに
evaluation functionのwikiまで教えてやった方が良いか?w
>>109 ここは基地外スレじゃないから。遠慮してください、
112 :
名無しのひみつ :2009/12/13(日) 01:25:53 ID:4OaLuSqB
>>107 >次世代スパコンのようなベクトル型(SIMD)計算に特化した
富士通参入した時点で、それはなくなった。まして、NEC撤退したし。
あんなもの、使い道はモンテカルロくらいしかない。
113 :
名無しのひみつ :2009/12/13(日) 01:33:41 ID:FBMIjk3i
wikiのHeuristic Functionのページを見たが、どう読んでも
ゲーム探索における局面評価関数についての記事じゃなかったんだが?
つーかevaluation functionのほうがまさに評価関数についての記事だし。
あんた何を言ってるんだ?
とりあえず探索終端での静的局面評価を行う関数を
heuristic functionと表現している論文をあげてみてくれや。
evaluation functionと表現している論文はいくらでも見つかるからさ。
例えば↓な。(Deep Blueの論文)
http://artvis.bc.edu/3ai/student/hsus.pdf それと、そもそもの問題として評価関数の英語訳がどうだろうと、
完全情報ゲームにおいては全ての局面が{先手必勝、後手必勝、引き分け}
の3状態しか持たない(これを真の評価関数と表現した)ってのは数学的な事実なんだが?
例えば完全探索が行われているどうぶつ将棋なんかはあんたが言う
「確実な解を持つ」静的評価関数が既に得られているぞ。
115 :
114 :2009/12/13(日) 01:52:09 ID:vVSC+4zI
116 :
名無しのひみつ :2009/12/13(日) 03:07:24 ID:l9h2MjoQ
>先生と言われる人と対局した時、直線状に碁石を並べていって2つの領域に別けて、 小学校の時、これやったよw
>>100 それを言うなら、将棋指しな。
将棋厨うぜーと思われつつも
「指す」と「打つ」の違いを指摘せずにはいられない
118 :
名無しのひみつ :2009/12/13(日) 03:33:54 ID:knA6pp8z
モンテカルロ法ってCGの言葉だと思ってた
不確定要素を採用する時点で、論理的なアルゴリズムが 限界だと悟っただけ。 確率的に当たるというのは同時に確率的に当たらないて話な。 一様分布ならランダムを使う必要はないし。
120 :
天使m :2009/12/13(日) 15:37:45 ID:VKuSXHGB
>>79 個数100倍すると精度1桁よくなるくらいかな
「乱数発生にC++のrand関数を使ったのがマズかった?」とか思って
まじめにメルセンヌツイスターへ作りなおしたけど、
>>75 と変わらんかった。
>>82 の言うとーり。
>>114 変にからんでいる奴がいるが、あんたの方が正しいから気にするな。
>>114 用語の意味を把握して正しく使っているし、
参考文献もちゃんと提示していてお疲れ様です。
本当にゲーム情報学が専門でないとしたら、
だいぶ記事を書くのに時間をかけたのでは無いでしょうか。
(ただ、UTCじゃなくてUCTだと思いますけど…)
何も知らないくせに無駄に偉そうな ID:ZLsnMs8R は114の爪の垢でも煎じて飲むべき。
そのうちあらゆる頭脳スポーツ、運動スポーツで人間が負ける日がくるよ そのときが人類の歴史の終わり、、、 だが平和の始まり、、、 マザーコンピューターにすべて任せる日が来るのだ
>>122 どもです(つω・。)
>>123 どもです。
研究室の教授がゲーム情報学のお偉いさんで
ゲーム研究をやってる先輩もいるんです。
自分も不完全情報ゲーム関連の研究テーマを選ぼうと
考えた時期があって勉強してますた。
UCTは・・・すみません。恥ですorz
>>121 レス飛ばした。すまん。
>Heuristicは終端では無く中間木探索の際の評価に用いられる手法
ん、だからそれ実現確率による探索打ち切りとかの手法のことでしょ。
探索終端における静的局面評価じゃないじゃん。
何でわざと別の話をするの?
ところで、ヒューリスティックな探索打ち切りって研究としても
マイナーだし、そんな良い結果でないって自分は聞いてるけど・・・
ひどい自演を見た 論文出されて自滅したからヤケになってるな
128 :
名無しのひみつ :2009/12/14(月) 20:32:42 ID:HCrs4RIR
129 :
名無しのひみつ :2009/12/14(月) 20:39:34 ID:HCrs4RIR
カーネルサンダース法
"evaluation function" shogi の検索結果 約 3,760 件
"heuristic function" shogi の検索結果 約 91 件
どう考えても evaluation function の方が一般的だ
ちなみに
>>121 に書かれてるのは、下の方の検索でトップに出てくる論文みたいね
131 :
名無しのひみつ :2009/12/14(月) 21:20:17 ID:svKTXowb
モンテカルロ法とラマ−ズ法では何が違うのか?
>>121 おまえが基地外なのはよくわかる。さらにシッタカってところがワラエル
wikiは、"evaluation function"よりも"heuristic function"の方が説明が詳細に書いてあるね。 evaluationの方にもわざわざheuristicを付けて呼ばれることがあるって書かれてるくらいだし。 専門の人にはheuristicで呼ばれてるみたいだよ。
まぁ私は人口知能の専門家ですから(キリッ)!)っとか書いてる時点で 相当痛い奴ってのはわかったけどな 専門家なのに、wikiにすら載っているHeuristic知らないとか笑えるw 検索すればすぐに出てくるような論文すら、私のような専門家が無いって 言ってるんだから絶対に無いんです(キリリッ!)って書いた矢先に、すぐに あるじゃんwって出されてるような、お茶目なお間抜けさんなんだから、モウ♪
135 :
名無しのひみつ :2009/12/14(月) 23:21:55 ID:5XP+uXPt
てめえ、このやろうダンカン
136 :
名無しのひみつ :2009/12/14(月) 23:50:36 ID:lDVq/Pgq
理論が明確なら評価関数が作れるし、 理論が不明確なら過去の経験値との比較にならざるを得ない。 将棋はたしか過去の棋譜を元に判断して飛躍的に強くなったはず。 囲碁でモンテカルロ法が有効なのは、過去の実績が 評価に十分なほどのパターンを備えていないからだろう。 ところで、計算機は久しぶりに大改革期にあると思うのだが、 それを見据えると本格的な並列評価の手法が問題になるはず。
137 :
名無しのひみつ :2009/12/14(月) 23:58:49 ID:5+1uOgTM
heuristicって、コンピュータゲーム界では少なくとも’70年代から使われている。 マイコン・ブームの頃のOXゲームとかw
>>133 wikiでHeuristic Functionのほう訳してみたら?
探索中に次の探索対象ノードを重み付けする関数で、
探索中の枝狩り(cut-off)に使われるもののことであって、
ゲーム探索における静的局面評価を行う関数のことじゃないって
きちんと書かれてるが?
>>134 人工知能の分野ではヒューリスティックってのは
機械学習を用いたものとの対照として使われる用語なんだよ。
この分野の人だとお前の思ってる「大雑把」って意味ではなく
「恣意的に決めた(主に理論的な裏づけがない)」というような
意味でとるから今度から気をつけて読むといいよ。
(『ヒューリスティック関数』とかは既にそれだけで意味をもっているみたいだけど)
んで、ここまでを前提に
>>121 の指摘にについて答えるが
その前に、研究室配属されてる学生として一つ指摘しておくと
"Inducing Shogi Heuristics Using Inductive Logic Programming" T.Nakano, et.al
っていう同一の論文についての記事を「とか」で繋ぐのはやめようなw
これゼミでやると引用論文を読んでないことが即バレ。
で、まず最初だが、そもそもこの論文はいわゆる
「将棋のアルゴリズム」についての論文じゃない。
"This paper reports the results of an inductive logic programming (ILP)
application to solve shogi or Japanese chess mating problems, which are puzzles using shogi rules."
とあるように、これさ、詰め将棋(shogi mating problem)の探索問題なんだよ。
んで、この論文でどういう文脈で"heuristic function"が使われているかというと、
"We focus on heuristic functions to search for solutions in this state space."
ってあるように、ゲーム木探索における静的局面評価じゃなくて、
一般の探索問題における探索対象ノードの重み付けの関数を学習によって
求めさせようとしてる問題。
どうみても「評価関数」の訳語じゃありません。ありがとうございました。
で、都合の良いことにこの論文の著者日本人でCiNiiに
日本語版があったので引用させてもらう。
http://ci.nii.ac.jp/naid/110002892247/ 「・・・ここで、ヒューリスティック関数というオペレータの優先順位をつける
関数によって無駄な展開を避けるアプローチがある。本研究ではこの
ヒューリスティック関数を帰納することが目的である。・・」(第二節)
はい、思った通りでした。
>そこからして将棋のプログラミングが全然理解できていないということがわかる
>いくらでもあるが、何故この程度のものが見つけられない?
死ぬの?
マジ、論文を提示するなら最低限アブストラクトぐらい読んでからやれ。
これそこらの国立大のゼミでも、やったら教授・院生からフルボッコにして
涙目にされるレベルだぞ。
>>136 >囲碁でモンテカルロ法が有効なのは、過去の実績が
>評価に十分なほどのパターンを備えていないからだろう。
どちらかというと囲碁は局面数が大きすぎるのと、
一局の終了までの平均手数が多すぎるために、
(将棋が110手?で囲碁がその倍ぐらいらしい)
通常の探索では殆ど読みきれないってのが理由かと。
あと、囲碁って将棋のように局地戦で勝負をが決まるというよりも
大局的に優勢な方に誘導していく要素が強いゲームなので、
勝敗の確率を計算するモンテカルロ手法によって得られた
最善手が有効になりやすいって聞いた。
ついでに、囲碁は将棋よりも遥かに合法手生成(その局面で打てる手を捜すこと)
が簡単なのでモンテカルロ手法に向いてるとも言われてる。
>>11 bonanzaは将棋を知らない人が作ったんだけどなぁ
DBベースなら棋力はあんま関係ないんじゃないかなぁ
141 :
名無しのひみつ :2009/12/15(火) 00:59:19 ID:243qA3Bc
>>131 荒れ気味だったのでつまらんこと書いてなごんでもらおうとした。
>>75 なんで4倍したらπに近似するのかわからん誰か解説してくれ
143 :
名無しのひみつ :2009/12/15(火) 01:39:54 ID:UY22cV1m
>>142 円の面積は、S=π*r^2
さて、rは半径ですから、直径に変えると・・
S=1/4*π*d
よって、単位直径の円の面積を4倍すると・・πになります。
円の面積がπr二乗だから。 正方形の一辺の長さを1とすると、内接する円の半径は0.5 従って円の面積は0.25π。 一方で正方形の面積は1。 従って石が円内に入る確率は0.25π/1=0.25π。 円内に入った石の割合≒石が円内に入る確率だから π≒円内に入った石の割合/0.25となる。
なんでもいいから勝ちゃいいんだよ
前イギリスかどっかがあっさり優勝してなかったか
>>134 おまえが専門家きどりの発言をしているだろ、
それすら気がつかないのか?アフォ?糖質?
148 :
69 :2009/12/15(火) 11:50:10 ID:i5ltkURs
お前ら気楽に書き込んでるけど、このニュースを恐ろしいと思わないのか? ターミネーターの世界が本当にこようとしてるんだぞ。 機会が人間に勝つなんてこんなに恐ろしいことあるか。
>>144 円の面積が円周率×半径の2乗になることを
初等的に説明してくれって意味じゃね?
>>148 別に。今でも機械に勝てないことなんて、いくらでもあるでしょ
フランケンシュタインコンプレックスっていうんだっけか
>>148 あほか。
囲碁・将棋の類は、手数が有限でルールが単純だから、時間が無限なら誰だって最善手を知りうるんだよ。
どんな天才だって計算速度では電卓にも遠く及ばない。そのギャップでコンピューターが有利だというだけ。
問題の定義と発見やその解決法の発見など、知的生命体のすべてが行っていることはコンピューターでは難しい。
>>151 どうでもいいが、絶対ありえない前提を持ってくる時点でお前も
>>148 と同じアフォだよ。50歩100歩w
>時間が無限なら誰だって最善手を知りうるんだよ。
脳内仮想ではなく、現実に計算させるには無限という時間リソースは
存在しえない。ゆとりもいいところだな。
153 :
名無しのひみつ :2009/12/15(火) 12:28:12 ID:RJ3fIXhM
>>80 広いほうも、あなたの地だよ。
だから、最初に一手、天元(でなくてもどこでもいい)に打って、
相手が終局に同意すれば、あなたの360目勝ち。
大抵、相手が終局に同意しないから、そこから戦いになる。
154 :
名無しのひみつ :2009/12/15(火) 12:32:19 ID:RJ3fIXhM
>>80 あ、定義を聞いているのか。
あなたの死んでない石と、辺で囲われた領域があなたの地。
ただし、中に相手の死んでない石があったら駄目。
155 :
名無しのひみつ :2009/12/15(火) 13:06:13 ID:RJ3fIXhM
>>151 計算機に一番難しいことは、
「ゲームを作って、それで遊ぶことを楽しいと感じること」だな。w
156 :
名無しのひみつ :2009/12/15(火) 13:13:36 ID:7R7hC7Sp
俺はむしろプロの対局をコンピュータがあれこれ解説するのを見てみたい コンピュータが「バカでちゅね、このプロは」とかのたまわる
>>151 >時間が無限なら誰だって最善手を知りうるんだよ。
時間が無限なら。。
計算量が無限なら。。
神が打つなら誰だって最善手を知りうるんだよ。
まさにオカルト。
つまりこの屁理屈の最善手とは1手で勝負が決まるに等しい。
ジャンケンやサイコロで先手を決めて科学的に必勝するならば、
それは1手のゲームではなく、ジャンケンやサイコロゲームと言う
べきである。1手でも1000手でも同じこと。
思考をシンプルにするために無限概念があるんだが。 無限がオカルトなら、虚数はもちろん実数もオカルト、量子物理学もオカルト、 あれもこれも全部オカルトだなw 説明を短くするための部分にしかケチをつけられないなんて、哀れな頭脳だね。単発ID君。
159 :
名無しのひみつ :2009/12/15(火) 14:04:42 ID:oUyvfog3
>無限がオカルトなら、虚数はもちろん実数もオカルト、量子物理学もオカルト、 量子力学も一部の学者からオカルト扱いされているとおもった。
そーね。 でも、量子物理学の成果はLSIの設計から始まって、最先端工学の各分野で活用されてるしね。 量子物理学を置き換える理論が提唱されない限り、オカルト呼ばわりすることは不可能だしね。
盤上の石をニューロンに見立ててニューラルネットワークの応用としてアプローチはできないの?
>>160 トンネル効果を利用する半導体はオカルトだ!っていう人を見てみたい希ガスw
>>161 囲碁に適した実装ができるかは判らないけど、バックギャモンはニューラルネットワーク
使った局面評価導入で劇的に強くなった。
踊ってモンテカルロ 熱いタンゴで夜通し 割れてしまえ 地球なんか 恋は狂詩曲(ラプソディ)
>>161 アプローチは全然違うが、それは今俺らが使ってるじゃないか
インターネット
これの素晴らしい所はローカルで問題が解決するって事だな(全体を統括する必要がない)
1枚絵のキャラがいつも全然違うなww
167 :
名無しのひみつ :2009/12/15(火) 19:38:21 ID:243qA3Bc
モンテカルロってモナコと関係あるの?
あるよ
heuristicって言葉を知らない子が逆ギレしてますね 昔から現在に至るまで将棋のプログラムで使われてる有名な手法なのに、 それすら知らないとか信じられない 中盤で使われる手法なのに、勝手に終端で使われてる論文挙げろ、とか 無茶苦茶書いて、しかも将棋に限定してないのに、なんで詰め将棋の論文なんか 出すんだとか、頭の程度が疑われるようなことまで書いているし 将棋は全て探索木で表すことができるが、中盤での探索木は演算限界を 軽く超えてるので、その計算できない部分をいかにカットするかが重要になる そこで使われるのがheuristicで、経験や統計に基づいた手法でそれを実現するもの このheuristicが日本に持ち込まれた時に作られた訳語が「評価関数」 ただし現在ではコンピュータの性能も向上し、heuristicに頼らない様々な手法が 用いられるようになり、それらも含めた意味での評価関数という言葉に変化したが、 将棋においては現在でもなお中盤での完全な局面評価は不可能なため、仮想空間上での ゴールまでの距離(コスト)演算を行うことによってノードの重み付けなどを行う手法が使われており、 これをheuristic function、即ち評価関数とイコールで使われる 元々完全な計算ができない部分で使われている手法なので、そこで出てきた解の精度を 求めるなどということ自体がナンセンスで、全く理解できていない証拠 中京大学とかの底辺なのかも知れんが、最低限歴史的なことも含めて学んでおいた方が良い 思い込みのイメージだけで専門用語を使いたがるのがいるが、恥ずかしいから注意しておくように
>>169 > 仮想空間上での
> ゴールまでの距離(コスト)演算を行うことによってノードの重み付けなどを行う手法が使われており、
> これをheuristic function、即ち評価関数とイコールで使われる
このへんは、A*探索の評価関数の説明を拾い読みしたんだね。
二人零和情報ゲームにおける評価関数とは
ちょっと違うのでちゃんと読み直す様に。
(そもそも将棋における、ゴールまでの距離って何が言いたいんだろう?
min-max木の節点の評価値は全然距離じゃないし、証明数もちょっと距離とは違うしなあ…。
まさか169(=121)が lambda search のことを知っているとも思えないのだが…)
全体的に読んでいて非常に違和感を感じるのだが…
アドバイスとしては、
1, 有限二人零和完全確定情報ゲームの定義を調べる
2, 無限に考慮時間が合っても最善の戦略が得られないゲームがあるということを知る
3, alpha-beta枝刈りの原理を調べる
これくらいかな。勉強が終わったら授業料よろしく
172 :
名無しのひみつ :2009/12/16(水) 01:25:04 ID:L0/KC+lT
>>169 大丈夫?
学校で苛められてたりしない?
174 :
名無しのひみつ :2009/12/16(水) 16:51:18 ID:BCdSN77n
175 :
名無しのひみつ :2009/12/16(水) 17:18:04 ID:fYY8Gg5P
実際は今アマ低段ぐらいだろ?ほんでアマ高段レベルはすぐになるだろうと。
176 :
名無しのひみつ :2009/12/16(水) 17:43:53 ID:BCdSN77n
177 :
名無しのひみつ :2009/12/16(水) 18:33:01 ID:ESrocFSd
ヒューリスティックって計算知能とかあの分野か
ここプログラム板の囲碁プログラミングスレ超えたなwwww
179 :
名無しのひみつ :2009/12/16(水) 20:45:14 ID:T9qa8y3y
今年のゲームプログラミングワークショップの論文集見直してみたけど、 やっぱり評価関数の訳はevaluation functionですね。
180 :
名無しのひみつ :2009/12/16(水) 20:59:16 ID:F+qYwiPr
てか、真の高速演算と局面解析が達成されれば 「先手必勝」が証明されて思いっきりつまらなくなるってオチはないかな? 人間のアホさ加減と忘れっぽさには、面白さと夢があるという背理的証明にも なるのかもしれませんがw まあ量子効果が発揮されて人間性がマシンに付与されるとこまでいけば 真の信頼が得られるのかもしれんけどw
>>180 >てか、真の高速演算と局面解析が達成されれば
前提がすでにありえない。
>「先手必勝」が証明されて思いっきりつまらなくなるってオチはないかな?
つまらないのではなく、勝負ではなくなる。
勝負とは勝ちと負けを争う作業ってこと、ゲームでもないね。
だから確率や乱数に頼り、論理から逃げる行動をするのでは?
万物の真理を科学で解明できたという条件が達成されれば
人類は幸福になるのかな。(前提が破綻しているが)
>なるのかもしれませんがw まあ量子効果が発揮されて人間性がマシンに付与されるとこまでいけば
>真の信頼が得られるのかもしれんけどw
決定論で未来が完璧に固定されていて自由選択などなく、過去に
すべて依存している(つまり過去から現在は確定していても現在から
未来へは自由意思が介入できることはありえない)
ならば、勝敗はゲームをする前に確定しているわけで。
量子計算の多重性が実効的に無限多重ならば、その勝敗も
決定論に逆らえずに確定するだろうね
このスレHAL研のコンテストに参加してる奴いそうだな
183 :
名無しのひみつ :2009/12/17(木) 01:09:45 ID:ekrUzX7Z
モンテカルロとモンゴルと違いは?
>>179 あの馬鹿はGPWの存在自体知らんと思う。
どうせ論文出しても「日本語論文なんて無意味」とか言い出すぜ。
>>180 仮に将棋の完全解析を行える仮想機械があって、将棋が先手必勝だと解ったとしても
完全解析されたゲーム木を人間の思考できる範囲に収めることはできないから、
人間対人間の対戦の読みあいの面白さを無くすわけじゃないと思うな。
それに人工知能の一分野としての将棋研究も将棋の完全解析を目的としているわけじゃなく、
どちらかというと人間の抽象的な思考をいかに計算機に真似させるかというのがテーマだぜえ。
>>181 お前は何を言っているんだ。
185 :
名無しのひみつ :2009/12/17(木) 01:57:04 ID:3fDk/Oql
で、この中にまともに囲碁を打てるやついるのか?
アマ初段程度ですが
日本の学者も自分の発明した手法にアマエコロモ法とか命名してくれよ
189 :
69 :2009/12/17(木) 11:35:16 ID:h7VghWOb
お前ら違うぞ! このまま機会が人工知能をもってターミネータのような世界が来たらどうするのかといってるんだ。 そんなまさかと思ってるやつは想像力を働かせろ。
そんな昭和レベルの想像力は今すぐ捨て去れ
>>48 売り上げを全額日本に置いておけば問題ないだろうね
192 :
名無しのひみつ :2009/12/17(木) 18:21:00 ID:ekrUzX7Z
モンテカルロは残業とか強いの?
>>192 マジレスすると、相手の手番でも平気でトライアウトを
繰り返すから残業に強いと言っても間違えじゃないかもしれん。
>>191 お前、小・中学校時代クラスで一番下だったろ
日本の失業率は男女共に5%以上(2002年労働力調査)だ
5%って事は20人に1人、つまりクラスの男女でそれぞれ1人は無職になるということだ
お前、クラスで一番下じゃなかったか?
テストの点数なんか聞いてないぞ。人間としてだ
よく思い出してみろ。無職になるのは、誰だ?
196 :
名無しのひみつ :2009/12/18(金) 21:56:38 ID:iV7IXRPx
>>193 モンテカルロ部下がほしいんだよ。カーネルトリックなしの。
糖質の遊び場になりました。
heuristicも知らないで将棋のプログラミング語るとか、どんだけ素人 核戦も知らないんだろうなw
199 :
名無しのひみつ :2009/12/22(火) 21:56:45 ID:gURzmksX
素人汁男優です。
201 :
名無しのひみつ :2009/12/26(土) 03:11:30 ID:pP574WlE
完全ゲームの木があったとしても、その大きさが膨大であれば、総てを 生成することも、小さな計算機のメモリに格納することも望めないだろう。 宇宙の原子総てを使ってメモリーにしても足らないだろうから。 よって完全手は打てないだろう。
>>201 計算できたらという、絶対に無い前提を持ってきて
それならできるとか、(SFじゃない)
神がいたら神の力で結果が出せるという主張と同じことに気がつかない
のが最近増えてきたんだよね。どうするよ。
理論研究のための概念をそのまま受け取るとかアホか
>>201 ,202
高卒は高卒のいるところから出ないほうがいいよ。
下手に大卒のいるところで持論を主張すると
お互いのためにならないから。
>>204 中卒は中卒のいるところから出ないほうがいいよ。
どうみてもお前はガキの反応だろ。
まずは学校卒業して年金はらってから出なおせ。
ママに起こられるぞ。
2次方程式の解き方について議論している中学生の集団がいるとしよう。
小学生が一人それに向かって「数字じゃない物が足し算とかできるわけないだろバーカ」
と言っているとする。
その小学生に向けられる目線を想像したら、
>>121 >>169 >>201-202 あたりが
どういう目で見られているか分かるだろう。
俺は計算科学の専門家だが
>>201 の言ってることは正しいだろ
何でそれ以降の幼稚な反論と一緒にされてるかわからん
馬鹿は自分が馬鹿だってことにさえ気づかないものなのか?
>>201 は確かに正しい。太陽は東から昇る、ってのと同じくらい正しい。
太陽は西から昇るって言ってる人がいたら、東から昇るって言ってあげないとダメだね。
でもそんな人はこのスレにはいないけどね。
>>209 最初のリンクは切れてるな…citeseerのせいかな?
2番目の論文は Korf の Best-First minimax search の論文か。
これは良い論文だと思うけど、勉強するようにって言って持ってくるほどの
ものじゃないんじゃ…。どういう意図があってこれを持ってきたの?
alpha-beta 探索の勉強をするために、ってことなら
Knuth & Moore の1975年の論文を読むのがまず最初じゃないかな。
3番目の論文は Gelly & Silver の論文ね。これはまさにこのスレで言っている
「モンテカルロ法」についての論文だから、読む価値はあると思う。
でも、これも1個だけ挙げる論文としてはおかしい。これだけ読んで分かる人いるのかな?
ちょっと迷うけど、もし1個だけ読むなら、下のどっちかをお勧めする。
--
Remi Coulom
"Computing Elo Ratings of Move Patterns in the Game of Go"
ICGA Journal, Vol. 30, No. 4. pp. 198-208. 2007.
--
Sylvain Gelly and David Silver
"Combining Online and Offline Knowledge in UCT"
In International Conference on Machine Learning (ICML 2007)
--
原子で足りないなら素粒子を使えばいいじゃない
>>212 1回で負けたのは負けではない、連続して負けたなら別だろうけどな。
生物の進化もモンテカルロ法ですか?
>>212 =また騙されて囲碁板まで飛ばされたわけだが
とうとう負けたか、ちょっと前まで、上位のプロ棋士に勝てるようになるのは100年先とか言ってたのにな。
囲碁の場合盤面が広いだけだから、ハードが進歩すれば時間の問題だよな
218 :
名無しのひみつ :2010/02/01(月) 15:27:32 ID:VVkPPoXx
てか、コンピューターソフトがプロに勝てるのなら、プロの意味がなくなるな。 プロ試験がコンピューター相手の対戦って感じになるのかな? 毎年強くなるから、最終的にはプロが居なくなるかもw アマチュアだけで充分だろ。
馬がいても自転車があっても自動車があってもオリンピックは相変わらずやってるわけだし 人間の中で競い合うのは終わらないだろ
>>220 オリンピックなんて殆どアマチュアだろ。
機械に負けるようなら、プロは必要なくなる。
ソフトが一般化されれば、プロ以上のレベルと対戦できるんだぞ。
生き残るのは、新しい定石や戦法に特化した開発者だな。
222 :
名無しのひみつ :2010/02/09(火) 12:40:20 ID:LJt7jMHk
対戦相手の電源プラグを抜いてはいけないというルールはないだろから。
223 :
名無しのひみつ :2010/02/09(火) 13:55:46 ID:7qiotx8U
SAIはいつ登場するの?
224 :
名無しのひみつ :2010/02/09(火) 17:26:45 ID:67S3rspd
>>221 200km/hの球を投げれるピッチングマシーンがあってもピッチャーが居なく成らないようなもんじゃねーの
>>221 人がいかに強くなれるかを競ってる訳だから(オリンピックも同様)
機械に負けてもまったく関係ないし、そこに感動は無い
感動が無ければ誰もスポーツなんて見ない
人が自動車に勝てるか?って話
話題ずれてないか?
ソフト一般化する話と
>>219-220 は全然意味が違う
そりゃ強いソフトが出たら面白いだろうね
でも最終的には人間として勝てるから面白いのであって
プログラムが強いならプログラムに戦えさせた方がいい
ただ、これはまた別の話
でもそのプログラム作ってるのは人間だよね
>>226 だからプログラム同士で戦わせるのは、また別の話
今は拮抗しそうなレベルだからたまたま人間と戦わせるとか言ってるだけ
あっという間に追い抜いて、人間と戦わせる事すらばかばかしくなるさ
チェスなんか、もう人間の棋譜は弱くなるから学習させないもんな 人のトップがやっても6番勝負で一勝もできなくなってしまった