[人工知能]革新AI囲碁ソフト『Crazy Stone』@モンテカルロ法

このエントリーをはてなブックマークに追加
1名無し名人
Brendan Borrell 2007年05月11日

その昔、人工知能(AI)マニアが関心を向けるゲームと言えば、
何と言ってもチェスだった。
しかし、チェスでは物足りなくなったマニアたちは、
次なる狙い目として「碁」を選んだ。
だが、なぜ碁なのだろう?

碁の起源はチェスより1000年以上古く、
碁における石の手数は宇宙に存在する原子の数よりも多いと言われる。
だが、さらに重要なのは、囲碁の場合、コンピュータープログラムが
人間の囲碁の名手に勝ったことが一度もないという点だ。

世界中で、熱心なコード開発者たちがコンピューター囲碁の
メーリングリスト上でプログラム開発の秘訣をやりとりし、
『KGSコンピューター囲碁トーナメント』
[日本語版注:KGSは『棋聖堂碁サーバー』の略。
神奈川県茅ヶ崎市にある棋聖堂が運営している]で、
毎月腕を競い合っている。

2005年には、フランスのリール大学に所属するコンピューター科学者、
Remi Coulom氏が提起した新戦略が、既存の手法に革命的な変化をもたらした。
Coulom氏のプログラム『Crazy Stone』は、
2006年5月から6月にかけてイタリアのトリノで開催された
第11回『コンピューター・オリンピアード』で、金メダルを獲得している。
Coulom氏は先ごろWired Newsの取材に応じ、
囲碁ソフト作成の難しさやCrazy Stoneの成功の秘密について語ってくれた。

[日本語版:ガリレオ-藤原聡美/長谷 睦]

WIRED NEWS 原文(English)
http://wiredvision.jp/news/200705/2007051121.html
2名無し名人:2007/10/02(火) 20:35:02 ID:q6BMalXv
Wired News(以下「WN」):囲碁ソフトのプログラミングが
チェス用のソフトより難しい理由は?

Remi Coulom氏:碁では、[チェスのような形で]相手の石を取ることはない。
だから、黒が優勢なのか白が優勢なのか、盤面を見ただけでは判断できない。
勝ち残るためには、自分の石で2つの「目」
――相手に侵略されない空白の陣地――を囲む必要がある。

囲碁では、縦と横、19本の線が引かれた碁盤の上に石を置いていくわけだが、
それが生きた石になるか死んだ石になるかは、打った時点ではわからないので、
静的分析が非常に難しい。ここがチェス(あるいはチェッカー)と状況が違うところだ。
チェスならば、盤面を見て「わたしの方がポーンを1個多く持っている」と言えるのだが。

WN:「モンテカルロ法」とはどういうもので、どのように碁に応用されているのでしょう?

Coulom氏:モンテカルロという名前は、
カジノで有名なモナコの一地区にちなんでつけられたものだ。
碁の場合の基本的な考え方はこうだ。
次の一手の選択肢を評価するために、
まずは何千通りもの対局をランダムにシミュレーションする。
その上で、その手を打った場合、白よりも黒が勝利をおさめる傾向が強いとすれば、
その手が黒にとって有利だと判断できる。

WN:一般的な碁の対局では250手を要することを考えると、
それをシミュレートするには、非常に処理能力が高いコンピューターが必要なのでは?

Coulom氏:トリノのオリンピアードで使用したバージョンのCrazy Stoneでは、
CPUを4つ――米Advanced Micro Devices社製のデュアルコア・プロセッサー
『Opteron』(2.2 GHz)を2つ――搭載したマシンを使い、
1秒あたり約5万件の対局シミュレーションをランダムに実行した。
これまでのアルゴリズムとは異なり、モンテカルロ法のアプローチでは
非常に簡単に並行処理ができるので、
新世代プロセッサーのマルチコア構造を活用できる。

3名無し名人:2007/10/02(火) 20:35:32 ID:q6BMalXv
WN:Crazy Stoneはモンテカルロ法を採り入れたプログラムの
第1号ではありませんでしたが、囲碁ソフトのプログラマーの間で
流行となるほどの成功を収めました。
あなたのアプローチのどこが革新的だったのでしょうか?

Coulom氏:すべての対局をしらみつぶしにサンプリングすることは不可能なので、
モンテカルロ法のアルゴリズムでは、最良の一手を見つけられない場合もよくある。
たとえば、特定の一手を打った時の対局シミュレーションの結果が、
大半が負けで、1つだけ勝てるパターンがあったとする。
基本アルゴリズムは結果の平均値を取り、
そこに石を置くのはよくないと判断する。

Crazy Stoneは、この問題を回避できるようプログラミングされている。
1つの手から生じる一連の流れが他の手よりよいと気づけば、
シミュレーションの中でもその流れを重点的に取り上げる。

WN:KGSトーナメントの進行役を務めるNick Wedd氏のように、
モンテカルロ法を採り入れたプログラムの対局は、
見ていて退屈だと不満を述べる人もいるが、
それはなぜでしょう?

Coulom氏:モンテカルロ法によるプログラムは、
勝利の可能性を最大限にするもので、
大差で勝つことを目指していない。
相手よりはるかに有利な状況になると、
必ず安全最優先のモードに移るので、
攻め姿勢の対局に比べると、見ていて退屈だと感じるかもしれない。
見るにはつまらないかもしれないが、
ゲームで勝利をおさめるにはより効率のよいやり方だと思う。

WN:優れた囲碁ソフトの作者は、多くが自身も優秀な棋士だと聞くが、
あなた自身の囲碁の腕前は?

Coulom氏:最初の囲碁用プログラムを書く前には、
わたし自身も、世に出ている他のプログラムを打ち負かせるくらいには
強くなろうと心に決めていた。だが、
強い棋士であることが、強いプログラムを書くために重要だとは思わない。
そのことは、わたしがチェス用のプログラムを書いていた時からはっきりしていた。
わたしが作ったプログラムはわたしよりはるかに強かったからだ。

今出回っているプログラムの中には、
「定石」と呼ばれる、昔から最善とされている
決まった石の打ち方を用いるものがあるが、
わたしはこうした既存の知識をあらかじめコードに組み込むことは避けている。
無条件に定石を当てはめたために勝ちを逃すプログラムもあるのを知っているからだ。
4名無し:2007/10/02(火) 20:55:05 ID:cc5vqih8
>>1
>[日本語版注:KGSは『棋聖堂碁サーバー』の略。

KGSはKGS Go Serverの略じゃないの?
5名無し名人:2007/10/02(火) 22:13:19 ID:Htgxnw7g
GNUとかLAMEみたいなもんじゃね
6名無し名人:2007/10/02(火) 23:39:05 ID:OoAL5kOl
近い将来ソフトに負けないように、詰め碁、手筋がんばるか。。。
7名無し名人:2007/10/03(水) 00:28:02 ID:Wj3nCXqP
>>4
訳段階で虚偽情報を混ぜ込む・・・
何がしたいんだ
8名無し名人:2007/10/03(水) 01:10:46 ID:sAM2jiDL
>>4
> KGSはKGS Go Serverの略じゃないの?

Kiseido Go Server の略だよ。
9名無し名人:2007/10/03(水) 01:41:00 ID:hdCwv9Kg
>>8
今は違うよ。4は知ってて書いてるんだよ。
2chじゃそういう人よくいるから気をつけて
10名無し名人:2007/10/03(水) 01:47:51 ID:hdCwv9Kg
>>1
要するに、下手でも5万人集まって多数決で着手を決めれば
多少はましになる、って理解でいいのかな?
11:2007/10/03(水) 02:56:12 ID:6L2W1XL6
>>7>>4の指摘が正しいという意味だからな
http://ja.wikipedia.org/wiki/KGS
12名無し名人:2007/10/03(水) 03:06:13 ID:YqBQI+gb
多数決とはちょっと違うね。とにかくランダムに5万局最後まで打
つのが肝要で、あいまいなのは死石も抜いて
中国ルールでやれば最終局面の石数結果は簡単に判る。
変化の勝つか負けるかで勝率計算も自明。
ただ、むやみなランダムでなくパターンや
多少ヒューリスティックな要素を入れて絞っているので強くなる。
序盤はダメだが中盤以降は手筋がでたりそこそこ強い。
碁会所2,3級なら油断するとやられるよ。
13名無し名人:2007/10/04(木) 21:29:03 ID:ZlpASQAl
碁解除四段ですが何か
14名無し名人:2007/10/05(金) 01:39:56 ID:gxe5XXdA
>>10
5万人の秀才より、1人の天才のほうが激しく強い。
これは越えられない壁。

コンピュータがどんなに時間をかけて計算をしても天才の域には達しない。
そもそも思考の土俵が違いすぎる。
15名無し名人:2007/10/05(金) 02:53:44 ID:Bo6LKRsu
5万を50万にするとどれくらい棋力が上がるか興味あるな。
この方法ならコンピュータを並列化すればいくらでも棋力が上がるし。
まあ、ネット初段くらいが事実上の限界の気もする。
16名無し名人:2007/10/05(金) 11:53:38 ID:kyCiCWIA
ソフトって、石の連絡を正しく認識するのさえむつかしいような。
例えばケイマをでぎられても利き筋がシチョウあたりでシチョウに抱えられる場合とか。
状況の変化によっては利き筋が利かなくなって激しく振り変わったりするでしょ?
そういう認識をしっかりさせないで、ランダム対局5万局とか50万局とかさせても、ぜったいプロに勝てないと思うんだけどな。。。
17名無し名人:2007/10/05(金) 12:01:26 ID:Bo6LKRsu
そういうのをしっかりさせようと色々頑張ったけどあんまり強くならなかった。
モンテカルロ法を応用したらびっくりするほど強くなった。
低いレベルでの話だけどね。
(9路定先でプロに勝ったらしいけど)
18一歩:2007/10/05(金) 12:23:21 ID:243Bs6yK BE:1104743276-2BP(0)
>>1-3
までの記述、理論的にただしい。
 しかし、まだ大きな問題点が指摘できる。
  1. 如何にして「勝敗の確定」状態であると認識できるのか。
  2. 読み切りの確定状態になると、失敗の回避は不要になる。
  3. プログラムの主体は、失敗しない上げることになっているが
    形勢が有利な場合はいいけれ、不利に場合にはかえって「勝負手」が打てない
19一歩:2007/10/05(金) 12:30:05 ID:243Bs6yK BE:710191793-2BP(0)
もう1つ、
 この方法は、10級の棋力の人また6段の棋力の人が、
  勝率をあげる手段でつまり、間違いを減らすことで勝率を上げている

  そのため、6級に人が、間違うことによって5級になるという
  人間の成長システムとは、まったく異質のものに思える。

  つまり、
   発展がない世界での、最善の効率を求める
  というように思える。
20一歩:2007/10/05(金) 12:40:57 ID:243Bs6yK BE:315641434-2BP(0)
それを防ぐには...
 失敗の中で、最善の正解を見つけることが必要になる。
 しかし、これには、無駄を省くではなく
          無駄を検証することが必要になる。
  学問的には、無駄の検証ほど、無駄な時間はない。
 
 この矛盾を修正できれば、すばらしい理論的のに確かな発展が期待できそう。
21一歩:2007/10/05(金) 13:36:11 ID:243Bs6yK BE:631282638-2BP(0)
>>14
囲碁の発展は、一人天才の発想でだけで生まれるものではありません。
22名無し名人:2007/10/05(金) 14:09:50 ID:JqIRRmnT
うん
23名無し名人:2007/10/05(金) 14:39:10 ID:gxe5XXdA
>>21
されど、1人の天才がいなければ発展は激しく遅れるのも然り
24名無し名人:2007/10/05(金) 23:54:32 ID:q8Fld3Uc
CrazyStoneに100万局に1局も勝てない日本囲碁ソフトはおよびでない
25名無し名人:2007/10/06(土) 00:45:23 ID:8dnZoo1B
もうソフトとかいらね
100目以上差が付くってなんだよカス杉
それにコンピュータの対局中の地合い評価・形成判断って明らかに変なときがあるし。
いや、死なんだろってところを勝手に死に石として数えてたり
26名無し名人:2007/10/06(土) 01:11:53 ID:SJiKLifJ
MOGOの9路やれ。
27名無し名人:2007/10/06(土) 02:17:52 ID:yVHLrsjo
28名無し名人:2007/10/20(土) 22:13:41 ID:mRATaQ0g
保守
29名無し名人:2007/11/18(日) 09:22:01 ID:RSJ8iHd6
モンテカルロシュミレーションを高速化するにはどうすればいいんですか
30名無し名人:2007/11/18(日) 14:59:19 ID:uZ7dUshM
速い CPU を使う,たくさん並列化する,実装を頑張る(bitboard とか)
RAVE を実装する,Progressive widening を実装する,
新しいアルゴリズムを考える

好きな方法を選べ
31名無し名人:2007/11/18(日) 15:43:42 ID:RSJ8iHd6
それ以前の段階でつまってますorz
黒白それぞれに可能手をリストアップしてやるのが一般的なのでしょうか?
あとあとビットボードで書いて並列化する予定なのですが・・・
32名無し名人:2007/11/19(月) 02:50:54 ID:T75o4YQH
>>29
一時的にでもメモリにアクセスしないこと。
高級言語を使わないこと、動作する環境にあわせたデータ処理を行うこと、
キャッシュメモリを乱すアクセスをしないこと、
メモリアクセスはアドレスに対してシーケンシャルに行うこと、
予測分岐ペナルティを受けないように回数の少ないループは展開して行うこと
プロセッサの得意とする支援機能を熟知し、プロセッサ専用の命令語で
最適化すること。

アルゴリズム自体を別なものにすることw
33名無し名人:2007/11/19(月) 02:59:52 ID:T75o4YQH
>>31
メモリを一時に使うような工程を伴なうデータ処理でメモリを扱う
中間処理を行わないこと。
全体の処理を行う前に、それらを求める中間情報や計算位置や検索などは
予め前計算して、重い主処理では参照以外の書き込みを一切しないこと。

複数のCPUでメモリを共有せずに分散できるアルゴリズムを考えること。
34名無し名人:2007/11/20(火) 01:41:00 ID:vHuzy7ra
>黒白それぞれに可能手をリストアップしてやるのが一般的なのでしょうか?
普通は空点のリストを持っておいて
合法手か否かは別にチェックする
ただ,Remi, Sylvain とも,高速化は最後にやればいいと言っている
それよりアルゴリズムの方がずっと重要だと
もっとも,二人とも実装は上手だからそう言えるのではあるが
初心者の場合は何度も作り直すつもりで気楽に作るのがいいと思う
まずはとにかく動くものを作ることが大事
一気に凄いものを作ろうなんて考えないこと
35名無し名人:2007/11/20(火) 07:16:21 ID:dqur8LVS
>>32,33
なんとなくですが処理の遅い箇所がみえてきました
ありがとうございます

>>34
はじめは黒白双方に可能手をリストで作成していたのですが
効率が悪そうなので空点リストで作っているところです
やはりそちらのほうがメジャーなのですね
ありがとうございます
36名無し名人:2007/11/23(金) 15:05:06 ID:5+jAodNG
>>35
作業をしないアルゴリズムほど早いものはない、
つまり可能手リストをその場で作るというのが高速化には不利。
容量を捨てるほど使って全てパターン化、ハッシュ作品で1発検索すれば
解決できるのでは?
九九の計算をするときに暗記しておけば早いのは当然の論理。
このデータを蓄えると莫大な量になる、これを解決するには
パターンを記録するのではなく、規則そのものを記録するしかない
のでしょうね。
37名無し名人:2007/12/02(日) 22:44:08 ID:BgwwMCd1
UEC杯が終わりました.参加プログラムは27,一日目は予選で5ラウンド
変形スイス式,2日目は16プログラムによる決勝トーナメントで,結果は:
優勝 Crazy Stone, 以下,勝也,MoGo,AyaMC, GGMC Go, caren,思考錯誤,
きのあ囲碁,RunGo,GNU_ark,迷い子,Boozer,martha,GOGATAKI,
囲碁っぴ,boon−ぶーん−,でした.
Crazy Stone は今日行われた KGS のトーナメントの Open, Formal の
両部門でも優勝し,一日で3つ勝つという快挙を達成しました.
38名無し名人:2007/12/03(月) 01:12:14 ID:RdzW0o9b
囲碁って感覚で打つ部分も多いから難しいだろうな。
俺は感覚しか使わないけど
39名無し名人:2007/12/03(月) 20:19:34 ID:V8w4U/8M
boonってもしかしてVIPPER?
40名無し名人:2007/12/03(月) 20:43:07 ID:OuGz95En
そうです
41名無し名人:2007/12/03(月) 20:49:47 ID:OuGz95En
でも囲碁のほうが好きです⊂( ^ω^)⊃
42名無し名人:2007/12/03(月) 23:30:38 ID:V8w4U/8M
そうなんだ、応援するぞ
43名無し名人:2007/12/22(土) 15:37:58 ID:hsRjSkzT
17日発売の週刊碁の12月24日号に第1回UEC杯の記事が19面全部使って載ってる
24日に次の号が出るから購入は早めに駅の売店で
44名無し名人:2007/12/28(金) 22:03:15 ID:jKJDMh50
おっぱいでかい女友達が身長たかいやつって顔でかいからきもいっていってたお
45名無し名人:2007/12/28(金) 22:03:49 ID:jKJDMh50
誤爆した 死にたい
46名無し名人:2007/12/28(金) 23:33:16 ID:BgLRodPe
あがってるから見てみればwww誤爆乙wwwwww
47名無し名人:2007/12/28(金) 23:39:27 ID:J3Avo7Gc
死んでくれ
48名無し名人:2008/01/08(火) 20:54:07 ID:S0enMp6j
全数計算すればそれで終わり
49名無し名人:2008/01/08(火) 21:33:28 ID:Ympfxz+l
まずは結果を記録するメモリの手配から頼む
50名無し名人:2008/01/27(日) 15:23:56 ID:j+skORBb
9路盤において中国ルールを用いた場合
コミが7.5のときと6.5のときの
先手と後手の勝率分かるかたいたら教えてください
分かるところだけでいいのでお願いします
51名無し名人:2008/01/27(日) 23:08:46 ID:KI86RF0i
ttp://computer-go.org/pipermail/computer-go/2007-April/009367.html

If some are interested by the results, I just did a test.
9x9 games, MoGo with 3k simulations per move against itself. Of course
this player is much weaker than the one playing on KGS, but at least
it enables me to make thousands games in some hours.

Here are the results (wins for black):
komi 6.5:
1943/3640 (53%)
komi 7.5
1754/3640 (48%)

Sylvain
52名無し名人:2008/01/27(日) 23:44:55 ID:j+skORBb
(-人-)どもです
53名無し名人:2008/02/11(月) 16:59:31 ID:Fyaug53C
確率で計算していれば100%負ける
54名無し名人:2008/03/03(月) 22:45:06 ID:rVFKlbBG
9路MOGO強え〜
白番で勝てね〜
55名無し名人:2008/03/07(金) 17:43:34 ID:9wyjY26/
mogo9路強いなあ
56名無し名人:2008/03/09(日) 13:33:46 ID:LxIQpPzZ
強い
57名無し名人:2008/03/10(月) 20:35:27 ID:m+Qjii25
13路のもごも侮れない。
9路よりは勝てるけど。
58名無し名人:2008/04/11(金) 14:19:43 ID:ZY1Xv+/4
初歩的な質問なんですがMoGoが実装しているRAVEってどういうものなんでしょうか
UCTの中で候補手を絞ったりする方法のことでしょうか?
論文が見つからないもので…
59名無し名人:2008/04/11(金) 14:20:15 ID:ZY1Xv+/4
あげ
60名無し名人:2008/04/11(金) 16:36:16 ID:0U1VY/5T
>>58
こらこらマルチポストは遺憾ぞな
61名無し名人:2008/05/04(日) 15:43:23 ID:1dN71nIv
七路コミ6.5で、私黒番必勝のパターンがありますね。
いろいろやってくるかと思ったら、パターンに嵌ってからの変化ばかり。
62名無し名人:2008/05/04(日) 21:36:36 ID:X58zhmfr
7路でコミ6.5目は小さいんじゃない? 7.5だとどう?
63名無し名人:2008/05/05(月) 17:20:48 ID:oHKi+MRT
コミ7.5で10回に1度くらい負ける。
64名無し名人:2008/05/06(火) 00:54:27 ID:a0zZ5Jnz
相手はMoGoですよね.4コア相手にそれならプロレベルでしょ.
65名無し名人:2008/05/06(火) 15:09:44 ID:xfjHWPR2
Crazy Stoneって、MoGoなの?
4コア?
誤爆?
66名無し名人:2008/05/06(火) 19:47:08 ID:E7s9nFyg
ググレカス(AA略
67名無し名人:2008/05/07(水) 09:13:20 ID:ni5AHZgJ
MoGoは7路には対応してないはず。GNU Go?
68名無し名人:2008/05/07(水) 23:35:34 ID:2V8nHRzv
>>61
7路盤は人間の研究によれば、黒9目勝ちという結果が出ている。
なのでコミ6目半とか7目半なら黒かなり有利だと思われる。

もちろんしらみつぶしで証明されたわけじゃないが、
コミ8目なら紛れなく黒が勝てると思う。
69名無し名人:2008/05/08(木) 12:22:09 ID:QZEgB9JR
まさに>>68
実際に証明はされてるのは5路までだが6路と7路はプロが出した値があったはず
ちなみに9目は中国ルールだったかな
70名無し名人:2008/05/08(木) 13:41:56 ID:wIxjqk5D
>>68,69
> 7路盤は人間の研究によれば、黒9目勝ちという結果が出ている。

面白そうな話ですね。
よろしければ出典を教えてください。
71名無し名人:2008/05/08(木) 14:04:42 ID:6HkPsIKA
ttp://olive.zero.ad.jp/qin/7ro/
ほい。日本ルールでも中国ルールでも一緒らしい。
ただし、なんかjavaに問題があってみられない。
72名無し名人:2008/05/09(金) 00:51:40 ID:/YRpw+Ut
手が白番で終わってるから日本ルールでも同じみたいですね
73名無し名人:2008/09/07(日) 21:07:04 ID:3k6KRIbl
hoshu
74名無し名人:2008/11/13(木) 20:19:21 ID:5lPHpCCk
ほしゅ

ここ半年くらいで面白い論文ないかなぁ〜
75名無し名人:2008/11/14(金) 02:36:39 ID:HT2If84p
保守せんでも囲碁ソフトスレでいいでしょ
76名無し名人:2008/11/14(金) 02:43:12 ID:StQAHWkp
というか一年放置でも落ちないし
77名無し名人:2008/11/14(金) 19:47:21 ID:0gyogvAl
AI囲碁のversion17はどれくらいの強さですかね?
マルチコアでなければ1〜2級程度でしょうか?
78名無し名人:2008/11/16(日) 14:16:59 ID:KW9k4rL5
持ち時間次第じゃね?
79名無し名人:2008/11/17(月) 15:09:58 ID:pAX7cKPD
>>78
待ち時間を100倍にしても、強さは微妙にしか変わらない。
時間が多いほど人のほうが有利になるよ。

AIが時間分だけ深読みしても高次的な思考ができるわけでもないので、
アルゴリズムの演算が制限時間に間に合うかどうかにすぎない。

深読みをAIにさせても評価式が変わらない限り、最初に決断した
結果に大幅に有利な変更案が見つからない限りは合理的アルゴリズムで
選択された結果は変更されない。
80名無し名人:2008/11/17(月) 18:14:59 ID:GFUq/jKq
>>79
モンテカルロ木探索を使ったプログラムなら、
考慮時間を100倍にしたら相当強くなると思われる。
今までのプログラムは100倍にしても大して強くならないけどね。
81名無し名人:2008/11/17(月) 18:22:09 ID:JRG6EWeE
そもそもまだ発売してないので、現段階で思考時間や棋力を知るためには
メーカーに問い合わせるしかない。
82名無し名人:2008/11/17(月) 23:13:19 ID:pAX7cKPD
>>80
深読みしても、それが凄いか評価できなければ強くならないのよ。
その読みの中に凄い答えがあったとしても、それが凄いと判定できなければ
ダメということ、
83名無し名人:2008/11/17(月) 23:54:29 ID:ikQVZZLv
>>82
モンテカルロがどうやって評価してるか知らないのか?

84名無し名人:2008/11/18(火) 00:48:38 ID:UmhVVf3I
>>83
その評価では高次の判定はできないということが理解できないほど
君の思考が浅いということが分かった
85名無し名人:2008/11/18(火) 01:07:19 ID:ysomIXxY
>>84
モンテカルロは十分な時間をかければ最適解にたどり着くことが保障されているんだが?
(現実的にはかけられないけど)

86名無し名人:2008/11/18(火) 01:47:37 ID:1tSZd7/s
高次の判定(?)とかいうよくわからないものの話をしてるわけじゃなくて、
実際に時間をかけると強くなることが観測されているわけなんだけどね

対戦するときには100倍の考慮時間をかけると人間が待ってくれないから、
並列コンピュータでやったのだが
87名無し名人:2008/11/18(火) 16:05:40 ID:zN/s2oJu
ヒューリスティックな評価関数を用いた木探索と混同してるんだろうね。
88名無し名人:2008/11/18(火) 20:12:01 ID:UmhVVf3I
>>86
では聞くが、モンテカルが戦略を立てられるというのか?
人並みの思考ができるというのか?できないだろ。
高次の欠片も知らないから、そんな低レベルの古典的技術しかしらないんだろうな。
89名無し名人:2008/11/18(火) 20:31:52 ID:ceggNNSZ
>>88
まず、モンテカルロ木探索は2006年生まれのアルゴリズム
全く古典的ではない
(正確には2005年かな?)

さらに、人間並の思考ができなくても、囲碁は強くなるらしい
ということがいえるわけだ

そもそもチェスや将棋が強くなったのは人並みの思考のおかげではない
例えばボナンザが戦略を立てているわけではない
90名無し名人:2008/11/18(火) 22:07:51 ID:UmhVVf3I
>>88
はぁ?
作ったこともねぇ奴が何偉そうなことをwwwばかすぎw
91名無し名人:2008/11/18(火) 22:37:15 ID:zN/s2oJu
>90
何を自分自身に言ってるんだ?
92名無し名人:2008/11/19(水) 13:44:41 ID:RA4QhOWn
>>89
戦略において伏兵はモンテカルロでは実現できないだろ、
あたま使えよ。

93名無し名人:2008/11/19(水) 13:46:11 ID:otQdrfML
「戦略」って何?
94名無し名人:2008/11/19(水) 13:52:07 ID:RA4QhOWn
ゲームの場合は、予測できない部分と予測可能な部分があり。
予測可能な部分でしか勝負できない奴はジャンケンなどの相性問題という
単純な理屈すら理解できない。
最後に勝てばいいだけであり、途中がどんなに負けていても
それは勝ちとは言わない。
それが理解できないから途中の勝ちの評価の延長は常に最終的な
勝ちだと思い込む。
ゲームというのは勝敗が分からないから、予測できないからゲームというんだ
予測できない部分で勝負するから意味がある。
勝負の本質すら無視している奴は現実社会では見えない部分で俺が凄いのに
何故評価されないんだと嘆くだけさ。それは無能という証拠だ。
予測であるかぎり、予知ではない。予測なものを予知だと言えばオカルトになる。
戦術がすべての勝利条件だと思い込み戦略の意義もわからない奴に何をいっても
無駄だろうけどな。
95名無し名人:2008/11/19(水) 13:54:50 ID:RA4QhOWn
>>93
http://ja.wikipedia.org/wiki/%E6%88%A6%E7%95%A5
>間接アプローチ戦略を理論化して直接的な武力衝突ではない新しい間接的な手法
96名無し名人:2008/11/19(水) 13:56:14 ID:otQdrfML
wiki廚か・・・
97名無し名人:2008/11/19(水) 13:56:57 ID:RA4QhOWn
>>96
まずは伏兵がどれだけ重要か勉強してくるべきだ。
98名無し名人:2008/11/19(水) 14:01:09 ID:otQdrfML
もう来なくていいよ
99名無し名人:2008/11/19(水) 14:07:26 ID:8w3EVvFW
オセロ、チェス、将棋、囲碁のようなゲームは理屈上、最善の手順が必ず存在していて、
それさえ解ってしまえば読み切りであり戦略も糞もない。
モンテカルロ法(を応用したアルゴリズム)の場合、
時間が無限にあれば最善の手順が求まると数学的に証明されている。
100名無し名人:2008/11/19(水) 15:23:18 ID:RA4QhOWn
>>99
>オセロ、チェス、将棋、囲碁のようなゲームは理屈上、最善の手順が必ず存在していて、
単なる思い込みです。終り。

最善に見えるだけ、評価方法を考えたくない奴の詭弁にすぎない。

>それさえ解ってしまえば読み切りであり戦略も糞もない。
全数計算ができない言い訳です。

>時間が無限にあれば最善の手順が求まると数学的に証明されている。
全数計算が出来たという前提で、全数計算できなければ証明などされて
おりません、詭弁もほどほどにしろよw
101名無し名人:2008/11/19(水) 15:29:24 ID:TnOyPr3a
IDが赤い奴にろくなのがいない法則
102名無し名人:2008/11/20(木) 12:34:21 ID:wtikwzv8

評価関数ベースでも末端までよめば最善手順が分かるだろ
時間かければ(ryとか言ってる時点で痛すぎるんだけど
103名無し名人:2008/11/20(木) 14:05:50 ID:BTv3nfrI
>>102
そうだよな。末端まで読んでいないのに時間をかければ
読めると思い込んでいる。50歩100歩の読みでは
最善手なんて夢の夢。

まずは全部の手を読んでから評価することを考えるんだよな。
2手先読んで最善手では笑われるだけさ。残りの部分がどんだけ
あるか理解できないとはユトリ教育の結果か?
104名無し名人:2008/11/20(木) 16:18:53 ID:TI2V6MhP
2手先まで全部読んで、
さらに時間があるなら3手先まで全部読んで、
さらに時間があるなら4手先まで…

というふうに時間をかければ深さを増していくことができる
これを反復深化(iterative deepening)と言うのだが、
アルファベータ探索は普通はこれと組み合わせて使われる

これはごく普通のテクニックで、チェスや将棋のプログラムでこれを使っていないプログラムは無いと思う
アルファベータ探索で、無限に時間をかければ正しい結果が得られるってのは
当然こういう風に、深さをどんどん増やしていくことを想定しているのだ

ちなみにモンテカルロ木探索の場合の「時間をかければ正しい」ってのは、
これとはちょっと意味が違うんだけどね

ついでに二つ言っておきたいんだけど
・自分以外がみんなバカに見えたときは、自分だけが何かを知らない可能性が高いから気をつけましょう
・何かを批判するときは批判対象について少しくらい調べましょう

漏れはどっちの教訓もリアルライフで学んだけど、2chで学ぶのもいいかもしれないな
以上だ
105名無し名人:2008/11/20(木) 16:53:45 ID:wtikwzv8
反復深化すればいっぱい枝刈れるからね
MCTSは精度があがっていく感じであって結局完全に正しいっていうにはなんかね
106名無し名人:2008/11/20(木) 18:26:06 ID:TI2V6MhP
>>105
そうだよね
モンテカルロ木探索は「正しい」と言うよりは「最適解に収束する」とか何とか言う方がしっくりくる
何をもって「正しい」というのかが、アルゴリズムによって違うってことなんだろうけど

ただ、αβの場合は、評価関数がアホだと末端に到達する前までの探索は全く無駄かもしれないけど、
モンテカルロ木探索の場合はよほどのことが無い限り、時間をかけたのが無駄になることは無いだろう
(少なくとも囲碁についてはこれが本当らしい)

時間をかければ強くなる、というだけの当たり前のことが囲碁プログラムで実現できたのは
本当に画期的だと思う
107名無し名人:2008/11/22(土) 01:20:41 ID:I3cSkCr4
>>104
反復深化に関する説明が間違ってると思う。

>>105
必要な枝も刈る可能性を忘れずに。

みんなどこか少しずつ理解が足りないなぁ。
108名無し名人:2008/11/22(土) 01:37:09 ID:t1jwB5T8
うんwそうだね。
日本製のプログラムがへぼなのも納得できる。
109名無し名人:2008/11/22(土) 02:48:05 ID:EppwR/bA
必要な枝を刈る、ということの意味がよくわからない

>>105の言っている反復深化すれば枝をいっぱい刈れる、というのは、
一回前の反復の情報を利用したらmove orderingが正確になる、という意味だと思うんだが

ついでだが、反復深化の説明が間違っているようには思わない
ハッシュテーブルを使う、とか言うところまで説明すべき、ということ?
110名無し名人:2008/11/22(土) 13:33:34 ID:J2V+qoqY
>>109
日本語でおk
107の発言を深く考えてみるべきだ。根本的なことがわかっていないな
111名無し名人:2008/11/22(土) 14:16:51 ID:EppwR/bA
>>110

>>109の内容は、アルファベータ探索について少し勉強したことがあれば分かるはず
もちろん、説明なしに専門用語を使ってるから、勉強したことがない人には分からないと思う

ところで>>107が何を言ってるのかよく分からないんだけど説明してもらえませんか
112107:2008/11/22(土) 17:59:31 ID:I3cSkCr4
わからないならいいや。めんどくさいし。
113名無し名人:2008/11/23(日) 00:23:26 ID:GDvf30T+
他人が何かを分かってないなと思う時は
分かってないのはもしかしたら自分の方かも知れないな
と一度は考えてみる癖を付けましょう。

恐ろしい事にその予感はかなりの高確率で正しいのです。

理解度が違えばその理解度なりの「正しさ」も違ってくるので
往々にして話がずっーと噛み合わなかったりもしますが。
114名無し名人:2008/11/23(日) 01:13:02 ID:mOyNczsg
115109 = 111:2008/11/23(日) 01:25:26 ID:x/G63Lhm
>>112
遠慮なく言えば、
>>103とか>>107はalpha-beta探索の原理が分かってないように見えるし
>>105はちゃんと分かっている人の様に見える
わざと無知を装っているのでなければだけど

しかしもし何か考えていることがあるなら説明してくれるとうれしい
(正直言えばあまり期待してない)
116107:2008/11/23(日) 04:34:15 ID:BbJY+tng
やっぱり反復深化について勘違いしているようにしか見えない。
一度実装してみればわかると思うんだけど。
117109:2008/11/23(日) 04:50:10 ID:x/G63Lhm
一応、alpha-betaは実装したことあるし、
反復深化っていう意味だったら、ゲームじゃないけどIDA*とかも実装したことあるんですけども

何か説明間違ってましたか?
118107:2008/11/23(日) 05:07:19 ID:BbJY+tng
alpha-beta探索を一応実装した程度の人に、俺は原理が分かってない、
とまで言われたのか。
これ以上説明しても無駄な気がする。じゃ。
119名無し名人:2008/11/23(日) 11:25:18 ID:nYAVaAoS
反復深化なんて普通のアルファベータをループで回すだけじゃん何言ってるの?
これはチェスのソフトの当該部分だけど

// iterative deepening

for (depth = 1; depth < DepthMax; depth++) {
120名無し名人:2008/11/23(日) 12:43:41 ID:GDvf30T+
>118
これ以上説明してもってあなた、まだ何も説明してないじゃない。
相手が何か、重要な事を見落としてると本気で思って指摘までしてるなら
それを説明するのが礼儀ってものじゃないでしょうか?

どうせ分からないだろうから言わないではただの逃げ。
121名無し名人:2008/11/23(日) 14:16:02 ID:M69vibnG
118じゃないけど
αβ探索の問題点は(静的)評価関数の精度に全面的に依存してること
評価関数に矛盾があると最適解を刈ってしまう
なので(囲碁を含む)良い評価関数が作りにくい問題では使えない
MCTSならこれを避けられる
#一般的にどちらが優れてるという事ではない
122名無し名人:2008/11/23(日) 14:21:01 ID:xJMmkOpv
何度実装しても分かってない人も居るし、
一度実装しただけで分かる人も居る。
ようはセンスなんだよね。
107 人に簡単に説明出来ない程度にしか理解していない。
何度も実装したことある実績なんて自慢にならないね。
123名無し名人:2008/11/23(日) 14:21:26 ID:mOyNczsg
そんなことがいえるなら巡廻セールスマン問題が簡単に解けるよ。
ばかじぇね?
124名無し名人:2008/11/23(日) 14:52:38 ID:GDvf30T+
>121
それは「必要な枝も刈る可能性」の方の話題だと思うが、
MinMax探索を適当な深さで打ち切る(末端局面まで探索しない)限り、
どうやっても起きる問題でαβや反復深化を使用する事には
無関係な話だと思う。

評価関数が完全にはほど遠い状況ではどうしても起きる問題。

>107の書き方だと「反復深化」手法が実装しだいでは余分な問題を
起こすかのように読めてしまう。

と言うか「反復深化に関する説明が間違ってる」と言う言葉に
それ以上の説明が全く無い。これで何をどう理解しろと?

>104が「読む深さを増せば(評価関数がそれなりなら)だんだん
正しい手を指すようになる」と言う原理と言うか経験則の例に
反復深化手法を持ち出したのは必ずしも適切では無いかも知れないけど。

反復深化手法は読む効率を上げたり、考慮時間の制限のために途中で
読みを打ち切らなければならない時でも掛けた時間なりに良い指し手を
得るためのテクニックだからね。
125名無し名人:2008/11/23(日) 15:08:20 ID:/OYi2AI7
指し手とか言う奴は出ていけよ。
根本的に囲碁がわかってない。
126名無し名人:2008/11/23(日) 15:11:43 ID:GDvf30T+
>125
あ、ごめん。
俺は将棋の方でプログラム書いてるもんで、ついね。

でもαβや反復深化のテクニックを使うのに囲碁かチェスや将棋かで
何か違いあるのか?
127名無し名人:2008/11/23(日) 15:30:09 ID:AgGgK9sH
何か違いある
囲碁は、指し手生成や評価が難しい
飛車を取る手などは高確率で実現するが、囲碁はあまり高確率の手がない。
128名無し名人:2008/11/23(日) 16:14:14 ID:mEgFsUSe
難しいことを言っててもさ、ソフトを作れないなら、ただの評論家じゃん。
129名無し名人:2008/11/23(日) 16:37:11 ID:GDvf30T+
>128
それはそうかも知れないが、それってこのスレの存在意義の否定、
読む意味も無いって事になりゃしないか?
130109:2008/11/23(日) 16:38:07 ID:x/G63Lhm
>>104 の説明は、その上の人に理解してもらえるように書いたので、
不正確なのはその通りですよね

正しい、ってことと反復深化は何の関係もなくて、alpha-betaで最初から
深さを大きくとってやれば、反復深化とは関係なく正しい結果が得られるはずです
でも、囲碁の場合は深さをどれくらいにすればいいのかが難しいので、
説明がめんどくさかったということです

囲碁には将棋の詰みのようなわかりやすい基準がないので、
そもそも人間にも終局がいつなのか分かりにくいわけで、
何も終局判定の基準がないと、
同型反復禁止のルールだけを頼りに終局判定をすることになって、
そうすると深さ10000手とかじゃとても足りなくなります

たとえば、中国ルール+Benson's algorithgm とかを使えば、
深さ1000もあれば十分かもしれないですけど

などと言うことを書いても、たぶん>>103の人には理解されないんじゃないかと思ったので
適当にはしょった説明をしたわけです
131名無し名人:2008/11/23(日) 21:55:00 ID:mOyNczsg
>>130
詭弁はほどほどにしておけ。自分の間違いは素直に認めるべき。
説明になっていないよ
132名無し名人:2008/11/24(月) 20:17:29 ID:G6t2dD0M
>131
「二人零和有限確定完全情報ゲーム」って知ってるか?
133名無し名人:2008/11/24(月) 21:07:24 ID:G6t2dD0M
ちなみにそれに分類されるゲームはルール上可能な任意の局面における結論、
すなわち先手勝ち、後手勝ちあるいは引き分けかが理論的に決定できる。
そこから双方最善を尽くした手を打った(指した)としたらね。

つまり勝ちのある側には相手がどう応じても勝てる必勝手順が存在する。
その局面の結論が引き分けなら相手がどう応じても少なくとも負けない
(引き分けにできる)手順が双方に存在する。

したがってその分類に入るゲームは初期局面からの結論
(勝敗)が実はやる前から着いている、理論的にはね。
134名無し名人:2008/11/24(月) 21:31:44 ID:mT2kP+bL
前提にしているのが全手読みなんだから、
その総計算の半分も読めていないのに、全手のように語るバカってw
135名無し名人:2008/11/24(月) 21:44:07 ID:G6t2dD0M
>134
数学的帰納法とか素数が無限個ある事の証明とか知らない?
数学の証明とはそういうもの。

相手が例え無限であっても理論的に証明できる事もある。

全部の手および局面を読んでみないと結論そのものは分からないが、
結論が先手勝ちなのか、後手勝ちなのかあるいは引き分けなのか
対戦前から実はどれかに確定していると言う事は証明できる。
136名無し名人:2008/11/24(月) 22:16:51 ID:G6t2dD0M
もし囲碁やチェス、将棋に上に書いたような性質が
存在しなかったとしたら、盤上の情報だけを
元にした先読みは無意味なものになるだろう。

つまり、常に対戦相手の癖、好み、思考、作戦を
さぐり合うばかりで定跡も読みもさして重要ではない
ゲームになってしまう。

結局は相手の裏をかく事がすべてのゲームになる。
137名無し名人:2008/11/24(月) 23:08:02 ID:G6t2dD0M
囲碁や将棋のプロはそのなかなか得られない最善手を
探し続けている存在だと言う事もできる。

彼らはそれを棋理と呼ぶ。
138名無し名人:2008/11/24(月) 23:37:37 ID:pnHcQV4j
さらに言えば,最適化問題というのは(プランニング等も含む)
本質的にそういうものだろ
139名無し名人:2008/11/24(月) 23:44:37 ID:/x20cu6g
いずれにしても強いプログラムを作れない口だけ達者な理論家は
あまり信用できない。
140名無し名人:2008/11/24(月) 23:50:07 ID:/x20cu6g
あ、一般的な話だから気にしないでねw
141名無し名人:2008/11/25(火) 00:16:19 ID:VfywPXKj
>138
最適解が存在する事は分かっているが、
それを実際に知る事が非常に困難なので
実用上は近似最適解で我慢している
と言う点ではそうだね。

>139
別に私の事を信用してもらう必要はない。
ただ、自分の頭で真剣に考えて欲しい。
私はそのための材料を提示しているだけだ。
自分の頭で考えなければ納得が行くはずもない。
142名無し名人:2008/11/25(火) 08:51:37 ID:3nXf8O6c
所詮は評論家
14374:2008/11/25(火) 17:49:33 ID:LgsLl72P
なんか荒れてますね 俺のせいですんません
ほとんど身内なんだから仲良くしませんか
144名無し名人:2008/11/25(火) 22:35:23 ID:VfywPXKj
>143
そう? そんなに荒れてるとは思わないけど。
当たり前の事を長々と書くなと言う意味だったら申し訳ない。

145名無し名人:2008/11/25(火) 23:02:52 ID:5mnFr6E0
あまり長いものは読まなければいいと思うよw
146名無し名人:2008/11/26(水) 02:33:21 ID:zqMWglkP
自分が考えたことが正しいかどうかは
(例えば)プログラムを作って確かめるのが普通だと思うのだが
そういうことをしない人もいるのだろうか?
147105:2008/11/26(水) 06:33:56 ID:fIawcp+d
>>107
君の基準でいくと全探索でもしないかぎり必要な枝がかられちゃうわけだね
評価関数の意味から考えたほうがいいよ
反復深化を簡単にいうと深さを増やしながらαβするようなもんで
あいだあいだでmove orderingした結果,枝がかりやすくなるって意味ね
いまある評価関数でαβして枝刈りやってるんだから必要な枝がかられるとかは意味が分からない
148名無し名人:2008/11/26(水) 08:18:52 ID:7pbORTWh
開発者か研究者かなんか知らんが、こんなとこで屁理屈こねて
油売ってるから日本はだめなんだと思うよ。
149名無し名人:2008/11/26(水) 09:05:51 ID:fIawcp+d
金にならん研究だからな
大半は趣味でやってるだけ
国レベルで考えてるのは北朝鮮くらいだろ
あと>>148
150名無し名人:2008/11/26(水) 12:17:30 ID:BiXvy6yk
>>148
自分で何もできないニートがシッタカの知識で俺絶対だと主張しているのに
すぎない。
>>147
平均的な評価と、アンバランスな実体を1つの評価式で絶対だと言うのは
愚かだと思わないか?
単純読み数だけで評価できるのなら羽生が悪魔的な技を使うとか
評価されないわけで、そもそもその名人級の域の勝負の理もしらない
奴がなにをいっても、素人の域の話だろ
151名無し名人:2008/11/26(水) 12:50:52 ID:tVnzbmmd
馬鹿の振りをしてるようだけど実はプログラマなんだろ>>150とか
152名無し名人:2008/11/26(水) 17:41:52 ID:zqMWglkP
>>121でFA
153名無し名人:2008/11/26(水) 18:03:51 ID:tVnzbmmd
評価関数に矛盾って表現が意味分からない
評価関数に誤りがあっても最善手順を通る可能性は普通にあるし
ただそれを最適解として選ぶかどうかは別だけど
154名無し名人:2008/11/26(水) 18:19:57 ID:h3dimWy2
>>153
最善手順を通るだけじゃダメでしょ、それを最善手として選択してくれなければ

もし評価関数に全く矛盾がないなら、1手読んでどれがいいか調べれば
最善手が打てる/指せるということだから、ここから先は机上の空論になっちゃうけど、

仮にそういうものがあるとして考えれば、
探索を途中の深さで打ち切っても、最善手順を、
「それが最善手順だという証明付きで」求めることができる
というのがmini-max探索の原理なわけだし
155名無し名人:2008/11/26(水) 19:26:52 ID:BiXvy6yk
だから最善手というのは勝敗が決まらないと判断できないわけ。
その目の前の有利という最善手が勝敗で言う最善手だと誤解している
ところが知能が低い奴の浅い思考というはなしだ。

1手先の最善手は最悪手な可能性がある。それは可能性であって。
どんな評価関数であっても最善手を選ぶ可能性が高くなるだけで
ゲームの勝敗を決める最善手ではないことは明らかだろう。
目の前の勝利と最終的な勝利の違いすら分からないのってゆとり教育?
156名無し名人:2008/11/26(水) 19:39:32 ID:h3dimWy2
>>155
そんなことは、自分も含めてみんな百も承知だよ
単に、「原理的に」二人ゼロサム完全情報ゲームは、(あと有限とか確定とか付くけど)
mini-max探索で末端まで読み切れば最善手が求まる、という話だ
(ゼロサムじゃないゲームや多人数ゲームは、読み切っても最善手が求まるとは限らない)

囲碁や将棋では全部読み切るのは不可能に近い、というのも当然理解している
当たり前だから言ってないだけで

ちなみに、上の方で話に出てるalpha-beta探索の話はこれとはちょっと違って、
mini-max探索だと全部の枝を読むことになるけども、
alpha-beta枝刈りをすれば、探索時間を大幅に短縮しつつ、
mini-maxと同じ結果を得ることができる、という話なのだが

つまり、「正しさ」の意味が文脈で違ってて、
 mini-max探索の場合:もし完全に読み切れれば最善手が求まる
 alpha-beta探索の場合:(たくさん枝刈りをしてるのに)mini-maxと同じ結果が求まる
 モンテカルロ木探索の場合:時間をかければ最善手にいくらでも近づける
という感じかな

そこらへんは理解してますか?
157名無し名人:2008/11/26(水) 21:35:21 ID:phed+EAV
だからさぁ、いい気分で屁理屈こねてないでCSより強いソフト作って持ってこいよ。
それが他者を納得させる最も有効な方法だと思うよ。
どうだ俺はこんな強いソフト作ったぞ、文句あるか?でいいんだよ。
それができない知識なんて紙屑同然だろ?一歩理論にも通じる部分がある。
158名無し名人:2008/11/27(木) 01:47:42 ID:6rnfEMr0
>157
なんつーか、権威主義だねぇ。

気持ちは分からんでもないが(私も竹内薫の物理学の一般向け解説書を
見るとお前に何が分かる?と言いたい気分になる)
こんなところで強いソフトを開発した実績のある有名な開発者が
実名を晒して発言するわけも無いだろう?

今、発言してる人ももし開発が成功して強いのが作れたらここでは
二度と発言しなくなるさ。少なくとも決して名前は出さないだろう。

変にもめたら評判が傷つくし、自分のブログと違って責任も取りにくいし。
159名無し名人:2008/11/27(木) 02:07:19 ID:GxF57VVm
>>158 勝ち
>>157 負け
160名無し名人:2008/11/27(木) 02:17:20 ID:hldjwQxy
MCの研究はまだ始まったばかりであって
強いプログラム作れだのわめいてるのはどうかしてると思います 終
161名無し名人:2008/11/27(木) 02:39:58 ID:6rnfEMr0
>157
本当に開発者の話が聞きたかったら情報処理学会の
「ゲーム情報学研究会」と言うのに参加すると良いよ。
情報処理学会の会員でない者も個人会員になれて論文が読める。

ttp://sig-gi.c.u-tokyo.ac.jp/

開発者や研究者の生の声や発表が聞きたかったらGPW
(ゲームプログラミングワークショップ)に参加するのが一番だが
今年のはついこの間(11月上旬)開催されて終わったばかりだ。

次のイベントは来月のUEC杯コンピュータ囲碁大会だね。
ttp://jsb.cs.uec.ac.jp/~igo/2008/
興味があれば誰でも見に行けるはずだよ。
162名無し名人:2008/11/27(木) 07:08:29 ID:wwadsHho
越田正常の戯言並みの、低レベルなスレですね。
163名無し名人:2008/11/27(木) 20:11:03 ID:SrOJqkVX
>>158
あたり前。
2chに入り浸って無駄に時間を浪費してるような人はたとえ一生かかっても
そんな素晴らしいものは出来まいという前提の上での皮肉だと思う。
164名無し名人:2008/11/27(木) 21:02:01 ID:pmQ/dfoW
結局、勝てない理由は処理時間じゃなくて評価関数の問題だろ。
まずは勝ててからだ、そこそこ強くなったから
まぐれ勝ちはあるだろうが、所詮は同じアルゴリズム
対戦して人側が癖を学べばいいだけの話さ
165名無し名人:2008/11/27(木) 21:53:26 ID:6rnfEMr0
>163
ハイハイ。>157にも言えると思うがそんなに無駄だと思うなら
このスレ読まなきゃ良いんじゃないか?

>164
い、意味が分からん。
166名無し名人:2008/11/27(木) 23:29:46 ID:wIrZBp1b
このスレの話題は、CrazyStoneがなんで強いのか、ってことなのに
(ついでにαβがどういう原理なのか、とか)
それに対して>>157みたいな反応が返ってくる意味が分からん

どうも>>90あたりから始まってるようだが、つまり自分の理解するところだと
このスレの流れはこういうことだね

『趙治勲の強さを語ろう!スレ』
A「アホか、治勲なんて強くねーよwww」
B「いや、強いよ、大三冠取ってるし、タイトルも多いし…」
A「はぁ?じゃあ趙治勲に勝ってみろよ、2chなんか見てないで」
B「( ゚д゚)ポカーン」
167名無し名人:2008/11/27(木) 23:39:24 ID:DMcunDna
研究者とか開発者って寸暇を惜しんで、というより身を削る思いをして頑張ってるものだよ。
そうでなくては、世界レベルの最先端で戦うことはできない。
それでも何年も努力してきたことが鼻先ひとつ先を越され一瞬で水泡に帰するような厳しい世界。
なんかそういう部分で甘さを感じるんだよ。こんなところで何を力説しているんだ?みたいな。
頑張るべき場所が違うと思うよ。後塵を拝している現状を認めてしまっているのかな。
168名無し名人:2008/11/27(木) 23:48:48 ID:6rnfEMr0
>167
いや、だからさ、
そんな最先端の研究者や開発者が(主に?)ここに書いていると言う
前提自体が間違ってると思う。

コンピュータ将棋だってコンピュータ囲碁だって一握りのトップの周りには
大勢のアマチュア開発者やその他大勢やらが居るのだよ。
ちょっと齧っただけの奴とか(私もそのひとり)。

そういう趣味でやってる人間の楽しみをあれこれ言われる
周りから謂れは無いと思うが。トップか然らずんば黙れみたいな事をね。
169名無し名人:2008/11/27(木) 23:54:58 ID:6rnfEMr0
頑張りたかったら自分で勉強なり、研究なり、開発なり頑張ってくれ。
頼むから!
170名無し名人:2008/11/28(金) 01:18:09 ID:9nwfOFGb
よくわからんが、従来型の探索&評価方式よりモンテカルロ使ったほうが
今後は強い囲碁ソフトが開発される可能性が高いとみてよろしいか。
171名無し名人:2008/11/28(金) 01:31:38 ID:v3P56AUb
まだ最初の論文が出てから2年半ですが、1年以上前にすでに
強さは逆転してます

今後、従来型の囲碁ソフトがモンテカルロ木探索を使ったソフトを
逆転することは無いでしょう
172名無し名人:2008/11/28(金) 02:43:29 ID:olWCunuP
ないと言い切るのはちょっとあれかなって思うけどね
強くすることが人間のトップに並ぶっていうことなら
今のモンテカルロの打ち方より,従来手法のほうが人間らしさでいえばまだましだから
従来手法といかに組み合わせるかですね これからが楽しみだ〜
173名無し名人:2008/11/28(金) 04:17:19 ID:v3P56AUb
ああ、そうですね、全く無いとは言い切れないですけど、
でもモンテカルロ木探索と組み合わせる方が簡単なのは確かだと思います

ちなみに、10月にあったコンピュータオリンピックの囲碁部門で優勝したのは
従来の知識とモンテカルロ木探索を組み合わせたプログラムだったので、
過去の蓄積がモンテカルロでも役立つって言うことは言えると思います

正直言えば、過去の知識をうまく生かした人が優勝してちょっとうれしかったですね
174名無し名人:2008/11/28(金) 04:26:13 ID:olWCunuP
Many Faces of Goですっけ?
175名無し名人:2008/11/28(金) 14:53:20 ID:8sncMdNj
プログラムすら作れない香具師があつまるスレ。
おれスゲーも根拠は脳内
176名無し名人:2008/11/28(金) 16:33:21 ID:rNa4Ui/I
それでも,ここを見て「一丁俺も作ってみるかっ」て人が少しでも出れば
と思って書き込んでいるのだが
177名無し名人:2008/11/28(金) 20:25:52 ID:z9XYueF9
作ってみるかっと思ってスレをのぞきはじめたのですがなかなか手が出ないでやんす
178名無し名人:2008/11/28(金) 21:08:34 ID:s1aAXhFS
>>166の的確さにわろた。

プログラム板のお前ら最強の〜プログラムしてみろよスレなんかだと、
愚にも付かない俺アルゴリズムをさらしたときに>>157見たいな反応が
返ってくることがあるけど、モンテカルロ木探索がそうだといいたいのかな?





179名無し名人:2008/11/28(金) 23:39:48 ID:gaN5kEo+
俺は作り始める前に2chのそれ関係のスレを読んだり、
疑問をぶつけたりしてずいぶん役に立ったよ。
普通の(モンテカルロでない)将棋の方だし、
まだ作ってる途中だけどね。

モンテカルロ将棋は試してる人も居るみたいだけど
なかなか難しそうで俺にはまだ手が出せないな。
180名無し名人:2008/11/29(土) 00:22:22 ID:UeowqOK6
ことしのGPWでモンテカルロ将棋の発表がありましたよ
181名無し名人:2008/11/29(土) 00:34:20 ID:dTq9XcOj
モンテカルロ将棋 ×
やるやつ ×
182名無し名人:2008/11/29(土) 00:36:52 ID:dTq9XcOj
連続駒損して、かなり勝ちにくい局面であっても詰ませば勝ち。
モンテカルロでは、ほとんど勝てないけど、詰ませる手順が存在する場合が読めない。
183名無し名人:2008/11/29(土) 01:00:05 ID:UeowqOK6
それは詰め探索と併用すれば解決すると思いますが
184名無し名人:2008/11/29(土) 01:02:54 ID:UeowqOK6
まぁそれでも将棋は評価関数が高性能だから
必要ないといえば必要ないですが
185名無し名人:2008/11/29(土) 04:00:36 ID:ZJz1HHkG
想像してみてください

■あなたが某国の指導者だったらどうしますか?■

・オリンピックも終わり、景気もピークを過ぎた
・ふとみると、繁栄する沿岸部と貧困にあえぐ農村部の格差。社会不満の増大
・永らく続いた一人っ子政策のために数千万人〜1億人の無戸籍・無国籍の子たち
・戸籍があっても6〜7億人は餓えに苦しむ。一触即発の国内不安


■そのとき隣国が■

・なんと世界第二位の経済大国が、「この者は19歳11月である」という公証さえ持参
 すればいくらでも国籍をあげます、という法律を通した!
・国籍には参政権がもれなくついてくる!輪転機を回して5000万枚の年齢公証を
 印刷するだけで、隣国を合法的に支配下に置くことが可能となった!軍隊全く動かさず
 血を一滴を流すこともなく!
・しかも、隣国では、自国農村部の10年分くらいの生活保護費が毎月貰える!


■あなたが指導者ならどうする?■
<選択肢A> 輪転機ぶん回して、5000万枚の年齢公証出して、農村部の貧民を
          フェリーに満載して隣国に送り込む
<選択肢B> なにもしない。国内で農村の貧民層が武装蜂起するのを座して待つ


【外国人激増】国籍法改悪案の反対【日本破綻】★29
http://changi.2ch.net/test/read.cgi/ms/1227861008/
186名無し名人:2008/11/29(土) 10:51:48 ID:hTeZrvdu
よくわからんがわかることはスレチということ
187名無し名人:2008/11/29(土) 10:57:27 ID:kDf9wRaj
スレチ&マルチだな
188名無し名人:2008/11/29(土) 12:18:49 ID:yQxX3iqQ
狭い範囲の手筋を見出すのに有力な手法って事?
後は盤面が広い序盤や中盤の判断か。

189名無し名人:2008/11/29(土) 16:52:34 ID:7B6Wfq4d
今のMCTSは勝てる手の比率が高い局面を選ぶ傾向が強いので
細い一本道の勝筋みたいなのは苦手なのよ
190名無し名人:2008/12/02(火) 00:35:38 ID:hehnUdsq
全手計算できない時点の最善手など、
1000年動くから永久機関だと主張するのと同じ。

現実に全数手にははるかに及ばない。1%も計算できない罠。


191名無し名人:2008/12/02(火) 17:36:49 ID:uy8nBYvN
はいはい 分かった分かった
192名無し名人:2008/12/02(火) 18:29:19 ID:kROKsN4I
>190
完全に読まなければ本当の意味の最善手では無い。
飽くまで探索した範囲内での不完全な評価関数
(評価関数を用いているならば)を元にした
最善手に過ぎない。

いわばかっこ付きの「最善手」。
つまり真の最適解から見ると非常に荒っぽい
近似解に過ぎない。

で、それがどうかしたの?
そんな事は皆、話の前提として分かっている事なんだが。
もしかして今のところ自分だけが知っている
新発見だとか思ってないよね?
193名無し名人:2008/12/02(火) 18:47:28 ID:uy8nBYvN
ほんとにね
だから仮の最善手としてプロの棋譜つかって学習とかやってるわけなんだが
194名無し名人:2008/12/02(火) 19:09:10 ID:jM2+mUAN
教科書を読めば勝てると193は申しております。
次もすべて同じ結果になると193は思い込んでいます。

何故ならプロの棋譜は最適解だと思い込んでいるからです
195名無し名人:2008/12/02(火) 19:12:45 ID:d0ihLx8M
たぶん枝切りの段階で捨てられたものの中に真実が埋まってる
可能性もあるねw
196名無し名人:2008/12/02(火) 19:14:20 ID:kROKsN4I
>190
あー、でも最善手を実際に知る事と
それがある事の証明(存在証明)は別だよ。

それが何であるかを実際に知る事は事実上不可能でも、
それ(最善手)の存在は理論的に証明できる。

どうやっても負けしか無い側でも負けを最大限に
引き延ばす手と定義すれば最善手がある事になるね。
197名無し名人:2008/12/02(火) 19:29:59 ID:kROKsN4I
>194
プロの棋譜を元に学習させるのはチェスや将棋では良く行われている手法。
>193は多分、将棋でのボナンザメソッドを意識した発言だと思う。

この手法が面白いのは最善手(プロの指し手)は最も
局面の優劣に変化が無い手だと仮定されている点だね。
198名無し名人:2008/12/02(火) 19:42:10 ID:uy8nBYvN
>>194
仮と書いているわけだが
延々と全探索すればいいと思います
囲碁ならまずは1−1から調べるといいね
小目から調べるほうが効率いいと思いますけどね笑

>>196
k-in-a-row gamesの証明とかですね

>>197
ボナンザメソッドもそうだし
CSも着手の特徴のeloレートを棋譜で学習してますね
199名無し名人:2008/12/02(火) 20:58:43 ID:szaH6lKT
囲碁で全探索とかいってるやつまじきちだから放置でいいよ
200名無し名人:2008/12/02(火) 21:17:01 ID:YgkaC07B
囲碁は将棋よりシビアだろう。
一度劣勢(中押し勝ちなど)の局面になればどうやっても勝てないはず。
しかし、将棋はプロが劣勢だと判断しても、まだ決まらないばす。王を取ればいいからな。
201名無し名人:2008/12/02(火) 21:23:02 ID:t8JRjclL
囲碁の手順の数なんて高々361!程度だろ。所詮は有限だ。
全ての手順をチェックして最善手を見つければいいだけじゃん。
でも、そんな単調作業をやるほど俺は暇じゃねーからさ、
人間どもにやらせておくわ。

by 神様
202名無し名人:2008/12/02(火) 21:25:16 ID:ncVfeRD+
大コウで一発逆転とか全く無いわけじゃないけどな
203名無し名人:2008/12/02(火) 22:49:52 ID:szaH6lKT
それも含めて劣勢だけどな
204名無し名人:2008/12/02(火) 22:50:40 ID:mz9TiosO
将棋の終盤はおもしろいよな
囲碁も終盤が楽しめるようになれば上達すんのかな
205名無し名人:2008/12/02(火) 22:54:00 ID:szaH6lKT
囲碁は終盤にいくまえにたいてい終わるから
そういう意味では中盤が面白いのかもね
206名無し名人:2008/12/02(火) 23:31:59 ID:kROKsN4I
将棋は逆転の起こりやすいゲームだからね。
9割9分勝ちでも最後の寄せでミスすれば逆転される。

最後に大きなミスをした方が負けると言う
優勢になっても全く油断できないゲーム。
207名無し名人:2009/01/20(火) 12:58:17 ID:S6rRIbMH
もう御終いなの?
208名無し名人:2009/01/20(火) 23:05:10 ID:55QMDbZv
今は話題が無いんでしょ?
なんか、また面白い話題が出て来たら続くでしょ。
209名無し名人:2009/01/23(金) 01:16:01 ID:tki5hewx
学習したデータに無い領域になると極端に弱くなるのがこの手の

プログラムの糞的な仕様だろ。

どんなに対戦させて学習させても、対戦に無いような手法には無力。
210名無し名人:2009/02/03(火) 07:59:41 ID:oNRJyfNH
5路 完全解析 
211名無し名人:2009/02/04(水) 17:20:28 ID:4w6+ChWf
学習データに依存するAIなら、学習しえない手順では遥かに
人の読みパターンに劣るってことが証明されたようなものじゃん

どこが強いんだよ、最弱だろ。
212名無し名人:2009/02/04(水) 18:09:07 ID:5r0mhLOT
>>209 >>211
なんか、モンテカルロ法を学習する手法と勘違いしてないか?
213名無し名人:2009/02/04(水) 19:48:31 ID:Hcxoz2hI
力いっぱい勘違いしてるとオモワレ。
もしくははただの釣り。
214名無し名人:2009/02/05(木) 00:15:45 ID:gi1UJwqP
必死だな
215名無し名人:2009/02/05(木) 03:06:47 ID:QL662sXm
俺も209,211は釣りのような気はするが

>>212
なんでそう思った?
216名無し名人:2009/02/09(月) 02:54:31 ID:mWHtuasc
>>215
よくわからんが、学習しないモンテカルロ法のAI囲碁アルゴリズムて
どっかで作ったのがあるの?
217名無し名人:2009/02/09(月) 08:25:31 ID:mJtchGPi
学習するモンテカルロ法の囲碁ソフトなんてあるのか?
218名無し名人:2009/02/11(水) 12:03:11 ID:q3Z/3OQq
>>217
学習しないとなると学習によって間違えを修正できないということですね。
つまり行動は100%固定になる。
219名無し名人:2009/02/11(水) 12:22:57 ID:tfpwXgL6
>218
いや、普通乱数を振ったりして一局ごとに打つ手を変える。
220名無し名人:2009/02/11(水) 12:44:04 ID:EhJLIPtd
乱数使わないとモンテカルロ法じゃないよね
221名無し名人:2009/02/11(水) 12:46:41 ID:F/wJDw/Y
モンテカルロのやっている探索を非常に短期的で揮発的な学習と捉えることもできなくはないが、
普通学習とはあんまり呼ばないわな。
222名無し名人:2009/02/11(水) 13:17:56 ID:YzbCIs+F
探索には相手の意志が介在しないから学習というより読みだね。
現実的には探索結果の良好な上位5つくらいから乱数で傾斜つけて選択するとか
そういう感じがいいんじゃないかな。
223名無し名人:2009/02/11(水) 23:25:54 ID:q3Z/3OQq
>>222
それって学習そのものでは?
224名無し名人:2009/02/11(水) 23:27:05 ID:q3Z/3OQq
>>219
判断ができない要素に乱数を使っては、それは最善手ではないね。
行き当たりを運に任せているのをアルゴリズムというのはいただけないな
225名無し名人:2009/02/12(木) 00:18:55 ID:XUKCF6x9
乱数を使うアルゴリズムって普通にあるだろ・・・

相手しちゃいけなかったかな?
226名無し名人:2009/02/12(木) 00:43:06 ID:69cqFJ9u
>>224
本当の最善手を求めるってのとゲームとして実用的な手を求めるってのは微妙に違う要求だからね。
着手の質を落としてでも時間内に計算させることはちゃんと意味のあることだよ。

227名無し名人:2009/02/12(木) 04:57:08 ID:jsRIc7m9
>>218
>>219の言うように乱数を使うから、100%固定ではないけど、
学習するわけじゃないから、強さはバラツキはあるけど固定だよ。
強くするためには、沢山の探索をするとか、無駄な探索を省くとか、
コンピューターの進化やプログラマの努力が必要で、
自発的に強くなったりはしない。
>>209, >>211もそこのところを勘違いしてるのだろうけど。

>>223
過去の対局から学ぶのが学習で、
今の対局の先がどうなるか考えるのが探索。
普通のモンテカルロ法は探索において過去の対局の
情報を使ったりはしないから学習とは言わないよ。
228名無し名人:2009/02/12(木) 16:05:17 ID:I17sQaN/
オフラインの学習ならMoGoもCrazyStoneもやってるけどね
229名無し名人:2009/02/12(木) 17:15:22 ID:MMPvYCXA
棋譜データの分析して、分析結果を盛り込んでプログラムを改良することを「学習」と呼ぶのなら、
すべての囲碁プログラムは「学習」していることになる。
しかし、まあ、そんな用語の使い方をするのはお主だけだろう。
230名無し名人:2009/02/12(木) 22:02:01 ID:I17sQaN/
人間がプログラムを改良するのではなく
自動だから
231名無し名人:2009/02/12(木) 22:56:58 ID:69cqFJ9u
>>230
へー、それは知らなかった。
学習した結果をどういった形式で蓄えてるか、もし知ってたら教えて。
232名無し名人:2009/02/12(木) 23:56:15 ID:ow696H+q
>>229
そう、「学習」してるんだよ。
そしてそれを「学習」と呼ぶのは一般的なんだよ。
勿論他にも呼称はあるけどね。
233名無し名人:2009/02/13(金) 02:56:46 ID:JDfCoyib
>>231
CrazyStoneは色々な特徴の重み(強い人の棋譜から)
MoGoは色々な大きさのローカルなパターンの重み(自己対戦で)
学習方法やどう使ってるかなど詳細はこの辺りの論文嫁
ttp://www.geocities.jp/hideki_katoh/
234名無し名人:2009/02/13(金) 04:05:49 ID:hO1xKkSm
>>209 >>211
学習したデータ通りにしか打てないなら、
確かに学習データに当てはまらない場合は弱くなるだろうけど、
読みの参考にするだけなら弱くなるとは言えない。人間と同じ。
そもそもモンテカルロ法は読みの部分の話なので、
学習に関しての批判は的外れ。
235名無し名人:2009/02/13(金) 08:21:02 ID:sgoIizu6
>>233
きみの主張を裏付ける論文はそのページには載っていない
236名無し名人:2009/02/13(金) 12:57:32 ID:JDfCoyib
Referenceもチェックしたか?
237名無し名人:2009/02/13(金) 13:40:29 ID:sgoIizu6
お前自身では参考文献を見つけられなかったわけだ
要するにお前の主張に根拠は無い
238名無し名人:2009/02/13(金) 18:13:54 ID:ER6nyFz2
>>234
これって誰が正しいの?お前も嘘つきだろ?

>そもそもモンテカルロ法は読みの部分の話なので、
詭弁にすぎない。ここはAI囲碁ソフトスレでモンテカルロがおまけに過ぎない。
おまえは言葉を誘導しているだけ。

普通の2chのクソの書き込みに等しい、ソースぐらいつけて発言しろよ。w
>>237
あなたの言うとおり、単なる吠え合いと根拠付きではデタラメと真実の差ぐらい
信用度が違うよな。w

他人の発言をたたくなとか言う奴もいるだろうが。
言った奴にはそれを通す為に、その説明責任はある。そのぐらい道理ってもんさ
根拠付きで説明できないなら、犬のカリントウと同じってことさ。
239名無し名人:2009/02/13(金) 19:13:42 ID:VnaPd3IB
ここは革新AI囲碁ソフト『Crazy Stone』のスレなので他の話はしないでください
240名無し名人:2009/02/13(金) 23:58:25 ID:JDfCoyib
言葉尻,重箱の隅,観念論は不要
241名無し名人:2009/02/14(土) 01:39:57 ID:5f5Qq+vI
>>238
ここまでくるとすごいな
242名無し名人:2009/02/14(土) 03:14:32 ID:X6TP0pET
やっぱり、うっかり触っちゃいけない人だったようで。
243234:2009/02/14(土) 04:42:23 ID:oQXMRGKI
いや、モンテカルロの話をしてるわけではなかったのなら、
彼は別におかしくはないんじゃないか。無知なだけで。
あまり詳しくなくて、モンテカルロ法も知らない人が、
コンピュータ囲碁スレではなく、こっちに来てしまって
持論を述べたら、モンテカルロ法のことを言ってると
勘違いされた(笑)ってだけのことで。
確かに最初からモンテカルロ法とは一言も言ってないしな。
244名無し名人:2009/02/14(土) 04:50:33 ID:5f5Qq+vI
モンテカルロ法のことを知らないでコンピュータ囲碁スレに書き込もうという時点で
相当アレな人だろ。JK
245名無し名人:2009/02/14(土) 08:50:03 ID:lsu4EOtt
結局のところ、>>233が書いてることは本当なの?それともウソなの?
246名無し名人:2009/02/14(土) 08:55:06 ID:gduKsJge
>>245
うそ。

謀っている。ブラフ、デマカセ、はったり、の類

>>244
シッタカ君ほど何も説明できない愚か者。
247名無し名人:2009/02/14(土) 10:16:04 ID:zQ+UOAlz
Mogo強くなったの?
適当な選び方の方が強いというのもすごいな。
俺もよく分からんけど、ヨセた後の地の数え方とかってどのぐらい正確なのかな。
数目はズレるのか?
248名無し名人:2009/02/14(土) 11:13:24 ID:9vQkd9uh
論文読んでも理解できなかったからといってデタラメ扱いするとか恥ずかしいね。
249233:2009/02/14(土) 11:27:37 ID:+llmck+3
>>245
自分で調べない限り本当の事は分からないわけだが
少なくとも >>246は根拠を出してない
多分論文もまともに読んでないんだろう
MoGoの自己対戦によるパターン学習の話はDavid Silverの論文にある
ttp://www.cs.ualberta.ca/~silver/research/publications/files/local-shape.pdf
>>247
強くなったって,何と何を比べて?
公開版とクラスタ版なら,本体も多少改良されてるけど
基本的に並列度の高さで強くなってる
Olivier Teytaudのサイトに論文がある ttp://www.lri.fr/~teytaud/
終盤の誤差は半目以下
250名無し名人:2009/02/14(土) 12:18:41 ID:lsu4EOtt
突拍子もない主張をしてしまってから、あわてて根拠らしきものを探し回ってる様子が手に取るようにわかる。

> MoGoの自己対戦によるパターン学習の話はDavid Silverの論文にある
> ttp://www.cs.ualberta.ca/~silver/research/publications/files/local-shape.pdf

ざっと目を通すだけでも判るはずだが、その論文はMoGoについては触れていない。

> 少なくとも >>246は根拠を出してない
きみも根拠を出してない。
正確にいうと、きみが根拠だと言って示してるものは根拠になっていない。
自分で読んでから根拠提示すべきだろうね。これは、人間としてのモラルだよ。
251名無し名人:2009/02/14(土) 12:28:58 ID:+gXNmVaR
mogoの序盤のばらまき布石って、mogoが算出した手なのかな。
なんとなく違うような気がする。
252233:2009/02/14(土) 17:11:00 ID:+llmck+3
やれやれ,全然論文読んでないのが丸分かりだな.
なら「UCTでオンライン知識とオフライン知識を組み合わせる」の参考文献になってる "Reinforcement Learning of Local Shape in the Game of Go"
David Silver, Richard Sutton, and Martin Mueller
ttp://www.cs.ualberta.ca/~sutton/papers/SSM-07.pdf でもいいが.
それからCrazyStoneの話は「囲碁の手のパターンのEloレーティングを計算する」な
#単に自分で調べるのが面倒なんでいちゃもん付けたんだろ?
253名無し名人:2009/02/14(土) 18:08:50 ID:lsu4EOtt
> ttp://www.cs.ualberta.ca/~silver/research/publications/files/local-shape.pdf

がMoGoについて一斉触れていないことを教えてあげたんだけど、
完璧にスルーするつもりのようですね。
254名無し名人:2009/02/14(土) 18:20:31 ID:lsu4EOtt
これ以上このスレで遊んでいられないので、
根拠資料を提示しておこう。

http://www.machinelearning.org/proceedings/icml2007/papers/387.pdf

MoGoの開発者のホームページに載ってる資料だから、
知ってる人なら一発でこの資料を提示する代物だ。
>>252が書いてる「「UCTでオンライン知識とオフライン知識を組み合わせる」は
おそらくこの論文の和訳なんだろう。

>>233みたいに該当資料が載っていないページを示して「この辺りの論文嫁」なんて
言ってしまうと、何も知らない奴が「あわてて根拠らしきものを探し回ってる」ことがバレバレですよ。

255233:2009/02/14(土) 18:26:46 ID:+llmck+3
>おそらくこの論文の和訳
ほら読んでないw
256名無し名人:2009/02/14(土) 18:49:54 ID:GpKRCzGS
やけに自信ありげだからもしかしたらと思ったが
ただのゴミだったな
257名無し名人:2009/02/15(日) 01:03:46 ID:aZlKjJGv
>>255
日本語も理解できないようだ
258名無し名人:2009/02/15(日) 07:12:26 ID:Sbz5+W48
>>246
君は上のほうで学習を批判してる人なんだろうけど、
>>233はどちらかというと君の主張の論拠を増す意見だぞw
259名無し名人:2009/02/15(日) 10:35:05 ID:9NDDXQpV
と言うか、なんで内容の議論で無くて
ただの知識自慢になるかね?
260名無し名人:2009/02/15(日) 11:43:58 ID:40gtzQPM
最初から>>254の論文を挙げてれば済んだんじゃないの?
261名無し名人:2009/02/15(日) 22:44:15 ID:aZlKjJGv
>>258
幻想乙、釣りに反応するのは遠慮してくれ。
262名無し名人:2009/02/16(月) 18:00:36 ID:5iKA6wNm
>>259
知識自慢にもなってない。嘘の塊
263名無し名人:2009/02/16(月) 22:29:08 ID:s5+tnVhp
>>259
高尚すぎて誰もわからないジョークとかそういうのじゃない?
264名無し名人:2009/02/16(月) 22:35:30 ID:5iKA6wNm
>>263
そのジョークも誰も理解できない類なの?
265名無し名人:2009/04/08(水) 02:07:04 ID:mDN1u4Lg
学習しないモンテカルロ法はモンテカルロ呆でしかないのは明らか。
行動は予測可能か不可能か、そういう話だ。行動が読める相手なら
あらかじめ戦略を立てることが可能って話になる。
266名無し名人:2009/04/11(土) 06:31:13 ID:Fh2lta7v
学習しないモンテカルロ法て、学習していないパターンについては無力で
その行動パターンは全て対戦するまえに決定されているわけだから
戦う以前にどういう行動になるかは確定済み、つまりそれさえ調べておけば
パターン行動には100%必勝ってことだよな。
学習するモンテカルロ法は、学習する故に高度の学習した相手には勝てない
と証明するようなもの、両方とも学習するもので対戦させれば明白で、
それは高度に学習したほうが勝つ。
それは人が高度に相手の行動を学習しているならば、単純な学習しかできない
低次元の論理学習をする学習パターンでは人の高度な学習パターンには
勝てないという話になる。
どっちにしろ人工知能AIソフトは人のリアル対戦するほど人に勝てなくなる
それは人のほうが高次の判断で学ぶ能力が高いからだろう。
単純学習では限界があるからな。
267名無し名人:2009/04/11(土) 15:34:20 ID:kHkLbE1V
モンテカルロ法について根本的に分かっていないと思われ。
終局まで何度もでたらめに打ってみて一番勝てそうな手を選ぶだけ。
死活とか石の強弱とか考える必要が無いのだし
戦略とか学習とか意味が分からないね。
268名無し名人:2009/04/11(土) 23:56:09 ID:/UR0vBHT
それもちょっと違うな。局面を作るのはばらまきだけど、
評価関数には学習の余地がある。
269名無し名人:2009/04/12(日) 00:45:25 ID:nxBt3h6J
そりゃ君がモンテカルロ法と評価関数を分離して考え切れてないからそう思うのだ
270名無し名人:2009/04/12(日) 01:38:14 ID:BscTl+DH
評価関数がなければ一番勝てそうな手など選べないのだから
分離して考えるのが間違いだよ。
271名無し名人:2009/04/12(日) 01:56:39 ID:nxBt3h6J
個別に改良して再び統合できると言っているだけで
分離することを一方が無ければなどと発想する事が間違ってる
272名無し名人:2009/04/12(日) 02:01:07 ID:BscTl+DH
たしかにその発想は間違ってるけど
誰もそんなことは言ってない。
273名無し名人:2009/04/12(日) 02:09:31 ID:nxBt3h6J
そうか
それはよかった
274名無し名人:2009/04/12(日) 06:59:17 ID:dvg49tgB
大きすぎるmini-maxツリーに対して、

・読む手数を制限して(ツリーの高さを制限して)、
 末端の部分で盤面評価関数を使う。

のが従来のチェスや将棋で使われていた方法で、
囲碁ではまともな盤面評価関数を作るのが大変なので、

・読む手数(ツリーの高さ)を制限せずに必ず終局まで
 読むことにし、その代わり枝の分岐を確率的に選択することによって
 減らす。

のがモンテカルロ。終局まで読んでしまえば盤面評価関数は
要らなくなるということ。

もっとも、短時間でいい手を読む強いプレーヤを作るには、
手を確率的に選ぶときに、「よりそれっぽい手を選びやすい」
ために簡易でも的を射た評価関数のようなものが必要なので、
全く要らなくなるわけでもない。
275名無し名人:2009/04/12(日) 14:22:52 ID:Y0GMYqym
的を射た
276名無し名人:2009/04/12(日) 18:24:25 ID:tZTCYz0T
>>275
的を射たの何が問題?
277名無し名人:2009/04/12(日) 19:15:50 ID:RF1FMidm
褒めてるんだろう
278名無し名人:2009/04/13(月) 05:17:55 ID:TTwk5kB1
総合失調症な奴ほど、ものごとを割り切り
先手必勝の論理にこだわる。

なぜならそれこそ考えるのが容易で合理的だからだ。
まさに無能、
279名無し名人:2009/04/13(月) 10:42:58 ID:fohm9YuA
何の事?
280名無し名人:2009/04/14(火) 10:22:51 ID:7HDmLlcL
なんのことかすら分らないのが1名
281名無し名人:2009/04/14(火) 21:25:00 ID:SG9EdzbV
で、何の事?
282名無し名人:2009/04/16(木) 16:39:13 ID:iHdacLU4
何故かほぼ同じタイミングで同じレスがされる気がする

ウンコ

どうぞ↓
283↑鏡:2009/04/16(木) 18:54:00 ID:GxI1jFae
で、何のこと?
284名無し名人:2009/04/20(月) 14:18:04 ID:Yj3Uev5b
スレタイトルが悪いね、AI囲碁じゃなくて、

モンテカルロ法 囲碁ってちゃんと書いておかないとな。
285名無し名人:2009/05/22(金) 22:29:38 ID:aS7W4WJ5
AI囲碁を一般名詞と見るか商品名と見るかによるね。
スレタイはAI囲碁ソフトなんだけどな。
286名無し名人:2009/07/14(火) 01:14:46 ID:vzcY/YBj
ちょっと妄想してみた。

囲碁の完全読み切り先手必勝の棋譜ってどんなのだろう。。。とね。

先手の最初の一手が必ず勝つ手になるのであれば後手に最善の手はないことになる。

もし完璧な評価関数があったら一手目で投了するはずだが、
後手に最善の手がないのに、後手の最善手の評価関数は存在できない。
どうやって投了するのだろう。どうやって後手に最善の手をみつければよいのだろう。

まぁなんとか後手が最善手を打てたとして、後は、手数、最小か、最長か
大差か、僅差か、などの細かい試合展開の話になる。

結局、試合展開は、試合展開は先手がコントロールするわけではなく
後手の気分次第で決まるという事になる。

おそらく実際は勝ち方、負け方に無限のパターンがあると思う。

過去の優れた棋士達が打った碁のなかにも、その必勝パターンが
少なからずあるだろう。

こう考えると先手の最善手なるものは、無数に存在するのではなかろうか。
つまり、状況と試合展開によって手は変わる。

永久に分からないのは後手の最善手。
287名無し名人:2009/07/14(火) 01:17:36 ID:vzcY/YBj
自己レスだが、

>結局、試合展開は、試合展開は先手がコントロールするわけではなく
>後手の気分次第で決まるという事になる。

なんかまるで、プロと低級者の指導碁のようだ。
ある意味、これも完全読み切り先手必勝の棋譜の変形かもしれない。
288名無し名人:2009/07/14(火) 01:23:06 ID:vzcY/YBj
さらに自己レスだが、
もし完全読み切り先手必勝ならば、

神様か、完全計算力をもった宇宙人の囲碁は

囲碁から二人零和有限確定完全情報ゲームの”確定”
をのぞいた物になるだろう。

つまり、10手おきにサイコロを振るでもなんでもいいが、
アタックチャンスのスペシャル問題のように、相手の石の
どれかを自分のに交換できるなどの、盤面をランダムに
改変するルールが加わるかもしれない。

289名無し名人:2009/07/14(火) 01:29:12 ID:8tPOTi8E
何手か進んだところで、白黒取り替える選択権を白に与えれば競技としては成り立つ。
というのが、必勝手順解明されてしまった連珠ですでに行われている。
290名無し名人:2009/07/14(火) 01:31:59 ID:8tPOTi8E
ただ、そうすると黒番は最善手を打つわけにはいかず、平衡維持な打ち方になると思うけど
これが囲碁の発展にとって良いものかどうなのか・・・・・という気はするけど
必勝手順が解明されてしまったら関係ないかw
291名無し名人:2009/07/14(火) 01:35:40 ID:L5l9zj85
>>289
五目並べって終わってたのか。オセロの方が早いかと思ってたのに。
292名無し名人:2009/07/14(火) 06:59:38 ID:tpGyaqRT
>>286
対局終了時の予想目数を出す評価関数を作ればいいよ
293名無し名人:2009/07/14(火) 19:00:36 ID:J2qFvpZ6
>神様か、完全計算力をもった宇宙人の囲碁は
神を前提にした時点でオカルトだよ、わかっているよな。
それは前提としはありえない、可能性でも存在しない。

勝つという評価関数が成立していれば、その裏を計算する評価関数も成立する。
294名無し名人:2009/07/14(火) 19:07:08 ID:adQP1pX7
そういえば囲碁板にも理論書を書いている宇宙人がいる。
295名無し名人:2009/07/14(火) 19:18:20 ID:5gvVmdQc
>293

>勝つという評価関数が成立していれば、その裏を計算する評価関数も成立する

逆説的だけど
不完全な評価関数なら後手も計算できるし成立するが、

完全な評価関数だと先手が最善手である限り後手の最善手は見つからない。

なんか不完全性原理みたい。
296名無し名人:2009/07/14(火) 20:30:09 ID:tpGyaqRT
最善手=必勝手と勘違いしてない?
最善手は先手でも後手でも必ず存在してるよ
297名無し名人:2009/07/15(水) 03:35:01 ID:MFFwOB3v
局終了時の予想目数を出す評価関数は、

二人零和有限確定完全情報ゲームの完全読み切りの評価関数
とは異なると思うけど。

モンテカルロ碁のアルゴリズムだったら勝ちのプレイアウトしか拾わないし
298名無し名人:2009/07/15(水) 17:43:54 ID:HdIl8ug6
>>296
最善手は1つではない、見えない最善手も存在しているが、選択候補に
選べない予想関数などゴミ
299名無し名人:2009/07/15(水) 18:00:11 ID:hdEb3DZm
>>298
最善手は1つではないんではなくて1つ以上だよ。
300名無し名人:2009/07/19(日) 15:06:36 ID:hUX2/fyr
コミが一目増えれば、必勝が白だったりするわけで、最善手はあるはず。
301名無し名人:2009/07/19(日) 15:22:50 ID:aDvauhjb
いや、コミが何十目あろうが、置き石が何十個あろうがお互いに最善手はあるんだよw
302名無し名人:2009/07/19(日) 19:21:54 ID:RpKQc8wn
だから最善手はあっても1つではなく1つ以上ってこと。
等価な手が存在している。
1つを最善手と決めれば、等価なほかの手は最善じゃないっていう
考え方もできるのでもっと厳密に言うべきだろ
303名無し名人:2009/07/19(日) 23:06:01 ID:cXQ96o7V
1つ以上だという事に誰も異論は無いと思うが、
そもそも1つだなんてみんな言ってないよね。
304名無し名人:2009/07/19(日) 23:18:10 ID:E0KlMVJr
きっと俺たちには見えないレスがあるんだよ。
305名無し名人:2009/07/20(月) 17:33:36 ID:L8xWqG3O
>>301
コミを操作することで、最善手(らしき物)をモンテカルロを使って、見付けることが出来ると言っているのさ。
306名無し名人:2009/07/20(月) 20:37:54 ID:SPvTx58j
釣りくせぇ
307名無し名人:2009/07/20(月) 21:44:52 ID:vcoG0QH1
例の勘違い君か
308名無し名人:2009/07/20(月) 21:56:40 ID:YMB8XNY5
統合失調症か↑
309名無し名人:2009/07/20(月) 22:16:21 ID:vHY5dqW/
そういえば、「おいっ、この野郎!」とか電柱に向かって喧嘩打ってる人見たことあるw
あの類か。
310名無し名人:2009/07/21(火) 13:25:23 ID:jahI2pa5
>304
なるほど、そういうやり方があるんだな。
311名無し名人:2009/08/23(日) 00:47:07 ID:QsudXNGr
AIをアクションゲーム(スーパーマリオ)に応用
http://gamez.itmedia.co.jp/games/articles/0908/18/news086.html
312名無し名人:2010/05/01(土) 21:36:29 ID:jAgcmBfg
sa
313名無し名人:2010/07/15(木) 00:27:27 ID:zkl2moEc
今日ヨドバシカメラで買ってきた。
何という重さ。
コンピューターの思考長すぎ。

布石とか小林流の数手目くらいからもう無いんだけど。
なんじゃこりゃ、金返せ。
314名無し名人:2010/07/23(金) 21:52:07 ID:5GGUE9Zs
買ったって何を? Crazy Stone は売ってないし
315名無し名人:2010/08/21(土) 12:30:36 ID:23K7qdOg
糞スレage
316名無し名人:2010/08/21(土) 17:41:24 ID:WNLM9VtD
キチガイ石
317名無し名人:2010/09/12(日) 00:53:23 ID:IVXus4dO
今月の「数学セミナー」に原理の説明が載っていた
318名無し名人:2010/09/12(日) 06:11:20 ID:arniQCzg
来春、アンバランスから発売
ソースは碁的
319名無し名人:2011/03/07(月) 17:47:35.32 ID:rHeE9I18
アマ四段

AI囲碁18と互い戦
序盤から無理な戦いを仕掛けてきて次々に崩壊
1箇所殺し損ねた(4箇所全滅)が、274目も買ってしまった
絶対アマ三段はありえない
好意的に見て初段あるか無いかが良いとこ
320名無し名人:2011/03/08(火) 05:50:33.41 ID:NMffJdrI
人間だからTOPプロでも過ちは犯すよ。機械はプログラムされた
仕組みとは違う行動はしないけどな。
321名無し名人:2011/04/16(土) 00:10:07.28 ID:QZqTIzi/
サイエンスZERO「人工知能がクイズ王に挑戦!(前編)
322名無し名人:2011/05/07(土) 23:24:17.77 ID:l2qATnTD
>>318,319
発売されたけれどちょっと期待はずれっぽいね。ただアマ四段とはどこにも書いてないようです。
http://www.unbalance.co.jp/igo/sigo2011/
323名無し名人:2011/05/08(日) 02:36:53.52 ID:LzKiVBKn
機械は間違いを起こさないから、プログラムの条件判定を
リバースエンジニアリングすれば行動は全て予測できる。
324名無し名人:2011/05/09(月) 18:42:22.05 ID:jXJpXpLO
未来人ジョンタイターだっけ?
従来のコンピュータモデルはIF−THENだったが
もし(If)−ならば(Then)−たぶん(Maybe)みたいな構造らしい。

325名無し名人:2011/05/13(金) 06:33:50.86 ID:LsLfaZw2
>>324
それデタラメだから、そもそも未来人とか信じている時点で病気だよ。
326名無し名人
さあプログラムの性能が勝つのが先か演算能力の向上が勝つのが先か