おまいら最強の将棋プログラムしてみろよ part5
888 :
デフォルトの名無しさん:2007/03/11(日) 20:27:50
最近誰も最強の将棋プログラムしてなさそうな件
889 :
デフォルトの名無しさん:2007/03/11(日) 20:33:43
まだ全然最強じゃないけどそれを目指してやってるよ。
最強を目指すどころか思考部なしの人vs人のプログラムもまだできない。
ROMってる人は結構多いのね
893 :
デフォルトの名無しさん:2007/03/12(月) 07:59:02
リバーシスレの
>>1の無敗アルゴリズムがあればなぁ
そんなものはない
あれは似非科学者だから。
似非数学者だろ。
それとも○○○信者?
真理とか言ってる時点で終わってる。
唯我論者
脳内お花畑の妄想が現実と区別できない典型例。
実力以上の事を机上論以前の論理だけで出来ると思い込んだ挙句にそれを言いふらし、
結局大破綻して自分は何も果たせなかったと実証している辺りが何とも。
あのbuggyでスパゲッティなコードで一体何が動いたんだ?
本スレに帰れ
wdoorって何度も試してるとランキングされるんだな
知らずに何度もデバッグ用につないで負けを増やしちゃったよ
おまいら大和証券杯みてるか?
開始日時:2007/03/21 13:30:00
持ち時間:各2時間(チェスクロック使用)
棋戦:大和証券杯特別対局
場所:品川クラブeX
手合割:平手
先手:ボナンザ
後手:渡辺明竜王
開始時間:2007/03/21 13:30:00
▲7六歩 △8四歩 ▲6六歩 △3四歩 ▲6八飛 △6二銀 ▲4八玉 △5四歩
▲3八玉 △4二玉 ▲2八玉 △3二玉 ▲7八銀 △5二金右 ▲1八香 △5三銀
▲1九玉 △3三角 ▲6七銀 △2二玉 ▲2八銀 △3二金 ▲5六銀 △4四銀
▲4六歩 △8五歩 ▲7七角 △4二金右 ▲3九金 △1二香 ▲4五歩 △5三銀
▲4七銀 △1一玉 ▲3六銀 △2四歩 ▲2六歩 △2二銀 ▲5八金 △2三銀
▲4八金寄 △1四歩 ▲2七銀引 △2二金 ▲3八金寄 △3二金右 ▲6五歩 △7七角成
▲同 桂 △4二金 ▲6六角 △3二金右 ▲7五角 △4二角 ▲5六歩 △7四歩
▲5七角 △3三角 ▲4六角 △8三飛 ▲6七飛 △8六歩 ▲同 歩 △同 飛
▲9一角成 △8九飛成 ▲4四歩 △同 銀 ▲4七飛 △9九龍 ▲6四歩 △3五銀
▲3六歩 △4六香 ▲3七飛 △2六銀 ▲同 銀 △4九香成 ▲6三歩成 △3九成香
▲同 金 △2五歩 ▲同 銀 △2七歩 ▲同 飛 △2六歩 ▲同 飛 △1五金
▲2四歩 △2六金 ▲2三歩成 △同金右 ▲2四歩 △2七歩 ▲2三歩成 △3九龍
▲2二と △同 角 ▲3九銀 △2八金 ▲同 銀 △同歩成 ▲同 馬 △2七歩
▲同 馬 △同 金 ▲3九銀 △3八銀 ▲2八金 △同 金 ▲同 銀 △2七歩
まで112手で後手の勝ち
あれだけガチガチに囲って112手じゃ物足りないな 200手以上の激戦すべき
905 :
デフォルトの名無しさん:2007/03/22(木) 01:47:13
碁棋
908 :
デフォルトの名無しさん:2007/03/23(金) 15:50:19
Perlで書いている人いる?
自分、Perlくらいしか書けないから
threadを駆使してがんばろうと思うんだけど。
909 :
デフォルトの名無しさん:2007/03/23(金) 17:55:04
チェスと将棋の違いはアレフの階層が一つ違うだけだから簡単だな
>>909 階層同じじゃないんか?
違う理由を書いてほしい。
どうせアレフって言ってみたかっただけだろ
つか将棋は有限だよな
チェスは詳しくないけど可算なん?
あーそうだよチェスも有限じゃね
50手ルールだっけ、なんかそんなのがあるから
将棋は有限なのかな? 証明されてるの?
持ち駒をうてば、永遠に続けられそうに思うが
局面の種類が有限なのと千日手ルールから有限です
盤上の駒の配置、持ち駒、手番が同じ局面
たとえ何万手離れていようが、いつかは同じ組み合わせが出る筈で、必ず千日手になるという事か?
しかし、それを記録してチェックする事が物理的に不可能なら?
>>916 そういうことだな
今の規定では、同じ局面が4回出たら千日手
ここは、実装できるかどうかとかじゃなくて
ルール的にどうかという話をしているところだろう
918 :
デフォルトの名無しさん:2007/03/24(土) 00:17:41
bonanzaのプログラムをわかりやすく説明してくれ
見敵必殺
921 :
デフォルトの名無しさん:2007/03/24(土) 07:37:28
将棋界最高位を保持する渡辺明竜王(22)とコンピューター将棋ソフト「ボナンザ」の公開対局が21日、東京都内のホテルで行われた。
タイトル保持者が公の場でソフトとハンデなしで対局するのは初。1手争いの際どい勝負になったが、渡辺竜王が112手で辛勝し、プロ
の面目を保った。
本局は、来月開幕する「大和証券杯ネット将棋・最強戦」のイベントとして実現した。ボナンザは、東北大大学院で化学を専攻する保木邦
仁さん(31)が趣味で開発したソフトで、昨年5月に行われた第16回世界コンピュータ将棋選手権に初出場で優勝している。
今回使ったコンピューターでは1秒間に400万局面を先読みすることができる。
ttp://headlines.yahoo.co.jp/hl?a=20070321-00000011-yom-soci
922 :
デフォルトの名無しさん:2007/03/26(月) 01:06:58
>>920 ありがとん。
でも工房の漏れには難しいぞ(;´Д`)
まとめると
ボナには2種類の技が搭載されてて
1つ目は
探索(全幅探索+静止探索)
2つ目は
局面評価の学習
だけど、探索は普通で、局面評価の学習がすごいわけか。
でも、探索とか普通にわかんねーよwwww
まあ、学習もわかんねーけどwwww
強い人の棋譜と同じ手をボナが指すような
局面評価を作ろうとしていて、
そのためには
J=
Σl(p,v)
+
λ[M(v)-M]
+
wM(v)
を0にすれば学習完了なのかな。うにゅ。
それぞれの意味がわからん。
923 :
デフォルトの名無しさん:2007/03/26(月) 01:16:19
Σl(p,v) のl()はー
minimax探索の評価値の差?
まずminimax探索がよくわからないwww
ネットで調べたけど、minimax探索の評価値ってのは
minimax探索をしていって、だいたいこの手の評価はいくつですって
評価値のことか。
ってことは
Σ[S(p,v)-S(p,v)]
の前のS(p,v)は、その他の手の予測評価値で、
後ろのS(p,v)が強いであろう手の予測評価値だから
Σ[S(p,v)-S(p,v)]はなるべく小さい方がいいのか。
ふむふむ。
924 :
デフォルトの名無しさん:2007/03/26(月) 01:21:26
ぐえーーー
ΣT[S(p,v)-S(p,v)]
Tがついてたーーー
Tってなに?
グラフを見ると、0から1の間に抑える関数か。
ってことは、やっぱり
強い人の棋譜の評価値が高くなるようにしたいから、
ΣT[S(p,v)-S(p,v)]
が小さい方がいいのか。
分解能とかわかんね。
で、どうやってT決めるの?
拘束条件?
925 :
デフォルトの名無しさん:2007/03/26(月) 01:30:15
拘束条件は2つ目の項っぽいねー
J=
Σl(p,v)
+
λ[M(v)-M]
+
wM(v)
駒割りの意味がわかりません(ノ´∀`*)
今日はもう寝る(・∀・)
PDF読まずに
ΣT[S(p,v)-S(p,v)] = 0
じゃないの?
と言ってみる
Bonanzaの保木さんの招待講演は,局面評価用の静的評価関数の設計を,
最適制御理論の枠組みで行なったという話.
学習に用いる棋譜データは6万局ぶんで,特徴空間は1万次元以上,
計算時間はPCで3ヶ月とのこと.
minimax探索の結果の勾配(評価関数のパラメタ空間に対する勾配)は,
その探索における最善応手列(特徴空間の十分狭い範囲で一定と仮定)の
末端局面に対する静的評価値の勾配と等しいことを利用して,
「棋譜データを再現するための静的評価関数の学習」を
「minimax探索の結果と棋譜データとの一致度(+安定化項)の最小化問題」に置き換える.
特徴ベクトル更新の幅の調整は手動で,
じょじょに小さくする.…という感じだったように思うが,
理解できているか自信がない.
次元の大きさが驚きだった.
なお,収束していない特徴への対応や次元圧縮のために
補間を用いることを提案されていた.
Bonanzaのサイトにて発表スライドが公開されている.
http://ebiomiya.exblog.jp/6025019/
ボナンザ、激指、東大将棋にそれぞれ他ソフトの上位候補手も同時に読ませるように
したら最強のソフトが出来るかも
囚人のジレンマで相手の動作がわかっていれば最強なのみたいでなんかいやですね
いやそんなことないか・・?
932 :
デフォルトの名無しさん:2007/03/26(月) 17:17:09
なんか違うよな・・結局自分で考えてないような気がするんだよな・・
>>928 そういう手法(minimax探索とか最小化問題とか)を解説している本しりませんか?
934 :
・∀・)っ-○◎●:2007/03/28(水) 18:26:06
>>930 CPU時間が減るから読みも浅くなって性能劣化と
結局トントンかもね。