おまいら最強の将棋プログラムしてみろよ part5

888 ：デフォルトの名無しさん：2007/03/11(日) 20:27:50

最近誰も最強の将棋プログラムしてなさそうな件

889 ：デフォルトの名無しさん：2007/03/11(日) 20:33:43

>>888
最強じゃなくていいならやってますが？

890 ：デフォルトの名無しさん：2007/03/11(日) 20:35:17

まだ全然最強じゃないけどそれを目指してやってるよ。

891 ：デフォルトの名無しさん：2007/03/11(日) 20:47:53

最強を目指すどころか思考部なしの人vs人のプログラムもまだできない。

892 ：デフォルトの名無しさん：2007/03/12(月) 02:22:30

ROMってる人は結構多いのね

893 ：デフォルトの名無しさん：2007/03/12(月) 07:59:02

リバーシスレの>>1の無敗アルゴリズムがあればなぁ

894 ：デフォルトの名無しさん：2007/03/12(月) 09:05:05

そんなものはない

895 ：デフォルトの名無しさん：2007/03/12(月) 12:38:38

>>894
リバーシスレの>>1は自信満々だが？

896 ：デフォルトの名無しさん：2007/03/12(月) 13:03:35

あれは似非科学者だから。

897 ：デフォルトの名無しさん：2007/03/12(月) 21:54:41

似非数学者だろ。

それとも○○○信者？
真理とか言ってる時点で終わってる。

898 ：デフォルトの名無しさん：2007/03/14(水) 01:54:29

唯我論者

899 ：デフォルトの名無しさん：2007/03/14(水) 07:41:47

脳内お花畑の妄想が現実と区別できない典型例。

実力以上の事を机上論以前の論理だけで出来ると思い込んだ挙句にそれを言いふらし、
結局大破綻して自分は何も果たせなかったと実証している辺りが何とも。
あのbuggyでスパゲッティなコードで一体何が動いたんだ？

900 ：デフォルトの名無しさん：2007/03/14(水) 10:38:36

本スレに帰れ

901 ：デフォルトの名無しさん：2007/03/17(土) 22:03:28

wdoorって何度も試してるとランキングされるんだな
知らずに何度もデバッグ用につないで負けを増やしちゃったよ

902 ：デフォルトの名無しさん：2007/03/21(水) 15:23:09

おまいら大和証券杯みてるか？

903 ：デフォルトの名無しさん：2007/03/21(水) 16:44:37

開始日時：2007/03/21 13:30:00
持ち時間：各2時間（チェスクロック使用）
棋戦：大和証券杯特別対局
場所：品川クラブeX
手合割：平手
先手：ボナンザ
後手：渡辺明竜王
開始時間：2007/03/21 13:30:00

▲７六歩 △８四歩 ▲６六歩 △３四歩 ▲６八飛 △６二銀 ▲４八玉 △５四歩
▲３八玉 △４二玉 ▲２八玉 △３二玉 ▲７八銀 △５二金右 ▲１八香 △５三銀
▲１九玉 △３三角 ▲６七銀 △２二玉 ▲２八銀 △３二金 ▲５六銀 △４四銀
▲４六歩 △８五歩 ▲７七角 △４二金右 ▲３九金 △１二香 ▲４五歩 △５三銀
▲４七銀 △１一玉 ▲３六銀 △２四歩 ▲２六歩 △２二銀 ▲５八金 △２三銀
▲４八金寄 △１四歩 ▲２七銀引 △２二金 ▲３八金寄 △３二金右 ▲６五歩 △７七角成
▲同　桂 △４二金 ▲６六角 △３二金右 ▲７五角 △４二角 ▲５六歩 △７四歩
▲５七角 △３三角 ▲４六角 △８三飛 ▲６七飛 △８六歩 ▲同　歩 △同　飛
▲９一角成 △８九飛成 ▲４四歩 △同　銀 ▲４七飛 △９九龍 ▲６四歩 △３五銀
▲３六歩 △４六香 ▲３七飛 △２六銀 ▲同　銀 △４九香成 ▲６三歩成 △３九成香
▲同　金 △２五歩 ▲同　銀 △２七歩 ▲同　飛 △２六歩 ▲同　飛 △１五金
▲２四歩 △２六金 ▲２三歩成 △同金右 ▲２四歩 △２七歩 ▲２三歩成 △３九龍
▲２二と △同　角 ▲３九銀 △２八金 ▲同　銀 △同歩成 ▲同　馬 △２七歩
▲同　馬 △同　金 ▲３九銀 △３八銀 ▲２八金 △同　金 ▲同　銀 △２七歩
まで112手で後手の勝ち

904 ：デフォルトの名無しさん：2007/03/21(水) 21:01:38

あれだけガチガチに囲って112手じゃ物足りないな　200手以上の激戦すべき

905 ：デフォルトの名無しさん：2007/03/22(木) 01:47:13

中原ｵﾜﾀ.｡･ﾟ *:.｡.:*･゜ﾟ･＼(^◇^)／.｡*･゜ﾟ･*:.｡.｡*･ !!!!!

【将棋】中原誠（永世十段）“突撃”に失敗！開発中のボナンザに敗れていたことが判明！
http://life8.2ch.net/test/read.cgi/goki/1171814404/

906 ：デフォルトの名無しさん：2007/03/22(木) 02:00:33

>>905
urlにgokiが含まれてますよｗ

907 ：デフォルトの名無しさん：2007/03/22(木) 05:25:19

碁棋

908 ：デフォルトの名無しさん：2007/03/23(金) 15:50:19

Perlで書いている人いる？
自分、Perlくらいしか書けないから
threadを駆使してがんばろうと思うんだけど。

909 ：デフォルトの名無しさん：2007/03/23(金) 17:55:04

チェスと将棋の違いはアレフの階層が一つ違うだけだから簡単だな

910 ：デフォルトの名無しさん：2007/03/23(金) 19:54:31

>>909
階層同じじゃないんか？
違う理由を書いてほしい。

911 ：デフォルトの名無しさん：2007/03/23(金) 20:01:58

どうせアレフって言ってみたかっただけだろ

912 ：デフォルトの名無しさん：2007/03/23(金) 20:03:12

つか将棋は有限だよな
チェスは詳しくないけど可算なん？

913 ：デフォルトの名無しさん：2007/03/23(金) 20:04:15

あーそうだよチェスも有限じゃね
５０手ルールだっけ、なんかそんなのがあるから

914 ：デフォルトの名無しさん：2007/03/23(金) 20:52:32

将棋は有限なのかな？　証明されてるの？
持ち駒をうてば、永遠に続けられそうに思うが

915 ：デフォルトの名無しさん：2007/03/23(金) 21:06:49

局面の種類が有限なのと千日手ルールから有限です

916 ：デフォルトの名無しさん：2007/03/23(金) 21:20:29

盤上の駒の配置、持ち駒、手番が同じ局面　

たとえ何万手離れていようが、いつかは同じ組み合わせが出る筈で、必ず千日手になるという事か？
しかし、それを記録してチェックする事が物理的に不可能なら？

917 ：デフォルトの名無しさん：2007/03/23(金) 23:12:18

>>916
そういうことだな
今の規定では、同じ局面が４回出たら千日手

ここは、実装できるかどうかとかじゃなくて
ルール的にどうかという話をしているところだろう

918 ：デフォルトの名無しさん：2007/03/24(土) 00:17:41

bonanzaのプログラムをわかりやすく説明してくれ

919 ：デフォルトの名無しさん：2007/03/24(土) 00:51:58

見敵必殺

920 ：デフォルトの名無しさん：2007/03/24(土) 01:50:24

>>918
http://www.geocities.jp/bonanza_shogi/gpw2006.pdf

921 ：デフォルトの名無しさん：2007/03/24(土) 07:37:28

将棋界最高位を保持する渡辺明竜王（２２）とコンピューター将棋ソフト「ボナンザ」の公開対局が２１日、東京都内のホテルで行われた。
タイトル保持者が公の場でソフトとハンデなしで対局するのは初。１手争いの際どい勝負になったが、渡辺竜王が１１２手で辛勝し、プロ
の面目を保った。
本局は、来月開幕する「大和証券杯ネット将棋・最強戦」のイベントとして実現した。ボナンザは、東北大大学院で化学を専攻する保木邦
仁さん（３１）が趣味で開発したソフトで、昨年５月に行われた第１６回世界コンピュータ将棋選手権に初出場で優勝している。
今回使ったコンピューターでは１秒間に４００万局面を先読みすることができる。
ttp://headlines.yahoo.co.jp/hl?a=20070321-00000011-yom-soci

922 ：デフォルトの名無しさん：2007/03/26(月) 01:06:58

>>920
ありがとん。
でも工房の漏れには難しいぞ(；´Д｀)

まとめると
ボナには2種類の技が搭載されてて
１つ目は
探索（全幅探索+静止探索）
2つ目は
局面評価の学習
だけど、探索は普通で、局面評価の学習がすごいわけか。
でも、探索とか普通にわかんねーよｗｗｗｗ
まあ、学習もわかんねーけどｗｗｗｗ

強い人の棋譜と同じ手をボナが指すような
局面評価を作ろうとしていて、
そのためには
J=
Σl(p,v)
+
λ[M(v)-M]
+
wM(v)
を０にすれば学習完了なのかな。うにゅ。
それぞれの意味がわからん。

923 ：デフォルトの名無しさん：2007/03/26(月) 01:16:19

Σl(p,v) のl()はー
minimax探索の評価値の差？

まずminimax探索がよくわからないｗｗｗ
ネットで調べたけど、minimax探索の評価値ってのは
minimax探索をしていって、だいたいこの手の評価はいくつですって
評価値のことか。

ってことは
Σ[S(p,v)-S(p,v)]
の前のS(p,v)は、その他の手の予測評価値で、
後ろのS(p,v)が強いであろう手の予測評価値だから
Σ[S(p,v)-S(p,v)]はなるべく小さい方がいいのか。
ふむふむ。

924 ：デフォルトの名無しさん：2007/03/26(月) 01:21:26

ぐえーーー
ΣT[S(p,v)-S(p,v)]
Tがついてたーーー
Tってなに？

グラフを見ると、０から１の間に抑える関数か。

ってことは、やっぱり
強い人の棋譜の評価値が高くなるようにしたいから、
ΣT[S(p,v)-S(p,v)]
が小さい方がいいのか。
分解能とかわかんね。
で、どうやってT決めるの？
拘束条件？

925 ：デフォルトの名無しさん：2007/03/26(月) 01:30:15

拘束条件は2つ目の項っぽいねー
J=
Σl(p,v)
+
λ[M(v)-M]
+
wM(v)

駒割りの意味がわかりません(ﾉ´∀｀*)

今日はもう寝る(・∀・)

926 ：デフォルトの名無しさん：2007/03/26(月) 01:42:12

PDF読まずに
ΣT[S(p,v)-S(p,v)] = 0
じゃないの？
と言ってみる

927 ：デフォルトの名無しさん：2007/03/26(月) 01:49:27

>>926
そこはどう見ても最小化だろ

928 ：デフォルトの名無しさん：2007/03/26(月) 01:51:25

Bonanzaの保木さんの招待講演は，局面評価用の静的評価関数の設計を，
最適制御理論の枠組みで行なったという話．
学習に用いる棋譜データは6万局ぶんで，特徴空間は1万次元以上，
計算時間はPCで3ヶ月とのこと．
minimax探索の結果の勾配(評価関数のパラメタ空間に対する勾配)は，
その探索における最善応手列(特徴空間の十分狭い範囲で一定と仮定)の
末端局面に対する静的評価値の勾配と等しいことを利用して，
「棋譜データを再現するための静的評価関数の学習」を
「minimax探索の結果と棋譜データとの一致度(＋安定化項)の最小化問題」に置き換える．
特徴ベクトル更新の幅の調整は手動で，
じょじょに小さくする．…という感じだったように思うが，
理解できているか自信がない．
次元の大きさが驚きだった．
なお，収束していない特徴への対応や次元圧縮のために
補間を用いることを提案されていた．
Bonanzaのサイトにて発表スライドが公開されている．
http://ebiomiya.exblog.jp/6025019/

929 ：デフォルトの名無しさん：2007/03/26(月) 10:44:28

>>928
諦めました

930 ：デフォルトの名無しさん：2007/03/26(月) 16:18:52

ボナンザ、激指、東大将棋にそれぞれ他ソフトの上位候補手も同時に読ませるように
したら最強のソフトが出来るかも

931 ：デフォルトの名無しさん：2007/03/26(月) 16:21:52

囚人のジレンマで相手の動作がわかっていれば最強なのみたいでなんかいやですね
いやそんなことないか・・?

932 ：デフォルトの名無しさん：2007/03/26(月) 17:17:09

なんか違うよな・・結局自分で考えてないような気がするんだよな・・

933 ：デフォルトの名無しさん：2007/03/28(水) 07:37:00

>>928
そういう手法（minimax探索とか最小化問題とか）を解説している本しりませんか？

934 ：・∀・）っ-○◎●：2007/03/28(水) 18:26:06

>>930
CPU時間が減るから読みも浅くなって性能劣化と