【IT/ゲーム理論】無敵のポーカー・プログラム完成、カナダ研究©2ch.net
掲載日:2015年1月9日
プレーヤー2人に限定したポーカーの「テキサス・ホールデム(Texas hold'em)」で、理論上絶対に負けない
コンピュータープログラムを開発したとする研究論文が、8日の米科学誌サイエンス(Science)に掲載された。
論文の主執筆者、カナダ・アルバータ大学(University of Alberta)のマイケル・ボーリング(Michael Bowling)氏は
AFPの取材に、研究チームは2003年より「現在の超一流プレーヤーに負けない、またどんな戦略にも負けない、
完璧なプレーヤーを作り出すこと」を目標に掲げてきたと語る。
研究チームは2008年、ポラリス(Polaris)と呼ばれる最初のポーカー実行プログラムを完成させた。ポラリスは、
2人のプレーヤー勝負のホールデムで人間の一流プレイヤーに勝つことができた。「この時点で、コンピューターは
この形式のポーカーでは全ての人間より強いプレーヤーとしての地位を確立した」とボーリング氏は言う。
ポラリスがポーカーで人間に勝てることが判明した後、「論理上の次なるステップは(このゲームを)解くことが
できるかの検討だった」と同氏は続けた。4800個の中央演算処理装置(CPU)群がゲームを解決するための計算を開始した。
「本質的にゲームを解決するという目標に到達するのに2か月あまりの計算を要した」と同氏は話す。
結果は、世界中でプレーされている最も人気の高い形式のポーカーがこれで「本質的に弱解決する」というものだった。
これは、人間が一生分プレーしても、統計的有意性を持って打ち負かすのは不可能であることを意味する。
ボーリング氏は、電子メール取材に対し「ゲームを解決する完全な戦略の算出を目指したが、われわれの戦略はゲームを
本質的に解決するものにとどまった。これはつまり、戦略がほぼ完璧であるため(人間が一生涯にプレーできるゲーム数に近い)
6000万回プレーした後でも、負ける可能性が運によるものか否かさえも区別できないほど非常に小さいことを意味する」と説明した。
■コンピューター対人間
ゲームで人間を打ち負かしたコンピューターとしては、ポーカーの他にも1994年にボードゲーム「チェッカー」の世界選手権で
初めて人間を破ったプログラム「チヌーク(Chinook)」や、1997年に当時のチェス世界チャンピオン、ガルリ・カスパロフ
(Garry Kasparov)氏に勝った「ディープ・ブルー(Deep Blue)」などがある。米コンピューター大手IBMが開発した
高性能コンピューター「ワトソン(Watson)」は2011年、米国のクイズ番組「ジョパディ!(Jeopardy !)」で優勝した。
だがポーカーのテキサス・ホールデムは、特に難題であることが判明していた。プレーヤーが2人だけでも、
どのカードがすでに相手の手札に入っているかなどの未知の情報が大量にあるからだ。
米カーネギーメロン大学(Carnegie Mellon University)のコンピュータ科学者、トゥオマス・サンドホルム(Tuomas Sandholm)氏は、
数多くある「不完全情報ゲーム」のなかでも、ポーカーは人工知能(AI)にとっては最大級の挑戦だと、サイエンス誌に
同時掲載された解説記事に記している。
同氏の説明によると、これらのいわゆる「不完全情報ゲーム」を解決するための一般的手法では、最初にゲーム全体を
抽象化して「規模はより小さいが、戦略的に同様なゲームを生成し、均衡発見アルゴリズムで対応可能なサイズにまで
縮小する」という。次に、抽象化した各ゲームを解決して均衡または均衡近傍を導き出し、それらの戦略を元のゲームに対応づける。
ゲーム解決への挑戦は、現代社会に進歩をもたらす助けになるかもしれない。ボーリング氏によると、空港検問所の
保安体制の強化、沿岸警備パトロールの向上、医療上の決定の改善などに役立つ可能性があるという。このポーカーに
利用されたようなアルゴリズムの進歩は、現実世界の不確定性と不明情報を含む状況に対して意思決定を下す場合に、
より効果的な解決策を見つける助けになるかもしれないと、論文は結論付けている。(c)AFP/Kerry SHERIDAN
<画像>
テーブルを囲んで行われる「テキサス・ホールデム」。仏領コルシカ島で(2007年2月撮影、資料写真)。(c)AFP/STEPHAN AGOSTINI
http://afpbb.ismcdn.jp/mwimgs/0/2/1024x/img_022ebfab1a6d719e34bf0d62b5827fb6184463.jpg <参照>
Science - Heads-up limit hold’em poker is solved
http://www.sciencemag.org/content/347/6218/145 <記事掲載元>
http://www.afpbb.com/articles/-/3036040
2 :
名無しのひみつ@転載は禁止:2015/01/11(日) 22:28:26.82 ID:yASJmtdk
論理と心理の狭間が割り切れるという説明
3 :
名無しのひみつ@転載は禁止:2015/01/11(日) 22:34:32.48 ID:G4ulDx5h
で、そのプログラムどうして対戦したら 両方負けることがないと?
引き分けってポーカーにあるの?
4 :
名無しのひみつ@転載は禁止:2015/01/11(日) 22:37:01.51 ID:G4ulDx5h
ちょっ これやたら重要なやつじゃん
「不完全情報ゲーム」の2者対戦における最適解なの?
ゲーム解決への挑戦は、現代社会に進歩をもたらす助けになるかもしれない。ボーリング氏によると、空港検問所の
保安体制の強化、沿岸警備パトロールの向上、医療上の決定の改善などに役立つ可能性があるという。
マジだとすると、このアルゴを理解できれば相当有利になれるのか?
5 :
名無しのひみつ@転載は禁止:2015/01/11(日) 22:46:30.30 ID:yASJmtdk
>>4 戦略そのものの統計を元にしたアルゴリズムは統計に沿わないものには無力である。
神のアルゴリズムであっても、次に配られる手配を支配できないかぎり運に支配される。
勝とうとするアルゴリズムは負ける戦略をしない。
負けない戦略と勝つ戦略で戦うとき、勝つ戦略で負けない戦略を倒すのはムリゲー。
6 :
名無しのひみつ@転載は禁止:2015/01/11(日) 22:46:41.80 ID:27r6j11G
絶対勝てない麻雀ゲームならあったな。
7 :
名無しのひみつ@転載は禁止:2015/01/11(日) 22:59:07.67 ID:eiIA2/DY
のこコンピュータ―プログラムどうしなら
前者と後者のどちらが勝の?
8 :
名無しのひみつ@転載は禁止:2015/01/11(日) 23:00:39.90 ID:eiIA2/DY
このコンピュータ―プログラムどうしなら
前者と後者のどちらが勝の?
つーか何をもって無敵というんだ?
ポーカーなんて一回勝負なら役がそろわなくて負けることもあるだろ
何千万回もやれば必ず勝ち越すとかそういうこと?
捨てられたカードから、確率的に相手の手札の強さが分かるってことかね
カジノって瞬間記憶みたいな人がカード全部覚えるのはイカサマ扱いなんだろ。
11 :
名無しのひみつ@転載は禁止:2015/01/11(日) 23:08:25.41 ID:yASJmtdk
>>10 >捨てられたカードから
捨てたカードで敵の戦略を縛るのも戦略である。
>>9 統計的に見て勝ち越す、だから収支とは別問題。
13 :
名無しのひみつ@転載は禁止:2015/01/11(日) 23:13:18.08 ID:G4ulDx5h
>>5 なんか詳しそうじゃん この分野の参考書みたいなのない?
最も期待値の高い選択を選び続けることで、負けることがない。
相手が間違った選択をすることで、勝てる。
同じプログラムでお互い最適な選択をすれば5分の勝負。
人間でもプロは、完全ではないけど、期待値の高い選択をし続けている。
15 :
名無しのひみつ@転載は禁止:2015/01/11(日) 23:25:16.02 ID:G4ulDx5h
>「Cepheus」は、CFRと呼ばれるアルゴリズム(あの時ああしていれば! という
後悔を最小化するアルゴリズム:参考)の改良版「CFR+」を用いて、
自分自身と対戦することで最適戦略を学習。2カ月にわたって、
秒間60億以上の手を考えるCPUを4000個稼働し、完璧に近い腕前になったそうです。
16 :
名無しのひみつ@転載は禁止:2015/01/11(日) 23:26:26.02 ID:G4ulDx5h
>>4 不完全情報ゲームの解法の統一理論じゃないでしょ。
18 :
名無しのひみつ@転載は禁止:2015/01/11(日) 23:27:54.38 ID:tVvdMuQv
総当りとか?
19 :
名無しのひみつ@転載は禁止:2015/01/11(日) 23:51:56.47 ID:G4ulDx5h
>>9 精神と時の部屋に入って自分自身と何万年分の修行を積んできた、俺Tueee!!!!
ってことをコンピュータがやったってことでしょ。
そのタイプの俺とは千年前にやったことがあるから最善手が分かってるぞ!
てな感じ
将棋のCPUトーナメントみたいにポーカーでもそういうのやればいいのに
それで殿堂入り出来るくらい優勝したら実力認められる
つってもこれリミット・ホールデムの話だからな
今メジャーになってるノーリミット・ホールデムはまだ解けてない
リミットとノーリミットの違いは賭け額が決まってるか決まってないかの違い
大ざっぱに説明すると
リミットは賭けられる額が決まってるがノーリミットは自由、いきなり全額賭けても問題ない
逆に言うとリミットは最初から全額賭けるみたいなことは不可能
リミットとノーリミットは人間レベルでも戦略が違ってるので
ノーリミット解けるのはまだまだ先、そこまでいかないと使いものにはならんだろリミットとかマイナーだし
個人的にはオマハ解けるぐらいになったら大変素晴らしいと思うがそれは当分先だな…w
22 :
名無しのひみつ@転載は禁止:2015/01/12(月) 02:23:13.32 ID:UMXntrkM
人間には「ルール変更」と云う大技があるわな。
23 :
名無しのひみつ@転載は禁止:2015/01/12(月) 03:48:13.16 ID:dFxMhv3r
>>1 言っとくけど、カードカウンティングは、カジノでやったら、ルール違反
24 :
名無しのひみつ@転載は禁止:2015/01/12(月) 03:55:33.65 ID:Ko58y1hJ
>>1(人間が一生涯にプレーできるゲーム数に近い)6000万回プレーした後
80年生きるとして、1ゲーム42秒。そこまで積み重ねないといけないなんてただの地獄です
ポーカーの面白いのは、プレーヤー同士の駆け引きなのに・・・
26 :
名無しのひみつ@転載は禁止:2015/01/12(月) 04:13:30.78 ID:By256xVa
これ対人で常時勝利してないだろ。プログラムvsプログラムじゃ勝負とはいえない
27 :
名無しのひみつ@転載は禁止:2015/01/12(月) 05:48:36.81 ID:xNk+unqJ
ほぅ無敵なのか
戦わなければ負けないから駄目だな
29 :
名無しのひみつ@転載は禁止:2015/01/12(月) 07:42:50.94 ID:xZxtkdSi
30 :
名無しのひみつ@転載は禁止:2015/01/12(月) 07:44:48.82 ID:xZxtkdSi
麻雀でこういうの研究されてるのかな?
31 :
名無しのひみつ@転載は禁止:2015/01/12(月) 07:56:12.21 ID:8YA12k1C
競争原理を超えてより共存の方向へ舵がきれるとよいね
32 :
名無しのひみつ@転載は禁止:2015/01/12(月) 08:06:59.65 ID:+OunYY73
医者「この手術は一種の賭けです。コンピューターに選択させましょう」
アメフト監督「これはギャンブルプレイだ。コンピューターにまかせる」
会社役員「会社経営なんて宝くじみたいなもの。コンピューターに聞くのが一番」
2ch民「人生ゲームがすべて教えてくれた」
無限のゲームで統計戦略が必勝なのは当然
短期戦では運で勝敗が決まるからゲームになる
言わんでもわかることだろ
DQXのディレクターに>1コレ教えてやれよ。
ゲーム内カジノでやらかしちゃってるじゃん。
35 :
名無しのひみつ@転載は禁止:2015/01/12(月) 08:40:32.24 ID:/BmUqmmH
ここまでポーカーフェイスなし・・・
36 :
名無しのひみつ@転載は禁止:2015/01/12(月) 08:44:02.37 ID:wG0KNXlT
囲碁ではモンテカルロ法が当たり前の昨今、完全情報も不完全情報もねーって
>>30 麻雀は選択肢多すぎて難しいんじゃないか?
将棋でさえ解けてないのにそれと比べものにならないくらい組み合わせが多いし
振り込まないプログラムを作るのはまだ楽かもしれんけど常時勝てるようにするのはかなり難しそう
将棋とこれや麻雀とでは、全然考え方が違うぞ。
これは統計戦略で、かつ、例えばブラックジャックのカードカウンティング等も
併用した明らかな合理性による計算を使ってる可能性が高い。
それが主たるロジックなら簡単だよ、少なくとも将棋よりはね。
ただし、PC上でやるならともかく、BJのカードカウンティングと違って
さすがに複雑だし、現場でやるのは難しいだろうけど。
39 :
名無しのひみつ@転載は禁止:2015/01/12(月) 11:03:33.13 ID:wG0KNXlT
>>38 モンテカルロ法も知らないって、馬鹿なの?
>>39 > モンテカルロ法も知らないって、馬鹿なの?
知ってるよ、馬鹿w
お前はブラックジャックすら知らんようだがw
41 :
名無しのひみつ@転載は禁止:2015/01/12(月) 11:24:49.43 ID:I2Vb1tdw
てか、こんなソフト簡単だろ。
自分でも、アルゴリズム作れそう。
麻雀ゲームでCPUに連勝していると異様に相手が強くなるアレですねわかります
43 :
名無しのひみつ@転載は禁止:2015/01/12(月) 12:24:32.27 ID:wG0KNXlT
>>40 「これは統計戦略で」って言うあたり、囲碁とかでのモンテカルロ法のこと何も知らないことは、
ばればれなんだけど?
44 :
名無しのひみつ@転載は禁止:2015/01/12(月) 12:35:34.81 ID:Pz5ExZH/
負けそうになったら電源ブチーで。
最強かもしれないが無敵ではないよね?
>>43 > 「これは統計戦略で」って言うあたり、囲碁とかでの
馬鹿すぎるw お前小学生かw
これが統計戦略であることと、最近の囲碁プログラムが
モンテカルロ法を使ってることとは何の関係もないんだがw
なんで囲碁がモンテカルロ法をやっていたら、
これが統計戦略やその応用でやってることにならないんだ、お前池沼か?
47 :
名無しのひみつ@転載は禁止:2015/01/12(月) 15:43:29.72 ID:wcoKXvr1
>>42 脱ぎ麻雀でCPUが強くなるのはツモでイカサマしてるからだろ
48 :
名無しのひみつ@転載は禁止:2015/01/12(月) 16:05:00.12 ID:DVXsspTn
>>23 カードカウンティング禁止なんて、表面上のルールじゃん。
してるしてないは証明できないし。
全くしないで勝負してたら、ポーカーがおもしろくなくなる。
店はシャッフルを早くするとかで対応するのみ。
勝ってるからと追い出したら店に傷がつく。
49 :
名無しのひみつ@転載は禁止:2015/01/12(月) 16:09:07.19 ID:DVXsspTn
>>23 そもそも、ポーカーのカードカウンティングを禁止してるかね?
ブラックジャックならまだしも。
ポーカーでカードカウンティングを止めたら糞おもしろくないぞ。
無敵って書いてないんだけど
ルール上は禁止していても実際はばれなければいいってだけだからな
現実には、カジノ側が、カウント計算役やサインを送る人を
チェックしてるにすぎないわけで
カジノじゃイカサマ扱いだろ
53 :
名無しのひみつ@転載は禁止:2015/01/12(月) 16:47:10.35 ID:Ko58y1hJ
総当りだと演算量が膨大で無理なので、パターン学習型にして、
必勝パターンのデータベース作ったよって話?
何テラバイトあるのそれ?
54 :
名無しのひみつ@転載は禁止:2015/01/12(月) 17:16:15.36 ID:wG0KNXlT
>>46 >これが統計戦略であることと、最近の囲碁プログラムが
>モンテカルロ法を使ってることとは何の関係もないんだがw
UCTとか統計戦略そのままなのに、そこまで無知を曝け出さなくても、、、
ハッタリの仕方にも統計があるのか
でも、イカサマがあるから人間には勝てないよ。
ポーカーの醍醐味は心理戦な訳何だけど本と信じていいんかな?
>>54 > UCTとか統計戦略そのままなのに、そこまで無知を曝け出さなくても、、、
いやお前があほ過ぎて話しにならんよw 関係のないモンテカルロを
勝手にもってきた次はUCTですかw
なんでUCTが出てくるわけw 言ってみろ。
俺が言ってるのはこれは統計戦略と言ってるだけで
モンテカルロ法の話などもともとしてないしw何を勘違いしてるのやらw
>>55 最後に勝つのは胴元だけです!
最強CPUからもレーキ取ってウハウハでっせ
59 :
名無しのひみつ@転載は禁止:2015/01/12(月) 18:18:17.43 ID:lg8ejNtm
統計的に正しい選択をするって事は、それまでにコンピュータに与えた情報が
一緒なら、同じ状況では同じ行動をとると言うことだろ
それなら、アルゴリズム逆手に取れば、コンピュータを手玉に取れそうだけど
あと当然ながら、PCはあくまでカードの情報だけを頼りに
最善手を打とうとするだけだよね
人間同士なら、アクションまでの時間なり表情なりも情報の一部にできるから、
3人以上のプレイヤーがいる時はコンピュータ最強になるのはほぼ不可能そう
ポーカーは自分のカード情報と同じくらい(人によってはそれ以上に)
対戦相手の情報が重視される
同じ状況でも降りる奴降りない奴
参加するカードの基準の緩さ堅さが違うから同じ状況で同じ行動取るとは限らんよ
あと全く同じ相手、同じ状況でもプロはあえて5回に1回違うアクション取るみたいなゆらぎ入れる人いるけど
最強CPUとやらがそこをどうするかは分からんね、興味あるわ
3人以上が無理なのは同意、だけど表情とか仕草のテル読みじゃなくて
選択肢の数がどんどん増えるからと思う
しかし人読み出来るのは人間の良い所だね
単純にいい手を狙うだけなら簡単なんだろうな
>>48 んなことない。勝ってると追い出す店は普通に多い
63 :
名無しのひみつ@転載は禁止:2015/01/12(月) 19:27:18.04 ID:9zEZn0tP
>>59 麻雀で例えるなら、ひっかけリーチみたいなのに対してもう一人の
人間プレーヤーが引っかかるなんてことにはコンピュータが対応
できないって感じ?
人間×3、コンピュータ1みたいなのでもデータ積み重ねたら、理論上は
それにも対応されちゃうんじゃないのかな。
まあ、人間は何億回も対戦してくれないから、人間役のアルゴリズムを
作るところから始めないといけなさそうだけど。
最優秀戦略 とか 全ての人間より強い っていうのを 「絶対に負けない」とか「無敵の」って
センセーショナルに書いた記者に問題があるんでないかの。
「ポーカーのようなものでも非常に強い、不完全情報ゲームの強力なアルゴリズムを開発した」では耳目を集められ
ないから、こういう発表のしかたになるのかな。
、さらっと流してるけど、
>戦略がほぼ完璧であるため(人間が一生涯にプレーできるゲーム数に近い)6000万回プレーした後でも、
「試行回数が多い方が真理に近い」的な感覚を無意識に持ってしまうけど、
プログラムの優劣でなくて、ポーカーゲームの勝負 という視点で見るなら
「一回のゲームで勝利」 を 何回でも繰り返せないと 絶対に負けない、無敵 とは言えんわな。
>>59 もし、プレーヤーが コンピューター1+人間3だと知らされたら、
打ち合わせなしで 以心伝心の”通し”が人間間で行われるかもね。
そこまで読めるかな?w
66 :
名無しのひみつ@転載は禁止:2015/01/12(月) 19:43:48.62 ID:wG0KNXlT
>>57 >> UCTとか統計戦略そのままなのに、そこまで無知を曝け出さなくても、、、
>いやお前があほ過ぎて話しにならんよw 関係のないモンテカルロを
>勝手にもってきた次はUCTですかw
ポーカーこそが典型的なMulti-Armed Bandit 問題としての木構造探索なのに、今度は
モンテカルロ法とUCTまで否定か
っていうか、お前UCTどころかモンテカルロ法が何かも知らないのは、わかってるけど、
せめてググってUCTのフルスペル調べてみろ
そのサイトの内容がもし理解できたら真っ青になるだろうけど、無理か
67 :
名無しのひみつ@転載は禁止:2015/01/12(月) 19:53:50.74 ID:wG0KNXlT
>>64 モンテカルロ法全盛のいまどき、完全も不完全も関係ねーっての
しかも、
>結果は、世界中でプレーされている最も人気の高い形式のポーカーがこれで「本質的に弱解決する」というものだった。
>これは、人間が一生分プレーしても、統計的有意性を持って打ち負かすのは不可能であることを意味する。
って、天才的なプレイヤーが一般人が一生かけても思いつかない戦略を考え出したら、あっさり
ひっくりかえるレベルの結論でしかない
>>65 >>1 >ポラリスは、2人のプレーヤー勝負のホールデムで人間の一流プレイヤーに勝つことができた。
プレイヤーがほぼ対等でプレイヤー間に多少の干渉がある3人ゲームで2人のプレイヤーが結託
したら、残りの一人が長期的に勝てるわけないのは、自明
68 :
名無しのひみつ@転載は禁止:2015/01/12(月) 20:06:09.83 ID:kn8+CArk
チェスで世界チャンピオンに勝つぐらいだから、むしろ遅かったという印象。
うわ、ググったら
ノーリミットホールデムも勝てる人間殆どいないぐらいCPU強くなってんのか
俺の主戦場じゃないからいいっちゃいいけど
ノーリミットのHUはこれからやらない方がいいのかもな
ただでさえレーキたけーし
72 :
sage@転載は禁止:2015/01/12(月) 21:38:01.51 ID:fyEsthXm
ホーキングの話もあながち嘘じゃないかもな
73 :
名無しのひみつ@転載は禁止:2015/01/12(月) 21:44:28.98 ID:wG0KNXlT
>>72 人工知能屋はそうやって騙すんだが、ゲーム理論と人工知能は、実は全然違うんだな
74 :
名無しのひみつ@転載は禁止:2015/01/12(月) 21:45:07.12 ID:FSU//z+w
テキサスホールデム去年からハマってるわ。
75 :
名無しのひみつ@転載は禁止:2015/01/12(月) 21:50:01.00 ID:TBZaYO3y
>>63 だいぶ前の話だけど、コンピュータ同士で対戦させるとハッタリかけるのを学習するみたいだな。
76 :
超音波テロの被害者@転載は禁止:2015/01/12(月) 21:56:08.33 ID:5NufBtUa
超音波テロの被害にあっています。
卑劣極まりない被害にあっています。
何が起こったかわからないときから、
わかってみれば、
まだ世の中に知られていない超音波テロ。
世の中のどれだけの音の振動源・発信源が
使用されているのかわからないが、
多数の振動源・発信源がシステム化され、
ネットワークを通して、
超音波・音波を集中させて
対象を攻撃するらしい。
人や社会が襲われ、罪もない人が超音波で襲われ、
卑劣な被害にあっています。
77 :
超音波テロの被害者@転載は禁止:2015/01/12(月) 21:57:06.65 ID:5NufBtUa
聞こえる声、音。超音波テロの加害者の声。
「もらいました」という声とともに、
形のあるもの、ないもの、奪っていき、壊していく
超音波テロの加害者の声。
超音波による物理的な力で、
ものが飛び、ものが壊れる。
それが人間の体に対してまで。
身体の表面を突き抜け、内臓を攻撃される。
頭蓋骨を突き抜け、意識を失わされる。
聞こえる声、認識できない声で、精神的なダメージ。
人間の体を壊そうとする超音波テロ。
「見続けるのがいやだから、殺して終わる」、
「証拠隠滅だ」という超音波テロの加害者の声とともに
強烈な超音波の攻撃。
叫ばされ、いたぶられ、
超音波テロの卑劣な被害にあっています。
心の底から被害を訴え、祈っています。
天に神に届きますように。
78 :
名無しのひみつ@転載は禁止:2015/01/12(月) 21:57:31.02 ID:5NufBtUa
I'm suffering from dirty strong supersonic attacks!! Supersonic terrorisms!!
Help me!!
負けこまない
81 :
名無しのひみつ@転載は禁止:2015/01/13(火) 11:02:23.88 ID:8NgnOC8E
>>66 > モンテカルロ法とUCTまで否定か
馬鹿ですかw否定じゃないよw関係ないだけ
俺はそんな事は言ってない、関連づけて言ってるのはお前だけだ
> っていうか、お前UCTどころかモンテカルロ法が何かも知らないのは、わかってるけど、
だから知ってるよ、もちろん表面的なレベルではあるがね、
しかし、どうしてここまで馬鹿なのやらw
小学生並の知能でないなら黙ってればいいのに、そんなに勘違いが
恥ずかしいのかね。俺の話はモンテカルロとは関係ない、池沼
> せめてググってUCTのフルスペル調べてみろ
知ってる上に先に調べたよw やはり意味はなかったがねw
俺の発言とは基本的に関係ない、応用的にはあってもねw
なんで俺が部下ー?
後、早く遊んどったはずの責任とかを取ってくれない?
とぼけてないで。
馬鹿だねー。
24歳の頃から何回どこかに遊びに行ったんだろうねー?
ここから天然物の天性の祈りが始まっとるのに。
83 :
名無しのひみつ@転載は禁止:2015/01/13(火) 12:27:45.91 ID:Vh5i503O
肝心の論文どこで読めんのこれ
84 :
名無しのひみつ@転載は禁止:2015/01/13(火) 12:52:03.28 ID:S9ezalY4
はじめに、ロイヤルストレートフラッシュが揃う可能性がある以上無敵はあり得ない
>>6 勝ったらご褒美として、身につけているものを一つずつしかとってくれないアレの事か。
最強はコンセント抜く掃除のおばちゃんだろ
87 :
名無しのひみつ@転載は禁止:2015/01/13(火) 17:17:37.12 ID:TbH+xTsB
>>81 >> っていうか、お前UCTどころかモンテカルロ法が何かも知らないのは、わかってるけど、
>だから知ってるよ、もちろん表面的なレベルではあるがね、
お前、自分が科学板で議論できるレベルじゃねーって自ら認めたのかよwwwwwwwwwwww
馬鹿につける薬はないな
88 :
名無しのひみつ@転載は禁止:2015/01/13(火) 18:34:31.59 ID:Eogq9wvs
>>87 お前ら、モンテカルロどうこうじゃなくて、プログラムの仕様書書けよ
89 :
名無しのひみつ@転載は禁止:2015/01/13(火) 18:49:28.32 ID:2SUBUtoi
>>65 それって、人間×2、コンピュータ×2でどちらも
通しを使えるようにしないと意味ないのでは。
それに“以心伝心”も含むなら、人間の知覚できない情報の
やり取りができるコンピュータのほうが1億倍強いだろ。w
ポーカーにおいて通しが行われた所でリバーまでついてく時点で相当ぶっ込んでるだろ…
でその状況になってる時点でCPUのが確率有利な場面が多いだろうし負けるのは人間
そもそもフロップの時点で人間側が有利となっているならベットしたら降りるだろうしな
ポーカーフェイスなんて言葉から
ポーカーは相手の心理を読むのがデカいみたいに思ってる人いるのかもしれんが
基本地味に確率読み続けるだけだよ、表情読むより確率読むもの
91 :
名無しのひみつ@転載は禁止:2015/01/14(水) 09:04:25.67 ID:C5dllL9C
倍々プッシュの俺が一番
テキサスホールデムってかなり運ゲーよりじゃねぇの?
94 :
名無しのひみつ@転載は禁止:2015/01/15(木) 16:16:41.70 ID:b56DDTVQ
>>87 > お前、自分が科学板で議論できるレベルじゃねーって自ら認めたのかよwwwwwwwwwwww
はあ?何を勘違いしてるのやらw 別に口だけの小学生のお前と違って
問題ないレベルだよ、プログラムとか書いてないってだけ。
俺の話はモンテカルロは関係ないってのに今更気づいて、罵倒のみとは
本当に恥ずかしい奴w
> 馬鹿につける薬はないな
論理的な話は一切せず、それだけですかw
お前が何も知らないのはよく分かったw
本当に小学生かもしれんなw
素人な質問なんだが…
この無敵プログラム同士が戦ったら五分?
先行と後攻で勝敗に差が出るの?
凄く疑問
96 :
名無しのひみつ@転載は禁止:2015/01/16(金) 08:25:01.41 ID:sPV4zaDr
>>95 ハハハ、同じプログラム同士が戦って
仮に戦績に差がついたとしても同じプログラムなんだから
どこまで行っても五分五分じゃよ
これって、駆け引きなしの手札の強さだけのポーカーのことかね。つまらん
手札と見えている札を入力し、相手の手札を予想
自分有利は全ツッパ
自分不利は下りる
馬鹿みたいに簡単なソフト
100 :
名無しのひみつ@転載は禁止:2015/01/19(月) 19:21:05.38 ID:ZNbbpduj
とある有名プレイヤーの女が、オンラインポーカーの大会か何かで
自分の手札を見ずにプレイして優勝したって話を聞いた事がある
これが本当なら、無数にいるプレイヤーも実際は特定のパターンに沿って動く可能性が高く
そのパターンをプログラムに入れるだけでも高確率で勝ってしまうのでは
もうこの手のゲームの戦略じゃ、人の脳よりも人口知能のほうが上なのかな?
102 :
名無しのひみつ@転載は禁止:2015/01/19(月) 21:14:25.55 ID:Ma3F9heG
統計情報量が人間とAIじゃ全然違うからね。
人間は忘れるけど、AIはメモリが許す限り覚えていられるし。
ベイズ統計で有向グラフ化すれば、それこそ
競馬も競輪もドッグレースも相撲も野球もフットボールも
ポーカーもブラックジャックもバカラも
恣意的な偏向=いかさまを見抜くことも可能なわけだし。
AIの凄いところは、人間が勘に頼らなければいけない部分を
確率的に統計して、負けない様に選択できるところ。
つまり回数をこなせばこなすほど、均衡する点をAIは把握しているってこと。
個人的には、AIに麺を打ってもらいたい。蕎麦とか。
>>100 あれは実は1回だけ確認してると本人言ってた
つっても十分化け物である
104 :
名無しのひみつ@転載は禁止:2015/01/26(月) 11:28:15.72 ID:OCwQ9nH1
>>94 >問題ないレベルだよ、プログラムとか書いてないってだけ。
表面的なレベルで問題ない(キリッ
>俺の話はモンテカルロは関係ないってのに今更気づいて、罵倒のみとは
お前の話が駄目なのはモンテカルロと関係ないからだ
日本語力すらないんだな
105 :
名無しのひみつ@転載は禁止:2015/01/26(月) 12:09:45.70 ID:XHXqlWwg
11日以上経ってレスですかw 卑怯な小物はさすがだなw
>表面的なレベルで問題ない(キリッ
笑えるよ、お前はそのレベルにすら達してないんだろw
いったい俺の話のどこがモンテカルロになるのか言ってみろ、基地外
>お前の話が駄目なのはモンテカルロと関係ないからだ
なら問題ないなw
>日本語力すらないんだな
お前がなw
モンテカルロと関係ない話に突然モンテカルロの話を持ち出す何の知識もない厨房くんw
106 :
名無しのひみつ@転載は禁止:2015/01/26(月) 12:22:08.71 ID:OCwQ9nH1
>>105 卑怯って、ならageるかよ
>いったい俺の話のどこがモンテカルロになるのか言ってみろ
なってないから駄目なのに、まだ言ってるよ
107 :
名無しのひみつ@転載は禁止:2015/01/26(月) 15:26:28.30 ID:XHXqlWwg
>>106 > 卑怯って、ならageるかよ
卑怯で粘着質で小物でなければ11日もあいてからは書かないね、違うか?
> なってないから駄目なのに、まだ言ってるよ
なら問題ないと言ってるが、池沼か?
モンテカルロなんてお前が勘違いで勝手に持ってきた言いがかりでしかない、池沼
108 :
名無しのひみつ@転載は禁止:2015/01/26(月) 22:14:33.34 ID:OCwQ9nH1
>>107 11日ぶりにレスするのが粘着質?
むしろ、11日ぶりのレスに一時間もたたずにレスし返すやつこそ粘着だけど、お前の中では違うのか?
>モンテカルロなんてお前が勘違いで勝手に持ってきた言いがかりでしかない、池沼
>>1の話はモンテカルロだろうに、それ無視した勘違いで勝手にわけのわからん「統計戦略」とか
言い出した
>>38がお前なんだわ
110 :
名無しのひみつ@転載は禁止:2015/01/27(火) 12:30:20.36 ID:JoLmpqUh
>>108 > 11日ぶりにレスするのが粘着質?
粘着だねw
> むしろ、11日ぶりのレスに一時間もたたずにレスし返すやつこそ粘着だけど、お前の中では違うのか?
アホか、俺は一日2、3回は見てるんだよ、専用ブラだしすぐわかる
お前は放置しておきながら今頃こっそりレスをする明確な卑怯者だろうに
>
>>1の話はモンテカルロだろうに、
それはお前が言ってるだけ。
そもそもたかだかカウンティングの話で俺がモンテカルロについて
書かなきゃならない理由にはならん、池沼。
カウンティングの話でわざわざモンテカルロの話を出さないと
いけない、だから粘着するとか基地外の発想だ、違うか?
>それ無視した
無視するのは俺の勝手ですが?仮に使われていたとしてもね。俺は知ってはいてもモンテカルロを
> 言い出した
>>38がお前なんだわ
それで?
お前のやってることは人が将棋の話をしているのに、勘違いして
チェスのルールにはそんな物はないって言ってるも同然の
お笑い芸人みたいなもんなんだがw
111 :
記憶喪失した男@転載は禁止:2015/01/27(火) 18:01:35.81 ID:u1wCpzKE
これ、誰か詳細よろしく。
112 :
名無しのひみつ@転載は禁止:2015/01/27(火) 18:03:23.14 ID:8YoIetU5
>>110 >アホか、俺は一日2、3回は見てるんだよ、
粘着、乙
>お前は放置しておきながら今頃こっそりレスをする明確な卑怯者だろうに
うわー、真性かよ、もう放置しかねーな、こりゃ
113 :
名無しのひみつ@転載は禁止:2015/01/27(火) 18:08:06.28 ID:JoLmpqUh
>>112 > 粘着、乙
お前のためじゃない、興味あるスレはみなそうだ、
無知な池沼はこれだからw
> うわー、真性かよ、もう放置しかねーな、こりゃ
事実だろ、全くw
或いは語るに落ちるというかねw
そういう誹謗中傷しか言えないって事はそれが正しいって言ってるも同然w
サイコロの出目の原理があるかぎり、全数計算による有利な
計算など不可能である。
不確定部分を戦略や戦術で操作するなどきない。
Eカードの原理を理解していればわかるだろ?
ポーカー必勝法って
煽って煽ってレイズさせまくって掛け金ごっつり釣り上げた挙句
チャカでズドン!ってやつじゃなかったっけ
このプログラム同士を戦わせたらどうなるの?
118 :
名無しのひみつ@転載は禁止:2015/01/27(火) 19:43:14.48 ID:qXOl9BfG
千日戦争になる
>>10 違うよ。
>ボーリング氏は、電子メール取材に対し「ゲームを解決する完全な戦略の算出を目指したが、われわれの戦略はゲームを
本質的に解決するものにとどまった。これはつまり、戦略がほぼ完璧であるため(人間が一生涯にプレーできるゲーム数に近い)
6000万回プレーした後でも、負ける可能性が運によるものか否かさえも区別できないほど非常に小さいことを意味する」と説明した。
ナッシュ均衡をベースに相手のハンドレンジの情報を収拾してるぐらいのものじゃないの?
(Poker Snowieは、ナッシュ均衡ベースのポーカートレーニングソフト)
もしポラライズやデポラライズまで計算式が出来るのなら凄いけど
ブラフというのがある限り、計算式は出来ない(確率の範囲内に留まる)
まぁ、人間がミスをするという前提で言ってるだけで、ゲーム理論として成り立つかというと、胡散臭いけどなぁ。
122 :
名無しのひみつ@転載は禁止:2015/01/28(水) 06:31:25.84 ID:cSZywQ5Y
>>115 基礎知識の欠如を妄想で補ってる真性と論争とか、無茶言うな
123 :
名無しのひみつ@転載は禁止:2015/01/28(水) 11:58:27.51 ID:JZE5vo8X
ポーカーをハッタリゲーと言う奴はまだまだ初心者
124 :
名無しのひみつ@転載は禁止:2015/01/28(水) 15:23:48.56 ID:5v6UZMCU
>>122 > 基礎知識の欠如を妄想で補ってる真性と論争とか、無茶言うな
おいおいw
妄想でモンテカルロじゃないと、メチャクチャな言いがかりをつけ、
あげく論から逃げてるのはお前だろうがw
というか現実的に言うと
仮に、ヘッズアップが最強のプログラムが出来たとしても
それは、オンラインポーカーでしか出来ないのですね
実際のカジノでは、ヘッズアップもPLO(オマハ)すらカジノ側の利益が無いために場が立たないので
役に立たないといえば役に立たないですね
あとは期待値の収束というだけの問題だけど、ギャンブルの場合は資金(バンクロール)と寿命があるので
理論上は期待値のあるプレイをして負けても(バッドビート)必ず収束するか?
というのは、別問題かと(数学上は可ですが)
また、カジノだと1卓でしかプレイ出来ないため
ライブだと、プレイ時間も長い=ダウンスイングの場合収束するのに何日もかかる場合がある
オンライン=複数卓がプレイできるが日本では合法では無い上に、運営が信頼に値するかという問題がありますね
126 :
名無しのひみつ@転載は禁止:2015/01/28(水) 20:12:12.91 ID:fXaY2lV6
127 :
名無しのひみつ@転載は禁止:2015/01/29(木) 05:52:49.84 ID:LPw+NEZE
>>62 カジノはギャンブルだからね。
賭博ではないはずのパチンコは攻略法を使うとゴト行為で逮捕される。
パチンコは絶滅させるべき。
128 :
名無しのひみつ@転載は禁止:2015/02/01(日) 08:30:00.66 ID:zV1z5H4U
コンピュータで暗黙知を実現することが人工知能の定義である。
エンドールのカジノで使わせてくれ
130 :
名無しのひみつ@転載は禁止:2015/02/01(日) 20:20:52.75 ID:/sk6WMkj
テキサスはおもんないな
ドローポーカーなら自信あんぞ
>>95 相手の手を読む必要があるポーカーは基本的に先手が不利
先手は読まれないように時にはカードを見ずに行動を決めることも必要になってくる
後手は一手のアドバンテージがあるうちに早々に勝負を仕掛けるか降りるか決める戦略とることになる
これらの戦略を適切に切り替えるアルゴリズムのコンピューター同士で戦うと勝率は後手がまさることになるだろう
ただしその強さは圧倒的というわけじゃなくて数万回の試行でようやく差異があらわれてくる程度
しかし相手の戦略に目に見えるほどの偏りがあるとそいつは簡単に餌食になる
強気すぎたり弱気すぎたりあるいは戦略が不安定な場合も餌食になる
心理戦といわれるゆえんがこの辺にあるんだろうよ
公開しないでオンラインカジノとかで何十億円も儲ければいいと思うんだが
どうしてそうしないんだろう?
実はもう一生分稼いじゃったから、そのあとに公開したんだろうか
麻雀とかでつくれないの
135 :
名無しのひみつ@転載は禁止:2015/03/07(土) 21:23:12.28 ID:M9xEOIT6
ボーリングじゃない、ボウリングだ!
2人に限定って、実践的には全く意味なくね?
137 :
名無しのひみつ@転載は禁止:
勘といっても過去の対戦や経験を脳のどこかで
計算処理しているんじゃないのかな。
丸きりの勘だとでたらめといえそうだと思った。