>>1 乙
コボルの人がSPE2,3個って言ってるのはクロスバと双方向リングバスが同じ構造になるからだろ。
そういう意味じゃ筋は通ってるが、それじゃあマルチコアも3つで打ち止めって言ってるに等しい。
MPIつかって並列計算させるのだっていくつもプログラミングモデルがあるわけだけど、CPUが格子
のある場所を担当してメモリの全領域にアクセスする可能性があるような問題ならコヒーレンシが
問題になるが、問題を分割できるようなLINPACKやFFTやその他独立したタスクに分割できる問題
ならPPEとSPEをマスター/スレーブ型にすればSPE間でコヒーレンシをとる必要なんてない。
4 :
3 :2005/12/24(土) 02:05:15 ID:Jx+rCXxZ
MPIでいうならMPI_BcastやMPI_Barrierを使いまくるんだったらEIBが詰まってしまうことも多い だろうが、PPE/SPE間でのMPI_Send/MPI_RecvをやるだけのプログラムだったらSPE間でのコヒー レンシなんて考える必要がない。どういうプログラムが動くことを想定しているかが違うから話が すれ違ってるんじゃなかろうか。 コボルの人はゲームやらムビーのデコード/エンコードやらといったCell向きとされる処理はどん なプログラミングモデルで組まれると思っているんだろうか? COBOLにMPIはないみたいだけど、教えてほしいところだ。
このスレはPS3とそれに搭載されるCellについて論ずるのか、 それともCellアーキテクチャで出来ることを妄想するのか、 どちらなんですか?
cellについて論ずることの中に cellアーキテクチャで出来ることを妄想するのが入ってるんじゃないのか? 持ってる人がいない以上、cellについて論じようとしたら 妄想にならざるをえんと思うんだけど
ちなみにATi製GPUはリングパスでメモリにアクセスしていて 更にXBOX360に限ってはそのXenosを経由しないとCPUがメモリにアクセスできない構造。 Cellに限らず360もシステム基部に同じような手法を選択している意味を考えてみよう
>>4 たとえば当たり判定を複数のSPEに振ってMPIで実装するばあいMPI_Send/MPI_Recvで
どうやってデーターの共有を行うのか疑問なんだけど。
LS内に座標ワークを置いて、いちいち複数のLSを更新するのかな?
それに受信バッファがLSの容量に限定されてしまうのも使い勝手が悪いんじゃないかと思うが。
そもそもMPIってキャッシュやLSに使えたっけ?
901 :Socket774 [sage] :2005/10/02(日) 02:36:31 ID:iQnzwtyJ PPEのジョブスケジューリングや、分散型SPEカーネルは現時点では相当ウンコらしい 恐らく8個(7個)のSPEのうち半分は不良債権と化す そもそも開発チームは冗長性を見込んで多めの6個と検討していたのに、あのおっさんが余計なことを
PS2でVUの使い方を理解できなかったやつはPS3じゃ地獄だろうなw そうじゃないやつは普通に扱えるだろう。 DMAでアクセス中のデータを書き換えないなんて当たり前のことは PS1でもやってたことだし。
11 :
コボラー(2) :2005/12/24(土) 05:32:31 ID:/hvtC+TH
>>1 乙
>>3-4 嫌だなぁ、俺がcellを全否定しているみたいに思っている?
エンコードやデコードみたいなストリーミングではcellは無敵の強さを発揮だろうね。
特にエンコード用途ではcellは重宝すると思う。
コストの問題があるから、コンスーマで大量に普及するかどうかは知らないけれども。
ただ、ゲーム用と考えるとCPUにcellを使うのは"?"って感じだな。
もっとはっきり言うと、cellはまったくゲーム向きとは思えない。
貴方も
>>8 が言っている様な用途だと、PPEでやってしまった方が速いと思うでしょ?
きっと俺はソニーのそう言ったあざとさが嫌いなんだ。
>>7 俺はXBOXの事は良く調べていないので妄想で。
GPUとCPU間ではコヒーレンシが問題になることは少ないんじゃないかな?
ここまで読んでみた。 コボラーが馬鹿だと言う事だけは判った。
粉ボラーって、シッタカさんですか? いえ違います、粉砕屋さんです。
あたり判定を分割する必要があるんかね。 例えば、SPE1を当たり判定(広義で言う物理演算)をさせる。 これによって生じる結果をPPEや別SPEに転送すればいい。 他のコアは、送られてくるパケットをトリガーに、処理を行う。 ワークがLS以上になるならダブルバッファ使うなりしてDMAで取得。 もし、これよりもさらに複雑な物理演算が必要になった場合は、 やらせる計算のローカリティとかに注目して、演算を分割か。 ここらへんはアルゴリズムの問題。
まあ、現時点で公開されてるGNU-toolchainにMPIとかのライブラリが インプリメントされてないのが問題か。でも、バルセロナ大や、 IBMのフォーラム出入りする人に期待。 暇な人はMPI移植してみるのもいいかもな。 ちなみにバルセロナ大のページ見に行くと GNU-toolchainの新しいベータ版が出ててgdbとかもあるようだ。
コボはなぜ自分が人から嫌われるのかちゃんと考えよう
17 :
3 :2005/12/24(土) 09:41:53 ID:Jx+rCXxZ
>>8 それは無駄な分割じゃないだろうか。
当たり判定が複数SPEに分割しなければならないような複雑な境界のオブジェクトのゲームだとしても
同じ当たり判定をSPE1->SPE2と振るのは多分無意味で、n個のオブジェクト間の衝突n(n-1)/2を
均等にm個のSPEに割り振ってPPE/SPE間でマスター/スレーブするのが無難だと思う。
データのI/O量は特に結果の出力は計算量に比べて圧倒的に少ないから分割に偏りがなければこんな
原始的なやり方でも性能が高くなるはず。
そんな複雑な衝突・物理演算が必要ならば、PS3の開発に限定するなら、 AGEIAのPhysXを使えばいいと思うが。AGEIAやSCEの開発者が、 SPEへの移植や並列化やってるって言うんだから、 ゲーム開発者はライブラリとして呼び出すだけでいいと思うぞ。
19 :
3 :2005/12/24(土) 09:50:26 ID:Jx+rCXxZ
>>1 あなたはある目的を達成する方法について17で言ったように様々なアプローチがあることを
軽視しているんじゃないかと思ってる。
あなたが認めるようにエンコード/デコードにCellが有利であるとすれば、その有利なモデル
を他の問題にも適用するのはプログラマの腕次第じゃないだろうか。
「これこれのコードを書け」と命令されてやるだけのコーダーならそこまで頭が回らない
だろうけれど、問題に対するアプローチからして複数の引き出しから持って来れるプログラマ
なら(難しいけど)不可能なことじゃないと思う。
単純化してあなたに質問すると、原理的にマスター/スレーブ型では破綻してしまうような
問題でゲームでボトルネックになるような処理って何か挙げてもらえないだろうか。
20 :
3 :2005/12/24(土) 10:04:04 ID:Jx+rCXxZ
21 :
8 :2005/12/24(土) 11:39:20 ID:QcXFSPqU
>>17 たとえとして話しているだけだから使い道は物理演算でもAIでもなんでもいい。
聞きたいのはMPI_Send/MPI_Recvだけで複数のSPEでのコヒーレンシとLSのサイズを
越えた場合の対処法なんだけど。
CellエミュにはMPIライブラリさえ入っていないからLSに最適化されているかわからない
のに出来ると断言されるのも???だ。
LSのサイズを超えたらまとめてページアウトなんちゃうん
23 :
8 :2005/12/24(土) 11:50:40 ID:QcXFSPqU
24 :
名無しさん必死だな :2005/12/24(土) 11:54:23 ID:gH1iZI7I
今んとこ独立した処理を投棄実行するだけで複数のSPEで並列処理するのは無理そうやね。 PS3駄目ぽ。
>>24 Cellのアーキテクチャは優れていると思うがライブラリがこれだけ糞だと性能の
ほとんどは封印されたままですな。
相変わらずSCEはソフト周りが苦手というか要領悪いというか、サードが地獄を
みるのは変わらないだろうね。
少々性能が悪くても箱○に逃げるサードが増えそうだ。
>>23 いやだからまとめてページアウトなんちゃうん
投棄実行ってなんじゃらほい
今度はコボラーID使い分けか。
文体やおかしな用語の使い方・論法でバレバレだけど。
俺は別に
>>3 では無いが、
>>19 の質問に答えなよ。
>>21 みたいな返答は
>>19 の質問に逃げているだけ。
>>25 はあ。IBMやバルセロナ大が現時点で一般公開している物に対して、
>相変わらずSCEはソフト周りが苦手というか要領悪いというか、サードが地獄を
>みるのは変わらないだろうね。
というのは、お門違い。
>少々性能が悪くても箱○に逃げるサードが増えそうだ。
それは無いな。第二週の売り上げが1万切ってるXbox360に逃げてどうすんの?
10億円はかかると言われているPS3の開発費に耐えられる国内サードは指折り数えるほどしか無いんじゃないかと。
31 :
名無しさん必死だな :2005/12/24(土) 12:13:07 ID:ltH5sFtB
>>30 そういうのはどっか他のスレでやればいい。
10億円のうち、内訳はどうなの?PS3に固有な金額はどれくらいを占めるの?
そういう規模のゲームにおいてプラットフォームの費用なんてたかが知れてる。
PS3から逃げて箱○をスルーしてたどり着く先はレボ
サードはバイオの悲劇を忘れない
性能を使い切るようなソフトを作らない限り、 プラットフォーム間での開発費にさほどの差は現れないと思うんだが PS3には他よりも圧倒的に金がかかる要因でもあるん?
つまりレボで充分ってことだな
PPE <-> SPE PPE <-> MEM MEM <-> SPE の転送が殆どで SPE <-> SPEの転送がないようなプログラムじゃ PPEの能力かMEM転送能力がボトルネックになって せっかくのSPEの演算能力が生かせないんじゃ。 本気で使い倒そうとしたらSPEの隣接関係もコントロールしつつ SPE <-> SPEなデータ転送がメインになるようなアルゴリズムを 採用すべきなんじゃない?
>>36 SPEの演算能力を使い切るという事を前提に考えてるの?本末転倒だと思うぞ。
ところでそのPPEやEIBがボトルネックになるような処理って具体的にどんなもの?
レイテンシよりも帯域が重要になる局面って事だよな。
確かにそういうのを作れば、Cellを使い切ってると言えるのかもしれない。
あのEIBを飽和させられるならば他のCPUでは辿りつけない演算能力を発揮するだろうね。
38 :
3 :2005/12/24(土) 13:17:27 ID:Jx+rCXxZ
>>21 MPIの話をしたのは漏れが使ったことがあるから言ってるだけで本質はプログラミングモデル。
でもMPIをどう実装するかから考えてBlueGeneをつくったIBMだからMPIライブラリくらい
あるだろうと思ってた点は確かにがっかりだったな。
>>22 いきなり数十KBものデータを送るのは粒度が荒すぎるだろう。さすがに。
そんなことを平気でやっているならどんなCPUでもすぐにデータがL2キャッシュに乗らなくて
性能はがた落ちになるから非現実な想定だと思う。
39 :
3 :2005/12/24(土) 13:18:34 ID:Jx+rCXxZ
>>36 そこで言っている帯域消費型のアプリってまんまビデオのデコードだと思うんだが。
PPEは計算しないで管理だけやってるならばPPEの処理能力がボトルネックになることは
滅多にないんじゃないだろうか。というか、SPEが結果を返しているのに自分の仕事に忙しくて
受け取りを待たせていたらそれこそ無駄すぎる。
それにSPE-SPEのコヒーレンシが重要だとしても1:1だったらクロスバもリングバスも変わらない。
実装方法によってレイテンシや帯域が変わってはくるが、それはクロスバにしたからといって
解決する問題じゃない。
問題となるのはあくまでPPE:SPE = 1:n (>1)以上になるようなコヒーレンシをとらなければ
ならない場面がいったいどれくらいあるのかという点。
自分なりに考えてみたけど全力パーティクル処理くらいしか思いつかなかった。
でもこれもメジャーになってきたら空間分割でうまく近似する方法が使われるようになると思う。
>>30 次世代機PS3だから10億掛けるという単純な経営では、
たとえMSや任天堂機専業であっても会社の維持は難しいだろうな。
41 :
コボラー(2) :2005/12/24(土) 13:48:58 ID:o0PY7R28
>>18 頭良いな。
NovedeXがPS3で本当に早いのならばcellも捨てた物では無いって感じだね。
>>17 >>19 >あなたはある目的を達成する方法について17で言ったように様々なアプローチがあることを
>軽視しているんじゃないかと思ってる。
そう俺に言われても…
さまざまなアプローチを軽視した結果、生まれたのがcellだと思うのだが…
そんなに尖がらなくてよいから、もう少し使い勝手を良くした方が良かったのでは?
と、思うわけだ。
42 :
コボラー(2) :2005/12/24(土) 13:49:36 ID:o0PY7R28
>>22 >単純化してあなたに質問すると、原理的にマスター/スレーブ型では破綻してしまうような
>問題でゲームでボトルネックになるような処理って何か挙げてもらえないだろうか。
SPE間でコヒーレンシが保たれない事はご存知の通り。
つまり、一つの処理は同時には一つのSPEにしか処理を渡せない。
複数の処理をやらせようとするとSPEの数だけタスクをPPEが先だって用意しないといけない。
考えただけで色々と凄いコストだね。
そして8本のSPEに分割して本当に早いか判らない。
チャレンジするというなら止めないが、俺はそんなことをしなくてももっと単純に結果を得られる方法を知っているよ。
他のCPUを使うんだ。
>>39 PPE:SPE = 1:n (>1)のコヒーレンシが必要な所ってメインメモリー以外無い様な気が…
メインメモリーに必要以上に依存しない為にもLSが各SPEにあるのだろうに。
>>41 様々なアプローチを軽視したっていうが、
それならあれだけの性能はたたき出せてないだろ。
まるで未来永劫86系1つで構わんといっているのと言わんばかりだな。
全てのSPEを使い切るというのはPXに対するCellのアドバンテージであり、それを否定することは PXのほうがパフォーマンス(使い勝手も含む)のアドバンテージを認めてしまうので、Cellマンセーな 妄想さんたちはSPEを使い切る、または使い回す前提なんでしょ。 だからお花畑な人たちって言われるんだよ。
46 :
コボラー(2) :2005/12/24(土) 14:00:35 ID:o0PY7R28
ごめんごめん。 42は19へのresだな。アンカー間違えた。
47 :
コボラー(2) :2005/12/24(土) 14:04:59 ID:o0PY7R28
>>44 俺は普通の人が乗るならF1よりカローラだと言いたいのだよ。
cellは間違いなくF1。
てゆーか、飛行機で喩えるとコンコルド
>>44 汎用的なアプローチを削除したから特殊なパフォーマンスを引き出すことができる。
というのが正解でしょ?
>>45 お花畑なのはむしろ君。
Xbox360CPUに対するアドバンテージという事なら、
CellがXbox360CPUを上まわる結果を出せばいいだけ。
別にCellの力すべてを出し切る必要なんて無い。
例えばそれは既に各種ベンチマークという形で、一部が実証されている。
>>49 ストリーム系のベンチしか公表してないから、逆にそれだけなんじゃないかと思ってしまうけど。
チェスプログラムとかAI系のベンチは無いんかね。
それに定番ベンチのSuperπが無いのも不思議。
ん?流れが止まった
52 :
名無しさん必死だな :2005/12/24(土) 14:48:05 ID:ltH5sFtB
>>50 チェスやAIのベンチってどんなのがある?
スーパーπは気になるなら移植してみれば?
>>50 SuperΠは桁数次第で倍精度になるからベンチの結果があまりよくなかったんではないかな。
プログラムは簡単だからCellエミュで試してみればわかるとおもう。
コボラーさんコヒーレンシの使い方間違ってますよ もっと勉強してからいらっしゃい あなたの発言低レベルすぎ
データが同一かどうかをプログラマが管理するってだけなんだけどね。 LSはキャッシュレスだから、キャッシュのコヒーレントを気にする必要ないし。 後はMFCに命令さえ発行すれば勝手にDMA転送される。
56 :
コボラー(2) :2005/12/24(土) 15:19:54 ID:3ihuNHla
あっれー、おかしいなー。間違ってたかー。 とでも言って欲しいのかな? 宜しければ、何処が間違っているのか教えていただきたいな。 無理して付いて来なくても良いよ。 俺も素人に1から10迄教えられないから。 いや、教えて皆が判るのならば、プログラマなんて職業は無いから。
57 :
コボラー(2) :2005/12/24(土) 15:22:59 ID:3ihuNHla
>>55 簡単に言うけどハードの支援が無いって事はそれなりにコストが発生するって事だよ。
結果、PPE単体でやったほうが早いってのはザラに有ると思うな。
何より、今のところSPEを使いこなしました〜ってゲームの話は聞かない。
簡単ではないんじゃないかな。
>>8 cellでマルチスレッドプログラミングするといっても、こんな変な実装しないでしょ。
せっかく極太帯域あるのに通信を同期にしか用いないのは頭悪いとしかいえない。
IBMもジョブキューとか言ってるし、jocamlやCωのような同期通信チャネルを使うのが一番楽。
>>57 ループする気は無いし、むりやりこじつけで言ってるコボラーに
レスする気はもう無いのだけどここだけ。
>何より、今のところSPEを使いこなしました〜ってゲームの話は聞かない。
別に今の段階で発表する必要がないだけ。
その手のテープアウト発表してないから○○は存在しない系理論はうんざりだ。
61 :
コボラー(2) :2005/12/24(土) 15:28:42 ID:3ihuNHla
>>58 俺、そのjocamlやCωって何者かさっぱり知らないんだけど…
メモリコヒーレンシ無しのSPEで実装できるの?
>>61 まあその2つの言語を知らなくてもいいよ。
ただコヒーレンシの意味ぐらいちゃんと理解してから、このスレきて欲しい。
63 :
コボラー(2) :2005/12/24(土) 15:31:30 ID:3ihuNHla
>>59 そのページの説明と俺の単語の使い方の何処に矛盾があるんだい???
>>63 MPI通信でコヒーレンシが問題になることは100%ありえません。
65 :
コボラー(2) :2005/12/24(土) 15:35:04 ID:3ihuNHla
>>60 >別に今の段階で発表する必要がないだけ。
>その手のテープアウト発表してないから○○は存在しない系理論はうんざりだ。
そうかい?
俺がメーカーなら嬉嬉として宣伝するけど?
コヒーレンシが問題になるのは共有メモリ型マルチスレッドの場合だけで、 みんなが分散メモリ(cellの場合はLS)マルチスレッドの話してるのに、 「コヒーレンシがあーだ、コヒーレンシがこーだ」 これじゃ周りからは馬鹿としか思えない。
67 :
コボラー(2) :2005/12/24(土) 15:40:40 ID:3ihuNHla
>>66 ゲームの話はどうでも良いと。こういう事かな?
「科学技術計算ではcell無敵」と。
同じ意見だよ。
68 :
コボラー(2) :2005/12/24(土) 15:42:21 ID:3ihuNHla
で、別に俺の「コヒーレンシ」の使い方は間違っていたかい? さも俺が間違ったことを言っているかの様だったが。
>>3 なんかはゲームで具体的に問題のある事例を示せと言ってるのに対し
>>42 で、天の恵みのコヒーレンシを振りかざして禅問答をしたかと思えば、
>>67 ではこれまでの流れ(MPI)を完全に無視して「ゲーム」を振りかざしてきた。
まっとうな技術者どころか、人間と話をしているのだろうか?という疑問すら生じるな。
ウォーホークがすでにSPEを数個使ってると明言してる 自分が知らないからって、無いものだと言い切るのが凄いな
>>65 PS2年末商戦の今、PS3の話題を振りまく訳が無い。
最近よくきく言葉 ソフトウェア屋のタダメシ時代は終わった コボラーはこの言葉の意味をよく考えたほうがいい
73 :
コボラー(2) :2005/12/24(土) 16:47:33 ID:/hvtC+TH
>>69 コヒーレンシが無いのは事実なんだから、それは受け入れてもらわないとな。
で、MPIの流れって言うがそもそもMPIはcellでは動いていないぞ。
そしてここはゲーハー板だ。
>>70 ?
いや、知っているしその話はどこかでしたかと思うが…
俺の発言の何処に食いついているのか判らないので、これ以上resのしようが無いが…
>>71 了解。それはその通りだ。
PS3 Linuxはどう考えてもブレークしそうにないな。 いちいち起動するなんて面倒すぎる。 WindowsでPS3=Cell対応エンコソフト起動したら PS3検索して見つかったら起動中のゲームをいったんHDDにスワップアウトして エンコを行い終わったらゲームを再開位の事してくれないと使ってられないな。
>>47 その現状CPUで破綻が出始めたからCell開発に至った。
従来のCPU流用で充分先進性が出せるものならそのまま使っている。
PCでは古いを通り越して最早化石と化している86系を使い続けているし。
76 :
コボラー(2) :2005/12/24(土) 17:16:04 ID:/hvtC+TH
>>75 cell開発への歴史背景のご説明ありがとう。
俺がそれに異を唱えることは無いよ。
ここまで人と会話できないのも珍しいなぁ。
>>74 OSを一々起動するのはPCも同じ。
ついでに言えば、Cellは設計段階から想定されている仮想マシン対応だから、
それを使った驚愕の機能なんてものが出るかもしれないが…
コボラーさん、いい加減コヒーレンシをデータ共有みたいな意味で使うのはやめてください。 コヒーレンシをとるのはどういうとき?キャッシュミス、キャッシュラインのことばをつかって説明してください。
>>78 何を言っているのかよく分からないが
とにかく無関係な話をしているらしいということだけは分かった。
81 :
コボラー(2) :2005/12/24(土) 17:24:17 ID:/hvtC+TH
>79 いや、根本的に貴方は変なことを言っているぞ。 SPEではコヒーレンシは考慮されていない。 キャッシュミスも何もキャッシュが無いのでどうしようもない。 データを共有するのはどんな時って事かな?
一つの文中に句読点も無しで「〜たら」を連続三回も入れる奴よりはマシ
>>77 だな。
こんなにもアレだとしたら、実業務、たとえばSE業務とかで
かなり支障が出ると思うのだが、、、、
>>83 SEは無理じゃないかな。PGならギリギリ・・・。
85 :
コボラー(2) :2005/12/24(土) 17:30:50 ID:/hvtC+TH
>>77 >>83 人格攻撃とは参ったなぁ。
rDIMyWUxは人格攻撃専門の人かな?
それこそ会話出来ないなぁ。
貴方はどう言った会話をお望みなのかしら?
あとコボラーさん、CELLではC言語拡張でMPI実装されてるよ
>>84 だな。PGでもあまり使いたくないタイプだけど。
客観的指摘と人格攻撃の区別もつかないみたいだし。
まあ、だからこそのこの展開なんだろうけどね。
88 :
コボラー(2) :2005/12/24(土) 17:34:42 ID:/hvtC+TH
>>86 マジ?
それは激しく不勉強でした。
勉強してくるので関連URLお教えください。
>>85 あほwwwww???
今までのレスで考えられないwwwwww
芝生生やしまくっちゃうぞwwwwwwwwwwwwww
90 :
コボラー(2) :2005/12/24(土) 17:36:27 ID:/hvtC+TH
面白いように初出のID出てくるな(w
>人格攻撃とは参ったなぁ だってあなた、人格に問題ありすぎるもの
かっわいそー、かわいそーwwwww これだけ皆が説明してるのに理解できないなんてwwwwwwww 御前笑える!!!!11111!11!11
シミュを触ってみた経験からものをいっている人の数・・・0
マルチコアは暗中模索だから、まだまだこんな議論はつづくのです。たぶん。
議論が続く事は良い事だし、大切だが、 人の話も聞けない馬鹿の為にスレが 無駄に消尽されるのだけはかんべんな。
ここまで読む価値なし
PCでのエンコはATIの統合シェーダ使ったGPGPUとIntelのISA共通のホモコアで十分だろうな。 nVIDIAはMSに嫌われてVistaで脱落が決まっているし Cellに至ってはエコサイクルの最初の一歩すら回らずに死滅するだろう。
99 :
コボラー(2) :2005/12/24(土) 19:03:35 ID:/hvtC+TH
>>98 おお、ありがとう。
でもOpenMPとMPIって別物なんじゃ…
>>99 MPIだけが並列プログラミングの規格じゃないでしょ。
>>100 俺は別に拘ってないからどうでも良いのだが、
>>86 はMPIが実装されていると言っているもんでね。
まぁ、些細な違いだと思うけどね。
おや、同じページにこんな一文も有るよ。
>Photo24:ただここまで示してきたとおり、Shared MemoryはCellでは
>しばしば高コストのSolutionであることが最大の問題である。
あの、俺が言いたいのは無理してSPEに回さなくてもPPEでやった方が早い処理も多いって事で、
cellが並列プログラミング出来ないとは言った覚えは無いよ?
>あの、俺が言いたいのは無理してSPEに回さなくてもPPEでやった方が早い処理も多いって事で、 >cellが並列プログラミング出来ないとは言った覚えは無いよ? 当然だろ、いままで何議論してたんだか。
COCOAcellスレ
bscが公開してるGNUtoolchain(toolchain-2.3-i686.tar.bz2)の中には
MPIらしきものが、俺には確認できなかった。
ただしその事は、IBMがMPIを実装していないという事を差すわけではない。
1.IBMが論文などの中でMPIに言及していた
2.IBMはスーパーコンピューティングでMPIの実績を持つ
という点からCell用のMPIが既に実装されていてもおかしくはない。
単に現時点でそれが公開されてるとは限らないというだけの事。
それと、ゲームを前提にした時、OpenMPやMPI以外の拡張・ライブラリや
ミドルウェアを使った並列プログラミングが採用されているか否かも情報が公開されていない。
現時点では我々には知る由が無いという事。
これらを踏まえてできる議論は、MPIでゲームを作れるかどうか。
コボラーはまず
>>19 の最後の文に答えるように。
>>104 おお、失礼。確かに俺がややこしい事をしてしまった。
>>42 >>46 >これらを踏まえてできる議論は、MPIでゲームを作れるかどうか。
何でそうなるのかは不明だが、議論していただければよいのではないかな?
俺は興味ないけど。
コボラー敗走。 ID:ltH5sFtB氏、デンパのお相手お疲れ。
>>106 いや、まだ居るけど…
貴方はそれを言うために来たのかい?
興味があるなら
>>104 とMPIを語っていけば?
>>104 そりゃ作れるだろう。
ただ、注意したほうがいいのは、並列演算機能の主な目的は「10000時間を100時間にすること」であり、
「10ミリ秒を1ミリ秒にすることではない」ということだね。
1ミリ秒とかのオーダーであれば、並列演算を使用すると逆に遅くなるってことだ。
そりゃ、各機器間が接続してデータ投げてどうこうという手順を踏む間に、
1ミリ秒とか5ミリ秒程度なんてあっというまにすっ飛ぶからだ。
つまり、リアルタイム描画のような処理で並列演算を使用するのはかなりヤバい。
FPSを落としてカクカクの画像でいいならOKだけど。
また、そのMPIによる計算速度の向上を何に当てるかといわれても、
ゲームのジャンルとしてはほぼ出揃ってしまっている現状では、
パフォーマンスの投資先はないわけ。
せいぜい、MPIがあったとしても、フルに使いきれるのは
カクカクの「バーチャルリアリティー」か、FPSに関係しない「将棋」みたいな人工知能くらいだ。
こぼらーとガチで喧嘩してしまうとはもうホントに余裕が無いんだな。 無関係の漏れにまでデスマーチがひたひたと忍び寄る悪寒を感じるぜ。
Game developers say they haven't seen a prototype that comes close to the blazing processing speeds and life-like graphics of the commercial-ready console Sony is promising.
Though Sony declines to comment on such complaints, in November it failed to deliver on a promise to send game creators an upgraded prototype containing a graphics chip made by Santa Clara (Calif.)-based nVidia
Without the souped-up graphics chip, "the machine we have is 10 times slower than the PS3 should be," says an exec at a game software maker who spoke on condition of anonymity.
"The graphics chip was supposed to be ready by November.
But we're still waiting."
http://www.businessweek.com/technology/content/dec2005/tc20051222_242937.htm?campaign_id=alerts 11月の予定だった新しいチップが12月になってもまだ届いてなくて、実機10分の1の機材を使っている
Cellスレだから、GPUの話はどうでもいいんでない? とりあえず、Cellは順調に3.2GHzみたいだしw
と匿名で話したゲームソフトメーカーの幹部は言います。
113 :
108 :2005/12/24(土) 21:57:07 ID:1hiMLpyO
Cellというか、並列演算を最高に生かしきれるゲームは ・30FPS〜60FPS程度の描画速度を必要としない ・膨大な計算を実施する必要がある という条件を満たすものくらいだろうと思われる。 少なくとも、そんなゲームは「将棋」「囲碁」「チェス」しか知らん。 まあ「リアルタイム描画」の問題を解決する方法としては Meta Frameみたいに描画まで全部やってしまって、クライアントに画像を 投げるってことはありえる。 それなら、まあ「カクカクの画像」レベルに押さえ込むことは可能かもしれない。 また、ファイバ・チャネルなどで各機器間をつなぐブレードならば、 通信の遅延性もなんとかなるし、パフォーマンスも上げられる。 そうするとクライアントはショボくていいわけだから、Cellは要らないよねって話になる。 正直、CellはIBMしか必要のないCPUであり、ブレードでクラスタ組ませて 天文学的計算をやらせるのにしか向いてないCPUであり、 ゲーム機向きじゃあないとは思うぜ。
>>113 ゲームの処理でそこまで重いものをFPS/毎でやる意味があるのか?
そのへんからお前さんの考え方が間違ってると思うのだが
今ゲームでボトルネックになってるのはグラフィック面
処理が少しぐらい重くなったところで 0.4GHz(PS2) → 3.2GHz(PS3)
の8倍を使い切るとは思えんが?
>>113 >正直、CellはIBMしか必要のないCPUであり、ブレードでクラスタ組ませて
>天文学的計算をやらせるのにしか向いてないCPUであり、
>ゲーム機向きじゃあないとは思うぜ。
話が合う人が居てくれて嬉しいよ。
3月頃は俺が一言はなせば異教徒扱いされる様な状況だったんで(w
並列演算が本格的に出始めたのってつい最近だろ。 まだまだやれることを模索中だろうし、 ある程度の目安をプロが立ててるから、膨大な資金と時間を掛けてCELLを作ったんだろ。 それなのに知ったかで、限界を決めつけて何様のつもり?
またゲームに向いてない厨か…まぁ任天やMSが並列化が重要とか言い出したりすれば また手のひら返しでマンセーなんだろうがな…
>>117 感情論かい?
世界一美しいロボタンの例もあれば、コンコルドだって世界一早く空を飛んでたんだよ。
>>118 並列化は何処でもやってるやん。
MSもインテルも。
>>117 何十年前もからある。
さまざまな所で使われていて俺達はその恩恵を受けてきている。
どういった分野で有用か無用かはもう既にはっきりしている。
間違っても「ちょっと研究すればゲームも並列処理できる」なんて考えないように。
↓物理演算厨のつっこみは禁止
121 :
108 :2005/12/24(土) 22:34:13 ID:1hiMLpyO
>>115 確かに意味はないね。
俺が言いたかったのは
「Cell+並列演算のパフォーマンスは画像描画では生かされないし、
ほかの用途では並列演算もCellも要らないじゃん」
ってことであり、MPI要らないねってことだよ。
>>116 一応言っておくと、俺はCOBOL書けない。
DQNのJavaっ子だから。
>>117 信者はCellを批判すると、すぐに噛み付くけど1hiMLpyOの指摘は実に的を得ていると思うよ。
PXのサブコアやSPEの使い道はより重い処理をさせる為に使うのが効果的で物理演算やAIなどに
あてるべきなのだが1/60で出来る処理には限界があるから見た目の変化は劇的ではないと思う。
108は釣りか?
>>105 またループか。
>>42 で全然誠実に答えてない。
>>108 >1ミリ秒とかのオーダーであれば、並列演算を使用すると逆に遅くなるってことだ。
>そりゃ、各機器間が接続してデータ投げてどうこうという手順を踏む間に、
>1ミリ秒とか5ミリ秒程度なんてあっというまにすっ飛ぶからだ。
EIBで繋がったSPEとSPE/PPE間の通信に1msものレイテンシがかかるのか?
具体例をよろしく。自信満々に言うのだから示せるのだろう。
名前欄に数字入れたり論調がコボラーと同じなんだが、
こんなややこしい人が複数いるとは思いがたいな。
>「Cell+並列演算のパフォーマンスは画像描画では生かされないし、 >ほかの用途では並列演算もCellも要らないじゃん」 >ってことであり、MPI要らないねってことだよ。 マルチコア否定してない?
まぁヤツらの脳内ではまったく同じマルチコア見てもPSが採用すれば悪いマルチコア それ以外のゲーム機でなら良いマルチコアって変換されるから、もうなに言ってもムダ
128 :
108 :2005/12/24(土) 22:47:19 ID:1hiMLpyO
>>117 Beowulfみたいな「天文学的計算」とか「多量の画像描画」を行う際に、
10000時間を100時間にしたいよって場合には並列演算は有効。
リアルタイム処理には向かない、つまり通信の遅延性の問題で逆に遅くなるとも分かっている。
>>118 ファミ痛とかはノリそうだけど、開発サイドからは「ちょーっとムリじゃね?」
っていう意見が出まくるかもねえ。
あと、1ミリ秒でSPEが何回廻るか計算しといたほうが良いね。
>>121 クタタンはPLAYSTATIONはゲーム機じゃないと何度言えば(ry
つか、なんでCELLをフルパワーで動かすことしか考えてないんだろうか?
現状のPS2でさえ、常にフルパワーで動いているわけじゃないし
PCなんかいい例だろ、2ch見てるときみんなCPU稼働率100%か?
>>122 AIに使えればよかったんだが、LSを採用したことによってメモリアクセス性がすこぶるスポイルされてしまった。
ところで最近のcell信者は仮想記憶って言わないのね(w
>>124 何処が不満なんだい?
理解しようとしない人に理解させるなんて事は俺には無理だが…
だが、いったい
>>42 の何処が誠実でないと感じたんだい?
以下、雑感など
今の状況を一番判っているのは
>>109 そして、俺はcobolは出来ない。
今の時代でcobolで仕事が取れるならエリートだよ(w
>>122 的は射る物であって得る物じゃない。的を持ち帰る気か?
しかし、CEATECの魔法の鏡や、48本MPEG-2再生も否定するんかね。
SPEの並列処理なんて嘘っぱちだって言うつもり?
むしろスパコンでやるような並列演算には向かないだろう。
134 :
108 :2005/12/24(土) 22:49:41 ID:1hiMLpyO
>>124 Cell単体の話じゃあなくて、A宅のPS3とB宅のPS3をつなげた場合の話。
MPIの話だからそういうことだと思ってたんだが、違うのか?
信者は何が並列処理に向いていて何が向かないかも分かってない消防だったのか・・・・
>>132 語源からすると的は得るは正しいんじゃ?
>>131 質問に答えていない。
>SPE間でコヒーレンシが保たれない事はご存知の通り。
質問に答えていない。
散々指摘されている通り、君は「問題」ではなく、
「方法(コヒーレンシ)」にのみこだわっている。
>つまり、一つの処理は同時には一つのSPEにしか処理を渡せない。
次に「このつまり」というのが成立していない。
同時に処理を渡せないという根拠を書いてないし、
仮に根拠を書いても、答えになっていない。
>複数の処理をやらせようとするとSPEの数だけタスクをPPEが先だって用意しないといけない。
>考えただけで色々と凄いコストだね。
何を用意するの?具体的に幾らコストがかかるの?
やっぱりこれも質問には答えていない。
>そして8本のSPEに分割して本当に早いか判らない。
君の感想なんか誰も聞いていない。
>他のCPUを使うんだ。
あり得ない解決法を図っている。
詭弁ばかりだな。
>>134 MPIはインプリメントの一例だ。OpenMPや他の並列化手法がある。
単にEIBの帯域の太さやLSの独立性からMPIの手法を用いるのが適してるだけ。
別に、mfcを直接叩いてもいいんだから。
最初のうちはバケツリレー方式でSPEこねくりまわせばええやん。 この方式だってある程度は並列性でるよ。
140 :
108 :2005/12/24(土) 23:01:45 ID:1hiMLpyO
個人的に思うんだが ・Cell内部のSPE-PPE間の挙動 ・CellとCellをLANとかで繋げた場合の挙動 とをごっちゃにして議論してないか? 俺は「CellとCellをLANで繋げた場合にこうなるんじゃね?」 ってスタンスで書いているのだけれど。
「CellとCellをLANで繋げた場合にこうなるんじゃね?」 というのを前提にして話してるのは一人しか居ない気がする
重複はじゅうふくでもいいんですよ。 独擅場はどくだんじょうでもいいんですよ。 的を射るは的を得るでもいいんですよ。 言葉ってのは常に移り変わっていくもの。
>>137 もう少し冷静になったら如何?
最初から行こう。
>>SPE間でコヒーレンシが保たれない事はご存知の通り。
>質問に答えていない。
>散々指摘されている通り、君は「問題」ではなく、
>「方法(コヒーレンシ)」にのみこだわっている。
方法?
コヒーレンシが保たれていないのは残念ながら確定事項だが。
まさかここから説明しないといけないのかな?
いけません。まあ出来ないから逃げるのがコボラーだが。
>>142 言語は生き物と言うのは形容詞などの主に言葉のインフレにのみ適用されるべきかと。
識字率も高く、正しい情報にアクセスしやすい現代で、
それらの言葉の間違いは如何な物かと思うんだが?
全然関係ない話やな
146 :
108 :2005/12/24(土) 23:08:53 ID:1hiMLpyO
>>141 そうか。MPIに釣られたのか、俺は。
んじゃあ場違いなのでお約束を貼って消えることにする。
┌─┐
|も.|
|う |
│来│
│ね│
│え .|
│よ .|
バカ ゴルァ │ !!.│
└─┤ プンプン
ヽ(`Д´)ノ ヽ(`Д´)ノ (`Д´)ノ ( `Д)
| ̄ ̄ ̄|─| ̄ ̄ ̄|─| ̄ ̄ ̄|─□( ヽ┐U
〜 〜  ̄◎ ̄ . ̄◎ ̄  ̄◎ ̄ ◎−>┘◎
>>142 的を射ただけじゃあたってないじゃん。
的を射て、あたってポイントゲットで的を得る。
>>143 はいはい。コヒーレンシ、コヒーレンシ。
SPEはキャッシュを用いないのでコヒーレンシを保つ必要が無い。
何度言われても理解できないんですな。
全コアの間でメモリ内容を無理に同一にしなくても、
ゲームは作れると
>>3 は言って、それに対し
馬鹿の一つ覚えでコヒーレンシと唱えてるコボラーに対して、
>>19 で、
>>3 ができないというならその事例を示せと言われたわけ。
最も、ここまで書いて
>>3 の思惑から外れてたら申し訳ない。
同意見だと思ったので尻馬に乗ってる形だが、
私と意図は違うかもしれない。
>>148 根本的に理解してないのは貴方だと思うが?
>SPEはキャッシュを用いないのでコヒーレンシを保つ必要が無い。
後藤に担がれているぞww
正しく書いてやるな。
「SPEはLSを使用しているのでコヒーレンシを保つことが出来ない」
まぁ、確かにここで食い違えば結果も変わるよ。
でもな、無知にも程が有るんじゃないか?
キャッシュだから常にコヒーレントじゃなきゃいけないというものでもないでしょ。
コボラー(2)が言いたいことを要約すると、 ( ゚д゚) < Cell無駄 ( ゚д゚ )
ようは、かまってちゃんだろ。
確かにキャッシュとかLSとかは関係ないかもね。 cellの思想的にコヒーレンシを捨てたって言うのが正しいところだろうね。
>>150 どうしてコヒーレンシにこだわるの?
コヒーレントを保つのって、別のコアがメモリに書き込みしたら、
そのブロックを破棄しろって言うだけの話なんだが。
>>155 ?
誰が破棄するんだ?
俺は親切だから答えてあげよう。
PPE以外には有り得ない。
自動で破棄できるわけではないと思うぞ。
当然そこにはコストが発生する。
おっと、SPE-SPE間ではこれでは無理だな!
いやー、参ったな。みんな苦労するはずだwww
てか、まちがって書き込みが起こった場合には、 コヒーレントじゃなくなってもいいから 読み込み専用のキャッシュは欲しいところだ。
これはひどい
971 594 sage New! 2005/12/23(金) 23:14:39 ID:1mNhKDvR
>>969 どうして、そう言葉尻に噛み付くかな?
「クロスバーなら速度を犠牲にせずにコヒーレンシを保てる。」
これでよい?
973 名無しさん必死だな sage New! 2005/12/23(金) 23:18:08 ID:YJKw1uCM
>>971 どういう理由によって「クロスバーなら速度を犠牲にせずにコヒーレンシを保てる。」 のか、
976 594=コボラー(2) sage New! 2005/12/23(金) 23:22:02 ID:1mNhKDvR
>>973 知るかボケ。
「速度を犠牲にせずにコヒーレンシを保つ構造」
を突き詰めれば現在の技術ではクロスバーに成っただけじゃないか?
俺はソフト屋でハード屋ではない。
-----------------------------------------------------------
こういう人間なんだから、そもそも会話する価値すらないよ。
さっさとNGにいれなよみんな。
無知な漏れに教えてください。
だから言葉の使い方間違ってるつーの LSはキャッシュじゃないってわかってんならそのコヒーレンシってなんだよ? おれのPCのメモリと君のPCのメモリはコヒーレンシがないって言ってるのと 同じぐらいアホな事言ってることに気付け
お、最後のコピペミス。
>無知な漏れに教えてください。
ていうのは973の文言ね。
973 名無しさん必死だな sage New! 2005/12/23(金) 23:18:08 ID:YJKw1uCM
>>971 どういう理由によって「クロスバーなら速度を犠牲にせずにコヒーレンシを保てる。」 のか、
無知な漏れに教えてください。
つか、さっさとトリップ付けて欲しい。邪魔だから。
>>164 ?
名前で消せばいいんでないかな?
変えてないよ。
コヒーレンシを保つのにクロスバーってのは、脳みそが腐っているんじゃ? マルチキャスト可能だとしても、書き込み状態に移ろうとするプロセッサが、 他にキャッシュラインを共有しているプロセッサがある(可能性がある)という情報だけじゃなく 誰が共有しているかまで把握しているのか?
>>161 なに?その極端なたとえ?
コヒーレンシ不要論かい?
番号が飛ぶ飛ぶ
>>166 貴方はずいぶんとは無しの末端に拘るね。
通常のマルチなCPUは苦労してコヒーレンシを保っている。
cellはその努力を放棄した。
ここまでは同意していただけるのかな?
はいはい。コヒーレンシ、コヒーレンシ。
とりあえず
>>19 にコヒーレンシ以外の解答をしてくれ。
言葉の使い方が変なんだが・・・ 当を得る 的を射る が正しい。
>>148 複数のSPEで並列処理する場合、LSの一部はコヒーレントを保たないとならんのじゃないか。
よく「SPEはキャッシュを用いないのでコヒーレンシを保つ必要が無い」って言うけど、保つ
必要があるケースもあるわけで、そのセリフは恥ずかしいので禁止。
>>173 あのな、コヒーレンシが無いからmutex一つ実現するにもI/O経由でPPEにお願いしないといけない訳。
で、他のSPEに同期を取ろうとするともっとごちゃごちゃとやらないといけない。
はっきり言って「遅い」
ストリーム処理以外はね。
また番号がとんだ
mutexの実現の為にPPEにお願い、他のSPEと同期の為にゴチャゴチャか… 批判するならせめて仕様書ぐらい読もうね、もう日本語版も公開されてるんだし MFCが何の為に存在してるかぐらい理解しろよ
はっきり言うね。 BX/NxCW1 と ltH5sFtB 貴方たち丸裸だよ。 勝利宣言と取って良いよ。
そもそもそんな細粒度で使うものじゃないだろう。
>>173 物理演算で相互干渉するとしてオブジェクトの座標は複数のコアで計算する場合
LSの座標ワークは同一にしなければならない。
182 :
名無しさん必死だな :2005/12/24(土) 23:49:11 ID:W72SZVXW
>>174 どのくらい遅いの?
なんか定量的に比較できる数値ってある?
俺は整合性が必要なケースがわかれば Cellではどうやって実現しようかなぁ、と 結論は出なくとも楽しい妄想が出来ると思ったのだが、 だれかがそれをぶちこわしに。
コボラー君、いい加減脳内定義でコヒーレンシって言葉使うのやめたら? 君の言いたいことは単にPPEとSPEでメモリを共有してないってこと 無理してコヒーレンシとか使い慣れてない言葉言わなくていいから
>>181 そう取ってもらって構わないよ。
問題ない。
>>182 さぁ、
そもそも同期が必要な処理をSPEに投げようなんて思う奴はあんまり居ないのでは?
>>180 Cellに限らず、そういうのは容易に共有はしないものだと思うが。
空間分割とかそういう知恵を使おうよ。
ごめん下げ忘れちゃった
>>185 分からないのに「遅い」と断定するのはなんで?
>>174 getllar + putllc
SPEはコヒーレントなメモリシステムにDMA経由でアクセスする。
当然、DMAコマンドでmutexも実現できる。
ケチつけるなら、まずは理解してからにすべし。
コボラーってCPUのキャッシュを意識したプログラミングってしたことある? きっとないよね 一度やってみるとSPEが独立したLSを持っているメリットが理解できるよ
>>186 レイトレのボクセル分割じゃあるまいし分割した空間のオブジェクトが他の空間に
飛んだらどう処理するんかね、知恵が足りないのはそちらの方みたいだが。
>>184 本当にコヒーレンシの大切さがわかってないのね。
XDRからDMA転送したデータがSPEに届く頃には、そのデータは既に書き換わっているかもしれない。
いいか、書き換わる可能性は存在する。
どういうことかというと、いつかは確実に書き換わる。
重大な結果を生まなければ良いな。
>>186 確かにきちんと分割すればOK。凄い手間だと思うけどね。
>>187 いや、すまん。そんな素朴に聞かれると困るな。
データは無いよ。
チャレンジするなら止めない。
>>190 3D空間の全域で密な流体計算でもするゲーム作る気?
>>188 191が説明になるかな?
DMAだけではmutexは無理だ。
分割が凄い手間 ねぇ… ゲームプログラミングや3DCG系について、完全に無知なんだな… なんで自分の知らない分野についてこうも妄想だけでケチつけられるのかがサッパリ理解できん
>>191 >>19 に答える気がない人でしかもデタラメをブロードキャストしてる人に
突っ込む気にもなれないのだけど、それでも突っ込んでおこう。
「間違ってもそれをコヒーレンシとは呼ばない」
>>190 ヒント 軌跡 衝突時刻 重複計算 更新は調停(もしくは静的なルールで決定)後
>>193 MFCが何の為に存在してるのか理解しろ、最低限それを理解してからじゃないと
Cellでの同期について語るには無知すぎるぞ
実装方法はいろいろあると言う事だ。 て言うか、 PPE(R./W)⇔[LSMAP]⇔(R/W)SPE とかアフォな実装しようとしている奴はどうにもならん。
>>188 おっと失礼。
貴方は知識が有るようだ。
よく吟味させていただくよ。
>>193 コマンドまで挙げてやってるのに、なぜ仕様書を調べようともしない?
getllar + putllcのコンビネーションは、mipsではload lockedとstore
conditionalに相当する機能だ。したがって、同期変数のAtomicな
read-modify-writeを行うのに利用でき、ゆえにmutexの実装にも
使える。
>>193 SDK に標準で付属するライブラリに Sync Library ってのがあって、
アトミック操作と mutex が行えるけど、これじゃ駄目なの?
>>192 N3や無双みたいなワラワラゲーなら単純に分割出来ない事ぐらいわかるだろ。
グループ化してお互いのグループが接触しないようなPS2でよくやっている手法
なら別だが、次世代機でそんな誤魔化しやって楽しいか?
コボラー君コヒーレンシって言葉本当に好きだね じゃあレジスタとメモリはコボラー定義のコヒーレンシは とられないわけだけどそれに関してはどうお考え? それでプログラミング大変だって言ってたら マルチスレッドプログラミングできないよ?
>>202 そういうケースをマルチコアで解決するにはどうしたら良いか、
みんなで考えられたら楽しいねって思った。
そして手を抜いてメインメモリつかっちゃおうと悪魔のささやきが。
>>202 >>196 を読まないのね。なんか人の話を聞かない、このコンビ撃ちなんとかしてくれ。
君んとこのワラワラゲーは1/60や1/30secで分割空間を簡単に行ったりきたりする
ような超人ばかり出てくるのか?プレイヤーの目に止まらんぞ?
>>200 >>201 仕様書は読んでいないからなぁ。
ただPPE<->SPEのみなのではないか?
どちらにしろ簡単には答えられないな。
>>196 そんなめんどうな事までして並列化するぐらいなら素直にXDRにワークを置いて
参照すればいいやん。
頭はいいけど使い道を知らん天才バカボンの典型だね。
>>191 ゲームのプログラムでは、どのデータをいつどのようにハンドリングするか、
あらかじめ決まっているというか決めないといけないので、
かもしれないとか、いつかはとか、曖昧な状況は発生しないよ。
だから、どのような処理単位でSPEに投げれば良いかも、比較的簡単に決まる。
>>207 いやいや
>>196 はMFCのことを言いたいんだろう。
196はMFCに詳しいのかい?
良かったら、MFCでデータが捨てられるとどのような挙動になるか教えてくれないか。
とりあえず俺のエアコンが根性なしで、 部屋が全然暖まらない問題をCellで解決できますか?
>>205 >君んとこのワラワラゲーは1/60や1/30secで分割空間を簡単に行ったりきたりする
>ような超人ばかり出てくるのか?プレイヤーの目に止まらんぞ?
そりゃ1対多のPS2ゲームの場合だろ、Xboxでさえ50対50とか平気でやってるのに
次世代機でそんなショボイゲーム作って楽しいか?
>>208 191はDMAだけでmutexを実現する話ね。
とりあえずXBOX360の排気口を足元に向けることで、それなりに改善されると思われます
>>205 すべてのコアで共有されるメインメモリ上の同期変数をAtomic更新
するのに利用できる機能がDMAコマンドとして用意されている、
と言っているのだ。
当然、SPE<->SPEにも利用できる。
>>213 明日買って来ます。
それでそのXBOX360というのは灯油で動きますか?
Cell搭載エアコンが全て解決。 な訳ねーな
実際PS3が出たらSPEは3〜4個になってる予感
クリスマイスイブで、セックルして帰ってきたというのに、 おまいら昼間からよくずっと議論してられるな・・・
>>214 MFCによって新しいタイムスタンプのデータを取れることは知っている。
では捨てられたデータはどういう挙動をするのか聞いているんだけど。
ご存知無ければ自分で調べるから良いけど、時間かかるよ。
>>211 50vs50でもいくつでもいいけど分割空間を簡単に行ったりきたりする
キャラクタばかりじゃないでしょ?それも1/30や1/60secで。
その分割された時間・空間の中で他に干渉する可能性のあるオブジェクトなんて限られる。
それならその分だけ重複して計算するなりなんなり方法はあるでしょ。
>>207 の発言なんかもそうだけど、本当このコンビは態度も悪いな。
議論する気全くないでしょ。
>>206 なんでよく知らないのに、
>
>>188 > 191が説明になるかな?
> DMAだけではmutexは無理だ。
とか断言しちゃうの?
コボラーの性格嫌い、常に見下した発言しかしない。 お前、現実でも嫌な奴って見られてるだろ。
>>219 ごまかすな。
すべてのコアで共有されるメインメモリ上の同期変数をAtomic更新
するのに利用できる機能がDMAコマンドとして用意されている、
と言っているのだ。
当然、SPE<->SPEにも利用できる。
これを用いれば、Self Scheduling Loopを組んだり、Barrier同期を
行ったり、共有データアクセスの排他制御を行ったりすることが無理
なコードを書かずとも行える。
これまでの議論を全部リセットして、仕様書を読め。
>>223 おいおい、人格攻撃かよ。
正直素人相手では見下したくも成るぜ。
>BX/NxCW1 と ltH5sFtB
この二人な。
>>225 説明はなしかよ。
エラーで割り込みが戻るとか知っているなら教えてくれてもいいんでないかい?
まぁいい。
正しい指摘だ。仕様書を読むよ。
>>227 あれ以上何の説明が必要なんだ?
詳細で厳密な説明は仕様書にあるのに、何故ここで聞くのかサッパリ理解できん
事実の指摘が人格攻撃か
>>224 すると、あなたが 174 で主張している、
> あのな、コヒーレンシが無いからmutex一つ実現するにもI/O経由でPPEにお願いしないといけない訳。
> で、他のSPEに同期を取ろうとするともっとごちゃごちゃとやらないといけない。
> はっきり言って「遅い」
> ストリーム処理以外はね。
も根拠が全くないってことでいいの?
>>221 CoDみたいな戦争ものなら爆発で大量の破片や兵士があらぬ方向に飛び散るけどな。
仕様書も読んでない、説明されて初めて仕様書読むと言ってる人が、正しく理解してる訳無いですな
>>230 その通り。
>>232 おいおい、俺はかなり真摯に接しているぞ。
今から仕様書を読むよ。
時間かかるな。
今日はこれくらいで勘弁してやる。
これは2chで一般的な勝利宣言。
>>233 間違った脳内妄想仕様を前提に叩いておいて、それが真摯な態度とは恐れ入る
もう来なくていいです。 クビにならんように自分の仕事に専念してください。
>> 233 ちなみに付属ライブラリの Users Guide や Cell プログラミングの チュートリアルなど SDK 内に入っている pdf document は、SCE や IBM から直接 download は出来ず、SDK インストールしないと取得 できませんので頑張って下さい
Cellアーキーで脱落するエンジニアはどの程度いるのだろう。 しかし脱落してもマルチコアの呪縛から逃れられない訳で、 あ、まだ携帯機があるか。
238 :
236 :2005/12/25(日) 00:56:45 ID:r/mjfboN
>>236 あ、ごめん、間違った。
pdf は cell-sdk-lib-samples-1.0.tar.bz2 の中に入ってるので、
tar.bz2 を展開できる環境を持ってれば SDK をインストールしな
くとも取得できますね。
CBE_Tutorial_v1.0_21Oct2005.pdf
idl.pdf
libraries_SDK.pdf
libspe_v1.0.pdf
前から思っているんだけど、性能出すのは360の方のCPUの方が 遥かに難しいと思っているのはオレだけ? 普通にスレッド分割しただけじゃダメダメだよね?
こういう電波は実機で性能差を見せ付けられたら黙るから。(笑) 今後はコボラーにレスをつけたやつが頭悪いアホということにしていかないと 本気でクソスレになっちゃいますよ。
>>240 CoDですでに3個とも使ってるけど。
Cellと違ってサブコアもISAが統一されているからOpenMPも性能を引き出せて
いるようだし難しくはないようだが、GPU側にボトルネックがあるみたい。
CellでMPI、という話に関してちょっと質問があります。 MPIの一般的な使い方は、分散実行されるすべてのプロセスの実行ファイルは同一のもので、 プログラム内で自分が親かどうかrank見て判断し条件分岐で動作を変える、という形になってます。 というわけで、Cell単体のPPEとSPEでMPIを使って並列化をする場合には、 PPEだけじゃなくてSPEもPPEと同じプログラムを実行できないと困るんですが、そこは大丈夫なんでしょうか? また、プログラム全体をSPEにそのまま渡してしまったんではLSでは全然足りない気がするんですがどうなんでしょう?
>>242 それだとただ動いているだけですよね。
自分の中のイメージだとキャッシュミスを頻発して
ストールしまくりな気がするんですが。
まぁ1コアなのよりかは速いのかな。
さすがにキャッシュミス頻発させて ストールさせまくっているようなのが Cell使ったら性能を引き出せるということは無いと言うか 多分相当時間をかけて覚えないと何も作れないんじゃないか?
このマルチコア時代の到来は、何も悲観することだけじゃないよね。 下克上のチャンスでもあるわけだ。
>>243 IBMが単一ソースから両方のバイナリを吐けるコンパイラ作ってるので前者は問題無いだろうが
LSサイズの制限は問題だろうな
>>245 だからストールさせないで制御するってのがかなり難しいと思っているんですけど。
それが簡単なら今のPCだってもっと速く動いてもいいはずですし。
しかしリアルタイム処理には並列処理が向かないとか、 ひどい無知な発言してる状況はどうにかならんのか? ゲームのリアルタイムってせいぜい1/60s(≒16.7ms)だろ? 普通のクラスタマシンでも通信レイテンシは4〜5μsだぞ? 1fpsの間にノード間で2000回も通信できちゃう。 さらにcellでは、EIBというクロスバスイッチだとしても、1chip内通信だぞ? 数十クロックのレイテンシがあると聞いているが、(正確な情報もとむ) 100クロックだとしても、通信レイテンシは31nsだぞ。 1fpsの間にSPE間で250000回も通信できちゃう。
あとコボラーさんはいきなりcellのドキュメントなんて読まずに、 「初めての並列処理」とか「猿でも分かる並列処理入門」とかの本読むべき。 どっから並列処理の知識仕入れてきたのかどうか分からんが、用語の使い方間違いすぎ。
それ以前に人との会話ができていません。
潔く負けを認めて去った人を悪く言うもんじゃない。 それだって普通出来ないんだから。
>>122 おいおい、MHzサイクルよりも前で、更にvsyncとの同期をとっていた
様な時代ならともかく、GHzの時代にPCにとって1/60secってのは
かなり長い時間だそ。
本気で言っているならかなり問題があると思われ。
>>244 キャッシュミス頻発ってそんな事にはならないよ。
遅くなる要因があるとすればスレッドの粒度。
255 :
3 :2005/12/25(日) 07:12:21 ID:oOitxoch
コボラー氏はJavaの人? だとすればsynchronizedとvolatileで話をしてもらってもいいのだけれど、Cellでの プログラミングモデルは共有メモリの書き換えをさせるようなものじゃないと思う。 あるワークメモリをロックしてその参照を別のスレッドに渡すんじゃなくて、配列を 引数として渡して別の引数を返値として戻す形。 それでは性能が上がらない場合を教えて欲しい。 頂点変換、セルフシャドウ生成、コリジョン判定、物理演算、クロスシミュ、いろいろ 考えてみたけどMPIを例としたモデルでだめな理由がわからなかった。
配列って引数で渡せるん
257 :
3 :2005/12/25(日) 07:20:28 ID:oOitxoch
>255
「別の引数を」→「別の配列を」
スマソ
>>242 OpenMPはSMP用の自動並列化だからPXとの相性はいいと思う。
でも楽に自動並列してくれるのは行列演算くらいで粒度を適切に粗くしたいと思ったら
PthreadやMPI使うのと比べて楽にはならない。
特にC/C++との相性はかなり悪くて、ポインタつかったらまず自動並列化の恩恵に
預かれないと思ったほうがいい・・・って釈迦に念仏かな?
それにコード生成の時点で勝手にスレッドの割り振りを決めてしまうからその瞬間に
どれだけのコアが空いてるか分からないゲームに使うのはリスキーだと思う。
258 :
3 :2005/12/25(日) 07:27:49 ID:oOitxoch
>>256 Javaでは渡したつもりでも実際は参照だけど、渡したらすぐにGC行きのオブジェクトだと
思ってもらえば言いたいことが伝わると思う。
固定長の配列に限ってやりとりする単純なモデルを実装するならSPEでのメモリ管理も
楽だし、ごく初歩のMPI_Send/MPI_Recvそのものだから。
259 :
3 :2005/12/25(日) 07:38:30 ID:oOitxoch
>>258 は適切な例えじゃなかった。
Javaでいうならストリーム入出力に近い。
あるいは長さが固定だったら引数が100個とかのメソッドかな。
それはJavaだと非現実的なコードだけど、NUMA的な使い方をしやすいMPIでは普通に使われてる。
260 :
3 :2005/12/25(日) 07:43:29 ID:oOitxoch
漏れなんか寝ぼけて変なこと書いてるな・・・
>>259 で言ってる「MPIでは普通」っていうのは引数100個が普通なんじゃなくてMPI_Send/MPI_Recv
そのものってこと。
こういうのはOpenMPだと面倒になるから漏れはCellではOpenMPは使われないと思う。
>>231 飛び散る破片はどれくらいの距離飛ぶよ?
現時点の位置や、予測されるルートは?
そうやって次フレームに空間内のオブジェクトを分類できるでしょ。
干渉する可能性のあるオブジェクト。可能性の無いオブジェクト。
自分の所属する空間で完結する事が確実なオブジェクト。
イブの日まで箱詰めだったよ って、夜中何やってたんだよw くそう、こんな面白い馬鹿が居た日にかぎって、トラブル くそうっ
つうかお前ら手持ちの知識を垂れ流してないで Cellを学べ。そして語れ。それが面倒なら去れ。
>>263 エロゲPGなめんな
俺のPCじゃ満足にシミュ出来ないんだぞ! ダメジャン orz
本当にCellを待っていた人たちは今頃シミュに没頭中でしょ。 このスレでも以前はシミュ待望論があったし。 今、このスレにいる人はただの妄想を垂れ流したいドリーマーだと思われ。 でも俺はその妄想が楽しいんだけどな。
>>265 別にシミュ動かしながら2ch位書けるぞ。
Firefoxが嫌いで無ければFC4上でも動くし2chブラウザもある。
VMware使ったりマシン2台以上動かす手もあるしな。
群盲象を評す
>>267 確かにそうだなぁ
早く実機に触ってみたいぜ
>>257 釈迦に説法って言いたかったのか、
馬の耳に念仏って言いたかったのか…
>>270 実機が無い状態で(目が見えない)
CBE SDKに触るしかない(五感のうちの触感だけ)
で評価する
余り間違ってないんじゃないんじゃね?
>>272 思いっきり見まちがってた スマソ
DMA転送で、ただ単純に盥回しする事とかやってみたが、何か面白いな
時間組んだり最適化とか考えないままに、ヘンテコリンなコード書いてる今が一番楽しいんだろうなぁ……
本業のPGは、休みとかあるんだろうかな
>>261 だから、そんな無理してまで分割するよりXDRに全オブジェクトの座標を置いて
検索すればいい事じゃん、なんでLS内で完結させようとするの?
おまえ、マジで馬鹿だろ(w
>>275 複数のコアで同期をとる場合はXDRにワークを置くのが普通だよな。
SPEには変数だけLS−XDR間でオーバーレイ出来る機能もあるし。
LSはコヒーレンシが必要ないというのは合っていると思うがSPEにまったく必要が
ないということではない。
>>275 単一コアで演算するならともかく、マルチコア・マルチスレッドで演算する時、
演算を分割した分散処理をするでしょ。それを無理だと思うならやめとけば?
別にCellBroadbandEngine型のアーキテクチャに限らず、
他のコア・スレッドとの間では干渉する要素を減らすのが高速化なんだが。
一度でもそういう手のプログラム組んだ事があればわかるだろうに。
Mutexなんかも数が大量になれば馬鹿にならないでしょ。
+他のコア・スレッドとの間では干渉する要素を減らすのが高速化なんだが。 -他のコア・スレッドとの間では干渉する要素を減らすのが高速化に必要なんだが。
ねぇ 今日もウザイのいる?
というかよく考えたら、 干渉する要素を減らすのはマルチスレッドに限らない。 オブジェクトの全部を総なめせずに、空間で区切るなど 計算の枝を切って、オーダーを減らさないと。 言ってみればソートをする時にバブルソートを使わずに、 色々な他の高速なソートを使うようなもんだ。
281 :
名無しさん必死だな :2005/12/25(日) 13:40:03 ID:mq2kSA3+
オブジェクト同士が相互干渉しないならそれでもいいが物理演算でカリングやクリッピングなんぞやったら大変な事になるぞ。
やらないと大変なことになるの間違いじゃ?
SPEにはオブジェクトの移動量だけ計算させて、衝突判定はPPEでやればええんでね?
>>282 存在しないオブシェクトとの衝突判定はできん罠。
>>284 エリア分割して、相互干渉判定するときの話じゃなくて?
近傍エリアのオブジェクトはカリングするでしょ。
ワロス いまどきのレースゲーがすべて分割されたMAPで衝突判定してると しったらショック死するんじゃないか(笑)
世界初!グリッド技術 (*1)を応用した 自律的なコンテンツ配信システムを開発
既存システムの数千分の一 (*2)以下のコストでセキュリティの高いコンテンツ配信を実現
http://www.brother.co.jp/jp/news2005/cdg/n_cdg_ove.html グリッドの技術を応用したコンテンツ配信システム(以下『CDGシステム』 *3 )
を世界で初めて開発いたしました。『 CDGシステム』は既存の配信システム
(サーバークライアント方式 *4 )では困難を伴う“多数のユーザーへの大容量
コンテンツの配信”を低コスト、かつ高セキュリティで行うことができる画期的
なシステムです。現在注目を集めている、音楽配信や映像配信( VOD)、
ゲームの配信等での活用が可能です。
ブラザーといえばソフトベンダー「TAKERU」.
ブラザーのソーサリアンは糞だった。
レースゲーは自キャラから離れたオブジェクトはカリング出来ますがな。 Xboxでさえダブルスチールでやってるだろ。
291 :
しろーと :2005/12/25(日) 20:14:14 ID:RVDT2tra
箱○の3コアとcellのPPE+SPEは、どちらもクロック周波数が同じなんですけど、 ゲーム機としての性能は実際のところどっちが上ですか?
>>291 そんなのケースバイケースだし、良くわからん。
小島監督はどっちも一緒と言っているし、
Cell(PS3)の方が上という開発者もいるし360
の方が上と言う開発者もいる。
この話題は荒れるから扱わない方が良くないか?
ケチャップとソースはどちらが優れているか?と聞いてるようなもの。
どーせ自作自演で暴れて荒らす為の下地作りだろ
295 :
しろーと :2005/12/25(日) 20:45:34 ID:RVDT2tra
いやそのつもりでは…。ただ次世代機購入の際にやはり一番性能が高いゲーム機が単純 に欲しいから聞いただけなんです。(BDのついたPS3が一番の大容量という事はわかる) では結論から言うと、どっちの方のゲーム機が全体としての性能が高いと思いますか?
バーチャルボーイはある意味最高性能ですが
2chのこんな板のこんなスレで何が"しろーと"だよ。 初心者装うにも無理がありすぎんぞハゲ
オレも両方買ったほうがいいと思う、社会人独身なら余裕だろうし 学生でも年末年始忙しい業種で二週間〜三週間もバイトすりゃ二十万〜三十万稼ぐのは余裕だし バイトできないような年齢の子でも親戚巡りすりゃお年玉で十万ぐらい余裕だし
>>295 ゲーム機は性能で買うのではない、欲しいゲームがあるから買うのだ。
301 :
しろーと :2005/12/25(日) 21:02:17 ID:RVDT2tra
>>300 うーんそうですよね。素人がいくらあれこれ考えたって何もわからんのだから、結局
全部出揃ってから面白いゲームが出るときに買えばいいですよね。
>300 PS2とかPSPは案外そうでもないよ 性能と機能だけである程度売れた。
>>302 じゃぁ、なんでDSはあんなに売れてるの?
そんなことよりNHKを見るんだ、ゲハなんか見てるより有意義だぞ
サムスンすげー
そりゃ国から補助うけてますから。
むしろ、アレは国そのものだからな…
だな、日本でいうと道路に回す金の一部を半導体に使ってるってるようなモンだ、べつに凄くもなんともない
>>306-308 嫌韓で思考停止してしまったらいけませんぜ
それは相手を認めてしまって諦めてしまうことになりかねない
韓国って映画も国から補助受けてるよね。
>>310 それを言うなら、ハリウッドだって軍やらから補助受けてるす。
エンタテイメントわ思想統制の手段として有効性が認められているすよ(笑)
312 :
名無しさん必死だな :2005/12/25(日) 22:26:18 ID:6X7eERLV
道路に回さないで半導体に回したからすごいんでは? 半導体技術者を3倍の給料で引っこ抜くなんて文系社長に牛耳られた日本では考えられませんぜ? クタ社長になってくれ。
>>309 いや、嫌韓じゃなくて事実を事実の通りに指摘しただけなんだけど。
サムスンは今やソニー以上にグローバル企業
まあ、旧国鉄とか電電公社とか国から援助受けた企業が上手くいくとは限らないわけで。
そういやかの国の負け組みつうと、金星とか現代とかがあったな。 それはそうとして、1エンジニアとしては半島に渡った人の気持ちはわからんでもない。
サムソンは韓国最強(というかほぼ唯一に近い)の財閥のはず。
そりゃ国力そのものに近いんだからグローバルで戦えるでしょ。
>>316 韓国では職人は尊敬されないって聞くけどね。
しかし、メモリのことだけでCellとかの話が出てこなかったのは残念。
>>317 尊敬されないのは日本でも同じだからなあ。
どこぞの文系の阿呆が立てたどうみてもおかしな戦略に従って、体を壊しながらものを作る。
同じことなら金くれる方がマシだという気持ちになるのは非常に理解できるのよ。
真面目な話、自分の子供に技術職を勧める気にはならんねえ。
その論法は何職にでも適用できるというか、 自分が技術職じゃなくても同じことを言ってそうな気が。
農家最強
>>319 確かに今の日本では理系や技術者が報われない部分が多いな。
この世界の人間は政治や経済に興味を持たない傾向が強いからね。
ATIのAVIVOがあんなにすごいんだったらCell+RSXでとてつもないエンコシステムができるのでは、と 妄想するんですが、どうなんでしょ
Intelがのし上がった経緯も放送すべきだったな あそこも日本の電卓技術に世話になって今に至ってるんだろ 結局オペレーションの良し悪しでここまで差を付けられたってのが分かる
>>320 だな、単純にくさってるだけだよなw 人間こうなったら終わりっつー見本みたいなヤツだよなw
人生七十年ぐらいの短い期間なんだからなんでもっと楽しく一生懸命やろうっつー気にならんのかねw
サムスンは、株の大半をハゲ鷹外資に食われてるだろ。 おそろしいよのう…ハゲ鷹共は
>>325 >だな、単純にくさってるだけだよなw
若いねえ。一生懸命働いた結果、体壊して何の救済や見返りがなくても同じ事を言えるかい?
ま、心配されなくても楽しんではいるよ。別に会社は一つってわけでもないし、日本にしか求職が
ないといううわけでもない。次はEUあたりの企業かなあ。
>>324 それを作った鴨氏のblogは面白いね。
最近更新が停止してるのがちょっと悲しい。
身体壊してたら品質の良いものは作れない。 「モノをつくること」にこだわるなら、作り続けられるような職場環境・待遇の追求も 職務の一つだと思われる。自戒を込めて。
ポリフォニーなんかは、かなり良い環境と時間を与えられてるからなぁ それでもあのクォリティ叩き出すのは凄いが
>>299 まてまてまて、CPUとモックの発表段階から、
熱設計がダメだろ、レベルの議論をされて、
リアルに熱暴走、電源安定周りと思われる
トラブル続出の360を買えは、少なくとも現時点
ではないだろ。
>>315 いや、日本で言えば戦後復興期にやっていた斜傾生産の
半導体版だから、上手くいかない方がおかしい。
(そんくらい、中学校の社会科でならうでしょう?)
勿論、寡占、ダンピング的な問題が発生するので、「日本以外の
経済圏」では、自経済圏の半導体屋が『全滅』する前に反ダンピ
ング関税を発動している。
日本にとっての韓国の半導体のそれ以前の問題は、その資金と
技術が全て日本の半導体屋が血反吐破棄ながら蓄積したもんで
あり、馬鹿な団塊的な経営陣とモラルの欠片もない一部の屑工員
が殆どロハで流出させた事と、それを防止するスパイ防止法がな
かった点。
現に、韓国は(主に対中国、台湾向けの)企業自身の防衛もすごいし、
それに関する国の支援もすごい。
333 :
3 :2005/12/26(月) 00:42:44 ID:dRb84siV
今朝はレスをちゃんと読んでなかった。何だかな、っていうレベルの人もいるのでちょっと。
漏れの質問には答えてくれる人はいないようなので以降はROMに戻るつもり。
>>117 全然最近じゃない。日本の黒歴史だけど、第5世代コンピュータって知ってる?
>>121 すごくどうしようもない例を挙げないでくれ。
そのレベルに合わせてものを言うなら、並列処理しなければ10000時間かかるゲーム処理が
100時間になってたら意味あるじゃないか。
それを実際のプレイ時間で割ればいいだけの話。
usecのレベルで予測不能な遅延がおこってたら学術計算だって並列処理の恩恵はない。
> (そんくらい、中学校の社会科でならうでしょう?) 実社会においては、中学校の社会科の範囲では説明できない事象も多いのですよ。
教科書に載っていた、関東ローム層がとてもおいしそうな名前に見えたあの頃。
しかし説明が無いのはどうして寒損がフラッシュメモリーの経済的価値を知ってるかと
いう事。
>>326 の言う禿げ高が寒損を食うと言うより禿げ高が寒損に日本企業の情報を
流してると見るのが正しい。
337 :
3 :2005/12/26(月) 00:53:34 ID:dRb84siV
>>108 将棋のmin-maxを並列処理なんてその方が馬鹿げてる。
正直108はアルゴリズムのAの字も知らないんじゃないかとみんな相手にしてないのだろう。
プライドが傷ついたなら漏れが
>>255 で挙げた処理がMPIで速くならない理由を挙げてほしい。
>>243 MPIが新しいスレッドを立ち上げるときに自分のコピーをつくるというのは通常の実装で、
それを踏襲するならその懸念はない訳ではない。
しかしMPIの実装なんて常にアーキテクチャに最適化されるものなのだから、同じ実装を
Cell用にもしなければならない理由はない。
rank0になるのが常にPPEでSPEは1以降だと決め打ちしてればいいだけだと思わないか。
それに漏れが何度も言うようにMPIを例に挙げたのは意味不明な俺定義で言葉を使うのではなく
プログラミングモデルを明らかにできるような言葉を使うためのだから必ずMPIにしろ
などとは言っていない。
338 :
3 :2005/12/26(月) 01:01:28 ID:dRb84siV
>>243 への続き
それでもMPIに限定して話をしても実装方法はいくらでも思いつく。
ある限定した処理を行うスレッドをPPE用とSPE用のオブジェクトコードを持っておく。
このオブジェクトコードは機能に特化しているので非常に小さい。
メインループからはパイプなり共有メモりなりシグナルなりでPPEにあるそのコードを実行してい
るスレッドに要求を出す。そしてSPEで計算した結果をメインループに返す。
PPEはコンテクスト切り替えにも強いからこういうスレッドをいくつか立ち上げておけばよい。
これは非同期に要求を出したり受け取ったりするとデバグが非常に難しくなるが、通信を同期化して
さえ一定の効果はあるだろう。
>>334 う〜ん、博打打つ時に、単に運だけに任せる様な
奴は馬鹿、って言いたいのかな?
でも、それって、しかるべき選択(下らない突っ込み
防止としてかけば目の良い選択)をしての成功と、
無思慮の投機の成功も全く同じ、って言っているのと
変わらないと思うのだけれども。
余談だけど、俺のレスした315氏のあげた情報、物流を
外資から守る為に国営となっていた電電や国鉄と、加工
貿易で国力をつける為の斜傾生産の産業は、目的も
有り様も別だし。
>>337 んじゃ、MPI以外でのCellでの並列化アルゴリズムってなんじゃらほい。
>>338 関数やライブラリをSPEに置いておくって事かな?
戻り値を返すまでの間、PPEが待たされるんじゃシングルタスクと変わらないじゃん。
ポリフォニーはTVのドキュメントでやってたが、将来不安だといってたからやっぱダメだろう。 スペックに見合わないものを作るために大量に人員突っ込んでるし、技術的ないろいろやれて うらやましいとはとても言えないかと。 当然そこよりヘボな中小ゲーム屋よりはマシだがw
>>341 それはマルチスレッドでプログラム組んだことありませんといってるのと同義だ。
344 :
3 :2005/12/26(月) 01:19:18 ID:dRb84siV
>>270 スマン。寝ぼけてて変だと思ったままリアルに間違えた。「釈迦に説法」のつもり。
>>254 >>244 が言いたいのはPXでスレッドを立ち上げすぎるとL2の競合がひどくなるってことだと
思う。ただOpenMPだと同じアドレスを複数のスレッドで共有できるので全然別の処理では
なく、同じ配列に対する読み込みをして処理するルーチンなら速くなると思う。
しかし別のコアにスレッドが割り振られたら悲惨なことになるが。
OpenMP2.0はスレッドのレベルを制御できるらしいのでもしかしたらそこをコントロールできる
のかもしれないが、2.0は使ったことがないので分からん。
>>337 PPEとSPEではソース互換はあっても、バイナリ互換は無いんですけど。
そういう手法はPXみたいにISAが共通でないと出来ませんね。
346 :
3 :2005/12/26(月) 01:24:09 ID:dRb84siV
>>340 MPIは「アルゴリズム」じゃない。
>>341 PPEで非同期で動いている複数のスレッドのうち一つが待たされているが他は動いている。
待っているだけのスレッドには処理時間はほとんど割り当てられないのに何処に難癖を付けているのか
わからないのだが、そんなに分かりにくい言い方だったか?
347 :
3 :2005/12/26(月) 01:25:52 ID:dRb84siV
>>345 >PPEとSPEではソース互換はあっても、バイナリ互換は無いんですけど。
読んでから言ってくれ。
同じソースからPPE用とSPE用の両方のバイナリ(オブジェクトコード)を作っておくと言っている。
348 :
3 :2005/12/26(月) 01:38:42 ID:dRb84siV
というわけでROMに戻る。 漏れはハードのことはからきしだが、PthreadもMPIもOpenMPも使ったこともないのに名前を挙げる 人がいたので(多分java.lang.Threadくらいの経験?)ちょっと言わせてもらった。 これは勝利宣言じゃなくて、自分の知能の及ばない視点を出してくれる人がいないかと思っていたが 見当たらなくて意思が続かなくなっただけなのでなんとかのガイドラインで当てこすらないでくれ。
脳内講釈乙
同期通信で充分ですよ
まだコボは来てんのかよ・・・うっぜーなキチは
>>348 3氏、また今度気になることがあったら書き込んで欲しい
彼方の疑問はとても参考になった
まぁ、俺ショボイコード書いて悦に浸ってる、エロゲPGだけどな orz
キーワード使って#ifでソース統合しようと思えばできる。 バイナリが別になるのも、PPUのコード内で、 libspeのspe_open_image("spu.out")をしてるからだけど、 その中身ってmallocしてelfバイナリを読み込んでるだけだから、 別の場所・・・PPUのバイナリに専用のセクション作って そこから読み出すように改造する事も出来る。 cbe_linux/src/libspe/spe.cのspe_image_load()だな。 だから、ソース・バイナリを同一にしちゃうってのは出来るよ。
>キーワード使って#ifでソース統合しようと思えばできる。 (笑)
>>353 IBMのMPI実装例はSPUに限定した不完全なもので
>>3 が言うような理想的ものではないんでないかな。
Cellの開発でリッチコアを複数搭載したPXのようなものをIBMが望んだのもプログラムの自動並列化が困難になるからだろう。
ちなみにそれをする意味は、今のところ思いつかないな。 別にMPIの実装に必要とも思えないし。(MPIって、同一バイナリ じゃなきゃ駄目とかって仕様でもあったっけ?) なんなら、MP_Liteでもいいだろうし。
>>357 >>3 が望んだ姿かどうかはさておいても、別に不完全でいいと思うけど。
別にPPE/SPE以外では使わないのでサブセットで十分。
むしろ余計な処理入れてしまうと遅くなる。
360 :
名無しさん必死だな :2005/12/26(月) 12:39:43 ID:JLL1jHej
Cellがスパコンなのかどうかで言えば、”ハッタリ”と考えた方がいい希ガス。 理想条件での公表処理数値はやはりstreaming系特化したケースと見るべきだろうし マルチタスク制御考慮すると、どうしてもPPE+SPUセットの性能には疑問が残る。
361 :
名無しさん必死だな :2005/12/26(月) 12:41:46 ID:PvWcZGIZ
ソニー自身がPentium4と同じくらい といってんだからハッタリだったと認めたようなもんだろ
362 :
名無しさん必死だな :2005/12/26(月) 12:48:37 ID:4EGdRsMn
うるせえなあ馬鹿チョン。東ア来な!
363 :
名無しさん必死だな :2005/12/26(月) 13:07:18 ID:AgrLW2vy
現状ではMPIもOpenMPもミドルウェアもなしか。 PS2のロンチとたいしてかわらんな。
ゲームにそんなもん使うか馬鹿。 サランラップ製コンドーム並みに使えねーよ。 なんでCellプログラミングは難しい。から一足飛びに手厚いサポートライブラリがないと開発不可能になるんだよ。
MPIとかゲームに使うと思ってる阿呆がこんなとこで何してんだ
そう思うなら無駄にレスなぞしてやりますな(><;)
補完よろ Cellって糞なの?─糞じゃないよ派─Cellサイコーだよ派─┬─久夛良木原理派 (独裁主義者) │ │ ├─山崎崇拝派 (プロジェクトX主義者) │ │ ├─IBMマンセー派 (仙道主義者) │ │ └─これからはマルチコアだよ派(仙道主義者) │ │ │ └─────まあまあだよ派───┬─トランジスタで決まる派(数は力主義者) │ ├─IBMはいいけどSCEが派 (アメリカ崇拝者) │ ├─SCEはいいけどIBMが派 (国粋主義者) │ └─でも開発が難しい派 (底辺プログラマ) │
│ └───────糞だよ派───PXが上だよ派────┬─ソニーがやるのは全てだめ派 (元セガ信者) │ ├─MSがやることに間違いはない派(Officeマスター) │ ├─OpenMPの方が楽だよ派 (脳内開発者) │ └─GPUが糞だから意味ないよ派 (モンスター主義者) │ ├─────マルチコアは糞派──┬─クロック挙げろ派 (ただ飯主義者) │ ├─開発難しすぎ派 (エロゲーPG) │ └─マルチCPU派 (コスト無視主義者)
│ └────アーキテクチャ否定派─┬─リングバス糞派 (スパコン原理主義者) ├─LSはキャッシュ派 (コヒーレンシ主義者) ├─ぜいたくは敵派 (SPEはDSP主義者) └─MACオタ (MACオタ)
何か足りないなと思ったら、インテル系派がないようなw
ズレズレだよ(半角スペース撲滅派)
ズレータ(福岡ソフトバンクホークス派)
373 :
名無しさん必死だな :2005/12/26(月) 18:02:26 ID:JLL1jHej
糞とは言ってないんだよな。 印象 Cell→競馬用サラブレッドで多頭引きする馬車 ※ 単独走ではないので入念に調教しないと速さが生かせない。悪路や勾配等、多様に走破できるか疑問。高価。 PX →汎用トロッターで2・3頭引きする馬車 ※ 調教は比較的楽。それなりの速度とサラブレッドに勝る多様な走破性。安価。
MACオタがインテルマンセー派
ユーザーがCellに期待して悪いことは何もない。 ただ、新作を中古で買うようなアホに Cellを駆使した高度なゲームを期待する権利はないぞと言っておく。
>>373 PX→走破性が売りだが朝飯(キャッシュ&帯域)抜きで走る馬車
楽と言っても、Cellと比べてとかその程度だしね。 本当に簡単にマルチコアっで楽々プログラミング出来るなら、 ここまで延期続きにはならないわな。
>>375 中古市場があることは良いことだと思うぞ。
クソゲーを正規の価格で買いたいと思うか?
Getできなかったけど再販してくれない製品をどうやって買えばいい?
そういうマルチな視点をもてない奴もCellを駆使した高度なゲームを期待する権利はないぞと言っておく。
379 :
名無しさん必死だな :2005/12/26(月) 18:54:57 ID:JLL1jHej
開発に関して、Cellよりはかなり有利と思うなあ ・マルチスレッド化というよりOS、アプリ、映像処理を個別に扱わせる3コアでしょ。 速度は劣っても連携を最小に抑えるマルチタスク面のパフォーマンスアップを狙ったと思われ。 ・プラットフォームの違い。 窓もペンギンも開発資源の量はまず同等だろうが、オープンソース流用はセキュリティー上 × 窓なら従来からの安全なPC資源を選択すれば、マルチタイトル戦略が容易。
いつもの人かな
実機が出る前はいろいろ好きに言えたんだけどねー いくらIBMでも、2年ででっちあげるのは無理があった。
小鳥が「箱○でもMG4は可能」と言ってた真意がはっきり判った。 最近MGSのプロモビデオがゲーム屋に置いてあるけど、これ凄すぎ。 よりによって箱○が発売されてすぐにこういうビデオを置かれるとみんなPS3に逝って しまう事でM$に睨まれるのを懸念したとしか思えない。
383 :
名無しさん必死だな :2005/12/26(月) 19:16:51 ID:5Bb3kGsP
>>380 「いつもの人かな 」しか言わない、いつもの人だ。
元ネタでは箱○だけでなくPCも入ってたとおもう>小島発言 これからはプラットフォームより作り手のセンスが重要だという主旨
387 :
しろーと :2005/12/26(月) 19:34:37 ID:TOsjUsQz
多分小鳥は、箱○とMGS4については「理論上は作れるけどそのためにはいろいろカリカリチューン しないと」みたいな話をしてたんじゃないか?それくらいあの映像は凄い。多分そういう 言い方をしないと箱○が売れないのは小鳥の所為と言われかねんからね。
>・マルチスレッド化というよりOS、アプリ、映像処理を個別に扱わせる3コアでしょ。 >速度は劣っても連携を最小に抑えるマルチタスク面のパフォーマンスアップを狙ったと思われ。 OSってコア一つ使うってどんな重い処理させるの? それとメインコアと分離した映像処理って? しかも、Cellではできないとでも言わんばかり。 >窓もペンギンも開発資源の量はまず同等だろうが、オープンソース流用はセキュリティー上 × >窓なら従来からの安全なPC資源を選択すれば、マルチタイトル戦略が容易。 流用って何に流用するの? 安全なPC資源って具体的に何? そもそも、オープンソース流用はライセンスの問題が生じやすいし、 別にXbox360だろうがDCだろうがPS3だろうがPCだろうが同じ事だと思うが。
>>378 クソゲーを正規の価格でって・・・それ以前にクソゲーは買いたくないなw
390 :
名無しさん必死だな :2005/12/26(月) 20:22:04 ID:YbDnk1ES
>>388 重くなくてもPC的用法ならOSに一個でしょ。 現行のPC的マルチコアの用法だとそれが普通なのにw
「ゲームだから殆んど必要ない」と言うなら構わんが、周辺デバイスも考慮すると低負荷OS〜PS3のホームサーバーは糞かも?
Linuxの資源が基本的にオープンソースだからわざと書いてるんだろうがw
商用でゲーム成功or普及したLinuxアプリはほとんど無いだろ、ソコが違うと言ってんのに・・・orz
>>390 >周辺デバイスも考慮すると低負荷OS〜PS3のホームサーバーは糞かも?
ユニプロセッサマシンでホームサーバやると糞なのか。凄い理論来たな。
>Linuxの資源が基本的にオープンソースだからわざと書いてるんだろうがw
別にPS3のゲームにLinux使うわけじゃないし。
選択肢としてLinuxやTronを使える可能性はあるが、必須ではない。
PS3でLinuxは動くが、PS3=Linuxではない。
>商用でゲーム成功or普及したLinuxアプリはほとんど無いだろ、ソコが違うと言ってんのに・・・orz
そういう具体例で言うなら、ルータ、DVD/HDDレコーダ、携帯電話、NASとか
色々な分野でLinuxの成功例はあるが。ゲームなんて組み込み系の
一種みたいなもんなんだから、別に土台で動くOSなんてほとんど関係ない。
いつもくる人がワラワラゲーがどうのとか言ってますがこんな情報があるそうです、以下コピペ 9 名前:名無しさん必死だな sage 投稿日:2005/12/26(月) 20:01:49 ID:lRYtLeH9 >実験1:CoD2の死体はどんなもん? >XBOX360はシーン全体で4体まで。 >死体が一杯発生する激戦区(Hill400防衛とイギリスのラスト篭城の2箇所)で死体に集中して実験しました。 >基本的には視界外の物から消すようにしてはいるようなので、画面に無理やり4体見える状態を作ってから >倒したりしなければ、パッと消えてしまう事はめったに起こらないようにはしてあるみたい。 >戦闘終了後数えても4体までしか見当たりません。 >PC版は数えるのがめんどくさい、、 >けどがんばって数えてみました。360でやったイギリスキャンペーンのラストの篭城で戦闘終了後に >数えてまわった所、多少誤差があるかもしれませんが、54体でした。 死体だらけ。 いくらなんでも十分の一はショボすぎる。 ワラワラ苦手なのはGPUキャッシュ少ないせいか。 N3も予定した速度出なくて延期しちゃったしな・・
393 :
名無しさん必死だな :2005/12/26(月) 20:52:54 ID:YbDnk1ES
>>391 OS負荷がとにかく”在って無いような物”にしたいようで、それならそういう事にしといてあげるよw
Linux≒PS3だが、プラットフォームはLinux。
開発資源の話をしてるのに、随分捻ってくれる人ですな・・・orz
OSとサウンドはコアに一つずつ割り当てられていて負荷はそれぞれ5%、20% 残りはマルチスレッドでゲームに使うそうでコアが丸々一個OSに割り当てられるなんてことはありません
>>393 プラットフォームがLinuxだと何か問題があると?
396 :
名無しさん必死だな :2005/12/26(月) 21:28:42 ID:YbDnk1ES
マトモな回答ですね。 その記事はどこかで読みました。 割当量は変動の可能性もありますから、現時点での参考例とさせてていただきます。 意図としては、PXvsPPE+SPEとの利用形態が大きく異なる事ですので、 マルチコアの使いまわしについてCell同様の労力が発生しているかのようなレスへの警鐘と 共通項が多いだけで全く異なるレイアウトのCPUを、同一の発想で測るのはどうかと思って 詳細は黙殺しましたが、この点は強調し過ぎたと思っております、何卒ご理解くださいませ。
粒度の荒いマルチスレッドを使ってる時点で労力は一緒 あと難しい言葉でごまかそうとしてもムダ
>>393 >Linux≒PS3だが、プラットフォームはLinux。
>開発資源の話をしてるのに、随分捻ってくれる人ですな・・・orz
開発資源って具体的に何の事?SDK?PS3ゲームのOS?ライブラリ?
何を差すにせよ、それがLinuxであるというソースは?
PS3-Linuxがリリースされる予定と、IBMがCell-Linuxを配布はしているが、
それ以外の部分、特にゲームにおいてLinuxを使うという話は聞いた事ないのだけど。
399 :
名無しさん必死だな :2005/12/26(月) 21:36:58 ID:YbDnk1ES
少なくとも、公表性能通りの事をやろうとすれば、LSサイズに細分化若しくは最適化する労力が個数分多くなる。 一緒と考える脳内フィルタは相当壊れてると思われ。
400 :
名無しさん必死だな :2005/12/26(月) 21:39:19 ID:YbDnk1ES
GUIも独自にプログラムしてるのか? ますますCellは大変そうだ。
>398 中黒orz店に餌をあげないで下さい。
急にスレのクオリティが高くなったと思ったらもう冬休みだったのか
なぜCellだけ公表性能どおりなのか PXで公表性能どおりの性能を引き出すには3コアで共有する 二次キャッシュの最適化とプリフェッチが欠かせない 君の脳内フィルタは正常に稼動してるようだね
GUIって… このレベルの人がなんでプラットフォームとか語ってるんだろ…
405 :
名無しさん必死だな :2005/12/26(月) 21:46:04 ID:YbDnk1ES
実機があるのだから公表性能以下だろうが何だろうが、現状はあの程度で推移してる。 Cellの公表数値を根拠に叩く、狂信者に対する疑念を言葉にしてるだけですよ?
あの程度って?ベンチマークでも出たのかね
408 :
名無しさん必死だな :2005/12/26(月) 21:53:04 ID:YbDnk1ES
>>406 暗にCellの公表数値は「検証しない・できないもの」だと言う伏線ですか?
いくら妄想スレでも他社ハード叩きやるのなら、ソコは意味持たせなさいよw
なんのこっちゃ 結局Cell叩きしたいだけか OSで丸々1コア使うとかいう妄想はどうなったんだ
比較対象になるはずのPXのベンチがどこにもねーべよ
411 :
名無しさん必死だな :2005/12/26(月) 21:58:45 ID:YbDnk1ES
ポジティブ要素は妄信。 ネガティブ要素は黙殺・聞かぬ振り。 スレ住人の体質批判でもありますが何か?
PS2でも動作してるLinuxが重たいとはワロス発言だなw
413 :
名無しさん必死だな :2005/12/26(月) 22:00:09 ID:YbDnk1ES
重たいとは書いてないぞ。
>>411 具体的にOSのどんな処理が300Mhzで動作してるEEに負荷を与えていますか?
ああ、スレ批判したかっただけね 技術は妄想でもいいと
ゲーム機のOSなんてあってないかのごときの負荷ですが。 NDSにもOS入ってると知ったらショック死しそうだなw
まあどうせ、すぐにIntelの新コアに追い抜かれるだろ。
418 :
名無しさん必死だな :2005/12/26(月) 22:01:27 ID:YbDnk1ES
このスレはアンチが脳内Cell仕様に基づいて叩くのに反論してるスレに見えるんだがなぁ PX叩きってそんなに目立つか?
PXは叩かれてるというより笑われてるというか
PXなんて普段話題にすら上がらないじゃん。 もっともCELLスレなんだから別におかしなことはない。
だよな、いや
>>408 で他社ハード叩くならとか言ってるんでな
424 :
名無しさん必死だな :2005/12/26(月) 22:16:17 ID:YbDnk1ES
>>395 >>398 問題とは言っていない。
Linux(UNIX)向けの目ぼしい商用ゲームアプリが無いのは、窓ベースのゲーム開発環境に比べて不利だろうといっている。
Linuxではゲームがまともに動かないとか言っているわけではない。
開発環境としての具体例考慮しているなら書いているが、資源=Linux向けの著名ゲーム群という位置づけで説明した事、
意図をまだ理解していないご様子で。
608 :Socket774 [sage] :2005/12/03(土) 01:17:48 ID:nrkR5Pxx
http://blog.so-net.ne.jp/pcgame/2005-08-23 描画処理は並列化のいい見本となるが、ゲームプログラムそのものを
並列化することは予想以上に難しいことであり、このことが今後の
ゲーム開発をさらに難しくしていくことになるだろうと懸念を抱いている。
TLPの限界
http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2598&p=4 ハードウェア技術者はこれ以上大規模なスーパスケーラなCPUを
信じていません。ILPを僅かに増加させるのにも、指数関数的に大きい
OoOのハードウェア(=消費電力)を要してしまうからです。
TLPとマルチコアは今ホットな話題です。
しかし、ハードウェアのILPを向上させようとした時と同じような問題が、
ソフトウェア開発におけるTLPに関しても言えます。
レンダリングやデータベースサーバ等の自然に平行処理できる
アプリケーションを除けば、より多くのスレッドを使おうとした場合、
指数関数的に多くのプログラミングとデバッグの時間を必要とするでしょう。
>>424 そういう意味でのLinux向けの著名ゲーム群なら、PS2に山ほどあるじゃないか
PS2も開発環境はLinuxベースだぞ?
428 :
名無しさん必死だな :2005/12/26(月) 22:26:13 ID:YbDnk1ES
>>427 そういう話にやっと辿り着けたか;
ただ、Linuxプラットフォームで育てた資源もCellというハード環境がPXあたりと比べて特異なのは間違いないでしょ?
そうなるとゲーム開発の敷居が相当高いのは認めるべきだし、「PXだっておんなじ」と言った印象操作は姑息だろうと。
>>424 >>428 意図的かどうかは知らないけど、何をわざと混同してるの?
1. 開発プラットフォーム
LinuxだろうがWindowsだろうが関係ない。開発機のOSは、開発対象のゲームとは必ずしも関係ないのだから。
ゲーム機開発は昔からクロスプラットフォームが当たり前。
2. 対象のゲーム
>>424 の「資源=Linux向けの著名ゲーム群」という文から考えると、
これの事を差してるの?なら、無意味だ。
PS2のゲームはWindowsのゲームそのものか?違うでしょ。
Xboxシリーズ以外のすべてのゲームは、Windowsとは違うプラットフォームだし、
それはLinuxかどうかは関係ない。
むしろOpenGLかDirectXかと言った部分の方が依存度は高い。
3.ミドルウェア・ライブラリ
SCEやミドルウェア屋ないしソフトハウス自身が用意する物。
Linuxとは無関係。もちろん、一般的にLinuxと呼ばれる環境で
使われるオープンソースコンポーネントを流用する事はあるが、
それは個別のケースの話に過ぎない。
ライセンスの問題が生じやすいので手を出さない方がいいしな。
>>428 EEも相当特異だがな、2つは簡易とはいえCPUコアが3つ載ってるマルチコアに近いCPUだった
それを使いこなしていたPS2系のプログラマーには、Cellもそんなに特異には見えないだろう
逆にPCやXBOX系のプログラマーだと、PXが初のマルチコアハードになるプログラマが多い
だろう、そういう意味じゃXBOX360系の方が敷居は高いんじゃないか?
ま、これはプログラマに関しての話しだがな
「CellとPXの両方とも同じ程度に敷居が高い」というならともかく、PXだってマルチコア独特の
敷居の高さがある事は間違い無いと思うがな
431 :
名無しさん必死だな :2005/12/26(月) 22:48:25 ID:YbDnk1ES
>>429 >むしろOpenGLかDirectXかと言った部分の方が依存度は高い。
全てではないけれど応用例が圧倒的に多いであろう窓環境の優位性と考えていますよ。
親和性の高さはCellプログラミングについて余り期待できないし、やはり無視できない要素と思う。
詳細な事情は各環境でも同等と言いたいのでしょうが、それは無理があるでしょう。
432 :
名無しさん必死だな :2005/12/26(月) 22:48:53 ID:8J8Btl+R
分散させる処理が描画だけなら難しくないでしょ。 どうせVSYNCをボッケリ待つ間は他の処理は必要ない。
433 :
名無しさん必死だな :2005/12/26(月) 23:12:06 ID:YbDnk1ES
描画性能はCellの圧勝。 確かにそう思いますね。 ただやはり気がかりなのはLS・MIBの説明を見る限り、ロジカルな処理を組み込んだ時の ハードの素性からくる不向きな傾向と、実際のパフォーマンス低下かな。 PPE×2 SPE×3×2(PPE+3SPEが2セット)とかだったら、プログラミングはともかく現行のPCマルチコア のようなタスクの再配分でよさそうだしけちのつけようも無いですが、PPEvsSPEというようなグループ分けが出来ても 満足できるタスク分散は出来ないように思いますね。
PCのマルチコアのアプローチ自体に疑問があるわけさ。 ソフトウェアからの要求に基づいてないから。 MTのコスト払ってピーク2倍(実質ルート2倍程度か)じゃ割にあわない。 汎用コアは1個ありゃ十分。
>>433 > 描画性能はCellの圧勝。
俺もそう思うのだけど言い切るだけのソースはどこにあるの?
クライオンを見たらMGS4での確信が揺らいできている。
>>431 相変わらずWindows環境の「何が」Linuxより優位なのか書いてないのはワザとなのか?
プログラミングの親和性というのも具体的に何をさして言っているの判らないし
>>433 でも
「ロジカルな処理」「ハードの素性から来る」「不向きな傾向」「実際のパフォーマンス低下」と
曖昧な言葉を使い、印象操作をしているのはむしろそちらに見えるんだが
437 :
名無しさん必死だな :2005/12/26(月) 23:26:13 ID:/LPLM+2H
NECは,既存のアプリケーション・プログラムを自動変換して並列化し,マルチコア・プロセサ上で実行する技術を開発した。
既存プログラムを実行形式(バイナリ)のまま自動変換して並列化するツールと,新たなマルチコア・プロセサから構成する。
特徴は,既存のプロセサ・アーキテクチャに「投機処理」と呼ぶマルチスレッド実行の方式のためのハードウエアを追加することで,
上位互換性のあるマルチコア・プロセサを実現する。既存のプログラムの実行形式のまま変換できる並列化ツールも開発した。
中略
シミュレーションにより,各種ベンチマーク・プログラムでの性能向上を確認している。
「4プロセサ・エレメントの場合で,人手による並列化では性能が1.95倍になるところを,自動並列化により2.83倍に高速化した」としている。
ttp://techon.nikkeibp.co.jp/article/NEWS/20051219/111757/?ST=lsi こんなのもできてるぞ
>>435 クライオンってあの雑誌のスキャン?
まだ実機画像は一切公開されてなくて、「このムービーと同じ品質の映像が実機で動く」という
発表があっただけのようだよ?
TFLO方式で、製品出すつもりないんだからいくらでも大風呂敷広げられるわなあ。
>>436 で指摘されている通り、もっと具体的に言ってくれ。
もちろん、Windows上のゲームを移植しやすいだろうし、
そういう意味合いで開発しやすいとは言えるだろうけどな。
でもXbox360のOSと、x86 PCのWindowsの実装は全く同じというわけじゃない。
CPUの違い、細かい挙動の違いもある。
移植性を考えた場合、Linuxかあるいは他のOSかというのは関係ない。
単にWindows系かそれ以外かという事だけ。
MGS4は少なくとも実際の開発機上でカメラやライトを動かすデモをしてたよ
携帯電話に搭載されれば CELL PHONE
>>437 それってアウトオブオーダーのスーパースケーラと何が違うんだろ
445 :
名無しさん必死だな :2005/12/27(火) 00:05:19 ID:EvaYNZVP
近い将来、ゲーム機で簡易オフィスツールとブラウザ、マルチメディアコンテンツ統合されると考えてます。 PCの性能向上、ソフトの進化は停滞しつつも一般家庭には必要以上のものだし、 周辺機器端末→クライアント化とか成立しつつある。 PCそのものは途上国向けにまだまだ売れるかもしれないけれど、機能使い切れるユーザーは知れてる。 人型ロボットが出る頃にはPCではなくメイドPC(チョビッツ?)が高度に世話してくれるのだろう。 そうなれば簡易PCはゲーム機で間に合う、携帯がでかくなるのもノートが小さくなるのもニーズが無いけど 据え置きゲームがPC化するのは都合がいいと思う。 PS3に期待していたのはコレナンダヨナ。つかみどころのないCellは魅力無いのよね;
Cellは現実の市場で戦うための製品なので、妄想の世界の住人にはちと期待はずれな部分も多いかと。
あいかわらずアンチの例えはちょびっつとかキメーな
> 人型ロボットが出る頃にはPCではなくメイドPC(チョビッツ?)が高度に世話してくれるのだろう。 一番の突っ込みどころはここじゃないんだが、それでも突っ込みたくなるよな んで一番の突っ込みどころは、 「据え置きゲーム機がPC化してほしいと思ってたのにつかみどころのないCELLは魅力がない」 どう見ても前後の文がつながっていません、ほんt(ry
一番妄想激しいのはクタラギだけどな
クタのあれは天然
262 名前:名無しさん必死だな[sage] 投稿日:2005/12/27(火) 00:59:22 ID:Ic6xTV7k 分けるというよりも、CPUとGPUというプロセッサが各々で専有できる 直結のメモリを持つ構造は、コンピュータの構成としては自然な形。 PS3はその上で、CPU−GPU間を非常に高速なバスで接続し、 さらに相手方プロセッサのメモリも、直結のメモリと同様のプロセスで アクセス出来るバスアーキテクチャを採用した。 コスト的には不利だが、性能面では理想的。
>>441 もともとWindowsNT系はCPUを特定して造られているわけじゃなく、最初の頃はMIPSや
モトローラ系CPUのWindowsNTもあったけどね。
それと、Xbox360のOSはNTカーネルをベースにしているしグラフィックAPIもDirectXだ。
PCからの移植になんの問題があるのだろうか?
>>442 Xbox360はデモレベルのものは、すぐに作れるから近いうちにムービーが出てくるんじゃないかな。
>>454 360の場合はキャッシュやメモリの構成から、チューニングの段階で問題がでやすいことが予想されているね。
>>456 いや、勝手に予想されても。
ソースぐらい貼ってくれ。
>>454 一番の問題はエンディアンだろうな、PC向けに作ったバイナリデータは軒並みコンバートが
必要だろう、XBOXソフトのエミュでも問題になったようだし
それからグラフィクAPIはDirectXだけれども、GPUが独自アーキテクチャで、特にeDRAMと
タイルレンダリングというPCのGPUでは、今までに無い仕組みを取り入れてるので
eDRAMにフレームバッファ全体が載る場合以外は様々な制限が生じる
具体的にはレンダリングパスの構成をしなおさないとダメとかね
で、その制限を避けるためには内部解像度を落とすとか、AAのレベルを下げるなどの工夫が
必要になるのはご存知の通り
>>455 それなら、実際に出てきてから判断すれば良いんじゃないか
同じ画質なはずのイメージムービーが信用出来ない事はいい加減学んでるでしょ?
んなもんeDRAMなんかないものと思えば今までのPCと同じやん あとPPC970と同じ流れでエンディアンもintelチップと同じリトルエンディアンだべ
eDRAMを無いものにできないから問題なわけで
誰からそんなことを聞いたんだ
eDRAMにしかレンダリングが出来ないGPUなのに? それからエンディアンはビッグエンディアンだよ、なんせMS自体が配布してる Xbox360Preparation.docという開発者向け文書にわざわざ >Update your content pipeline to support big-endian hardware. >Intel-based PCs are little-endian, while Xbox 360 is big-endian. >We recommend that all content on the Xbox 360 game disc be in big-endian format for >best performance. と記述するぐらいだからね
そらあんた970以降のPPCはエンディアン切り替え式で混在不可だから書いてあるだけやん
>>464 >Intel-based PCs are little-endian, while Xbox 360 is big-endian.
の文が目に入りませんか?
>for best performance.
XBOX360はビッグエンディアンである事は間違い無いと、認める訳ですね? XBOXとの互換のようにデータのコンバートが不可能な場合以外、事前のコンバートで パフォーマンス低下を防げるのに、やらないとは思えませんがね 万一データ側を変更しないとしても、ソフトウェア側でエンディアン変換のプログラムを 追加する必要があり、結局移植に手間が掛かる事には変わらない訳で
468 :
名無しさん必死だな :2005/12/27(火) 08:32:09 ID:068Th3Ur
>>458 なんでx86のバイナリをXbox360でエミュしなきゃならんの?アフォか?
C++のソースコードにエンディアンの違いなんか関係無いだろ。
エンディアンの違いがまるきり関係ないわけではないが、組み込みソフトウェア開発という シチュエーションでは、深刻な問題となることはほぼないだろうね。
ちゃんと読めば判ると思いますが、バイナリ「データ」の話です プログラムの話じゃありません
>>470 マルチタイトルはソースを修正してコンパイルし直すだけでエンディアンは関係ありません。
脳内プログラマ乙。
>>471 マイクロソフト自身がビッグエンディアンなXBOX360の為に、データをビッグエンディアン形式に
して格納するようにと指示している訳なんだが…
バイナリ「データ」も元をたどれば「ソースコード」を「コンパイル」して作ってるのですよ、実は。
>>473 だから、そのデータを作る為のツールのソースコードを修正し、コンパイルし直して、
全てのデータをコンバートしなおすという追加作業が発生する訳だよね?
確かに大して難しい作業じゃないだろうが、手間が掛かる事には違いない訳で
んな定量的に予測できる追加作業の手間なんかが、PCからの移植時に 主たる問題の一つに挙がるわけないでしょ。あなた何しにこのスレ来てるの。
必ず発生する手間なのだから、十分に移植に関する問題の一つとして挙げられて良いと思うがな ところで、これ以上はCellとは関係無いからテクノスレでやった方が良いと思うんだが 他には、(たとえHDDユニットが搭載されていても)HDDへのスワップを使えないので 全てのフットプリントを512M以内に収まる用に修正する必要があるというのが大きいかな
>>476 の1行目は
レスの流れ的に、初代のXBOXのようにPCと同じアーキテクチャだったら必要の無い手間だと
いう点での話ね
>>379 確かに既存のプログラミングモデルでプログラムできるというのは利点だね。
当初は一つをゲームプログラムに、もう一つをLive関係に割り振る2コアだったが、
1コアではおそらくGPUに対して性能不足という話もあり、3コアとなったのだろう。
オープンソース流用がセキュリティ上ダメという事はない。
世の中のオープンソースUNIX系OSがセキュアじゃないというようなものだ。
またXBOXでとれたPCとのマルチタイトル戦略については、360では少し難しくなった。
CPUがx86系じゃなくなったし、今後マルチコア対応を進めたり、360のGPUへの最適化を進めるとより難しくなる。
>>475 たしかにそうだけど、XBOX−PCではほぼノーコストだったのに、
360ではそれなりのコストが必要になるというのは大きいよ。
実際360のソフトが発売日直前で延期をしている事が、
PC(PPC)ベースで開発を進めておいて、
それを360向けに手直しする手間が思ったよりもかかる事を示しているのでは。
>CPUは完全にMicrosoft専用の設計となっており、GPUもPCグラフィックスから >離れた部分(eDRAMなど)が多い。ソフトウェア層では、 OSをカーネルから起 >こしており、GUIなど新しいレイヤも増えた。プログラミングでは、カスタム >版DirectXを提供するだけだったXbox 1から踏み出し、包括的なプログラミン >グフレームワーク「XNA」構想を提唱した(実際には、実現しているのは最初 >のステップに過ぎない)。 後藤氏の記事より。 Xbox360はハード的にもソフト的にも、新しい実装が多い。 枯れた物を使えなかったわけだ。
ちなみにPowerPCとx86の違いはエンディアンだけじゃないよ。 アラインメントも違う。
本日の人 3xL4ccF0
なんじゃそりゃ。
またアイツ来てるじゃン
エミュするんならエンディアンもアライメントも大事かもしれんが それように作り直すんなら、なんの問題でも無いってのは普通の意見だろ
そりゃそうだが、初代XBOXみたいにPCと同じアーキテクチャだったら必要の無かった手間が 移植にかかるって話なんだから、その部分の手間が増える事自体は問題だろう
テスト
HDD非標準、固定ハードウェアスペック、カスタムCPU/GPUの活用等々、 ソフトウェアの設計段階に遡る要件変更のインパクトに比べたら、 エンディアンの違いなど瑣末事だ。
C言語だとエンディアン、アライメントでおかしくなるとしたら構造体をchar *でアクセスとか sizeof使わないで即値でオフセットとかintアドレスをキャストしてcharアクセスするとか いずれにせよ捨てた方が良いコードでないかいw
>>488 それらの要因とエンディアンは違うところで効いてくるのであえて
比較することもないんでない?
たとえバイエンディアンを意識してコーディングしていても、これ
まで異なったエンディアンの環境で検証したことが無いと、コード
のどこにでもエンディアン依存の部分が紛れ込んでいる可能性が
あるから、面倒な問題ではあると思うぞ。
491 :
名無しさん必死だな :2005/12/27(火) 12:44:02 ID:PM8FId8/
>>452 のソースを参照すると、少なくともCellでLive並みのサービス実装するのはかなり無謀ってことでFA?
>>489 エンディアンで問題が出るのはファイルへのセーブ等IO部分であって、
そんなところで問題なんてでるわけないだろ。
「サービスのためにコアを予約する」ってのが変な(めちゃめちゃな)解釈だ。 たとえ1コア/ハードウェアスレッドをシステムのために予約したところで、 それがL2キャッシュ汚したら、ゲーム用タスクの速度に影響与えるよ。 360の3コアは、単にピーク速度(カタログスペック)の追求のためとしか思えない。 システムのリソースを消費するようなネットワークサービスは ゲーム処理とは排他、というのがゲーム機では現実的じゃないかなあ。
>>492 ん?他のアーキで作成したツールで吐き出したデータを読む場合って事?
>>491 先生!どこをどう読めばそうなるのか教えてください!
ところで、PS2の時代は結構な割合でアセンブラで記述するって場面があったわけだが、PS3/Cellでも同じようなことをしちゃうわけかな? PS2の場合はある程度仕方なかった事かもしれないが、どうにかならないものかね。
LSフル活用しようと思ったら避けられないかと
普通のCのコードじゃ肥大しすぎてLSからはみ出ちゃうからな。
んー、それはSIMDを効果的にCで記述できないからってこと? だとすると、部分的にSIMDをうまく記述できるコンパイラがあるとすげ〜楽ってことになる?汎用とはいかなくてもそういうツールを作って、使っている会社ってあるような気がするなぁ。
>>499 それもあるし、そもそも256kBしかないのでデータハンドリングには細心の注意を払う必要がある。
DMAの読み込みタイミングあたりまでチューニングしようというならアセンブラは必須でしょ。
チューンするのはDMAと演算器を並列に最大限動かし続けるロジックであって、 記述はCレベルで構わない気がするが。
256KBしかないってのは、ちょっと違和感あるんだよなぁ。 純粋にロジックで使うのなら相当でかいと思うのだが Tiny Basicなんか2KBだぞw
G5の50倍のベンチ結果を叩きだしたTREdemoだと Cで記述されたソースから生成されたバイナリコード:30KB バッファスペース:212K スタック:5KB という割合だそうだから、C言語で記述しても相当複雑なロジックでもない限りは LSからコード部分が溢れるって事は無さそうに思えるな 馬鹿でかいライブラリを無駄に含ませたりしない限りはね
日曜にゲーム開発者の人と飲んだときにちょこっと聞いたんだけど 発熱のためにSPE二個は使用禁止になったんだって。 だから使えるのは8-1(りだんだん死)-1(発熱)-1(OS)で5個になるわけだ。 で、ミドルウェア一つにつき1,2個は使うからゲーム開発者は実はSPEなんて ほとんど使わないって事になりそうだね。
>発熱のためにSPE二個は使用禁止になったんだって >だから使えるのは8-1(りだんだん死)-1(発熱)-1(OS)で5個になるわけだ オマエは一行先に捏造したネタすら覚えてられないのかと
>>499 SPEの命令は組込関数で拡張されている。
ベクトル演算も。
>>500 256KBの半分をデータ領域として、それをダブルバッファで使っても64KB単位のデータが扱えるんから、
普通に関数単位とかの固まりでデータ転送できると思うけどな。
移植と言えばPC版のHaloはひどい出来だった
>>発熱のためにSPE二個は使用禁止になったんだって >>だから使えるのは8-1(りだんだん死)-1(発熱)-1(OS)で5個になるわけだ >オマエは一行先に捏造したネタすら覚えてられないのかと ワロタ
511 :
名無しさん必死だな :2005/12/27(火) 19:38:01 ID:4eUpFk0e
妙なゲーム開発者が暗躍しているみたいですねw
アンチの捏造情報も突貫工事ということだ
>>504 これでやっと久多良木が口出す前のSPE6個に戻ったわけだ。
なんだかんだでPS3が出るころにはもっと減りそうだな。
単発で自分の捏造にフォローか 惨めだろうなあ
自作自演か・・・
またこの病人か・・・
馬鹿が伝染しますよ
信者は書くネタがなくて自暴自棄になってきたな
そうだねMS信者カワイソス
>>521 ソニーの信者はMS信者の6万5千倍はカワイソス
すごい勢いで単発IDだな
ホントに自暴自棄になってるねw
あの爆死っぷりの当事者になってしまったのなら、狂ってしまうのもまた当然。0
釣れた釣れた
この調子だとPS3が出るころにはcellスレなくなってそうだな。
360が市場から消滅してる可能性のほうが高いです
530 :
名無しさん必死だな :2005/12/27(火) 23:25:27 ID:o54gZmyc
>>528 最近はGKですらPS3の話をしなくなったからね。
test
チップのテープアウトすら終わってないゲーム機について語るなんてSFもいいところだからな。
SFなテープアウトの続きはメルヘン板でやってくれ。
テープアウトの見通しすら立っていない オhル
535 :
名無しさん必死だな :2005/12/28(水) 00:28:14 ID:ZrMuJKF6
まだテープアウトしてないの? 春なんてありえないじゃん。
360が爆死したから 痴漢はもう、煽りに生き甲斐を見いだすしかないんだな
537 :
名無しさん必死だな :2005/12/28(水) 00:38:47 ID:iBOWKNfv
いきなり65nmプロセスで登場して、Xbox360との消費電力差を 煽って来る作戦と予想してみる。
まあ来年Q3以降になって90nmで出す意味ないわな
「360」と「爆死」というキーワードが含まれた文章を書き込むと、 爆発的に単発IDが増えるこの現実。
ソース出せソース そんなこと言われても自分じゃ検証する気にならんのじゃボケ
541 :
名無しさん必死だな :2005/12/28(水) 00:48:47 ID:fkWSp6Mi
>>505 > >発熱のためにSPE二個は使用禁止になったんだって
> >だから使えるのは8-1(りだんだん死)-1(発熱)-1(OS)で5個になるわけだ
> オマエは一行先に捏造したネタすら覚えてられないのかと
ペタワロタ
朝鮮人は引き算も出来ないのか…w だからあんなゴミハードになっちゃうんだな
>>541 彼の頭の脳細胞の大半がりだんだん死してるのだろうw
>>541 どこが面白いのかマジ分からん・・・orz 文章がどっか間違えてるの?
ああ、発熱のために2個が禁止っつってるのに、-1(発熱)って書いてるところか。 発熱(とOSのために)2個が使用禁止 ってことを言いたかったのかな。 それで7-2=5ってこと?
>544 前の行で「熱で二個死亡」と書いてるのに次の行で「-1(発熱)」となってる。 んで記憶喪失ですか?って事。
547 :
名無しさん必死だな :2005/12/28(水) 01:04:13 ID:wh7Wqqwp
ただのタイプミスだろ。 情報の本質から目をそらすな。
引き算の解答も間違ってるからタイプミスどころじゃなくてガチ。 一桁の引き算も間違える奴がマルチスレッドの話をしようとするなんて失笑モノ。
まぁ本当かどうかはさておき、熱問題は本当に大丈夫なのだろうか。 東芝のアレだって水冷だしさ。
計算結果もまちがっとりますがな
計算まで間違ってるのにどんなタイプミスなのか問い詰めてみたい あ、単発だから本人か
歩留まり向上のため無効になった1個も含めて「SPE二個」ってことなんでしょ。たぶん。 無理矢理翻訳すると >(歩留まり向上のため無効化される1個も含めて)発熱のためにSPE2個は使用禁止になったんだって >だから(開発者が自由に)使えるのは8-1(りだんだん死)-1(発熱)-1(OS)で5個になるわけだ
>>549 水冷は何がメリットなのか良く考えよう。
算数ができないから、箱○擁護なんて芸当が出来るんだと思う。
もともと一個はdisableになってるのに使用禁止になるわけないじゃん やっぱアホだなあと思った
・・・もしかしてこれは、360が発熱の為2コアまでの使用制限が掛かったという 裏情報をPS3と置き換えて、われわれに行間を読ませる形で 情報リークをしたかったのかもしれない。
真冬に熱暴走が多発してるXbox360では真ん中のコアをゲームに使わせないようにした可能性はあるかも 消費電力小さいSPEとくらべるとPPEはだいぶ熱いしなあ
テスタロッタちゃん座り姿後ろから見たら毛玉おばけやん
ま、実際の所はSONYのネガキャンが目的で、360は引き合いに出してるだけなんだろうけど。
563 :
名無しさん必死だな :2005/12/28(水) 08:33:07 ID:0DoMkXt3
Cell = 劣化PPC + 無駄×7個 Cell = 劣化PPC + 無駄×7個 Cell = 劣化PPC + 無駄×7個
(,,゚▽゚)∩先生質問です Cellはもうできてるのですか? 将来的にCellがPCの載ったりするのでしょうか?
軍事用のワークステーションには載ってるみたいよ
>>565 レスありがとうございます!
上の方のレスでゲーム向きではないとかあったのと、
開発が困難、移植が難しいとかCellはあんまいい話きかないので・・・
軍事用ですかww
っていうかCPUもできてないんじゃPS3の設計まだまだじゃん
なんでもいいからはやく発表してくれよSONY
来年から徐々に公表するって話を意図的に無視して、 アナウンスがあるまではこの線で煽ろう、と。
CELLが完成して無いって煽りは斬新だな 最近は、クロックだ!熱だ!ばかり聞いてたから
そもそも完成せずに出したのは箱○CPUだと何度いえば(ry
箱○はCellのPPE×3みたいなもんだから、一応完成といえないこともない 昔、PPC×3と言われてた頃の方が夢があったな 思えば随分遠くに来たものだ・・・
え? 完成してるの?? なら何故に発表しないんだSONY PS2のころはあんなに自慢げに水の描写とかたくさんだしてたのにー
>>571 TGSでやったMGS4は一応CELL使った開発機での実機映像だぞ。
E3の時もCELL使った映像が流れてるしIBM、東芝などでもデモを流してる
おまえ冬眠でもしてたんか?
一応どころか、既に開発機に載ってるだろ あと、医療機は試作品が走ってる
360の開発機から実機への、画質のヘタレッぷりはすごかったよなぁ・・・ ようはまだPS3できてないんでしょ
PS3とCELLの区別ぐらいつけような。 そしてここはCELLスレ。
その割には誰もCellの話なんてしてませんが。 Cellの具体的でテクニカルな話題は禁止というローカルルールでもあるの?
具体的にPS3のマシンパワーの話をされると都合の悪い人たちがいるんだよ。
アンチはどうしようもねえなw
PS3がBDとCellのイメージを悪くしているようで痛たまれない
(i)
ID:8jjBUHT1がアンチのイメージを悪くしているようでいたたまれない
PS3がなければCellもBDもなかった
DBがなければブルマや亀仙人との出会いもなかった
ピザでも食ってろDB
588 :
名無しさん必死だな :2005/12/28(水) 12:28:17 ID:skTOgS3X
>>585 PS3向けにCell開発が進んだと言うより、Cell普及戦略との兼ね合いでPS3に載るんだろう。
SPU開発の主力は結局冬芝だろうし、シェアが無ければ再び寒損に持っていかれると
Cellはゲーム専用に設計すればよかったのに 欲張って家電やHPC分野にも中途半端に対応しようとして 結果ショボーンなプロセッサになってしまったな。
ゲーム専用って具体的に提示してみそ。
>>590 GPUとの統合型とか?
つまり、ワンチップ化?
夢のある話ではあるけどな。
浮動小数点演算はバッサリ切り捨てる
ゲームほどfloatを使うアプリケーションはないぞ。
勿論トリプルコアだろ。
それ以前にPowrPCコア自体が基本的にはゲーム専用に設計されたものではない罠。 まー、ゲーム映像はメディア処理の一種だからPS3も360も小数点演算の強化を行っているけどね。 今までいろんなCPUが開発されてきたけど本当にゲーム専用に1から開発されたのはEEくらいだ。
EEもMIPSコアの改造でしょ。
家電やHPCにも向いてたら東芝やIBMは苦労してないと思うぞ。 家電に使うには消費電力やメモリのコストが、HPCに使うには倍精度浮動小数点演算能力がネックだ。 Cellは生粋のゲーム機用チップといっていい。
>>597 同感。
wh7Wqqwpは単発煽り厨なんだろうが、何を以って
ゲームに向いてないと思ったのか。
CELL否定派はなぜか低脳ばかりだなw
>>600 IPCの事を言ってるのではないかな、たしかに発展性が望めないアーキテクチャだ。
603 :
名無しさん必死だな :2005/12/28(水) 16:44:38 ID:fVscHFGs
CPUは整数演算とx87程度の浮動小数点演算だけでいいんだよ。 それ以上複雑な浮動小数点演算はGPUに下請けに出せばいい。
毛唐が陥りがちな極端なオブジェクト指向に走ったおかげで、 ポインタたぐりまくりワーク分散しまくりの惨状になってんだよ、カーマックのコードは。 そのツケがPPCで顕在化して、いきおいCPU批判になってるってわけだ。
605 :
名無しさん必死だな :2005/12/28(水) 17:01:12 ID:4qkgokqV
606 :
名無しさん必死だな :2005/12/28(水) 17:03:30 ID:4qkgokqV
グリッドシステム構築のためのオールインワン・パッケージ
http://www.cellcomputing.jp/ 標準価格 \35,000.- (税込価格、\36,750)
アカデミーパック \30,000.- (税込価格、\31,500)
・容易にPCグリッドシステムの構築が可能。
・アプリケーション構築を容易にするためのBOINC APIガイドを同梱。
・C、C++向け PCグリッド用ソフト開発SDKを同梱。
・オリジナル日本語GUIコンソール装備。
つまりSONY東芝は やっちゃった?
>>603 GPUじゃなくて、SPEに追い出したのがCellっしょ。
GPUでは自由度が低いが、SPEならまだ少しはマシ。
GPGPUのようにシェーダ言語もどきで書くのはしんどいだろう。
帯域や遅延を考えてもGPUよりCPUに近い位置にあるしね。
そう言えば、SCEと提携したAGEIAのPhysXのSDKってどうなんかな?
360版Quake4が最低フレームレート賞に輝いたらしい しかもPS2ソフトや旧箱ソフトもノミネートされている中でのことらしい さすがチカン期待の星カーマックですな、さすが整数処理が三倍の箱○ですなww
GPUは低速度・超並列処理なので、汎用の計算処理をGPUに追い出すのは結構たいへんと思われる。 GPGPUと呼ばれているが。
>>609 これが・・・ハイデブの神様がやることなのですか?
何てヒドイ!
そういいながらもしっかり煽り単語がはいってる
レボ以外全滅するんだから煽るしかない
615 :
名無しさん必死だな :2005/12/28(水) 20:25:10 ID:BEPl52+u
>>609 360版Quake4コア1個しかつかってねーのよ。つまりcellの性能もこの程度って事よ。
あれ?サウンドと物理処理はもう1個のコアにまわしてるんじゃなかったっけ?
>>615 自分の推してるハードのウリくらい理解しとけ
>>615 そりゃ、アンタらの祭り上げたカーマック神の性能でそ。
神カーマックの力をもってしてもフレームレートが上げられなかった箱○ 今後フレームレートを上げるためには涙ぐましい努力が必要とされるわけですな 解像度を下げたり描画を省いたり色を少なくしたりエフェクトを切ったり それか開き直ってのFUD(例:5fpsならPS3よりキレイな絵が出せるから高性能、等)の どちらかしか道は残されてないわけか…チカンカワイソス
実はPC版Quake4も酷いできらしいな。 PCアクション板のQ4スレと過去ログ掘ってみたら ・60fps制限が糞 ・マルチが重過ぎて糞 ・ていうか現状の最高スペックでもマルチで乱戦すると重いって何? ・武器のバランスが糞 ・モデルが角ばりすぎ ・マップエディタで光源置きすぎると重い かと言って減らすとのっぺりしすぎ ・何年前のゲーム性だよ ・サポートが糞 ・結局DOOM3と同じで暗いじゃん こんな感じの不満が出てる。 あとカーマックはDOOM3エンジンを作っただけで Q4の開発自体は外注のRavenだからたぶん360ローンチに間に合わせるために PC版も360版も手抜きなのかもしれない。
カーファックもマヌケ
Epic > Valve >>>>>>>>>>>>>>>>>>>>> id
カーマック、、 夏頃は痴韓国の最高開発者第一号に認定されてたのにカワイソス
カーマックは単に360に慣れてないだけじゃない? 慣れたらきっと凄いパフォーマンスを引き出すよ
マルチであおりとは優雅ですね
撒き餌たっぷり 群がる魚 ぶっこめ針を餌付けて 日がな一日釣り糸垂らしゃ 今日は大漁万々歳
はぁ〜 どっこしょ どっこしょ
Doom3エンジンは、やっぱステンシルシャドウが重いんじゃないの? あれ使うのどうかしてると思うほど重い手法だし。
ド素人の俺だが CELLのSPEではポリゴンの頂点演算が可能である また小島組によると、SPEを使ってAAを掛けることも可能である(予定) という点については認識しているつもり。 では他にCELLでどんなグラフィック処理が可能だろうか? CELLによって(RSXにあらず)今まで難しかったゲーム処理の何が可能になるのだろうか?
SPEを使ったAAと、言ってもだ。 オーバーサンプリング出来る訳でもないよね? 結局、ブラーだ。 そんな所に貴重なCPUリソースを回すなよ。 CPUリソースはもっとアグレッシブに使おうぜ。 なんてね。 cellは本当にゲーム業界が望んでいるCPUなのか? PSPは「何がやりたいのか判らない」とか言われていたが… 再来じゃないの?
そのアグレッシブな例をひとつ
cellは100本の動画エンコードを同時に回せますというデモンストレーションをやるためのCPU
720pで60fpsなゲームを提供するのに必要な演算性能を確保した、というだけでも 十分じゃないか?
>>633 従来CPUではそんな真似すら出来なかったが。
っつか売れてるハードで作りたい。それだけ。 今後のハードの移行考えるとメンドクセェけど慣れとくかな・・ってのがCell それだけ。
最初の開発機が配布されてから半年以上経つのにプレイアブルはおろかムービーさえ アップされていない、それがCellのすべてを物語っている。 PPE+RSXで序盤を乗り切ろうという思惑もRSXがテープアウト出来ず。
>>637 妄想+現実逃避はいいからCellの話しようぜ
639 :
名無しさん必死だな :2005/12/29(木) 20:49:07 ID:ZjgCOHXQ
>cellは本当にゲーム業界が望んでいるCPUなのか? 俺らがすげーの作ってやったからあとはソフト屋が勝手に使いこなしてくれという 人の話を聞かないハード屋の傲慢さが透けて見えるつくりだな。 ゲームメーカーが次々とPS3での開発から撤退していくわけだ。
発売されてもいないハードからサード撤退って、どういうこと?
現実逃避ではなく拒絶だな。
Cellの性能に関しては諸々のベンチマーク結果から疑う余地はない。
SPE用に書き直しさえすれば膨大な演算処理をこなすことができる。
でも書き直すのがしんどいかもナー。
>>639 開発者の意見を聞いて作ったと称するアレが開発現場ではアノ惨状なので。
我々は黙ってればハードが勝手に速くなっていたfree lunch時代の終焉に
直面しているのだから、しょーがないのだよ。
やりすぎなくらいミドルウェア投入してる会社に言う台詞じゃないな
>>640 発売前から開発しないで、どうやってロンチソフト出すのよ。
>>643 ふむ、じゃあ現段階でPS3開発撤退を明言したサードがいるってことだな?
撤退ってのは参入してから言う言葉だぞ?
撤退してるというソースを提示できてない時点で妄想
はやくプレイアブルデモでも出るといいね。 このスレで語られてる内容は半年前と大差ないから。 化けの皮が剥がれるの楽しみー♪
アンチの脳内では、箱とかレボに参入=PS3撤退、といういつもの妄想と思われ 箱1やGCのときも参入会社をズラーっと発表したのを覚えてないらしいw
>>639 こう言う人って
今から5年前にも、また5年後にも
同じ様な文章書いてるんだろうね。
>>646 最低、箱○のGearsOfWarは越えないとPS3の性能はアピール出来ないから当分は
なにも出てこないんでないかと。
時間が経つにつれRSXは旧世代となるしグラのハードルは高くなるしで開発は
胃に穴が空きそうな状態。
> いやぁ実際夏頃までは360に傾いてる所もあったんじゃないかな。 当時はPPC970相当のコアを3基集積しているだろう、なんていってる人もいて(誰とはいわないが) 想定していたスペックが実際のものよりかなり上だったのだろう。
655 :
名無しさん必死だな :2005/12/30(金) 10:48:11 ID:OINK0j6m
Cell = 劣化PPC + SPE×7だからなぁ SPEのLSが256KBしかないからできることが限られているのがポイント つまり、SPEに処理を分散できるアプリケーションなら有効だが、アプリケーションの内容次第ではSPEを あまり活用できないのではないだろうか。 劣化PPCはかなり遅そうなのでこいつには頼れない
本当ですか?
次世代ゲームは、物理シミュレーション全盛になるので、 全く問題ありません。
SPEはSIMD命令を活用できれば速いが、整数演算はかなり遅い つまり、ロジックの実行は遅い とにかく浮動小数点の計算だけが速いだけ 使い道が限られている
かなり遅いって何と比較して何%遅いんですかね
660 :
名無しさん必死だな :2005/12/30(金) 11:20:05 ID:mfPBfcoD
>整数演算 と >浮動小数点の計算 ってどう違うんですか?
>>660 よくわからないけど、PS1やSSでみられた、
近距離のポリゴンがなんかビクビク動いてるのと関係あるかも
何言ってんの?
360の整数演算はPS3の3倍だとアラードさんが胸を張っておりました。
誤差の話かいな
PPE+SPE*2(内1つは半速動作)、LS 2MB、Clockは4GHz で再設計中です。
ぶっちゃけ、LS256KBのSPE×7(8)の仕様よりLS512KBのSPE×5(6)のほうが良かったんじゃね?
それだと美学が。
それならSPE4つがバランス的にも ちょうどよさそう。
LSアクセスのレイテンシが増えちゃうからパフォーマンスも落ちる
メモリアクセスレイテンシ1程度増えることが問題になるほど短いパイプラインではないでしょ。
671 :
名無しさん必死だな :2005/12/30(金) 12:30:23 ID:CqMRWOuP
>>650 整数演算はマイナスの値や小数点が扱えないがゲームでの計算はほとんどが整数演算なのでこっちを強化したほうがゲームではパフォーマンスが上がり易い。
また、1バイトで処理出来るので高速に実行出来る。
浮動小数点演算は3Dのゲームが出てきてから必要になった、主に座標系の計算に使われる。
データは2バイト必要、SPEは浮動小数点演算とSIMDに特化されているので整数演算を使ってもパフォーマンスが上がらない。
PPE=PXが遅いとか、整数演算が遅いとか未だに根強い信仰が残ってるのか。 1/4のCESがそんなに恐いのかな?
整数演算性能が必要という文脈で実際に必要とされているのは 予測の当たりにくい分岐命令が多用された場合の性能だろう。
分岐機構に関しては、SPEもPPEもPXも変わらないしなあ。 浮動小数演算でも分岐命令は普通に使うだろうし、 本当に演算能力が必要な部分ではloop unrollingとかするし。
マイナスが扱えない整数演算とは、また斬新な。
アラードの言葉は無条件に信じて、整数演算弱いって言うけど、 でもクタの「スカラ性能も強化した」って言葉は無条件に信じない痴漢脳。 アラードのハッタリは綺麗なハッタリですね。
痴漢とか言い出す輩が出てくると一気にスレのレベルが下がるな。
SPEでの分岐については、学習型の予測機構がないだけで、投機実行のロジックはある。 コンパイラが静的に投機実行部分にフラグを付けておくから、 whileループのような部分ならまず問題がないし、ifでも学習型より実行効率が高くなるケースもある。
679 :
名無しさん必死だな :2005/12/30(金) 13:07:18 ID:mUv2gQax
>>675 符号付きならマイナスの値も扱えるが桁数を半分にしてまで使うケースというのはまず無い。
>>676 アラードの整数演算は3倍という発言は明らかに間違いだがSPEはLSを外れると極端に性能が落ちる構造なのでDMAと複数のSPEを上手に稼動させてレイテンシを隠蔽させないと性能が発揮出来ない。
効率の良いコードを書こうとすると、とんでもなく見通しの悪い複雑なプログラムになりそうだ。
デバッグは困難を極めそう。
>整数演算はマイナスの値が扱えない >1バイトで処理できるので高速に実行できる >符号付きならマイナスの値も扱えるが桁数を半分にしてまで使うケースというのはまず無い 大型新人の登場か?
あまり深く突っ込まないであげよう。
>>680 はDOS窓で
Debug
-D
なんてやったことないに1票。
683 :
682 :2005/12/30(金) 13:38:20 ID:x9LwmsWd
事細かに指摘しなくてもLSって時点で好き嫌いははっきり分かれるCPUだろな。 あとはクタとの相性&信頼関係と。
なんでDOS窓なのか知らんが電波すぎてワロス >浮動小数点演算は3Dのゲームが出てきてから必要になった、主に座標系の計算に使われる。 >データは2バイト必要、SPEは浮動小数点演算とSIMDに特化されているので整数演算を使ってもパフォーマンスが上がらない。 これもアホだなあ
1ビット
SPEによる並列プログラミングネタとしては一番やさしい トリップ解析すらいまだ誰も手をつけてないなんて 信じられないほどヘタレなコミュニティですね。
有るのはシミュレーターだけだからなぁ。 やっても速くないだろ。 まぁ数寄者くらいだよ。いま実用プログラムを書こうって奴は。
だがしかし、実用に耐えるものを作って、 初めてハードの特性や難易度が判るのも事実だな。
>>687 >>679 への突っ込みが煽り文句だけってのもなんだかなぁ。
本当に解ってて突っ込んでいるのか疑わしい。
>符号付きなら桁数半分 これにどうやってつっこめばいいのか 単発IDが見本をみせてくれ
がんばってみる。 各桁に独立に符号が付くんかい。
693 :
682 :2005/12/30(金) 14:03:40 ID:x9LwmsWd
でも、80386のころは・・・ LSがメインメモリーで、XDRがHDD。 いろいろできそうだなと思っただろうな、あのころだったら。 あのころ、苦労してアセンブリで書いてた人からするとCELLのSPEは、そんな苦じゃないよ。 LSが256Kって言ってもプログラムがそんな大きくはならないし。 演算に必要なデータをもってくるのだってうまく隠蔽すればいいし。
まあ根本的なとこがわかってないのが電波飛ばすとツッコミようがないよなあ 1バイトの処理だから早いとかいつの時代からトリップしていこいたんだか
>>693 いや、386時代は既に640Kあったぞ。っと元RA使いが懐かしんでみる。
それにあの頃はTrueColorなんぞ夢のまた夢だったからデータ量も全然少なかったなぁとEGC使いが懐かしむでみる。
トリップ計算は良い課題だな。 並列効率は高いが、ほぼスカラー演算だ。 ゲームでも有りそうなシチュエーションだね。
697 :
682 :2005/12/30(金) 14:54:24 ID:x9LwmsWd
>>695 なつかしいですよね。俺もN88から入ってMASMやったりしてたなぁ。
すみません、CELLスレを汚してしまったことを誤ります。
では、リセットかけてFFFF0に戻ります。
符号付整数を使うときは必ず符号拡張命令を使いましょう。 なら、桁数半分になるかな?
アホ臭過ぎて突っ込む気にもなれん。 整数=1バイトに限定 LSの256は必ず越えて、しかも使い物にならなくて PXの1MBは必ずヒットするか(またキャッシュロック云々)サイズ越えてもペナ無し そもそもLSと同じレイテンシでゼノンのL2がアクセスできるかのような物言いだし。 勝手に言ってろ。
桁数という点にマジレスすると駄目な空気なのかな。
701 :
名無しさん必死だな :2005/12/30(金) 18:06:56 ID:mfPBfcoD
360のPXは本気でIBMに足元見られて吹っかけられたけど、 CellはSCE・東芝・IBMのスクラムだから、足元みて吹っかけた瞬間IBM死亡だよ。
704 :
名無しさん必死だな :2005/12/30(金) 18:19:44 ID:mfPBfcoD
xbox360のcpuってibmが製造してるの?
>>703 各社で特許持ってるし、IBMが吹っかけたらSCEは自社工場で生産しちゃうもん。
>>704 2ちゃんソースはいいんだけど、ちゃんとしたソースだしてくれるかな。
CELLはIBMに製造費吹っかけられている! ソースは2チャンネル! 信じない奴はGK!GK!GK!
>>705 IBMのEastFishkillで作られてる(はず)。
箱○の生産量が伸びないのはこのPXの歩留まりがよくないとかなんとか
言われてたなあ。
昔、AppleもIBMのプロセッサ供給能力の低さによってビジネスチャンスを
逃したとお怒りだったし。
>>706 いやだから、SCEが自社では生産できないという話なんじゃないの?
真偽は別としてさ。
まあIBMがPPCを潤沢に供給してもMacが売れないから意味無いんだけどな。
Cellがアメリカで作られようと九州で作られようと 歩留まりが悪かろうが良かろうが 性能が低かろうが高かろうが プログラミングが難しかろうが簡単だろうが エロゲーPGのお前らには関係ないけどな
CPUに高速専用メモリつけるのは王道だし、LS否定してるやつは謎だな。 EEは8KBのメモリにダブルバッファもってDMAで裏読みしながら処理してたけど それが256KBになると難易度が上がるとか良くわからず。 SPEが遅いといってるのも謎で。どの命令がどのCPUのどの命令と比べると 遅いのか。
俺個人的には、 Cellに合わせる為にソースに変なエクステンション付けなきゃならないのが嫌。
SIMD使うプログラムは全てアーキテクチャ依存になるからCellに限った事じゃない MMXもSSEも3DNOWもVMXもすべて同じ事
突っ込むの早すぎ。どの環境を使ってたかしゃべらせてから突っ込むんだ。
スマン
WindowsでCELLって使える見込みあるの? あるなら大歓迎なんだが。
既存OSで対応が発表されてるのはLinuxくらいでしょ?
MacがPowerPC捨てるからPowerPCをサポートする可能性すら閉ざされたからな。 WinがPPE&SPE何ぞに対応することはありえないだろう。
Linux動けばWindowsはエミュレータで走るだろ。 あんまり意味のあることとは思えないけどな。
>EEは8KBのメモリにダブルバッファもってDMAで裏読みしながら処理してたけど >それが256KBになると難易度が上がるとか良くわからず。 なんだ、それは? EEがメインメモリにアクセスするのにDMAってこと? 詳しく説明きぼん。
だよな。 にもかかわらずCellのプログラミングは難しいと言ってる奴を見ると それはお前の頭が足らんだけとか職変えたほうがいいんちゃうの? とか思うわけよ。
>>723 なるほど。EEを使いこなしたプログラマにとってはCellは笑いが止まらないくらい
使いやすいわけね。小島組の大風呂敷も現実的に実行できる範囲内と言うわけか。
>>725 そこまで楽観すんのはまだ早いと思うけどなあ
その理屈で言うとオールアセンブラでメモリの最も少ないファミコンが最も開発困難だということになるな。 ある意味では正しいがその正しさは全く無意味。 PS3でPS2並のゲームをやるのが望みなのか? ま、難しかろうが簡単だろうがお前らはゲームが出るのを口をあけて ボケーっと待ってるだけなんだから関係のない話だ。
>>727 ファミコンとPS2じゃハードウェアの規模が桁違いだろうが。
そりゃ誰だって自分が無能だとは認めたくないからな。 やれアーキテクチャが悪いだの、開発環境が悪いだの、制作効率がどうだの言って、 みっともない言い訳を周りに喧伝しながら、自分を誤魔化し続けるわけよ。
>>725 EE・GSの時の難しさとはまた別の所に別の難しさは有るとは思うよ?
乗り越えられない山ではないと思うけれど。
PS3/Cellで俗に「開発困難」といわれてるのは、 コーディングではなく、もっと上流の話だな。
>>730 EE+GSの時みたいに「使いこなさなければゲームそのものが作れない」なんて
深刻さよりは遥かに楽だと思われ。
CS、PC問わず次世代の主流になるアーキテクチャだから遣り甲斐はあるんじゃないかな。
>>729 そうやってCellエミュを使わない、みっともない言い訳を周りに喧伝しながら
自分を誤魔化し続けるわけだな。
>>731 次世代機に求められるゲームのハードルがこのスレの住人の望むレベルにしようと
思うと簡単ではないわな。
PS3のソフト作ってる香具師ってここに居るの?
>>734 このスレでの次世代ゲームは。。。
@120fps
A1080p解像度
BGears Of War並みのグラフィック
C物理演算
D表示キャラ数、数千体以上
だもんね。
>>736 120fps望んでる人なんていたっけ?
第一、and条件じゃないでしょそれ。
ついでに丸数字は機種依存文字だから使わない方がいいよ。
後付で困難さの定義を変更されたらいつまでも議論に決着が付かないが。
BGears Of War並みのグラフィック C物理演算 このふたつでいいよ
>737 くたたんが望んでるので、PS4があれば実現される事でしょう。
マカーや携帯の事なんていちいち気にしてられなーい
人間の視覚は集中時に眼の中心部でMAX120fpsくらい処理できるからな。 それと他に欲しいのは、 インチキじゃない動きベクトルから計算したモーションブラー。 インチキじゃない計算して作られた被写界深度のある映像。
ID:mfPBfcoD
>>743 射影変換は目に見えるイメージに則していない
インチキだけどそれは構わないのか?
746 :
名無しさん必死だな :2005/12/31(土) 01:28:11 ID:kDDpY4t/
>>740 それって箱○じゃん、いきなりハードル下げてきたな(w
自信ないのか?
楽しければそれで良いと思うけどなぁ。 cellのプログラムは個人的には全く楽しめないけど、楽しめる人も居るんだろうなぁ。 日本人の職人気質的な所が現れているんだろうね。 欧米とかインドはどうなんだろう? 奴らは楽するための苦労をいとわないイメージなんだが。 力技を有効にする為にルールを変更するというか。 思うに、同じ使うなら楽しまなきゃ損と。
単発IDで変なのが湧いてるな。 せいぜいコボルでも楽しんでくれよ。
http://news18.2ch.net/test/read.cgi/bizplus/1133728961/470 >IBMがふっかけてるのは製造技術。
>特許に出すと特許広報で外に公示されて中国や韓国がパクりまくるので最近は製造に関するものは
>特許に出さない。 ロジックの製造技術はIBMの 方がかなり先行してる。
>そんなわけで「SCEは自社工場で生産しちゃうもん」なんてのはど素人の妄想。
「SCEは自社工場で生産しちゃうもん」なんてのはど素人の妄想。
「SCEは自社工場で生産しちゃうもん」なんてのはど素人の妄想。
「SCEは自社工場で生産しちゃうもん」なんてのはど素人の妄想。
「SCEは自社工場で生産しちゃうもん」なんてのはど素人の妄想。
SOIはSCEじゃ出来ないんじゃまいか。
このスレにCell叩きにきても信者いないぞ?
むしろ信者しかいないと思ったが? 彼らの妄想を生暖かい目で見守るのがこのスレの楽しみ方。
それ以前にそもそもIBMの量産能力もどうなんだ? あんまりいい話聞かないが nVIDIAの時もだしPPCの供給能力問題もしかり・・・
>>751 CPUでSOIプロセスの立ち上げに成功しているのはIBMとAMDだけだからね。
SOIは大変らしいから当分の間はIBMでCellを生産する事になるんだろうね。
フィッシュキルに生産ラインを建てたのも製造技術の問題かも。
RSXとcellは別のチップですよw(言っても解らんかな?)
構うと感染するよ
ちゅーか、プロセス技術をSTI、IBM・AMD連合で作ってるわけだが。 90nmもSOIも65nmも、共同で開発してるんだけどな。
CellもRSXも延期 ソ ー ス は 2 チ ャ ン ネ ル !
>>759 あと、chartered、そしてあのSamsungが加わります。
設備投資で360億あげたのにふっかけるってありえるの? 投資の段階でそういう面も話すんじゃ。
どうしても春に間に合わせるために焦ってるところを突かれてるみたい。
高クロックの物がとれないならDD2への設計変更でIBMがごねた結果のようなきがするがねぇ。 それでふっかけてきてるんなら信頼関係のめんでかなり問題になるのでは?
765 :
名無しさん必死だな :2005/12/31(土) 17:52:56 ID:i5+7oHH1
NYT(笑)
TSMCやNECエレじゃあるまいし、今になってSOIの見通しが立たないとかアフォなことは
言い出さないぞ。年間1000万単位で生産するラインの立ち上げなんて、もっと前に目処
が立ってないと不可能だし。
CellはEEと違って汎用向けの需要が既に動き始めてるし、医療機器向けなどのCell向けに
IBM内にラインを作ってるんだろう。そして将来的には長崎のようなFabを北米と欧州に建設
して世界3極体制にする可能性もある。
>>765 NYTなんて特定アジアの傀儡で有名だぞ。
ES細胞!ES細胞!
どこ向けとはあえて言わないけど Soi対応させた生産ラインなんかとっくの昔に納入した。
あけおめ〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜!
あけましておめでd
ことよろ
>>765 こんな板で「また大西か」なんて言いたくないんだが。
やっぱ大西かな?
776 :
名無しさん必死だな :2006/01/01(日) 02:57:17 ID:SQfaA9b6
PS2の時にもクタタンが言ってたけど、ある程度の開発難は必要だと思う。 プログラマーのスキルアップ(ハードの叩きがい)があったからこそ 発売から6年経った今でも、現役で頑張ってる>PS2
777 :
名無しさん必死だな :2006/01/01(日) 03:19:38 ID:LLip25rL
あけおめー! 程度によるよ(iωi)>開発難
やっぱり仕事を'仕事'としてCELLをいじる人も居れば、 半ば'趣味'的な思いも込めてCELLをいじってる人もいる訳で、 前者と後者とではCELLに対する思いや感じ方もやっぱ違うだろうさ。 後者がCELLのあるべき姿を開拓して、前者がその道を踏み固めていけばいい。 世の中はなんだってそうやってバランスが保たれてきたのだから。
箱○は言語DirectX9つかえるから、最初からバリバリで開発されるけど PS3はOpenGLで時間かかるし、熟すまで時間かかりそう。 FF10とかPS2初期のソフトってポリゴンがブレてたりなんか変だったし
グラフィックスAPIで開発が困難になることはもはやないだろう それは記憶力の問題だ 俗に言うCELLの開発の難しさというのは、相互性によるところだな バランスというか、アーキテクトを構築する思考が試されるというか
781 :
名無しさん必死だな :2006/01/01(日) 04:47:46 ID:SQfaA9b6
従来のゲームは 「如何に美麗なグラフィックを叩き出すか」 であって、スペックあたりの性能を極限まで上げるアプローチをPS2は行い ハードやAPIをPCから流用して性能あたりの工程を減らそうとしたのがXbox。 ところが次世代機のPS3ではフルHDの解像度と、スペック表に載せるのも バカバカしいくらいのポリゴンとシェーダで描画する性能が最初からある。 つまり、Cellが叩きつける次世代ゲームの難しさとは 「美麗なグラフィックの先にあるもの」 なんだな。高精度なデジタルがアナログに近くなっていくように、今までの目標 としてた発想を飛び越えて、作り手としてのセンスが問われる時代なのだろう。
783 :
名無しさん必死だな :2006/01/01(日) 05:41:59 ID:SQfaA9b6
http://pc.watch.impress.co.jp/docs/2005/0608/kaigai186.htm 【久夛良木】 今回、Microsoftは、はっきりPlayStationを追っかけていると公言している。
でも、彼らが追いかけているのはPLAYSTATION 3じゃなくてPlayStation 2。
なぜなら、3は僕らが作って最中だから彼らは知らない。彼らは2を見ているから、ああなる。
目指すところが違っている。
他社だと、グラフィックスがHDになっても、中身は同じ。ほとんど演算していない。
フィジクス(物理シミュレーション)なんてほとんどしてなくて、モーションキャプチャで動きをつけただけとか。
ぱっと見た目で区別がつかなくても、こうした違いはすぐにわかる。
http://www.watch.impress.co.jp/game/docs/20050721/psawards.htm コンピュータエンタテインメントの世界も、ものすごいコンピュータのプレイステーション 3が
登場するが、今、その手前なんでしょうね。そのあとは、制作する側のアイディアと感性だと僕も
思っている。PSPの『福福の島』や『ポケットリゾート』といった作品は、なんかほっとするじゃ
ないですか。これからのキーワードは、進歩、感性、ほっとするという点にあると言うことを
すごく考えていかなければならない。皆さん私でもできるような作品を忘れないで作ってくだ
さい」と、技術の進歩と共に、より制作者側の感性が大切になっていく点を強調。
最後に「これから技術プラス感性が必要な新しい10年が始まります。素晴らしい時代が始まり
ます」とかたり、締めくくった。
この人なんでゲームの核心知ってるんだろう オブジェクト指向でそれぞれ物理演算にそって動き出す世界はマジで真理なんだよね
>>783 その好例を今から体験できるソフトがある。ムービー作品のFFZAC。
グラフィックのクオリティはどこも同じだが、シーンごとに担当者の力量の違いが出てる。
香港映画を研究し尽くしたかのような緻密なアクションもあるし、単なるポリゴン人形劇で
終わってるのもあるし、異世界に引き込まれるようなファンタジックなシーンもある。
次世代機で何が難しくなるのかを明確に示してる。買うなりレンタルなりで観ておくといい。
>彼らが追いかけているのはPLAYSTATION 3じゃなくてPlayStation 2。 まさに360のゲームがこれ HDというより箱1のゲームがワイドになっただけ
ttp://nur.ath.cx/no0/pb/src/1136062056738.jpg こういうことやってると最初は楽しいけど、すぐに飽きた。
ドラム缶の山をロケット弾で吹き飛ばすとかも3回目やったらウンザリ。
Havokエンジンがダメなんじゃなくて、やってることが下らなすぎるからつまらない。
レゴブロックがあっても創造力が乏しいと面白い物は作れないのに似てる。
たとえ高度な物理演算が可能になっても、ゲームとしての面白さはマップ作りにかかってくると思う。
物理演算なんてPCゲーですでにいくらでもあるじゃん。 むしろ物理演算言ってたPS2にはPSのパネキットを越えるものすらないじゃん。 何いってんだと思った。
PS2は「エモーションシンセス」とは言っていたが「物理演算」とは言ってないぞ、少なくとも登場時には。
>>787 箱は初代からワイドだろ。・・・ゲーム本数そのものが少ないからアレだけど。
Dead or Alive4って売れてんの? これでXBOX360が完全死亡確定なら PS3は1年ぐらい延ばしていいんちゃうの?
>>790 演算能力さえ高ければ高度な物理演算が可能と思っている人が多いが、実のところ
ネックになるのはメモリ容量なんだよね。
PC以上のものにはならないから、それほど期待はしていない。
796 :
【大吉】 :2006/01/01(日) 12:32:06 ID:nR130ZAS
>>796 それはただのワークエリアでしょ。
メインメモリを使わないわけじゃない。
メインメモリをつかうったってPCI経由じゃ最大133MB/sしか帯域ないが
512MBあっても帯域足らずに苦しんでるゲーム機が現にあるわけだが
>>798 だから拡張ボード上のメモリにガッとまとめてデータと処理内容を転送してから、
ボード上で物理演算し(ここで大帯域を使う)、
終わったら演算結果をまとめてメインメモリにまた転送するという形になってる。
CPUが元の値を作ったり結果の値を参照したりいじったりするのはメインメモリ上。
>>798 PhysXカードのメモリは物理演算APIと座標位置ワークに使用。
オブジェクトやテクスチャはVRAM、PhysXカードから返された座標を元にCPUで頂点データを生成してメインメモリに格納される。
PCI経由でやりとりするのはPhysXカードも同じなんだが。
高度な物理演算をするのにメモリがいるのか高度な映像表現をするのにメモリがいるのかという点で食い違ってないか? オブジェクトやテクスチャをメモリに格納するのでメモリが沢山いるというのはわかるがそれは高度な映像表現の話であって高度な物理演算のお話ではないと思うのですが。 と思ったけどどっちが欠けてもゲームでは結局意味ないよな・・・
133MB/sの帯域しかないのに大量のデータは送れないという話だろう メインメモリがどれだけあっても物理演算に使うメモリは大きくない
まあ、基本的な考え方として その機種で表示できる範囲のGPUシェーダー回りの映像(これまでの使われ方)と、 それをリアルに動かす為の物理演算の関係ですな
805 :
名無しさん必死だな :2006/01/01(日) 17:26:06 ID:SQfaA9b6
>>803 大量のデータはシーンのセットアップ時にボード上のメモリに送る。
演算用のモデル形状や重量や摩擦係数などのパラメータ、
加えて、位置やモーメントなどのオブジェクトの初期データ。
フレーム単位でボードに送らなければならないのは、
増減したオブジェクトについてのみだから多くはない。
ボードから送り返されてくるのは、レンダリングに必要な
位置と向きの情報などの最小限分で、これもそれほど多くはない。
フレーム単位でPCIバスを越えなければならないデータは多くはないが、
モデルやインスタンスを含めたワークメモリや、演算時の帯域は大量に喰う。
ボードのメモリは128MBしかないというのは読んでないのかね
>>802 物をワラワラ動かすシーンならシェーダ周りは
思いっきり簡略化してもそれ程気づかないと思う。
カメオの群集シーンなんて丸影さえなかったからな。
不気味の谷の話があったけど、人間の眼はまず動きに重きを置く。
だからリアルである程自然に動かない物を不気味に感じる。
だから死体が怖いんだと、養老先生も言ってましたよ。
>>807 PhysXのワーク程度でPS3のメインメモリの半分も喰うってことだ。
実際にそれを使うためのメインメモリ上のワークも加えれば大量だろうよ。
CellのパワーをPS3で生かすためには、オブジェクトを増やすのではなく、
デルタを小さく取って描画の1フレーム中に物理演算を何度も回すなど、
突き抜けなどを抑制した、精度を高める方向での使い方になるだろうな。
ほとんど自由度のないEE+VUと途方もないCellの自由度を比べて難度が変わらないとか本気でいってるのか。 最初はSPE使わないでPPEだけでも十分なパフォーマンスがでるとかお花畑も程々にしとけよ。 そもそもフルHDになんか対応してしまったらGPUの優位性なんて一瞬で消し飛ぶ。 へぼいゲームはSCEから後ろ指刺されまくるし、ほんとロンチ狙いの所は地獄確定だよ。ご愁傷さまとしか言いようがない。
フルHD必須じゃないんだからいいじゃん。
ワークだったりデータだったり大変だな
なんだ真性か。相手にして損した。
自分でデータとかいってたのになあ データはボードのメモリにのる程度でメインメモリはPCIバスの帯域で間に合う程度だと ゲーム程度の物理演算で大量にメモリ消費なんてことはないわけだな
新年早々安置も信者も悲しいくらいレヴェルが低いな
815のレベルの高いお話を拝聴したいと思います。
メモリ量が物理演算の決定的な違いだとしたら、 PSのパネキット以上のものがPS2にないはずがないんだが 高度な物理演算って話なら、まだ倍精度演算ができないからって方が納得できる。 まあCellも物理演算言うわりに、なぜか単精度なわけだがw
ただ単に物理演算が必須のゲームを出さなかっただけだって考えは浮かばないのか。 パネキットみたいなゲームがプレステでいっぱい出てて、PS2ではそれよりいいものがなかった って言うなら別だけど、PSでポンと出てそのままフェードアウトしてったようなソフトなんだから、 2で出しても売れないと判断されて出なかっただけなんじゃない?
>>814 消費するメモリはジオメトリの複雑さと数量に比例する。
数を優先する場合は流体や群衆などのパーティクル系、物体のクラッシュや布シムなど複雑なものは数出せない。
>>809 は半分正解、数出す時は用途が限られるだろうね。
CGアプリでパーティクルなんか使って雲を作るとメモリを大量消費するからコンシューマ機はこのあたりの用途は苦手なんではないかと。
PhysXのデモを見ればわかるとおりメモリ量よりも演算性能のほうがずっとクリティカルなんだよ PhysXやCellをもってしても単純なブロックで数万個を制御できるにすぎない 流体物理にしてもメモリ量が問題になるほどの格子がきれるなら地球シミュレータはいらない
>>821 地球シミュレータの値段が幾らすると思ってるんだ
本日のいつもの人 lvxBsP3S
仕様変更でRSXが内部SLIになるってどこからの情報だよ 誰か知らない? 90nmじゃ厳しいだろうと思うけど・・・ 発売時期をずらして65nmで行くのか? わからん・・・・ガセか?
4日だか5日に欧州でPS3の何らかの発表があるんじゃなかったっけ? 内情を知ってる立場の人間はここでバラせるはず無いし、数日中には 妙な噂も全て払拭されると思われ。
ちょっと前にG7x系のバリュー向けGPUのG71が90nmで製造されるという話が海外のサイトであった (NVIDIAは新しいプロセスに移行するときバリュー向けを一回挟む) で、それのコアが二つ乗ったのがRSXになるんじゃないかという話を「2chで」見かけた それぐらいだな なんとなくトランジスタ効率が悪くなりそうな気がするが CPUのマルチコアの原理と同じで消費電力を抑える効果はあるかもしれん まあ今ではG71は32ppで64shaderのハイエンド向けGPUという見方が大勢になってる よーわからん
それはCESで、シェーダ性能倍バージョンのRSXを発表するわけ? 元々GPUは並列化が激しいのでマルチコアにしても意味ないような。
32pp 64shaderか 360GPUがホントに化けていたら やっていたかもね
>>824 >内部SLI
そんなトランジスタ余ってない。
SLIは高速化に使う方法にもよるが、VRAMの効率が著しく悪いので、素直にシェーダー数を 増やした方がコストパフォーマンス的にも良い 内部SLIはありえないだろうな
832 :
824 :2006/01/02(月) 00:24:02 ID:A2EXI/Bm
やっぱりガセの可能性が大きいな いまさら発売時期を延期や65nmで製造する事は考えにくいし 何より内部でSLIにする意味が無いよなー たしかどこかのサイトにG71が2月上旬に700Mhz?で32ppという事を書いてたような 仕様変更するとしたらこのコアを使うのかな? でもいくらなんでも700は無理だろうな、現状でもチップがあまり取れていないようだし そんなことするより帯域を広げた方がいい結果が出そう まー現状じゃようわからんし欧州の情報を待つわ
ブルガリア
834 :
名無しさん必死だな :2006/01/02(月) 00:32:09 ID:rXfFiYyp
CESは欧州じゃなくてアメリカラスベガスだ・・・・・
SLIはガセくさいがRSXが32ppというならG71ベースという話もちらほら見るのであり得るんだろうけど。 ただRSXの設計に関してG70にFlexIOつけるだけならこんなに遅くはならないとは思うんだよなぁ。 トランジスタの最適化でもやってたかはたまた他の理由があるのか・・・
>>835 CellがRSXのGDDR3を使おうとするとRSXが止まってしまうという話なら「2chで」見かけたが。
ソースが2ちゃんねるじゃ、ネタレベルじゃないかと。
>>835 TSMCと東芝でプロセス違うから、
おそらく論理合成からやりなおしでそれなりにかかるだろ。
でも、そろそろなんらかのアクションは欲しいころだけどな。
>>836 RSXが止まるということはRSXはすでに製造されて評価キットなりに載ってるのかな?
テープアウトも終わってないチップに何言ってんだか
あ、俺おかしなこと書いてるな。 今更バグ付きのもの製造しても意味ねーよな。
>>835 単純にPCIやPCI-e替わりにFlexIOを付けるだけならともかく、PCIやPCI-eとは桁違いの
帯域を持つFlexIOだとそう簡単にもいかないんじゃないか?
PS3だとCellからVRAMに透過アクセスできるようにもしないといけない訳だし、シェーダーの
ベースは同じでもいろいろと手を加える必要があるだろう
そう簡単には行かないんじゃないかね
あと、大量生産に向けて物理設計にもそれなりに時間をかけてるんだろうし
>>837 本物かどうか不明だが半年前ぐらいにRSXの試作チップの画像が台湾の掲示板に
アップされてたけどね。
>>836 の元ネタも、後になってその掲示板に書かれたんだが、投稿した人が
身分を明かさなかったのでネタ扱いだった。
内容は、CellがRSXの頂点バッファにジオメトリデーターを書き込むなど作業エリアを
いじるとシェーダーがロックしたり暴走するとかいう話。
NUMAといってもRSXが未使用の領域をデーターの格納に使えるだけでNUMAの意味が無いとか書いてあった。
>>841 その投稿も理屈のこね方がネガキャン臭かったな。
もしもあの写真が捏造だったとしても、正式に公開されていない以上は確かめようが
無いわけで、その写真だけで如何にも信憑性があるように見せかけてるだけかも。
なにかしらのプロセッサが読み出してるメモリにたいして適当に上書きしたら ハングアップしたりするのは当然かと。 SPEが読み出してるメモリだって同じ話で。 PS1でもDMA転送中のディスプレイリストをいじくるといろんなことが起きる。
>>818 >>819 つまり、PS3(Cell)により実現される物理演算によるゲーム表現には
商品として何の価値もないってことですね(笑)
すごい読解力ですね。どうやったらそういう風に読めるのか。 パネキットは物理演算で現実の世界をシミュレートすることこそが肝だったわけで。 PS3ではリアリティーを出すための一手段だってだけ。主従が逆転してるぞ?
>>843 CPUと違ってGPUはどのメモリを参照しているのか、おおざっぱにしかわからないから迂闊にいじれないよね。
未表示のダブルバッファとかテクスチャエリアぐらいかな、頂点バッファをいじるとポリゴン表示がおかしくなる。
Xbox360はCPU-GPUの連携が前提で設計されているが、Cell-RSXは
>>841 の話にあるとおり
予備ワーク以外の使い道はあまり思いつかないな、無理してFlexIOを実装する意味があるのかと言われると、そうかもと思ってしまう。
>>846 箱○のシェアしてるだけのメモリを連携と呼ぶのは事実と異なる。
512MBのうちからVRAM用に割り当てを行ってるだけだから。
FlexI/Oの目的はCell演算結果をRSXが参照したりもしくはRSXへ
転送することが主目的になる。
「NUMAの構成上、理論的に可能だけどやる意味は無いもの」を
引っ張り出してFlexI/Oそのものの否定に持っていこうとするのは
詭弁もいいところ。
福福の島はいやしです
849 :
名無しさん必死だな :2006/01/02(月) 09:30:26 ID:gJZ4rrUp
>>847 箱○のメモリはシェアしているだけではないよ。
メモリコントローラがGPUに内蔵されていてCPUとの調停は自動的に行われるし、シェーダーユニットでフレームバッファにエフェクトをかける、PXのL2をロックしてのストリーム処理、シェーダをすべてピクセル処理に振って、CPUで生成した頂点を流すといった事も出来る。
一から設計したXenosとG70を流用したRSXとでは自由度が違う。
>>849 で、その素晴らしい設計の結果があのザマなんだが。
>>847 XDRに頂点・フレームバッファーをRSXが置けるというソースなんかあったっけ?
クタが話していたのはAGPメモリのような使い道を考えているという話だったが。
>>852 その記事にAGPメモリとしての使い方しか出来ないって書いてあるじゃん(w
どう頑張っても箱○の現実は変わらないよ
>>845 >パネキットは物理演算で現実の世界をシミュレートすることこそが肝だったわけで。
>PS3ではリアリティーを出すための一手段だってだけ。主従が逆転してるぞ?
そのPS3(Cell)で差別化されるという物理的リアリティってものに
商品価値がないってのがパネキットで端的に証明されてるとは
おもわんの?w
>>856 それって、売れなかったポリゴンゲー1つを持ってきて「ポリゴンゲーに商品価値はない」
と言ってるようなものでは?
くやしい!言い返せない!
>>857 そりゃクソゲーを一本持ってきて言ってるなら馬鹿げた発言と言えるけど
パネキットはよくできた、むしろ名作と言っていいゲームですよ。
すばらしい超理論ですね。
布シミュしきれなくて着物がデモ画面だけになった某ゲーム機の例もあるんで 計算能力に余裕があること自体はいいことだろう
パネキットが名作かどうかはともかくそれが物理演算の全てでは無い。 それに、PS2は時代にあわなかった、PS2が考えられていたほどの 物理演算には向いてなかったという事だろうし。 過去の機種つかまえて、PS3についてあれこれ妄想してもしかたない。
>>859 まあ、良作=ヒット作ではないからね。でも、物理演算にチャレンジしたゲームが圧倒的に少ない
現状で、「物理演算に商品価値はない」と断言するのは如何なものかと。
いろいろ試した上でそれでも売れないゲームしかなかったら、そういう結論になるんだろうけど
まだ結論を出すには早すぎると思うよ。
新年早々今年もレベルが低いですね (;つД`)
挙動のリアルさを売りにして商品的に成功してるゲームってGTくらいしか 思いつかないんだけど、あれも(リアルかどうかはともかく)そのリアルさ が売れてる要因かというとかなり疑問だ。 あの挙動のままで実車でなく、グラフィックもへぼかったらどうだろう? 逆に挙動がもっとへぼくても売り上げには影響ないんじゃなかろうか。
まぁ今度物理演算を使った大作である聖剣伝説が出るんで、それで判断しようか?>売上
物理計算なんか微塵も感じさせないリッジが日本だけはバカ売れだしな。
まるでFlexIOが >メモリコントローラがGPUに内蔵されていてCPUとの調停は自動的 これやってないかのごとき書き込みだな。 メモコンの調停がなければ、「使ってない領域」にアクセスしても吹っ飛びますがw
グラフックスがショボくて挙動が神の車ゲーにはGPLがあるな いまだに挙動であれを超えるゲームはないとの説もある 売れるには売れたが一般受けしたとは言いがたいかな
>>865 逆にグラフィックがレースゲーの評価の主体なら
北米などはゴッサムとかの方が売れるのでは?
PPE単体だとPPCと比べて同じ周波数でどのくらいの性能になるんだろう。やっぱ半分ぐらい?
>>841 > 本物かどうか不明だが半年前ぐらいにRSXの試作チップの画像が台湾の掲示板に
> アップされてたけどね。
あれはRSXのパッケージングを試験する部署からの流出で、RSXのマーキングは
あるが肝心の「コア」は入っていないテストパッケージ、だったはずだが。
>>849 >PXのL2をロックしてのストリーム処理
LSのほうが自由度が高いです
ごめん、途中で書き込んでしまった
>>849 >PXのL2をロックしてのストリーム処理
LSのほうが自由度が高いです
>シェーダをすべてピクセル処理に振って、CPUで生成した頂点を流す
複数のSPEで頂点処理を行えるPS3のほうがはるかに高効率です
VSがヒマになることでテクスチャ加工を行う余裕もできます
>シェーダーユニットでフレームバッファにエフェクトをかける
テクスチャをeDRAMから読み込めないXbox360ではレンダリングバッファにエフェクトかけるのはムリですね
メインメモリまで転送するんじゃ不自由としかいいようがありません
875 :
名無しさん必死だな :2006/01/02(月) 18:29:44 ID:nr8LuMPY
>>874 >テクスチャをeDRAMから読み込めないXbox360では
>レンダリングバッファにエフェクトかけるのはムリですね
いや、eDRAMを介さずにフレームバッファの読み書きが出来るけど。
876 :
名無しさん必死だな :2006/01/02(月) 18:35:10 ID:8/xje4Kp
>>868 使ってない領域にアクセスしても吹っ飛ぶからRSXのテープアウトが遅れていると予測。
レンダリングバッファと書いてるじゃないですか レンダリングしてメインメモリへ送らないとダメってことです
そもそもシェーダでエフェクトをかけるなんて処理は当たり前にできるもんなんですけどね Xbox360ではレンダリングしてメインメモリ上のフレームバッファに転送しないといけないから特殊な処理になるだけで
>>877 なんか勘違いしているようだが、頂点バッファもフレームバッファもGDDR3にあるんだけど。
eDRAMから直接画像出力出来る訳じゃ無いぞ。
>>874 テクスチャがeDRAMに入っているなんて初めて聞いたけど、これって笑うところ?
881 :
名無しさん必死だな :2006/01/02(月) 18:48:25 ID:wMhMfWmY
Cell搭載Mac miniが欲しい。 別にMac miniじゃなくてもいいけどああいうのが欲しい。
レンダリングバッファと書いてるのがどうしても読めないみたいですね テクスチャをeDRAMから読み込めないをどう読んだら テクスチャがeDRAMに入っているになるのかも理解できないですが あとIDが変わってますが同じ人ですか
レンダリングバッファーって普通はフレームバッファーの事だけどなに電波飛ばしてんの?この人。
Xbox360ではレンダリングバッファはeDRAMでありフレームバッファはメインメモリ上ですね 低レベルの勘違いをする人が何人もいるとは思えないのでやっぱ同じ人ですか なんでIDが違うのかな
関係者から聞いたけど1月にはテープアウトするってさ、 2007年だけど。
信用できる筋からの情報だけど PS3が開発中だったってのは、他社に対する情報戦の一環であって、本当は開発してなかったらしいよ
関係者=敗デブ仲間
>>883 シェーダエフェクトをeDRAMにかけるという考えが、すでに間違いなわけだが、どうやら気がついてないようだ(w
またID変わってますね 普通はできて当たり前なんですよ。レンダリング結果をテクスチャに使う処理は頻繁にあります できないのは自由度が低いというしかありません
>>875 > いや、eDRAMを介さずにフレームバッファの読み書きが出来るけど。
これは初耳だ。
ROPはeDRAMと同じ娘ダイ上にあるからシェーダーとしてのレンダリング対象はeDRAMのみと理解していたが、
共有メモリ上のフレームバッファに対する親ダイ上のシェーダーからの書き込みとは具体的にどういう処理を指すんだ?
真相はいかに!
eDRAM使わなかったらCPUとGPUで1本の帯域取り合って話にならないぞ。
先日政府筋は結局RSXの規格を解釈し出した
擁したGは70の基本的主体は再び4個が6個の特製の主体に到達することに加える!?
ヒルバートが塊式を分けて図を裁って本物そっくりの画面を大げさに表現し描写することに非常に適合する。
RSXはあるに程度がCELLの設計理念を参考にしたことをまいて、彼女はGPUの伝統の冗長なライン方式を排除した。
CELLに、PPEは主要な行程を担当してそれで、RSXに、採用して1 粒の特別仕立のGは70は主主体として、
内容がpure video、ultra shadow 2および、cineFXを取り消すことを包括することをカスタマイズする。
cellに、PPEはSPEを制御可能に、RSXに、特別仕立のG 70は制御可能に4の6個の特製ののいろいろな用途の
途和多道のものは程主体を編集可能だ。 (頂上シェードのように、白い暗い影のように、光写真などの特効)
下はRSXの棚の構見取り図で:(RSXのウルトラ強の6hb 点を打つこれを撃って下見してすべて遊戯する図画)
http://image2.sina.com.cn/gm/y/n/2006-01-01/U610P115T9D138708F167DT20060101135701_c.jpg
なるほどねえ・・・と見栄を張ってみる。
実在する360の水冷キット展示の紹介だからネタというわけではないな。 タイトルのつけ方には「解決かよ!」と突っ込みたくなるが。 開発機にバグがあるのは当たり前なので、もっと具体的な話が出ないことには どうにもなりません。
>>890 このスレに居ながらMEMEXPORTも知らないなんて、とんでもないお馬鹿さんでつね。
おい、XENOSシェーダーのMEMEXPORT機能ってのは、 フレームバッファ上の画像に対してエフェクトをかける為の機能ではないぞ。
>>899 PS3に不利な情報は一切信じたくないという気持ちは分からないでもないよ。
RSXもCellみたいなヘテロジニアスマルチコアだったてことか。 なんか予想を裏切ってくれて凄いな。
>>902 ここまで馬鹿だと、いいかげん付き合いきれないな。
>>902 SPEでAAはかけられてもXenosでエフェクトはかけられないってか、禿げワロス。
どっちみち360 GPUの話はスレ違いなんで。
>>
>>902 どうやらGPGPUも知らないらしい、このスレに居る資格無し(w
>>907 AAは娘ダイ上のROPとeDRAMが担当する設計だろうが。
親ダイ上のシェーダーが共有メモリにアクセスしてAA処理する意味などないだろ、アホ。
正月の酔っ払いと単発IDは、相手にするだけ無駄。
要するに360GPUはレンダリングバッファとフレームバッファがeDRAMとメインメモリ に分かれている変則的な構成なのを判っていない人が暴れていたということ? あとシェーダがメインメモリにアクセスできてもフレームバッファをeDRAMと同じようには 扱えないということ? 素人なんで適当だけどモヤモヤするので誰か正解を教えて (単発が嘘ついてるクサイけどさ)
単発が適当に嘘書き散らしてるから。相手するだけ無駄。
つーか
>ROPはeDRAMと同じ娘ダイ上にあるからシェーダーとしてのレンダリング対象はeDRAMのみ(
>>890 )
これでFAなん?
MEMEXPORT 頂点シェーダとピクセルシェーダから、システムメモリに対する「読み書き」を可能にする機能 システムメモリにレンタリングする機能とはちゃう スキャッタ/ギャザが可能と言う解説も この機能がGPGPUに使う事を想定されている事を示す GPGPUは空いたGPU(シェーダ)を使用し高速演算をさせる構想で、高度3Dゲーム中に使える物か どうかは考えるまでも無い てか、何でついてるん?
>>904 ソースが中国語じゃなぁ…
TSMCで製造するわけじゃないから
中国語圏の人絡むことあまり無いと思うのだが…
ROPつかわないでシェーダレジスタの内容を メモリに書き出すくらいならできないこともないんじゃない?
ALU毎に書き出し先を指定整列させれば可能かもね
>>918 >>919 メインメモリから「読み込む」事と、指定したフォーマットで「書き出す」事は出来るだろうが
3Dレンダリングは、Z、α、ステンシルテストの為に「読み込ん」でテストして、α合成して
「書き出す」という両方の作業が必要になる
通常この作業をするのはROPで、ほぼ固定機能として実装される為シェーダーよりも高速
しかも、Xenosの場合通常は書き込むデータの提供はシェーダーから、既に書き込まれている
データはeDRAMからと両方の帯域を使える
GPUGPでレンダリングするとなると、読み書き共に貴重なメインメモリの帯域を使う上、ROP相当の
操作をシェーダーで実現する必要があるので、激しく遅くなるだろう
それから、フレームバッファとだけ言うと誤解を招くから eDRAM上のシェーダーがレンダリングするバッファ = バックバッファ メインメモリ上の最終的に表示される画像を格納するバッファ = フレームバッファ と、使い分けた方が良いかもな 確定事項としては ・XenosのeDRAMはバックバッファ専用 ・実際に表示する為にはメインメモリ上のフレームバッファに転送する必要がある ・eDRAM上のデータはテクスチャアクセスやMEMEXPORTを使いアクセスする事は不可能 ・MSAAやトーンマップはバックバッファからフレームバッファに転送するときに実行 ・バックバッファからフレームバッファの転送中はバックバッファへのレンダリングが止まる (spinの記事だとオーバーラップ出来るとかいてあるが、記事のソースの英文だと違う)
CESはあと □□□□□ □■■■□ □□□■□ □■■■□ □■□□□ □■■■□ 日です。 □□□□□
GKが勝か 痴漢が勝か・・・
>>904 の
>RSXもCellみたいなヘテロジニアスマルチコアだったてことか。
>なんか予想を裏切ってくれて凄いな。
凄いなってことは良い意味で裏切ってきて凄いのか!?
それともネガティブな意味の凄い?
ポジティブな意味
http://pc.watch.impress.co.jp/docs/2005/0521/e304.htm >よく知らない人は、これがPC向けGPUの焼き直しだろうと思っているようですが、実はアーキテクチャ的には全く異なります。
>カーク氏(NVIDIAアーキテクト)も含め、NVIDIAの人たちは夢を描くのが好きな人たちばかりですよ。
>その部分で互いに共感する部分もあって、これからも新しい事をやっていこうと話し合っています。
このクタタンの発言は真実だったということですか。
ずっとみんな「またクタタン何か言ってるよ」って感じで流してたがw
>>892 こ、これは・・・
ヌビディアにした意味あるのか?
これならCellGPUで良くないか?
だれかCellとRSXの差分キボンヌ。
今年中のテープアウトは無理ぽ
>>929 ヒキってるとわからないかもしれませんが、もう新年ですよw
>>913 eDRAMに転送する前、ピクセルシェーダでの演算中にポリゴンへの色付け(質感設定)は行われているから、その後にバックバッファをいじる必要は無いのにeDRAMからの読み込みを力説する所が激しく痛いのではないかと。
娘ダイでの作業はラスタライズの工程なんだな。
>レンダリングバッファーって普通はフレームバッファ ワロス フロントバッファとバックバッファで固定したほうがいいんじゃないか?
>>933 ああ、確かに(w
突っ込みどころはそこなのね。
根本的な部分で勘違いしてるから話が噛み合わないわけだ。
計算結果を再利用するにはメインメモリに書き出ししなきゃならんし レンダリング結果をしようするならeDRAMからメインに1度もどさねばならない。 レンダリング結果じゃなくてシェーダ上での計算結果ならMEMEXPORTで直接 メモリに戻せる。
その線でいくと、Xbox 720のCPUはへテロジニアスマルチコアになるのか。
http://pc.watch.impress.co.jp/docs/2005/0521/e304.htm 「たとえばRSXですが、これはNVIDIAのPC用チップの亜種ではありません。
CellとRSXは密接な関係を持っており、両者ともメインメモリとVRAMに対して
透過的にアクセス可能です。CellはVRAMに対してメインメモリと同じようにアクセスできますし、
RSXもメインメモリをフレームバッファとして扱うことが可能です。主にどのような用途として使うかで、
メインメモリとVRAMに分かれているだけで、その区別はありません。
このようなアーキテクチャにしたのは、CellとRSXの間で無駄なデータのコピーや演算をなくすため
です。」
まさにクターキターだな。
これだと春の発売ムリだな。
箱が自滅した今、慌てて春に出す意味無くなったよね
XBOX360は予想以上に突貫工事だったみたいだな
無茶な突貫工事の挙句に落盤してりゃ世話無いな。
>>939 「シェアードメモリではこれはできません」と言っているけど、GPUとCPUが
同じデータを直接参照するというのはUMAの十八番じゃないの?
文脈からすると、「少ない帯域を消費してしまうので現実的でない」という意味か。
>>925 独自->独自アーキテクチャですげーパフォーマンス
流用->実績のあるチップだからすげーパフォーマンス
で結果は一緒。
信者はアーキ無関係に褒めちぎりたいからどっちにしてもポジティブ。
仮にG70と違うものを作ろうとして、G70を流用するよりパフォーマンスが下がるようなら使われない つまり、G70が最低ラインで、みんなもまあそんなもんだろうと思ってたところに この情報が入ったんで、G70より良くなる可能性も出てきた それと、これは今回あきらかになった(かもしれない)情報なだけで、路線変更を急に行った わけではないんで、これで遅れるとか意味不明だな
それ以前にマジで信じてた香具師はアンチしかいないだろう
>>933 ラスタライズ後のデータをシェーダで再利用するようなエフェクトって
少ないんでしょうか
>>948 ラスタライズ後に行うエフェクトはフィルター系のものが多いね。
今のところモーションブラーぐらいしか使われてないけど使い道は多いと思う。
MEMEXPORTはどちらかというとGPGPU的なジオメトリ処理か゜主になると思うが。
ここまで物を知らない人間がどうして回答する側に回っているのかそれがとても不思議でならない。
エフェクトのような後処理も考慮すると、eDRAMをバックバッファに使うような 細工よりもビデオRAM全域をシェーダーが自在にアクセス出来る通常の GPU構成が、結局は一番効率がいいというオチになるんじゃないか。
>>948 、949
バックバッファのデータを再利用するような処理はいっぱいあるだろ?
というか、今のレンダリング技法の主要テクニックじゃないか?
環境マップ、シャドウマップ(セルフシャドウ)、グレア処理、被写界深度フィルター、など。
あと、ラスタライズは違うんじゃない?ラスターオペレーションならわかるけど。
ラスタライズはピクセル分解する処理だから、ピクセルシェーダーの前の処理だよ。
Cell GPUはハードワイヤードのピクセルパイプライン処理にかなわなかったから捨てられたんだから、いまさらRSXにSPE乗せてくるとは思えないなあ。
のせる可能性があるとしたらGSエミュレーション機能(GSのeDRAMの帯域確保のための機能)だと思うけど。
レスありがとうございます
>>952 ということは、一々参照のために妹ダイからメインメモリに書き出さなきゃならないことは
やっぱり手間だということになるんでしょうか
それとも、そんなに頻繁ではないので大したことは無いという感じなんでしょうか
そろそろ次スレが必要だな。
>>953 手間なんて大したことはないが、そのためにバックバッファ(eDRAM)からテクスチャバッファ(GDDR)への
コピーが必要になるのは、ただでさえきつい帯域を浪費してもったいないってことだろう。
そろそろ次スレ
手間なんて大したことはないが、そのためにXDR->LS->XDR->GDDR3->XDR(ポスト処理入れるならさらに->LS->XDR)への コピーが必要になるのは、ただでさえきつい帯域を浪費してもったいないってことだろう。
それより次スレ
どうも発狂しているみたいだがそれは何がしたいのかね? フロントもバックもGDDRにあるPS3でXDRへのコピーは必要ないし、 LSへのコピーは最低限必要なデータフェッチと変わらないが。
>>950 みたいな物を知らない人間がどうして粘着してまで反論しようとするるのかそれがとても不思議でならない。
>>955 帯域の浪費というほどひどくはならんだろう。
非圧縮で書き出したとしてもeDRAMがない場合の
フレームバッファ(カラーバッファ)初期化と同じ書き込み帯域しか使わんのだから。
書き出しがオーバーラップできないのだとしたら
特に繰り返し時に待ち時間が増えてパフォーマンスの問題が生じるだろうけど。
>>962 帯域が足りないと言うわりに、実際に計算した人はいないけどな(w
論争に決着をつける為に誰か計算してみない?
帯域は足りないというほど消費はしないだろうけど(eDRAMのものを全部転送しても 10MBなので) 22GB/sってことは1秒60フレームとして366MB/フレームだから、 1回全体を読み出すような処理をやるとフレームあたり約3%の帯域消費だな。 タイリングが重たいのは同じテクスチャを何度も参照してしまうからで、3回やると 1フレーム中に使える描画帯域は3分の1になってしまうんだろう。 (ワーストケースだが) 512MBのうちテクスチャと頂点データは120MBくらいにしとけってこった。 メインメモリ256MBにしときゃよかったのにな。
それじゃUMAの利点がなくなるわな
>>964 やっぱ元々256MBで設計したシステムって感じだな。
メモリ増量に合わせて帯域増やす事もしなかったし。
そりゃPS3に対するメンツだけでのっけたものだもの
メンツつーか、メモリ量は「ライバルと同じだけ載せる」以外の選択肢がないからな。 少なければサードの開発意欲に差がつくし、多ければコスト競争で負けてしまう。
メモリ量って大きくなればなるほど価格の上昇カーブがきつくなるんだよね。
1フレーム366MBの帯域だが、読み出しは半分の178MBなのですよ。 それをGPUとCPUで分け合ってるのだが。
>>964 タイリングが重いとしたら頂点のせいでしょ。
テクスチャアクセスなんてオンデマンドで
起こるものだから、タイルだからといって
テクスチャアクセスが極端に増えるという話は聞いたことがない。
3回タイリングして、3つにまたがったものが同じテクスチャ参照してたら 少なくともキャッシュヒットは見込めないわけで。頂点もそうだけどね。 いまだにマテリアルでソートが有効なのはこの辺が関係してるわけだし。 1フレームに3回描画するってのは、3倍の180フレームを実現してるようなもんで。 ハードの特性を生かすとなるとアルファブレンディングしまくりなものかな。 それだとソートもZでやるしかないし。
なんかまさにPS2しか触ったことありませんって匂いがプンプンするんだけど。 起動される頂点スレッドとピクセルスレッドの比とか考えたことありますか?180フレームとかあんま平気で言わない方が良いよ。 キャッシュはテクスチャ単位で格納されるわけではありませんよ?最小タイル単位です。境界またがったからと言ってリニアに負荷は増えません。
974 :
名無しさん必死だな :2006/01/03(火) 23:10:03 ID:LDkDX+eM
>>973 PS2的発想しか出来ないから、プロシージャルテクスチャも思いつかないようだ、そっとしておいてやれ(w
>>974 彼らPS原始人にはプロシージャルテクスチャはオーバーテクノロジーなのです。
だから使用を許されていませんし、理解も出来ないのです。
芸のない単発馬鹿がまた沸いたか。
>>976 その馬鹿をいちいち相手にしているおまえも相当かわいそうだが。
おやおや、みんなハイデフのためのタイリングをやめたのにw
DOA4はHDですよ。
おまえらタイリングのメリットをわかってねーな
>>980 タイリングならではのメリットも有るが、トータルでは結局デメリットの方が多いと思う
証明は3年半ぐらい経って箱3が出ないと出来ないが。
タイリングのメリットはコスト的な物だけで、性能的には何も無いような 帯域の節約はメインメモリと別にレンダリング用メモリを持つ事による物であって タイリングによる物じゃないし
>>974 そうだよな、今までテクスチャで描いてたのが9割ぐらいシェーダープログラムのパラメーターをいじるだけになるから、使用帯域は大幅に減るよな。
やがてくる未来を語るスレはここですか?
まあ、もし本当に何でもかんでもシェーダーで用意できてテクスチャがいらないなら DVDどころか8cmCD程度の容量で十分過ぎるわけだが。 でも実際には全然そんなことはないわけで。
>9割ぐらいシェーダープログラムのパラメーターをいじるだけになるから 笑うところですか?
988 :
名無しさん必死だな :2006/01/04(水) 13:04:22 ID:tij/6pSi
>>987 今時、そんな時代遅れなこと言ってると笑われるぞ。
テクスチャ無しなんて時代にはなってないよ
改行してないし、なんか意思統一されてる単発だし、いつものヤツ臭い ああでもテクスチャほとんど描いてないから箱○の画面はああなのかもしれんかw
テクスチャ無しなんて書いてないよ。 眼腐ってんじゃないか?
コロコロID変えるな。 意図せずID変わっちゃう環境ならトリップつけろ。
煽られ耐性低いな。
そのシェーダのパラメータ(ノーマルテクスチャ等)で帯域増えてますがな
法線マップのことをパラメータとかいってるのか?w なんか大笑いだな。 こいつらの頭の中では環境マップやHDRとかもパラメータいじるだけで 実現できるんだろなw
パラメータがノーマルマップ等を示すのならば、「パラメータをいじること」で いろんなエフェクトが実現できますなぁ。 MEMEXPORTでデータ作ればメモリに書き戻さなくても良いと思ってるなら これはトンだワロス話で。
うめちゃうよ
(ヽ、,/) ,、) | 〜| ,-、-、 ∧ ∧ ,、_,、 (V⌒⌒) ⊂ つ / J J ,、_,、 ∧ ∧ キタ━(*゚∀゚)━⊂( 。__。)⊃━⊂( )⊃━( )━⊂( )つ━(*゚∀゚)━━(*゚∀゚)━!!! ⊂ つ〜( 〈 `´`´ ∨ ∨ `´`´ ⊂ つ ⊂ つ 〜| | `J J 〜ヽ、つつ 〜| | ∪∪ ∪∪
r -、,, - 、 クマ− __ ヽ/ ヽ__ ,"- `ヽ, / ● l ) / ● \__ (● ● i" __/ ●)  ̄ )"__ "`; .(_i ● ' __, '"  ̄`'(___/.i⌒i 丶_ ,i⌒i,,_(_/ ● i ̄ ̄ )_|__ __, '"  ̄ ヽ! ● ●) ミ~ ̄_● ヽ) クマー (_/ ● i ∪ / ⊂{● |. l ●( _●) (  ̄)- / -' i /ヽ、 |∪l T i ● '")
1001 :
1001 :
Over 1000 Thread このスレッドは1000を超えました。 もう書けないので、新しいスレッドを立ててくださいです。。。