XboxとGameCubeどっちが性能いい? Vol.40
×面
○片
点でもいいや。
953 :
名無しさん必死だな:02/01/18 13:11 ID:3T52SJdT
954 :
まっとう斎:02/01/18 13:11 ID:STAmRBMq
>>951親切にどうも。
フラグメントは過去に何度も調べたのですが日本語の解説が見つからなくて
困っていたのです。
955 :
まっとう斎:02/01/18 14:26 ID:STAmRBMq
GCのテクスチャキャッシュは1MBだけど1MB分のテクスチャが入るのでしょうか。
もしかして並列化のために8分裂させて使って128KB分しか入らないとか。
などと妄想してみる。
956 :
609:02/01/18 14:33 ID:7arRS2uK
>>948DepthPeelingって本当に実用性あるのかねぇ。
結局手前から数枚の描画をしたところで
ソートを打ち切る処理をしなきゃ使い物にならないし。
どうせ打ち切るなら、ここの後半部分みたいなやり方の方が良さげだけど。
http://www.geocities.co.jp/HeartLand/8281/journal.html#20010517nレイヤ分のZ、RGB、ブレンド比率、ブレンドの仕方をためるバッファに
1パス描画をして最後にブレンドするのね。
こうすれば、必要なバッファは増えてもパス数は1回で済むし。
奥から積めて描画して、レイヤがたりなくなったら
奥2つのレイヤを合成していけば、手前からn-1枚の半透明までは正しい描画が保証されるからね。
4レイヤも用意すれば、ほとんどZソートの必要は無くなるんじゃないかな。
副作用として、エッジアンチもZソート無しでそこそこのクオリティが出せるしね。
64のエッジアンチの資料を読むと
これに近いことをやっていそうな感じだし。
957 :
名無しさん必死だな:02/01/18 14:42 ID:/jEV3x4n
ここってGCがいかにXBOXより性能が上かを証明するためのスレなの?
958 :
609:02/01/18 14:51 ID:7arRS2uK
>>955確かかなり細かくバンクバンク分けされていたはずだから
各バンクと出力ポートがクロスバーでつながれているんじゃない?
バンクコンフリクトが無ければ常に8ポートつかえるかと。
完全にランダムな8ポートの要求だと
それでも結構なストールが起こりそうだけど、
所詮近接4ピクセルで使用するテクスチャだから、
きちんとMIPMAPしている限りストールしないんじゃ無いかな。
調べたら512バンクらしい。
さすがにこれでクロスバーを作るのは辛いか。
32x8くらいのクロスバーかな?
959 :
609:02/01/18 14:56 ID:7arRS2uK
>>957いや、GC、XBOXのどちらも得意、不得意があるにせよ
PS2の2〜4倍程度の実効性能になるという、
2年弱の時間差を考えると当たり前な結論を導くスレじゃないかな?
960 :
名無しさん必死だな:02/01/18 14:57 ID:dkL2kdKi
今までこの糞スレ煽ってたのは609とまっとうの2人か。
961 :
名無しさん必死だな:02/01/18 14:58 ID:/jEV3x4n
凧酢も・・・
962 :
まっとう斎:02/01/18 15:04 ID:STAmRBMq
>>958そういうクロスバーはNVIDIAの特許出願中の技術ですからGCには
使われていないと思います。
963 :
名無しさん必死だな:02/01/18 15:07 ID:3T52SJdT
NVIDIAより先に出願してたりして
964 :
まっとう斎:02/01/18 15:14 ID:STAmRBMq
妄想続き。
8個のS3TCブロックに同時アクセスするのではなくて
1個のキャッシュ用ブロック(S3TCブロックをさらに4x4個)を3サイクルで
L1テクスチャキャッシュ(存在は不明)に読むとか言うのかもしれません。
965 :
:02/01/18 15:17 ID:ZvWAy+JR
なんでこの板まだ続いてるんだ?
966 :
名無しさん必死だな:02/01/18 15:18 ID:ZvWAy+JR
まちがえた。板→スレッド
967 :
609:02/01/18 15:23 ID:7arRS2uK
>>962ただのクロスバーごときで特許なんて…
クロスバーなんて昔から電話の交換機とか
いたるところで使われているでしょ。
NVIDIAの場合クロスバーでの特許が取れたとしても
PCのメモリコントローラ用に
NVIDIA独自の制御機構で実現されたものに限定されるでしょ。
仕組みが違えば、他のメーカーでもクロスバー型メモリコントローラはいくらでも作れる。
サイズ、配線が巨大になる完全なマルチポートSRAMの代わりに
マルチバンク化+クロスバーでほぼ同様の性能を出そうという試みは
すでにいろんなところで使われていると思うけど。
>>957たかがゲームハードを素人が議論するスレかと。
だからどっちの性能が良いかなんてあんまり関係ないような。
ただ、何を言ってるのか訳が分からないならこのスレを無視すれば良いのだけの話。
この板って、「ゲーム業界、ハードウェア@2ch掲示板」でしょ。
969 :
名無しさん必死だな:02/01/18 16:38 ID:qnGnqcLt
ゴタゴタとウザイスレだな。
テクスチャ話はこのスレ中にカタをつけとくぞ。
GC
4ピクセルパイプライン1TMUの648Mpixel or texel/s。
レンダリングは2*2矩形単位で実行、転送。
フィルレートは混載フレームバッファにより理論値に近い数字が出せる。
また、半透明時にも負荷は変わらない。
トリリニアまでフリー(バイリニアTMU*2に比べて
テクスチャ座標計算が大幅に簡略化できる)。
テクスチャキャッシュは512バンク1MB。32バンクに同時アクセス可能。
テクスチャキャッシュ帯域は512bitで、計算上は32bitの完全に離散的な
トリリニアアクセスには耐えられないが、多分矩形単位でレンダリング
することでテクセルをフェッチする際に重複テクセルを端折って
何とか実現するのだろう。
テクスチャキャッシュ領域をロックしてそこに直接レンダリングが可能。
1画面で使用されるテクセルの総計は多くても3MB程度なので
1MBのテクスチャキャッシュはオーバースペック。よって上記の機能を
活用しないと1MBのテクスチャキャッシュは意味無し。
テクスチャフェッチ8段、ピクセルブレンド16段。依存テクスチャ可能。
ピクセルブレンド段は或る程度柔軟性があるが内積バンプなどの
計算は苦手。
メインメモリはイニシャルレイテンシ3、read/write切り替えペナルティ1、
バースト長4。つまり実効性能は4or3-1-1-1で20MB/f(1.2GB/s)程度
970 :
名無しさん必死だな:02/01/18 16:39 ID:qnGnqcLt
XBOX
4ピクセルパイプライン2TMUの1Gpixel or 2Gtexel/s。
フレームバッファアクセスの制約によりフルスピードは無理。
よって時間をかけてピクセル処理した方がお得。
バイリニアまでフリー。トリリニアだと2TMU消費。
テクスチャキャッシュは32-64KB程度。
GCに比べると小さいように思うかも知れないが、下記の通り
メモリ帯域はフレームあたり30MBもあるので充分。
テクスチャフェッチ4段、ピクセルブレンド8段。
フェッチ、ブレンド共に極めて高度な演算が可能。
メインメモリはレイテンシ20ns-20ns-20ns程度と思われる。
バースト長は8またはフルページ。バースト長8での実効性能は
24or16-1-1-1-1-1-1-1で30MB/f(1.8GB/s)程度。
フレームバッファアクセスはフルページで行うと思われる。
結論:XBOXのメモリ帯域は十分な広さを確保している。
GCの利点は混載フレームバッファで、半透明ビルボードなどを
大量に描く場合はXBOXを凌駕できるだろう。あとは全てXBOXの勝ち。
GCは混載メモリに目が奪われがちだが、GCの混載メモリは
フレームバッファアクセスを徹底して追い出すことで
低価格化を実現するコスト優先の仕様であり、性能面ではXBOXの
敵ではない。もちろん、コスト対性能比はGCの圧勝。
971 :
まっとう斎:02/01/18 17:19 ID:STAmRBMq
妄想は妄想と断って書いてほしいです。びっくりするから。
972 :
名無しさん必死だな:02/01/18 17:24 ID:qnGnqcLt
974 :
まっとう斎:02/01/18 17:38 ID:STAmRBMq
このへんが怪しい。
>テクスチャキャッシュ領域をロックしてそこに直接レンダリングが可能。
>メインメモリはイニシャルレイテンシ3
このへんが個人的希望の域を出ていない。
>テクスチャキャッシュは32-64KB程度。
>フレームバッファアクセスはフルページで行うと思われる。
このへんがスゴイ間違い。
>フレームバッファアクセスを徹底して追い出すことで
>低価格化を実現するコスト優先の仕様
975 :
まっとう斎:02/01/18 17:39 ID:STAmRBMq
あとクロスバーのメモリ分断をまったく意識していないところがおめでたいです。
976 :
609:02/01/18 17:46 ID:7arRS2uK
>>969,
>>970データが真実であるとして。本物の開発者さん?
データだけ見たときと、結論のギャップが大きくないかねぇ。
結論は両方でベンチをした上での評価だとすると
どれくらい詳細なベンチで計っている?
どうせならその条件くらい公開して。
977 :
609:02/01/18 17:49 ID:7arRS2uK
XBOXはビルボードを貼るときだけじゃなくて
マルチパス系のエフェクト処理もあまり得意じゃないでしょ。
それに実効帯域も十分とはいえないと思うけど。
特にテクスチャアクセスが3MB/frameあったときに
シェアして30MB/frameの帯域は本当に十分?
メモリバンク1つ当たりにすると7.5MB/frameだから
テクスチャを2つに上手く分散させたとして帯域使用率1.5/7.5=1/5
テクスチャアクセスだけで実効帯域の5分の1も使用したら、
衝突もそれなりに起こるからレイテンシの大きさは無視できないはずだけど。
1フレーム中のテクスチャアクセスを根拠に1Mのテクスチャキャッシュが無意味といってしまうのもなぁ。
これだけ大きければフレーム間での相関も利用できるから、かなり帯域負荷が下がるはずだけど。
フレームバッファアクセスがフルページなのもどうなのかなぁ。
ピーク性能をあげるのには有効だけど、
ブロック境界を跨ぎやすいポリゴンを描画するときに裏で読み書きしても、
特に32bit color時には隠蔽仕切れないでしょ。
Fill能力に関しては実質GeForce3よりもかなり落ちるからなぁ。
978 :
まっとう斎:02/01/18 17:52 ID:STAmRBMq
あ、イニシャルレイテンシー3は別にあやしくなかったです。
162MHz換算では1.5ね。
スペックダウンしてメインメモリー実効帯域がX-BOXに負けたんでしたね。
979 :
まっとう斎:02/01/18 18:07 ID:STAmRBMq
ビルボードだけでなくてポリゴン描くときも混載フレームバッファは役に立つのですが
そのへん無視するところが一般的なX-BOXサポーターさんと同じですね。
本当にびっくりしましたよ。とうとう本職のお出ましかと思った。
980 :
名無しさん必死だな:02/01/18 18:19 ID:VMppzZJJ
>このへんが怪しい。
>>テクスチャキャッシュ領域をロックしてそこに直接レンダリングが可能。
>>メインメモリはイニシャルレイテンシ3
最大レイテンシが4でreadwrite切り替えに1クロックかかるんだから
4-1-1-1-3-1-1-1みたいなレイテンシなのは容易に想像できるだろ。
>このへんが個人的希望の域を出ていない。
>>テクスチャキャッシュは32-64KB程度。
>>フレームバッファアクセスはフルページで行うと思われる。
テクスチャキャッシュ32-64KBなんてごく普通の仕様じゃないか。
どこが希望的観測なんだ。
フルページアクセスなんてグラフィックチップ以外使わないだろ。
だったらよりデータ量の多いフレームバッファアクセスという
ことになる。もしかしたらテクスチャの読み込みも
フルページかもしれんが。
>このへんがスゴイ間違い。
>>フレームバッファアクセスを徹底して追い出すことで
>>低価格化を実現するコスト優先の仕様
PS2と比較すれば混載の優位を無理に追い求めてないのは明らかだ。
VRAMを余分に追加したりメモリバスを128bitに拡張するのはコストが
かかるから、フレームバッファを混載したと考えるのが理論的だ。
981 :
名無しさん必死だな:02/01/18 18:27 ID:VMppzZJJ
>あとクロスバーのメモリ分断をまったく意識していないところがおめでたいです
クロスバーは128bitのバス幅を有効活用するための技術だろ。
なんか勘違いしてないか?
>データが真実であるとして。本物の開発者さん?
違うよ。全部海外のサイトや掲示板で集めた情報。
>マルチパス系のエフェクト処理もあまり得意じゃないでしょ。
「マルチパス系」だけでは漠然としすぎ。
>特にテクスチャアクセスが3MB/frameあったときに
シェアして30MB/frameの帯域は本当に十分?
3MBは本当に多く見積もった場合の数字。
計算してみろよ。1フレーム300Kドットにマルチテクスチャと
余分フェッチを勘案して1200Ktexelとしても24bitベタテクスチャで
やっと3.6MB。きちんと圧縮を活用すれば1MBもいかないさ。
>メモリバンク1つ当たりにすると7.5MB/frameだから
>テクスチャを2つに上手く分散させたとして帯域使用率1.5/7.5=1/5
>テクスチャアクセスだけで実効帯域の5分の1も使用したら、
チミは何を言ってんだ?4バンクに分割されてるとそれぞれの
バンクアクセスに32bitしか割り振れないとでも思ってるのか?
このスレの住人がフラグメント知らなかったのはマジで痛い。
やっぱりワナビーの集まりだったのか?
983 :
まっとう斎:02/01/18 18:36 ID:STAmRBMq
>>980ポリゴン描画にフルページつかって何の意味がありますか?
そもそも粒度を高めるためのクロスバーです。矛盾しますよ。
フレームバッファ混載で性能が犠牲になったならコスト優先と
いえますが、なにか犠牲がありますか?レイテンシーもバス幅も
性能向上に貢献していますが。
984 :
名無しさん必死だな:02/01/18 18:39 ID:VMppzZJJ
>1フレーム中のテクスチャアクセスを根拠に1Mのテクスチャキャッシュが無意味といってしまうのもなぁ。
>これだけ大きければフレーム間での相関も利用できるから、かなり帯域負荷が下がるはずだけど。
テクスチャアクセス自体が大した負荷じゃないんだよ。
大物はフレームバッファ。テクスチャはオマケ。
>フレームバッファアクセスがフルページなのもどうなのかなぁ。
>ピーク性能をあげるのには有効だけど、
>ブロック境界を跨ぎやすいポリゴンを描画するときに裏で読み書きしても、
>特に32bit color時には隠蔽仕切れないでしょ。
>Fill能力に関しては実質GeForce3よりもかなり落ちるからなぁ。
3DビデオカードのVRAMに使われてる高速DDRSDRAMはみんな
フルページモードを持ってるぞ。
実際ベンチを見てもメモリクロックにほぼ比例してフィルレートが
上昇してる以上、フレームバッファは主にフルページで
アクセスされてると考えるべきだ。
>ビルボードだけでなくてポリゴン描くときも混載フレームバッファは役に立つのですが
>そのへん無視するところが一般的なX-BOXサポーターさんと同じですね。
実際に4pixel/clockで描画しなきゃいかんほどテレビは高精細じゃない。
XBOXでも300Mpixel/sくらいは普通に出るだろうから、それで十分だ。
>本当にびっくりしましたよ。とうとう本職のお出ましかと思った。
頭の足りない狂信的GCサポーターは嫌だねえ。
985 :
まっとう斎:02/01/18 18:39 ID:STAmRBMq
>チミは何を言ってんだ?4バンクに分割されてるとそれぞれの
>バンクアクセスに32bitしか割り振れないとでも思ってるのか?
だからそうだって言ってるでしょ。
986 :
名無しさん必死だな:02/01/18 18:43 ID:VMppzZJJ
>ポリゴン描画にフルページつかって何の意味がありますか?
いちばん帯域食う処理なんだから効率を求めるのは当然だろ。
>フレームバッファ混載で性能が犠牲になったならコスト優先と
>いえますが、なにか犠牲がありますか?
あるじゃねえか。たった2MBしかリニアにアクセスできない
狭いフレームバッファという犠牲が。
ポスト処理とかする場合はすげえ面倒なはずだ。
987 :
名無しさん必死だな:02/01/18 18:44 ID:VMppzZJJ
>>985んなタコな仕様なわけないだろ。
メチャクチャにもほどがある。
988 :
名無しさん必死だな:02/01/18 18:44 ID:IqCdlIYV
というか今日のまっとうタンちょっと変。
仕切りなおしては?
989 :
名無しさん必死だな:02/01/18 18:47 ID:2hyCjGYO
ワナビーって何?
990 :
名無しさん必死だな:02/01/18 18:47 ID:1dJ0VVxU
991 :
名無しさん必死だな:02/01/18 18:48 ID:VMppzZJJ
ったく、せっかく俺がまとめたのにまっとう斎のせいで台無しだ。
992 :
名無しさん必死だな:02/01/18 18:49 ID:IqCdlIYV
want to be = wanna be
993 :
名無しさん必死だな:02/01/18 18:49 ID:Xs8ZKsQQ
PS2が最強
994 :
名無しさん必死だな:02/01/18 18:51 ID:IqCdlIYV
スレの最後に世迷言書きおって。
995 :
名無しさん必死だな:02/01/18 18:51 ID:cQnq6KtR
996 :
名無しさん必死だな:02/01/18 18:52 ID:1dJ0VVxU
つーかXBOXとGCの差はGCとPS2の差よりはるかに大きい。
997 :
まっとう斎:02/01/18 18:52 ID:STAmRBMq
>>987同時に1バンクにアクセスできる方がめちゃくちゃなのでは?
私のほうは前に根拠書きましたので反論があるならきちんと
理由を書いてください。
>>993スレを1000近くまで費やして出た結論がそれか。
999 :
まっとう斎:02/01/18 18:53 ID:STAmRBMq
GC最強。
>>993ちょっとワラタ。1000は誰かとってくれ
1001 :
1001:
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。