2 :
名無しさん必死だな:2006/12/27(水) 16:08:34 ID:fXSv5cNu
華麗に2ゲット
先進的計算基盤システムシンポジウムSACSIS2007併設企画
マルチコアプログラミングコンテスト 「Cellスピードチャレンジ2007」
http://www.hpcc.jp/sacsis/2007/cell-challenge/ 情報処理学会 計算機アーキテクチャ研究会,組込みシステム研究会,ハイパフォーマンス
コンピューティング研究会の主催により,先進的計算基盤システムシンポジウムSACSIS2007
の併設企画として,このような挑戦的なアーキテクチャを持つCell BEを対象とする
マルチコアプログラミングコンテストを開催することとなりました.
( ´,_ゝ`)プッ
6 :
名無しさん必死だな:2006/12/27(水) 18:47:53 ID:HMILb3gj
http://pc.watch.impress.co.jp/docs/2006/0927/kaigai304.htm ■後藤弘茂のWeekly海外ニュース■
綱渡り状態だった東京ゲームショウのPS3
>別なデベロッパは、SPEプログラミングを始めると苦しいのはメモリだと漏らす。
>SPEはメモリ共有モデルは取らず、各コアに内蔵する256KBのローカルストアメモリにプログラムと
>データを持ってきて実行する。ところが、256KBは実行イメージも含めての量なので、
>ユーザーエリアはそれより小さくなる。さらに、外部DRAMへのアクセスレイテンシの隠蔽のために
>バッファリングする場合には、このメモリを2分割して128KBで使わなければならない。
>「ローカルストアが1MBあれば、全然違っただろう」という。
前スレでも話題になったLSだけど、GKってどうして事実を偽ってLSが2Mbitもあるなどとうそぶく
のだろう?↑みたいなソースもあるのに。
これを使いこなすのは、困難だぞ。
釣りは釣り堀で
CellスレではCellの話題をお願いします。
8 :
名無しさん必死だな:2006/12/27(水) 18:51:28 ID:HMILb3gj
>>7 はあ?何いってんのあんた。
だからcellの話題出してるだろうが。
10 :
名無しさん必死だな:2006/12/27(水) 18:56:51 ID:HMILb3gj
11 :
名無しさん必死だな:2006/12/27(水) 19:03:37 ID:ttNE4co6
17号を吸収し、18号も吸収した。
12 :
名無しさん必死だな:2006/12/27(水) 19:14:17 ID:Bg6tUEWJ
bitとbyteの違いがわからない人がいるスレはここですか?
雑誌でもよく混同してるからいまさら感
もしかしてID:HMILb3gjは真性なのか?
さすがゲーハー板というべきか・・・
SPEさえ使いこなせればCell最強。
でも、使いこなせてないから最弱。
「てやんでぃ、SPEさえ使いこなせれば凄いんだぞぅ、SPEさえ使いこなせれば。。。むにゃむにゃ」
「お客さん、これ以上は体にさわりやすぜ」
「そーっとしといておくんなまし、この人も昔は輝いてたんですけどね、今じゃこの有り様で」
17 :
sage:2006/12/27(水) 19:26:10 ID:rWMKww0M
SPEよりSPYの方がいいかも
たしか1byteは8bitですよね?
19 :
名無しさん必死だな:2006/12/27(水) 19:35:16 ID:Lc02Couv
>>16 ほんと、去年までは燦然と輝いていたけどね。
こんなになるなんて想像も出来なかったよ。
俺の心の中のPS3はプリレンダ並の画質で1080pの画面が細胞のひとつひとつを物理演算で人体モーション生成の120fpsだったんだが。
なんでグリッドがNUMAしないんだぁぁぁ!
そしてID:HMILb3gjは消えた
22 :
名無しさん必死だな:2006/12/27(水) 20:07:17 ID:ZesnOlJi
>>15 ロンチだけ見て最強とか最弱とか、早漏君は大変だな。
>>18 本来マシンによって違うが現存するアーキテクチャは全てそう。
>>20 テクノスレ名物細胞君キターーーーーーーーーーーー。
ちなみに細胞細胞言ってるのはお前だけ。
HSPをcell上で動かしたらどうなりますか?
Core2Duo買ってPentium4 1Ghz程度のPPEって信じられないって
思った。以前のPen4 3Ghzでも今では超遅く感じられる。
PXにしろPPEにしろ相当な糞だろ・・。常識的に考えて・・。
東芝は、現在、家電向けの廉価版Cellを計画中で、「SPE(Synergistic Processor Element)」数を4個に半減させるほか、メインCPUコアの「PPE(Power Processor Element)」を取り去ることも検討しているという。
Cellの支持者は負け犬でFA w
いきなり書き込んでしまった。
IBMを負け犬とはおまえはマイクロソフトかと。
東芝からSPEだけのCELLが出るのか
SPE単体で駆動できるんだな
SPEだけで動かせば、消費電力もコストも下げられそうだから
専用LSIに対抗できなくも無いかな
1byteは8bitのことが多いが(2のべき乗は美しい)、
byteは「bitのかたまり」的な意味なので、
歴史的には1byteが9bitなアーキティクチャも実在した。
通信の世界などで、7でも9でもなく厳密に8bitを指したい時には1octetと表現する。
>>30 platformOViAのAPI仕様書って無いの?
ちょっとググってみた限り見つからなかったんだけど。
Cellで実装したら面白いんじゃないのかなぁと思った。
38 :
名無しさん必死だな:2006/12/28(木) 18:56:17 ID:w0Ic1ByT
speが使えないcell・・・・・・・・・・・・。
結局、GEKKO+PX+SPEにしときゃあ今頃ドタバタ騒ぎにならずに済んだ物を・・・・
PXはイランだろ
売りの部分がSPEより低機能なのに
>>39 ゲーム用としては悪くないぞPX、SPEが性能で凌駕出来るのはPXの機能の一部だし。
お前ら早くコード書けよwww
P4で2時間かかるしょりが2秒で終わったよ
ソースもなしに信じろとな
>>40 PXがPPEを上回ってる部分はSPE使う事でそれ以上の演算性能を発揮できるし
その他の部分はPX=PPE(部分的にはPPEのが上回ってる部分もある)だぞ
それにゲームのジャンルによってより必要とされる演算性能は違ってくるから
「ゲームの用途としては」なんて一言で片付けられる話しでもないんじゃ?
>>45 PXはPPE x 3
この部分はCellが永遠に超えられない壁だぞ馬鹿め
PXは最強なり。
PPEに劣っている事なんて何一つ無い。
整数演算器が削減されていることなんて、(゚ε゚)キニシナイ!!
共有L2のレイテンシがえらく長いことなんて、(゚ε゚)キニシナイ!!
48 :
名無しさん必死だな:2006/12/28(木) 22:55:42 ID:i9ggz4JJ
マジか!?
パネルはサムチョン、LSIはNEC・・・Sonyはいったい何を作っているのだ?
あ、Amazonの60Gが売り切れてる。
このスレの人は買えたのかな?
少しでもCellプログラミングが盛り上がって欲しいのだが・・・
盛り上がるより前に一度設計やり直して使いやすくした方が良い。
52 :
名無しさん必死だな:2006/12/29(金) 02:15:02 ID:fxzC0hkR
PXは分岐ミスレイテンシがPPE/SPEよりも大きいしな。
>>50 Cellプログラムが巷に広く普及することは間違っても無いだろ。
組み込みとか、スパコンみたいな特定用途くらいしか積極的に開発する理由がない。
一般人向けだと、何だかんだ言っても、PS3のCellで実現してマジ嬉しい用途って
違法ROM動かせるエミュと、エンコード/デコードくらいだし・・・
あとは既存ソフトウェアの移植になるが、これは大抵PCのほうが便利だし速いわけで
特にCellで動かす利点が無い。
54 :
名無しさん必死だな:2006/12/29(金) 04:11:40 ID:GP+g0SWX
71 名前:名無しさん必死だな 投稿日:2006/10/23(月) 17:06:52 ID:8MKY2TAx
294 名前:名無しさん必死だな 投稿日:2005/06/10(金) 03:29:27 ID:qlD0Kky2
マルチコア思想はシングルコアの打開策とかじゃなくトレンドの本流だ←半年前
そこにネットが加わってグリッドになっていけばマルチなんて意識して呼ばれることもなくなる
そのネット上のグリッドまで視野に入れてトレンドの本流に乗ってるのがCELL ←今この辺
CELL上でWIN動かして、WIN用のアプリを作るなんて古いエンジニアしかやらねぇ非合理的でナンセンスなことだよ ←もうすぐ
最終的にはオープンなLinuxがオープンなCELLネイティブに近づく形で意識しないOSとして完成するだろう ←2〜3年先
その時にはもうCELLプラットフォームは完成してパフォーマンスは地球規模で補完しあうわけだ←4〜5年先
やべーこのアーキテクチャーやべーこれマジやベー
55 :
名無しさん必死だな:2006/12/29(金) 04:16:22 ID:GP+g0SWX
解説すると、これはqlD0Kky2の書いた元ネタに対して、8MKY2TAxがコメントを入れてるのね。
Linux派生のCell専用OSってのはともかく、
地球規模で〜って飛び方はどうだろう
って、え、Linuxが完全Cell寄りになって完成つってるのか
それはないだろー
58 :
名無しさん必死だな:2006/12/29(金) 04:19:42 ID:GP+g0SWX
それぞれの日付もいい味出してる。
とにかく、なんというのかなぁ。微妙にガチなところが素敵じゃない。
こういう、おもしろレスも有りじゃないか。笑えるCellスレであって欲しい。
Cellで例の宇宙人探しやればいいよ。
並列計算でPCの数倍の演算速度はでるだろう。
仮にCellが普及してリビングのあらゆる家電に搭載されたとしても、
各Cell同士が結合しスーパーコンピュータとしての巨大グリッドを形成する事はないだろう。
何故ならお互いにつながっていないから。
しかし、悲観する事はない。 リビングの温度は5〜10℃程度上昇する。
その温もりこそが、われわれの目指すプレイステーション3なんだよね。
61 :
名無しさん必死だな:2006/12/29(金) 06:41:01 ID:GP+g0SWX
温風を媒体にしてCell同士を通信させればよいじゃないか。機嫌ぐらいは伝わる。
エンコードソフトウェアを動かせられるようなって
HDDに保存した動画を変換出来れば・・・。
PS3ももっと活動出来るのにな
>>62 EMMA3で十分なのでCELLの出番はない
なんかCellを開発中にASSPに追い抜かれるって言われてたけど現実になっちまったのかな・・・
追いつくにはとりあえずplatformOViAをCellに実装するのが手っ取り早いとおもう。
65 :
名無しさん必死だな:2006/12/29(金) 09:47:26 ID:KVRv2CwY
>>64 >ASSP
抜かれるって、専用カスタムLSIを起こすことがASSPなら、それ以上っての
はないだろ? がんがん変わるプロトコルや信号処理に対して「また、新しく
ハードウェア設計するのかよ〜」ってな感じで汎用にしたいってのは、
良くある話だね。設計よりテストの方が大変なんだから設計だけなんとか
してもだめ。
むしろ、これから出るマルチコア、メニーコアに対して、Cell が優位性を
確保出来るのかどうかだな。
68 :
67:2006/12/29(金) 14:08:38 ID:kukFuSat
搭載されてるのは多分MPEG2エンコーダーで、
>>66が言いたいのはH.264エンコだろう。
ま、MPEG2ならそのまま記録すりゃいいから別にいらないけど。
速くもデコードではCellの出番無くなったんじゃね?
残るはエンコのみか?
サンプル価格2万ってCELLより高いだろ。
量産でも1万は超えそうだ。
エンコのプログラムにいい参考書ってない?
本て
>>72 Waveletによる画像処理つう本なんかええよ。
彼はそういう情報を欲しているわけでは無いだろー
今YDL入れてるんだけど、installつうコマンド入力する画面になったら
モニタ(AQUOS46GX)がかってに525Pモードに切り替わってしまい、
画面が崩れて表示されるんだよね。
720pモードになるはずなのに、なんでだろ。
78 :
名無しさん必死だな:2006/12/29(金) 20:46:12 ID:OPiPPr3R
箱〇GOW馬鹿売(北米)れらしいね。
今までと違い、北米が一強他弱で流れが決まるかも。
CELLやベーマジやベー
79 :
名無しさん必死だな:2006/12/29(金) 20:47:33 ID:PVqMTVv6
何千億だっけ?>開発費
Cellに2000億だった気がする
それと65のラインに3000億かな
Cellの大半は人件費かね
Cellの設計・開発に520億。 ただしSCE/SONYとIBM、東芝で割り勘(割合は不明)。
技術者はIBM250人、残りで50人。 2004年完成
ソニーグループとして、65nmプロセスの新工場建設などに2000億。
これは2004〜2006年度のグループ全体での半導体投資5000億の一部。
残り3000億はIT家電等向け半導体
IBMは金だしてないんじゃない
一線級の技術者を大量投入してるから
人件費がもの凄いんだろう。
実際に使われ始めるのは2006年になったが、
設計は2001年(PS2発売の翌年)に始まったとされる。
最初のテープアウトは2003年で、試作品はその年の暮れだとか。
製品が売れるまで何も利益を生まない開発だけに、どこも気合が入ってる。
IBMは研究成果の一部をPXに流用してるみたいだがw
何やってもYDLインスコ時に画面がおかしくなるので、
しょうがないからinstalltextでやった。
通常のHDテレビをモニタにして、PS3にYDLをインスコ〜使用する際の注意点。
HDMIだと画面がうまく表示されません。
モニタが常にに525pと判定してしまい、画面が正常に表示されません。
なので、接続はHDMI以外が望ましいようです。
みなさんお気をつけを。
回避方法
DVI入力ができるテレビなら、HDMI-DVI変換をかまして接続するといいかもね。
88 :
しろーと:2006/12/30(土) 14:09:00 ID:32CFk/qu
89 :
しろーと:2006/12/30(土) 14:11:02 ID:32CFk/qu
↑
あるスレで見つけたんですけど、ゲーム発売欄でPS3が外されてますた。
不気味な予感を感じさせますね(^^;
ひょっとしてFFなんばーもマルチ?
スクエニはPS3向けのゲームから撤退だな。
前からずっと無いだけだぞ。
相変わらず「しろーと」はマンチキンだな。
PS3の開発費がPS2の10倍でなく1/10だったら
PS3独占ってのも現実味があるんだがな。
今の本体普及台数と開発費を考えると、マルチ化を否定できないのが悲しい。
「しろーと」だって・・、ダサ
>>89 SCEからクレームが来たんだろ。
PS3はゲーム機じゃないって。
その内新しいカテゴリーにPS3の欄が出来るよ。
多分。
通知表に「ひとのはなしを聞きましょう」とか良く書かれていると見た
http://www.beyond3d.com/forum/showpost.php?p=899873&postcount=127 >A small job manager (running on the SPUs themself) simply takes job descriptor from
>a main memory list and allocates that job to a free SPU. Each job runs to completion,
>so you have a simply co-operative multitasking system. One key point is that a job can
>create new jobs, which allows a single SPU job to kick off a lots of other jobs, providing
>autonomy from the PPU.
SPUだけでいろいろ回せてるデベロッパがもうあるみたいだね。
>>97 DSP的な使い方にはSPEは向いてそうですね、速いしいいんじゃないでしょうか。
自分はCellに対して否定的な考えですが東芝のアプローチは良いと思います。
PS3用のCellはほんとひどい仕様です。
>>98 否定な意見は数多くあれど、実際どうしたらいいかとは出てこない。
具体的に言って下さいよ、ひどい仕様とは?
>>98 日本語でおk?
>>97の文章と関係ない話題だろ。
どのみちタスクスケジューリングはPPE使わにゃならんのだし。
東芝何たらはPPE抜きのSPEx4チップの構想で当分先の話だが、
消費電力が少ないだけで使い方はCellと大して違わないぞ。
>>100 >>97の記述を見る限りでは、一つのアプリの中ではPPU無しで回せそうに
見えるが?
>>101 複数のSPEに跨るジョブでもPPE要らずってこと?
PPEに出来て、SPEに出来ない事は起動後の初回のSPEキックだけだから
SPE側にタスクマネージャー持たせて、自分からメモリ上の指示を取りに行き、それに従って
動作させる事は普通に可能
SPEからSPEへの割り込みも出来るからSPE同士だけでタスクスケジューリングも可能だよ
家電向けならSPEのみというのも十分選択肢に入ると思うけど、
ゲームでそれをやるというのは意外だよね。
>>103 それだとプログラム的に可能でもSPEのリソース(特にLS)をスケジューリングに割く
ことになるから、勿体無くね?
>>105 スケジューリングに必要なLSリソースなんて微々たる物だからなぁ
PC用OSのようなタスク管理じゃなけりゃ、RAMが2KByteしかないような組み込みCPUでも
タスクスケジューリング機能を持ったOSがあるぐらいだ
タスク実行に必要なデータ自体はメインメモリにおいてあるんだしね
まぁ、基本はPPEから叩く方法なのは違いないだろうが、PPEを経由するとPPE側がネックに
なるようなら、こういう手法で解決する事もできるって事だな
SPE同士の連携を密に取りたいような場合でPPEがその処理のネックになるというのなら
1つのSPEをタスクマネージャー専用で動かすってのもありかもね
良くSPEはPPEからしか制御できないと勘違いしてる人が居るんだが、そんな事は無くて
SPE間同士で連携が取れるようになってる
そもそもSPEのSはSynergisticのSなんだから当然なんだが
>>104 仕様として可能なのと実務で使えるかという話は別だがね。
LSに収まるジョブを単独のタスクで書くのは難しくないがリソースを細かく管理して
タイミングをとるには昔の8ビットパソコンみたいにASMで書いて詰め込むしかない。
それとSPEをどれだけ遊ばせずに稼動させるかという事も考えないとならないから
効率を考えずに単純にSPEを使うだけならどこでもやれてるよ。
あけおめ!
今年こそはCellを活用したコードがうpされますように・・・
>>108 8bit PC好きですね:-)
>タイミングをとるには昔の8ビットパソコンみたいにASMで書いて詰め込むしかない。
ASMってなんですか?:-P
とりあえずCellではC/C++使うのが標準的だと思いますが、
何か凄い言語なんですかね:-P
>それとSPEをどれだけ遊ばせずに稼動させるかという事も考えないとならないから
>効率を考えずに単純にSPEを使うだけならどこでもやれてるよ。
使うだけならどこでもやれてるよと言い切るのが凄いですね:-P
でもその割に、なんかレスとしては内容がないようですが。
おまえらあけましておめでとう。
108じゃないが
>>110 おまえ本当にバカだなw
システムのスタートアップコードをC/C++で書くわけねーだろ!
>>111 スタートアップコードってどこに出てきた話?
>>113 スタートアップコードなんて話、このスレ中に出てきた?
ASMとかいう謎の言語はともかく、C/C++以外の言語で書かなければ
いけないとしたら、CRTとかその手のだろうけど、
SPEの話とは関係ないだろうしな。
BIOSや、特定のデバドラとかの話でも無さそうだし。
C/C++で記述できないようなコードというのは意外に少ない物だよ。
8bitPCの話が好きなのはいいけど、知識がロートルすぎ。
多分この偏った知識は8bitPCが存在した時代にアマチュアプログラマやってたオッサンだと思われ
もしくはそのオッサンにいい加減なウンチク聞いたガキ
256KBは厳しいよなぁ。レイテンシ隠蔽のために実質128KB。
8bit機並みの空間だよな。命令長があるから、8bit機の感覚だと32KBくらいか。
マイコン世代のメモリケチケチプログラミングが再び役立つ時が来たと
前向きに考えようではないか諸君
CP/Mの付属アセンブラだな->ASM
今の世の中CやC++で書けないものはほとんどあるまい。だけど、コンパイラに
余計なことをやられるのがやだからアセンブラで書くという人間は確かに存在
する。バージョンが変わるごとに挙動やコードサイズが変わるのがいやなんだ
そうな。
>>116 256KB単位でモジュラリティを考えて書くと普通のプロセッサで動かし
ても速くなるぞ。
118 :
名無しさん必死だな:2007/01/01(月) 10:35:28 ID:GlrKhi9/
2006年は結局トップガンは一人だけだったな。
今年は張り切ってプログラム書けよ。クズども。
ミクシィのCellスレは盛り上がってるからな。
物理演算はマシンパワー喰うほうだからWiiには荷が重いけどな。
なのになぜWiiで物理演算かというと、物理演算はマウス前提のPCで発展したものだから
物理演算に干渉しようとするとどうしてもポインティングデバイスが必要になるからかね。。
視覚エフェクトとしての物理演算ならそれこそどれでもいいけど。
まあぶっちゃけElebitsみたいな、割り込み多用してオブジェクトに干渉可能なタイプの
物理演算はSPEに投げれないらしいんで、そんなもんでしょ。
ゲームに関係のない陰毛をビラビラさせるのは得意らしいが。
陰毛はひらひら。
ビラビラは陰毛とは別のもの。
お母さんに聞いてごらんなさい。
>>117 C++で書くにしてもLSのサイズを考慮しようとするとライブラリがまったく使えないってのがね。
バイナリサイズを決めうちするにはアセンブラもいいと思う。
Cellが使いこなせないのはアセンブラプログラマが絶滅危惧種だからですね。
Cプログラマは出来る出来るとのたまうだけで行動力の無いヘタレですから馬鹿ですね。
おすすめ2ちゃんねるのCell関連スレ見たけどプログラムの話が全然出てこないのにワロタ。
○○を移植してくれないかなぁーとか、こんなことが出来るはずとか妄想ばっか。
トップガンはいないし、普通のプログラマはCellなんかいじりたくないって事ですかね。
Cellに期待しているのは他力本願の妄想ニートばかりというのが悲しい。
>>120 割り込み多用って。
そのゲームやったことないので知らないが、
ちょっとやそっと割り込み発生させても、
1フレーム程度あれば十分だろうに。
>>119 ポインティングデバイスとゲームフィジックスの関係が意味不明だ。
モーターストームもマウスで遊ぶともっと物理できるのかしらん?
>>120 これも意味不明、割り込みを多用する処理の実例を頼む。俺が知る限り、
リジッドボディダイナミクスで割り込みを多用するなどという事実は無い。
>>122 ライブラリが使えないってのはどういうこった?バイナリに落ちてるなら、
バージョンが変わらん限りサイズも変わらんぞ。
>ポインティングデバイスとゲームフィジックスの関係が意味不明だ。
>モーターストームもマウスで遊ぶともっと物理できるのかしらん?
ゲーム内の固定的な挙動を、物理演算で算出するって事なんでしょ。
自由度の高いコントローラと、低い演算能力の組み合わせは皮肉だわな。
>>120 レジスタンスやってみるといいよ。
そんなの普通にできてるから。
あと、プログラムのことわかってないのに、いい加減なこと言うのはやめたほうがいいよ。
このスレにいるやつにはバレバレだから逆効果。
このスレにいるやつが、それほどレベル高いように見えないんだけど。
ASMで分からんわけないだろ。
GCCのインラインアセンブリくらいはさすがに使ったこと無いのか?
まともに最適化がかかっているか確認するためにも
組み込み系プログラマなら最低でもアセンブリくらい読めるのが当たり前なんじゃ?
>>132 知識無くても考えればある程度はさすがに分かると思うけど。
少なくとも職業プログラマやSEだったら8ビットCPU云々とは言わないだろうよ・・・
アセンブラでしか書けないとか・・・もうね
そもそもLSに目一杯詰め込もうとするのが間違いなんだよ。
データはダブルバッファでレイテンシ隠蔽して少量づつ転送しつつ処理すればいい。
その方針でいけばコードのみに200KBぐらい使えるから余裕だろう。
137 :
:名無しさん必死だな :2007/01/01(月) 16:08:05 ID:OJ/bWsGx
>>125 PS3で使われるのそれ?
だとすればますます市場を潰すな。
欠陥を自ら認めたようなものだし。PCで売ろうにもWin-telスタンダードにはとても
なれそうもないし。
139 :
名無しさん必死だな:2007/01/01(月) 16:16:45 ID:GlrKhi9/
   俺理論を語りだすと雄弁なのに
   検証のコードは一切書かないんだよなあ
逆汗すらした事がない初心者にわ
( SPEを使うのわ ) 難しい
実験出来るツールもあるんだし、そろそろできるんじゃないかな?でなくて
ここまで出来たという報告が欲しいですね。
アンチは出来ない、無理とか言っていればいいがCell派は証拠を示さないと駄目でしょう。
>>134 中途半端な知識と妄想が入り混っているのが一番タチが悪い。
優秀な詐欺師は少しの事実と多くの嘘を混ぜるのと同じ。
Cellがある程度高性能なのはちょっとずつ実感できるようになってきたから、
あとはこれをやらせたらすごいとか、これをやったら面白いってのが
具体的に見つかるといいんだけどなあ。
逆アセは普通にするけど効率の悪いコード生成や
問題のあるインライン展開をチェックするぐらいじゃね?
で、適当にコンパイラヒント与えておしまい、と。
ぶっちゃけ、その程度の作業で得られるパフォーマンスは
たかが知れてるけどね。
146 :
名無しさん必死だな:2007/01/01(月) 17:07:09 ID:H8sAYxUB
セルのプログラミングってどうやるの?
コンパイラ言語で開発可能?なんかむりそう
いまどきアセンブリ?まさかねそれはまた別のもんだいで無理だよね
>>133 アセンブラをASMと表記するのは特定方言でしょ。
ASMという単語そのものにvoid式ツッコミを入れただけ。
もうちょっと面白い書き込みを返してくれよな。
>>137 お前の理屈で言うとXboxCPUもGCのCPUも欠陥扱いだな。
どちらのCPUも後に発展系が出たんだし。
>>142 別に実証を示すスレではないし、
SPEのみで起動する事に関してはソースを元に語ってる事だしな。
先月からこのスレに出てくる8ビット君は昔いたコボラーの兄貴か何かか?
>>140 IBMのCellBEハンドブックに解説があって、サンプルコードも載ってる。
FIXSTARSのリンク集からたどればダウソできる。
偉そうなこと言ってるだけで何も中身がないスレだな。
151 :
名無しさん必死だな:2007/01/01(月) 18:29:33 ID:4gX4HuFu
サンプルコードは書き方だけじゃなかったかな。
タブルバッファリングでコードも引っぱれたっけ?
152 :
名無しさん必死だな:2007/01/01(月) 18:36:18 ID:GlrKhi9/
PGなら書き方わかったらコードに落とすのは簡単だろw
153 :
名無しさん必死だな:2007/01/01(月) 18:40:32 ID:H8sAYxUB
どういうコードが使えるんだ?
まさかC言語とか普通に書いてもセルの能力をうまく使えるようにコンパイルできるコンパイラなんてないだろ?
>>153 ある。SPEのコードも普通にCで書ける。
興味あるならFIXSTARSのサイト見てみれ。
PCを使ってCellのプログラミングをすることもできる。
タダで開発環境ダウソできるので誰でも試せるぞ。
156 :
名無しさん必死だな:2007/01/01(月) 19:20:46 ID:4gX4HuFu
既存のLinuxソースがそのままSPEで動くよ!Cellすげーー!!
と釣られてみる
>>156 馬鹿発見。
spe_main に書き換えないと動かない。ばーか。
libspe 2.0なら普通のmain 動く。見かけ上、既存のLinuxのソースがそのままSPE
で動くように見えるね。
>>156 そういう意味ではないけど、Cで書くのは本当。
しかしコードのひとつも書き込まれないところをみるとpdfながめてるだけで実際には試していないと見た。
というか、なんでこんな所でソースコード公開すんだよ
頭のネジ数本飛んでるだろ
Cで書くとランタイムとライブラリが漏れなくついてくる罠
果たしてキャッシュに収まるのかな
doubleベースでPCにさせる安いCellボードつくれー
PS3なんかいらねー
>>163 SDK付属のライブラリ以外は使えんよSPE。
あとはPPEでないと駄目。
ここにソース書くのはむしろ板違いじゃね
発売前は書く気満々だったじゃん。
それに俺、このスレとLinux板しか知らない。
適切なスレPLZ
>>163 普通のC言語でもランタイムは指定した物、ライブラリは指定しない限りは付いてこないが?
指定しなきゃデフォのが付くだけ
お手軽なVisualStudioでプログラムしてると勝手に付けてくれるけどな
↑Cell の運勢
>>163 リンカの役割を知らない人発見。
使ってないコードはリンクされないぞ。
それでも嫌なら、ランタイムやライブラリを自前で書き直すか、
リンクしない設定でコンパイルすればいいだけ。
まあ少なくとも(s)printf系の使用は止めといたほうがいいな。
文字列処理ならC++の<string>の方がマシかもよ。
ランタイムは普通のコンパイラだと明示的に指定するほうが少ないような。
バリバリプログラム書いている人でも組み込み系じゃないと
意外と意識していないんじゃないかな。
いや、VCとかでもマルチスレッド用とシングルスレッド用、それぞれデバッグ用とそうじゃないので
指定する必要があるんで、普通にプログラム書いてても意識はするんじゃない?
さすがにコマンドラインからじゃなくて設定ダイアログから弄れるけどさ
全くコンパイルオプションとか弄らないレベルの事しか知らない人なら別だけど
VCだとそんな面倒なのがあるのか。
unix系でgccやその互換コンパイラを使っていたら
普通はldを直に呼ばないから
crt*の存在を意識することも無いだろ。
-Sやobjdumpで最適化の確認をすることはあっても
>>174 普通に組んでるだけの人ならそうかもね
でもデバッグの時とかに存在ぐらいは気が付きそうなもんだけどな
ま、デバッグ用のでもなけりゃcrtのサイズなんて大した事無いし
ゲーム系ならCライブラリなんてまったく使いません、mallocすら使いませんという人もいるから。
crt0.s書き換えてお終いみたいな。
>>176 メモリはコンパイラが決めるんじゃなくて会議で決まるからなw
178 :
名無しさん必死だな:2007/01/02(火) 10:41:35 ID:+mdwparO
それ以前にゲーム系だとライブラリの関数を呼び出すだけで
C/C++の関数を直に呼び出すことすらないことが多い
こいつらそれで大丈夫なのかと心配になる
>>162 ソースコード公開とトップガンはこのスレで知識が無くても煽れる語彙。
180 :
名無しさん必死だな:2007/01/02(火) 11:17:24 ID:ioOUL9Un
>>147 >お前の理屈で言うとXboxCPUもGCのCPUも欠陥扱いだな。
>どちらのCPUも後に発展系が出たんだし。
お前のように口先だけの強弁なら何とでも言える。
しかし残念だけど、まともなソフトが書けないCPUは欠陥だが、
まともなソフトが書けるCPU(XboxCPUもGCのCPU)は欠陥とは言わない。
叩かれてすぐにバージョンアップ版出しますでは、何も考えずにcellを作ったといわれても
仕方が無い。
AmazonからWrite Great Code Vol.2が届いた。
>>163や、アセンブラに疎いようなレベルの奴はこの本読め。
ただし知ってる奴には内容がちょっと薄いのが問題だが、
一応PowerPC押さえてたりするからこのスレには丁度いいかもしれない。
>>180 >叩かれてすぐにバージョンアップ版出しますでは、何も考えずにcellを作ったといわれても
もしかして、Cellのような大規模なプロジェクトが昨日アンチ君に
叩かれたからバージョンアップしますなんていうようなお手軽な物だと思ってるの?
開発・量産に必要な期間を勉強してから出直せ。
バカはほっとけ
…ってこのスレで逝っても仕方ないか
素人の浅知恵なのか
cellをぶった斬れるやつはいるのかな
アンチスレはすぐに落ちたよ。
187 :
名無しさん必死だな:2007/01/02(火) 20:41:55 ID:Ni5rST9V
よりにもよって。本田かよ。
従来どおりにC言語で書いてたらCELLの能力の20%程度で頭打ちだな。
4コア*2のXEONでも潜在能力を全ていかすコードを書くのは難しいよ。
物理演算ねぇ・・。
物理演算で歩くモーションとか変わるのかな?
例えば階段の昇る時とか。
>>189 物理演算活用するならその条件で踏み外した転倒パターンとかだなw
>>189 CGアプリで、その手のプラグインはいろいろ発売されたが未だにモーションキャプチャか
手付けアニメでやってるな。
物理演算はニュートン力学に基づいたシミュレーションしか出来ないので人間の動きみたいに
重力に逆らった動きというのはなかなか難しい。
出来てもエボリューションみたいに人間がぶつかった後の動きとか、なんのあがきもしないで
物体みたいに落下するのとかが限界みたい。
以前、このスレで細胞のひとつひとつをシミュレートして人体モーション生成とか
笑い話みたなのがあったけど、いまんとこ無理。
骨格/筋肉モデルでいいんじゃね〜の? 20年前にそんなことよくやられていて、
特に難しいとかいう話は聞かなかったけど。「適当に動かしても、人間が勝手に
それっぽく認識してくれる」みたいな話だった。
>>192 MataRaysみたいに筋肉と骨格を持ったモデルを作れるプラグインもあったけど
人間の動きはタメとか反射行動とか体のバランスをとる為の行動とかあって単に
構造をつくるだけではロボットみたいな動きにしかならないんだよね。
こういうのが物理演算の分野じゃなくてロボット工学の範疇に入るから別のアプローチが必要かと。
ロンチのリッジレーサーはぬるぬる動くんだ。
素晴らしい性能だぜ!
360も見てみろよ。
同じリッジがロンチだが、今はデッドラやGOWだ。
PS3の一年後も凄い進化を遂げてるよ!
FullHDの性能と共にね。
たのしみだなー
夢や希望を捨てたら人間終わりだからな、がんばれよGK。
>>193 モーキャップや手付けモーションをどうやって環境の変化に適応させるのか
ってのは何年も前からホットなテーマみたいだが、物理シミュレーションと
の組み合わせもあるんじゃないかい?
確かGTHDが人体を物理シミュレーションで動かす予定じゃなかったっけ?
GTHDの次だったかも。
なんせポリフォニーデジタルが今その辺研究してるのは確か。
GT4の時点でドライバーの動きは物理演算のはずだよ。
>>194 > デッドラ
は正直すごいともなんとも。
Heavy Rainのバーチャルアクターとかも物理演算使ってるんじゃない?
あれの顔の筋肉の微妙な動きや目の演技の表現とかはモーションキャプチャだけではできないと思う。
なんかまた、物理演算を魔法と勘違いしてるやつが出てきたな。
プリレンダーの世界でも、筋肉や顔の表情に物理演算を使用してるとこなんて無い
そういうのは殆ど手付けでの作業
物理演算が出てくるのは、服とか髪の毛のモーション付け
それでもモノによっては、手付けのやる場合もある
>>198 あれはラグドールの物理演算で人形としての動き、人体のモーションとは別物。
筋肉なんかは物理演算というより、プロシージャルに定義されたものもあると思うけど、
表情のキャプチャは顔に山ほどマーカーつけてやってたりするよね。
でもラグドールだから人体のモーションとは別物ってのも極端じゃないかい?
人形と人体の区別がオレにはわからないし、立派な活用事例だと思うんだけど。
ワンダなんかでIKと物理演算をブレンドして動きを出してるのもそうだと思うし、
ヴァルキリープロファイルだったかで、モーションを位置じゃなくて速度ベースで
管理して、物理演算となじみやすくしてるのもうまく使ってる例じゃないかと思う。
>>177 超亀レスだけど、いっつもサウンドに割り当てるメモリが
極小なんだけど、この怒りをどこにぶつけたら良い?
>>205 会議においての、自分の政治力の無さじゃね?
たぶん、小泉元総理の政治力をもってしても、
32KBしかもらえないと思うよ。
SPE一個貰えば256KBに増えるじゃないか。
>>204 物体であるラグドールと意思がある動物の動きとでは当然大きな差があると思うが。
上手いアニメータなら箱で組んだオブジェクトでも動きだけで猫と犬の区別がつけられるぐらい
だから生物による癖みたいなものが物理演算で表現できるかというとなぁ。
あと、ただ歩くだけならすでに出来てるけど演技や感情を入れるのも難しい。
その部分は、アフリカに期待したい。
Wiiの物理演算パワーがもっとあったら、エレビッツの可能性は広がるのだよ
i860,i960,いたにうむ、いたにうむ2、V60、70、80
とろんちっぷ、
みんなみんな、欠陥CPUですw
>>184 Cellわ欠陥プロセサ .
IBMの RISCの重鎮氏 が奮発して 64bitA?Mなインストラクションセットを
整備してくれていたら , Clieを捨てずに , PSPを Clie拡張マシンとして
HandheldEngine*3を積んでマルチプロセッサプログラミングのノウハウを
早期から温めると同時に GBAコーダの移行をサポート , 更に
PalmOS6の神秘? 自動マルチスレッディングノウハウ を丸ごとイタダキ ,
奇跡の環境が整う , という夢の様な妄想が現実のも \( ry .
もうソフトウェアCellとか誰も口にしなくなっちゃったね
ソフトウェアCellとかいうのは新語なので、当然口にしたのは君が初めてです。
このおっさん、相変わらずの基地外っぷり全開だな。
Grape DRが使い物にならんので切れてるんじゃないの?
4コアになって倍精度でも現行のCellにすら及ばないような…
規制解除記念真紀子・・・とGK否定工作をしてみる
Cellが主流にならないってのは禿同だな
ジワジワと採用が増える気配が無い上に
妄想していた多くの用途でどんどん希望が断たれている
たぶん10年後にCellは計算機の歴史に名を残してはいるが
商業的には思い出したくもない黒歴史になってるに100ペリカ
主流になるかどうかは別として、もう少しソフトウェアの開発が楽に出来るように設計し直さないとな。
AMDもクァッドコアでは4つのコアで共有出来るL3キャッシュを搭載するみたいだし、
SPE間の共有データをもう少しスムーズに出来るような改良が必要だと思う。
>>223 Cellがアーキの歴史で名を残すならIMPPは賞の2つ3つは取れていたと思う。
それ以外の歴史だったらスマソ、俺はそこには興味ないや
>>224 熟練工なら、どのCPUを使って…とか考えてきそうだが、凡人になると
意識せずにマルチコアを使えるような物は必要かもと素人意見を言ってみた。
8つのSPEが共有するメモリ、そのなもGS(Global Store)ってか
セルのネックはコアの数じゃなくてローカルメモリーのサイズなんじゃ
メモリー操作のコストって無視されがちだけどさ
共有メモリは確かにあると便利そうだな。
現状の設計は汎用プロセッサとしてはちょっと尖りすぎかも知れん。
メインメモリってそのためにあるんだけど?
それぢゃSMPと変わりません><
メインメモリじゃ代用できないような用途にしたいなら
SPEを1つ動作させないようにしてLSをそういう用途に
回せばいいんじゃね。256KBで足りないなら2つくらいつぶせ。
5個もつぶすともうメインメモリでいいんじゃないかというくらい
演算性能が低下してバランスも取れるかもね。
>>230 SPEのメインメモリはLSだけですよ、XDRはストレージ扱い。
>>223 具体的な話できる?プログラマビリティについてはみんなが文句を言ってるが、
性能特性についてはあからさまにチューニング不足な奴を除いてネガティブな
話を全く聞かんぞ。
牧野のやつも、「Opteronの方が実効性能が高い」と思い込んでる時点で、
まともに情報集めてないのが明らか。
>>234 どこにもOpteronのほうが〜なんて書いてなくね?
CellだけでもメンドイのにOp混ぜたらさらにややこしいシステムにならね?
x86なプロセッサはニョキニョキと性能アップするわけだが、Cellはそれと同じペースで
性能を向上させて行くことが出来るのか?差が詰まっていくなら超ヤバいよ?
といってるだけじゃん?
>>234 デバッグも含めてプログラマビリティーや生産性が低いのはCPUとして致命的ですがな。
実行性能もベンチだけで実務で発揮出来てるわけではないし。
>>234 どちらかというとCell房の方がCellは実効性能が高い筈と思い込んでいると思うが。
現状では断言出来るだけの明確な実績はあげていないだろうに。
おー、ベンチは実績にならないのかw
たぶんおまえが理解できるような実績は永久に出てこないと思うよ。
初代箱相当に PhysX を差した程度と考えとけば良いかと
レジスタを上書きするだけのマンデルブロとかタスク固定でストリームデータを
流すだけのFFTとかはアプリのプログラムとはかけ離れているから参考にはならないかと。
IBMのゲームベンチはさんざんな結果でしたがPS派はなぜかこのベンチだけ見なかった
事にしようとするんだよね。
>>237 CPUのみで固定ロジックによる支援を使わずに、フルHDなH.264を2ストリーム同時にデコード
できる事は実績では無いと?
SDならMpeg2を48本同時再生してて実効性能が高く無いと?
今のCellが完璧でいじるところが無い、使いこなせないPGが悪いという考えではCellに未来は無いのではないでしょうか。
IBMは倍精度版、東芝はSPE4個のタイプと柔軟に考えているのに、それに比べるとソニーのエンジニアは頭が固いと思います。
社長がそういう考えだから、しかたがないのでしょうがワンマンでは誰もついてこないと思います。
>>240 さんざんな結果を出したゲームベンチってどの事?
少なくとも通常のPC以上の結果は叩き出してたはずだが
>>241 ここはゲハ板だから実績といえばゲームだろが。
そういう話はAV板でやれ。
>>243 現在の通常のPCはCore2DuoでCellと比べてたPen4は時代遅れで効率の悪い
ネットバーストのシングルプロセッサですが。
>>241 流石にCellすげぇなとは感じるけど
でも、それができたからといって何か大きな役に立つのかなぁ・・・
別に絶対Cellでなければ実現できない、Cellで無ければならないってわけでも無いし。
>>245 RailfanでCellが役に立つような部分あったっけ?グラはRSXだろ。
>>246 だからそのベンチマークのソースを貼ってくれよ、確認できないじゃないか
Railfanって背景はプリレンダだったのか、なんかショック。
箱○ロンチのPGR3でも建物はフルポリゴンだったのに。
>>251 実写はプリレンダとはいわないと思うけどな
>>251 電車の運転席からの現実の風景が売りのゲームでそんな事言われてもな
全くジャンルの違うゲームを比べてどうするんだ?
RailfanぐらいCellでなくても出来るだろ。
なんか昔アーケードにあったレーザーディスクのゲームを思い出しました。
Cellって案外レトロなゲームには相性がいいんですね、もちろん皮肉ですけど。
>>254 > performance differences between an Intel Pentium-4 (P4) 3.0 GHz system and a Cell BE processor 2.4 GHz system.
>Cell BE processor performance profiling was done on early hardware
これ初期のDD1でなおかつ2.4GHz動作のCellでの結果だぞ
>>256 上の方で
> CELL の 100Gflops と倍しか 変わりません
とか書いてあるのは無視ですか・・・そうですか。
被害妄想と揚げ足取りしかやることないのかい?
浮上してみる
>>254 結論しかまだ読んでないけど、データ転送の際にPPEでリパックしてるとか何とかで、
PPEは非力だから、そういうのやらせないように、そんなに難しくないからさ、てな感じ。
難しくないなら実際にそれでベンチやれよとは思うね。
>>240 >>254 おいおい、Cellが初期のバージョンとか言う前に、これMMOネットゲームでのサーバー側として
使う場合の話じゃないか、一切クライアント側のパフォーマンスの話は出てきて無いぞ?
本当にこの記事読んだのかよ?
Cell支持者がスルーしてたというが、ゲーム機のCPUとして語ってるならこの記事はスルーされて
当たり前だな
結局アンチは記事のグラフだけ見て内容を読まずに批判してたってことかよ…
Cellって得手不得手が激しいな・・・
速い仕事は馬鹿みたいにはやいが、不得手だと意味茄子
>>265 結局のところ、藻前さんとしてはCellのほうが実効性能が低いって一文が
許せないだけで、それ以上の理由無いだろ?
>>266 よーわからんなぁ、専門家としてあからさまに問題がある発言に突っ込んだ
だけなのになぜそうも絡むのだ?
ちなみに、牧野の日記の他の部分に関する俺の感想が聞きたいのなら、答えは
「突っ込みどころ満載」だ。今はこれ以上時間が取れないから何も言わない
けどな。
268 :
名無しさん必死だな:2007/01/05(金) 08:32:24 ID:0d0/JtM2
そろそろ、爆速H.264エンコードとかできないのかな
納得できる実績の1つだと思うんだが。
CELLの将来性において、現状のプログラマビリティだの生産性だのなんて関係ないよ。
ハードウェアとしての方向性が正しければそのまま拡張していくことで、ゲーム機である以上開発環境なんてのは時間と共に整っていく。
糞環境だったEEだっていまではこなれているけど、ハードウェアとしての方向性にまるで価値がないから見捨てられているだけ。
国家プロジェクトでさ
京速コンピュータってスーパーコンピュータを作る計画があるんだけど、
あれが倍精度強化のCellになるらしいね。
地球シミュレータみたく世界一の地位につく予定だから、
Cellアンチが発狂するんだろうなあw
>>270 またCELLアンチ、っつか痴漢がデ捏造しているが
「京速計算機」は日本の国家プロジェクトだから
IBMは参加できないぞ。
ってかメーカはNEC、富士通、日立だけだろ。
>>202 もうすぐ上映のモンスターハウスでは顔の表情に物理演算を使っているみたい
モーションキャプチャのデータに合わせて筋肉を動かすので自然な表情になるそうな
273 :
名無しさん必死だな:2007/01/05(金) 12:21:07 ID:oq5pXIBg
わかってないな
Cellは日本半導体産業の未来をかけたフラグシップモデル
これからどんどん採用されてCellワールドが始まりますよ
きみたちが知らないだけ
>>272 そういうのは昔からやってる、メタボールのオブジェクトを骨格に拘束してぶるぶる動かすやつ。
DOAX2でもおっぱいエンジンでリアルタイムにやってるじゃん。
276 :
名無しさん必死だな:2007/01/05(金) 12:39:22 ID:0I17ekjN
スパコンなんか採用されても数万個レベルだから、あまりありがたくはないと思うぞ。
>>262 もっと下の方を読むと大量キャラの当たり判定とかのベンチがあるよ。
PS3を100台つないだだけです、
みたいな500万円程度のシステムで
100テラフロップの性能がでちゃうんだから
ぼったくり価格でサーバーを売ってるメーカー連中が火病るのは当然だよね。
メタボールモデルも、
筋肉とかの物理計算格闘ゲームも
ウィニー金子が作ってたよね。
SCEが金子を雇えばいいのに。
4GHz時で256GFlops×(クロック分)3.2/4.0×(SPEの数)6/8×100台で理論値なら15.36TFlopsか。
BigMacみたいにやるところはあるかもな。
>>278も只のアンチのまき餌だろうけど、
PS3を購入した研究室とかはあるようだし、
クラスタとして使う事は実際にできるんだろうけどな。
284 :
名無しさん必死だな:2007/01/05(金) 14:13:38 ID:oq5pXIBg
一生懸命Cellはすごくないと思わせたいんだろうけど無駄だね。
実際たいした事ないからな。
どちらかというと凄さを見せ付けて欲しい、でないとPS3を買う理由が見つからないんだよね。
287 :
名無しさん必死だな:2007/01/05(金) 14:51:00 ID:I6ow0CGF
>>287 それはすべてのコアが同時に稼動するというありえないケースなわけだが。
XeonとCellとではスレッド効率が転地ほどの差がありそうだが。
数nsという瞬間最大風速的に出せる性能だけどね。
コンスタントにはXeonが性能を引き出せるだろう。
>>288 ベンチテストってありえないシチュエーションなの?
>>290 比較対照のXeonが実行値なのに
Cellの性能を理論値で持ってきているからだろ。
>>223 あんたが世界を知らないだけでしょ。
ちょっとHPCの研究発表を見れば、Cell関連の
論文はかなり出てくるよ。
日本の大学さえ、手を出してる。
まあ、まだCELLは実用段階というよりも、
研究段階であることは否めないけどね。
しかし口麦価なスレだな。
295 :
名無しさん必死だな:2007/01/05(金) 15:41:49 ID:oq5pXIBg
>>293 だよなぁ
ちょっと探せばCellのデータなんていくらでも出てくるのに
それすらみないでCellの性能を語る奴ってなんなのとは思う
見ればCellの圧倒的な演算性能は明らかなのに
296 :
名無しさん必死だな:2007/01/05(金) 15:47:18 ID:CH2qtLjz
>>295 いい加減アホなプログラマでも気づいているよ、データなど見ても無駄。
自分で触って、コードを書いて、実感した性能でなければ意味は無いと。
ばかげたベンチに数字遊びはもう終わりなのです。
PCからPS3にエンコードを任せたりできないの?
>>297 Linuxとか上手い事動かせば出来るんじゃネ?
SPEをフルに使った一般向けエンコーダやらレンダラ類がまだ公開されて
無いんちゃう?そういうのが出てくれば or 書けば。
PS3を爆速エンコBOX化ってのは1年以上前から言われてるわけだが
まだ出てこないな。
ソースがオープンされとるコーデック使えばSPE最適化は後回しにするとしても
とりあえずPS3でエンコする試作品くらいは作れるだろうにな。
速くしないとGPGPUでネットワーク越しのPS3より爆速にエンコできるようになっちゃう悪寒
>>300 Lameの移植に挑戦した人がいたけどLS容量がネックであきらめたみたいだが。
>>301 とりあえずSPE無視してPPEでやればパパっとプロトタイプは作れるジャン。
超遅いし、実用性の欠片もなさそうだけど。
とりあえずPPEでもいいから動くモノを作らないと後に続くSPE対応も来ないかと。
理想と現実
67 :login:Penguin:2006/12/18(月) 13:54:57 ID:mz3eZPDt
ホビーで軽くC#で書いたのとSPEを使って軽く本気で書いたのとでは雲泥の差があるね。。。
マンデルブロ集合(解像度 = 2048x2048, 繰り返し = 1024回, 途中での発散判定無し) を描くプログラムを
1. C# / Windows (デュアルコア用にSystem.Threading使用)
2. C++ / PS3 (SPE6個を使って軽く最適化)
で、HDDに書き出す/ビットマップに変換する時間抜きで判定してみた。
1. 02:02:08.36
2. 00:00:02.11
…えーと、クロック(PC環境 == Pentium Dの2.66GHzのタイプ)を合わせても2887倍ですか…
なんかSSE2辺りで本気で比較したくなってきた。
↓
123 :67 :2006/12/22(金) 05:32:29 ID:C7rpnh+2
ベンチマークの方だけど、かなり間違いをやってたみたいで、現在のところ
最適化しなおしたSSE2 : 4.36秒
CELL版(ジョブスケジューリングあり) : 1.19秒
クロック当たり = 1 : 3.046
って感じ。分岐が思ったよりも負荷になってる感じかも。
いやPPEのみ版ならすでに多くのソフトが動いてるよ。
PowerPC版のソフトがそのまま動くんだから。
でもそれだと単なるPowerPCパソコンだから意味ないけどな。
フリーソフトのCell最適化はまだまだこれからだろ。まだPS3出て2ヵ月しか経ってないんだから。
そういう俺も今Cellの勉強始めたとこ。
アマはみんなそんなもんでしょ?
>>304 はいはい、現実な。
>最終的なベンチタイムは0.32秒(平均) なので、結構速くなったと。
># ベンチマーク用コマンド : ./mandelbrot -x 0 -y 0 -w 2 -p 2048 -k 1024
># 速度比 = 1 : 13.63
># クロックあたり = 1 : 11.33
次の書き込みは、「マンデルブロなんて現実に即していない。
ゲームで成果を見せろゲームで」とかそんな所?w
ゲームはプログラマーによるだろ。
って書くと「じゃあCELLは使えねえ。」ってなる。
知るかボケ。
ところで本職の皆さんはコンパイラ何使ってるんですか?
やっぱxlc?SPEはほとんどアセンブリで?
最近は東芝のコンパイラ使ってる。
やっぱプロは道具も違うんですねー。
gccは何かイマイチっぽいんだよなあ。
東芝の使ってみたい・・・
>>307 君、マンデルブロのプログラム書いた事ないだろ。
レジスタを上書きするだけでXDRへはほとんどアクセスしないぞ。
ID:+oK0s/foってこう…わざとやってるんだよな。
>>309 このスレはアセンブリが流行ってるのか?
SPEでSIMD活用する程度ならアセンブリはいらない。
spu_〜の関数でしょ?
実質はほとんどアセンブリそのものだけど雰囲気的に敷居が低くて良いね。
アセンブリのソース見ると叫びたくwなるけど、これならやってみようかって気になる。
>>313 当たり前の反応の予測と実際の当たり前の反応じゃないか
spu〜の関数は、かなり早くなるよ。むだなくアセンブリに直に変換されだろな。
あと数学ライブラリも普通のCのものより、SPE用のやつのほうが全然はやい。
従来型の90nmSOIプロセスで生産されている現在のPS3用Cellプロセッサですが、2月に行われる
ISSCC学会では65nmSOIプロセスで製造されたCellによって、なんと6GHzでの動作が可能になった
という論文発表が予定されているとのこと。一方のIntelからは、80ものコアを集積して1TFlopsを
超えるメニーコアプロセッサの技術発表もあるそうです。
ISSCCというのはシリコン素子回路に関する国際的な会議で、CPU以外にも半導体技術の最先端
の技術論文のほか、IntelやIBMといったPCやゲームでもおなじみの最新プロセッサーなどもよく
技術詳細が発表されます
今となってはIBMの特定サーバー向けが将来何GHzで動くとかいう話よりも、
最新プロセスが採用されていつ値段が下がるのか筐体は小さくなるのかといった点の方が、既にPS3が
夢から現実のものとなったゲームファンにとっては断然気にかかる点なのかもしれません。
http://www.gamespark.jp/modules/news/index.php?p=790
321 :
名無しさん必死だな:2007/01/06(土) 10:00:24 ID:jRow31bT
スパコンはCPU間の帯域が重要なのに、なんでPS3でクラスタ組んだだけで
スパコンに勝てると思ってるの?
帯域、レイテンシが桁違いに違うのにwwwwwww
そもそもIBMはCellを使って専用設計のスパコン作ってるじゃんか。
PS3をクラスタ化した物なんてなんの役にもたたねーよwwwwwww
322 :
名無しさん必死だな:2007/01/06(土) 10:05:54 ID:TNgsTKO/
ここにスパコンとグリッドコンピューティングの区別がつかない人間がいますよ
323 :
名無しさん必死だな:2007/01/06(土) 10:47:05 ID:kvlMesg2
>>320 やっぱ使えないって論文もあんのかもねw
グリッドというかそろそろP2PでMMOとかやらないかなあ。
>>322 今のところグリッドコンピューティングは絵の中の餅
使える用途はかなり限られる
>>321 用途によるに決まってるだろ。
帯域重視なスパコンが必要なプロジェクトもあれば、
クラスタによる疎結合で十分な場合もある。
後
>>325もそうだが、国内最速のTSUBAMEを調べて出直せ。
ついでにtop500の中でどれ位グリッド・クラスタがあるか調べてこい。
>>309 SPEはほとんどアセンブラですかね。
SPE用のライブラリもいくつかあるんだけどYDLと大差ないですし。
SPEはC++でもアセンブラでも労力はあまりかわらないですね。
LSを有効に使いたいならむしろアセンブラのほうが楽
329 :
名無しさん必死だな:2007/01/06(土) 13:18:09 ID:xRwKT1dj
粗結合なグリッドでも使える分野はあるけど、それだと、PCを普通のネットワークでつなぐのが一番安上がりになる。
ある程度は密結合が求められる分野でないと、専用にスパコンを開発する意味が無い。
>>326 TUBAMEはノード同士をInfiniBandで繋いでるから、PS3同士を繋ぐのとは帯域の次元が違うじゃないか
PS3とCellを使ってクラスタ化したスパコンはまったく別のものだぞ
C/C++を使ってもアセンブラのような使い方をすれば、作業効率アセンブラ程度だし。
かといって、SPEを有効活用可能にする高級言語の開発はかなり難しいよな。
>>331 局所的に見ればそうだけど、
パラメータの受け渡しとか、ネームスペースの管理、
クラスの柔軟なデータ構造・モジュール管理による大規模設計ができるだけで、
ぜんぜん違うと思うよ。
何も無いよりはマシか……
>>327 お前の脳内アセンブラの仕様は知らんが、
>SPEはC++でもアセンブラでも労力はあまりかわらないですね。
これだけは無い。
>>332 制御構造もだな。
SPEはSIMDを直接書く価値はあるが、それ以外について
アセンブラで記述するメリットはさほど無い。
どうしても、256KBに納めたい時に最後の1バイトを削る程度。
336 :
名無しさん必死だな:2007/01/06(土) 17:13:10 ID:gxap//iF
たとえば、マンデルブローのプログラムをC++からアセンブラに変えたらどれくらいかわるの?
口はいいからさっさと使えるライブラリ揃えろよ。
道具から全部作るなんて馬鹿馬鹿しいんだよ。
すし屋は寿司という完成品は作るが包丁は作らん。
セルが使い物になるのかどうか知らんけどPS3は売れんよ
相当厳しい商売せまられる
339 :
名無しさん必死だな:2007/01/06(土) 18:49:10 ID:TNgsTKO/
>>337 便利なライブラリがないからゲームが作れないのは無能の言い訳
プロフェッショナルなPGなららコンパイラ以上のものを期待してはいけない
でも再利用可能なライブラリを作ったらオープンソースで公開してくれよな
>>339 それじゃSCE丸儲けじゃないか。
普通にミドルウェアとして販売するのが
ゲームを出すよりよっぽどいい商売になる。
>>339 これからは広範囲で作業の自動化は当たり前、何時まで手作りしているつもりですか?
いくら有能な人間でも天才でも自動化された作業にはかないません、時代遅れですよー
>>332 SPEで、そこまで大規模なプログラムは今のところ無理です、ほんと何も無い状態ですので。
とりあえず手をつけているのは今まで書いたプログラムでSPEに振れるものの洗い出しと、
LSに複数のタスクをどれだけ詰め込めるかという作業。
1bitでも惜しいので、ひたすら圧縮してSPEの稼働率を上げるのが優先です。
256kbでも結構入るもので簡単なコードなら数十個ほど入るのでSPEが待機すると他のタスクとスイッチします。
343 :
しろーと:2007/01/06(土) 18:59:40 ID:jU9HxxA1
■後藤弘茂のWeekly海外ニュース■
PS3、Wii、Xbox 360のコストを探る
http://pc.watch.impress.co.jp/docs/2006/1227/kaigai328.htm >日本でのゲームコンソール市場の不調などの悪条件が重なり、
>PS3バッシングに近い状況となっている
やはり厳しいですね、PS3。前回は、この記事を見るとM$がハードビジネスの恐さ
を知り、今回はソフトビジネスの恐さをSCEが知るという展開みたいでつね(^^;
それにしてもげいつさん相当執念深いでつね(^^;
皆さん、「フラット化する世界」と言う本を読みましたか?この本では、げいつさんが
日本のゲームビジネス脅威論を述べてまつ(^^;
XBOXでは5000億の赤字を出しても、まだ箱〇を出すわけですから、この点を久多良木さん
が甘く見すぎていたのではないかと。まあ倒れるまで戦いを挑んでくるでしょう(^^;
>>341 ライブラリなんて、自動化ではなく手作りの集大成に過ぎんがな。
>いくら有能な人間でも天才でも自動化された作業にはかないません、時代遅れですよー
その台詞は数十年言われつづけてるけどな。
しろーとうぜぇ
きえろ
>>344 ライブラリはあって当たり前かと、自動化が進んできているのはここ10年位かと。
寿司職人に鉄の打ち方から教えたいのですよ
>>339は
寿司職人たるもの 包丁も自分で作らなければいけないとか言って。
そしてマグロの一本釣りの仕方とか すべて自前で済まそうと言う。
非効率だから。
そもそも目的がおかしい。
ゲームプログラマはゲームを早く作って提供するのが本来の目的。
その為に生産性の高い開発環境が欲しいしそれを実現する為の大きなCPUパワーが欲しい。
これがcellではcellをいかに早く動かすかの研究に置き換わってる。
そんな自由研究は学校でやれよって話だ。
全く商業ベースになっていない。
任天堂やMSが優れた開発環境をちらつかせたならどのメーカーも鞍替えするだろう。
PS3でやってたらOUTなのは目に見えてる。
本気で画期的な新しいアーキテクチャを成功させようとしたら、それこそ
コンパイラどころか、プログラミング言語や新しいプログラミングパラダイムに
同等以上の開発リソースを当てなきゃいけないと思うんだけど。
>>344 開発環境の基本的なライブラリとコンパイラを作って揃えるのはハードメーカーの勤めだ。
ハッキリ言ってSCEは仕事を放棄してる。
自分たちでこの研究をやりたくないから大学とかソフトメーカーに押し付けてる。
大学は研究が目的だから乗り気の所もあるんだろうが
企業はついていかないだろうな。ビジネスじゃ失敗は見えてる。
>>348 一番つらいのは速く作る事ではなくて、ゲームの骨組みを決める時に必要な
トライアンドエラーの連続ですね、ここに掛かる時間が一番シビア。
この作業の間、プロジェクトにとって核兵器級の費用を出現をさせるデザイナの作業が進行しにくくなる
とにかくプログラムという物は作業工程におけるクリティカルパスになりやすい。
>>342 初代128kbマックで疑似マルチタスクをやってたのを思い出して涙が出た。
>>349 >コンパイラどころか、プログラミング言語や新しいプログラミングパラダイムに
Cellでは絶対に必要だった作業ですね。
むしろこちらを完了してから、それを効率よく動作させるハードとしてCellを設計しないのは致命的かと。
>>353 初代マックどころじゃないですよ、SIMD等で使うデータはめちゃくちゃメモリーの利用効率が悪いですから。
あと命令長もでかいし。
356 :
名無しさん必死だな:2007/01/06(土) 19:35:32 ID:xOGWwpEM
しかし自分がしらないとなかったことにする素人ばっかりだな。
EE+GSなんていう変態を使いこなしてしまったのが間違いの始まりだった
ゲハ一番の素人が言うなww
>>347 単にお前が10年程度の技術しか知らんだけだろ。
ここ10年で出てきた自動化技術とやらを実際に挙げてみろ。
>>348 ミドルウェアでもなんでもいいから買ってこい。金はお前持ちでな。
>350
>開発環境の基本的なライブラリとコンパイラを作って揃えるのはハードメーカーの勤めだ。
SCEIが発表してた資料の中に、PS3におけるライブラリ・サンプルの数が、
PS2の末期に相当する2000位っていうのがあったな。
フリーで公開されてるものだけ見て、プロの道具に文句付けてれば世話ないぜ。
次があったらCPUはIntel系だね。
>>359 それサンプル2000っていう高度なギャグ。
実際そんなにはありません。
でもPS2の頃よりはNVIDIA+IBMの資料が
豊富で助かるのは事実。
あの頃はホント地獄。
>>352 ゲームエンジンのスクリプトさえ書けばゲームが作れるようになればともかく、
プロトタイピングはPPUでやるだろう、普通。
プロトタイピングやらずにプロダクトコードをPPUで作りこんで、その後でホッ
トスポットをSPUに移すという手順をとると、まず確実に失敗するぞ。
>>340 PS2時代にそういうことを考えたアートディンクという会社があってな。
>>342みたいに256kbって書いてるのはいつも同じ人?
>>359 おいおいcellで使えるミドルウェアなんてあるのか?
Unrealエンジンも開発中止になってしまったじゃないか。
過去1年 そんな便利な物が金で手に入るならどこのメーカーも買ってるって。
そしてゲームが結構出てるはず。
でも、無いからどこも開発できなくて四苦八苦してるしタイトルも無いんだろ。
今となっちゃ企業としては失速してるPS3に力いれる事もないなってことで
仮にいろんなミドルウェアが今後出来ても買うかはわからんがね。
俺の中ではもう終わったプラットフォームだよ。cellとPS3は。
>>364 2Mbitと2MByteを混同してた奴か?
多分そいつとは違う。
むしろコイツはコボラーや秋ごろに暴れてた自称君の匂いがする。
>>359 PowerPCのライブラリだけでも2000ぐらいあるんですけど、その内SPE用のライブラリはいくつあるやら。
スタックとかも含めて256なの?
ライブラリってsinやcosもそれぞれ一個と数えるの?
>>364 bitで表記するのは組み込み系やファミコン時代からのゲーム屋さんに多いな。
Bayt表記はビジネスアプリ系のプログラマに多い。
>>354 現実を見ない理想論だったら何でも言えるってのの典型だなぁ。
そんな手順をとって成功したアーキテクチャ、挙げられるものなら挙げてみな。
>>371 ネオジオのカセットが100Mバイトだと勘違いした事のある俺が来ましたよ。
374 :
名無しさん必死だな:2007/01/06(土) 20:13:38 ID:HC95sY/n
しかしこうやって見ていると、Cell終わってんねー
Cell作っている奴ら、もはや清原とおんなじだわ
プライドだけは三人前、実力は素人以下。
Itaniumは開発環境充実してたな
>>374 そう悲観したものでもないですけどね、LSから出なければ本当に速いです。
ただ、SCEが当初想定していたジョブスケジューリングとかマルチタスクSPEと
いった使い方は現実的ではないなというのが正直なところです。
C++だけで組もうとするとPPEしか使えない割りに性能が低いのも想定外でしたし。
よっぽど上手く使わないときついな。
それともOSが上手くマネージメントしてくれるのかな?
javaやc#だったらアウトだな。
380 :
名無しさん必死だな:2007/01/06(土) 20:26:10 ID:HC95sY/n
>>378 >LSから出なければ本当に速いです
そりゃまぁそうですが、といいますかそれで遅かったら仕事辞めるべきかと(^^;
>>380 なんか無難にレス返してるけど
意味わかって言ってんの?w
>>378 マルチタスクSPEが現実的じゃない?
それ悲観した方が・・・
383 :
名無しさん必死だな:2007/01/06(土) 20:31:45 ID:TNgsTKO/
ないなら俺がツールでもライブラリを作って公開してやるとか思わないのかね、この人たちは
>>375 Itaniumは失敗だろう、公平に見て。プログラミングモデルを変えずに性能向上
を果たそうとして、コンパイラ屋の思い付きを詰め込んだ結果、コストパフォー
マンスの悪いものが出来上がった。
388 :
名無しさん必死だな:2007/01/06(土) 20:35:05 ID:HC95sY/n
SCEは地の底まで沈んで猛省してもらう必要がありますな
389 :
名無しさん必死だな:2007/01/06(土) 20:41:58 ID:TNgsTKO/
お前らもってまわった言い方はやめろ
SCEIはツールやライブラリを公開しろ ---> 僕はヘタレです。馬鹿でもつかいこな(略
Cellぐらいで難しいとかライブラリが欲しいとか言っている奴ってなんなの?
ID:TNgsTKO/
Cellをdoubleベースで作ってパソコン用のボードにしてください、僕がMathライブラリを作りますよ。
しかし、普通の人はマゾマゾハードのライブラリなんて作りたいとは思わないだろうなw
馬鹿でもSPEを全開で使えるスペシャルツールが存在したら
PS3のゲームももっとマシなモノがたくさん(ry
池沼コボラー乙
いまさら何故Mathライブラリなのか?
>>391 既にフリーであるだろ。Mathライブラリ
>>396 うっせーよ、自作爆速ライブラリ以外は却下なんだよ
低レベルライブラリは世間並みにあるんじゃない?
求められているのはAをしつつBも行うとかいった高レベルのものだとおもうううう。
インド人優秀だな。
ここでアクセル全開、インド人を右に!
みたいな感じか?
Cellを使いこなすのは大変そうだな。
くう が抜けてる。
itaniumはやればできる子
アプリケーションはなんだかんだで6000種を超えた
インドでは19X9などの九九を覚えている。
一度に暗算できる量が多い。
CELLも日本の九九レベルのライブラリはすでにあるだろう。
インドの九九レベルのライブラリが不足してんじゃないかな。
クイックソートぐらいなら書いてもいいけど
あれ結構メモリ消費するんだよな
LS分割と複数SPEを生かすなら、マージソートだろう。
とはいえ練習問題としては面白いが、実用性は薄いな。
よっぽど大規模なソートじゃなけりゃ、PPEでのクイックソートの方が速そ。
ソートねえ…
もう世界は変わりましたよ。
>>408 こういった用途で実用できるならOpteron+Cellというのも分かりやすい話かも。
一般処理はOpteronで画像計算はCell特化・・・余計にIBMに踊らされたか?SCE?
>>405 クイックソートは、データの内容次第で分割のバランスが悪くなる事がある
するとLSのメモリ使用量のバランスが悪くなって並列化しにくい性質があるからCell向きじゃない。やるならマージソート。
これを作るとなぜCellが遅いか良く分かる。
Cellは、良いアルゴリズムを採用する事による高速化の恩恵を受けにくいんだよ。
最近はベンチ相手にcygwinを使うのが流行ってんのか?
412 :
名無しさん必死だな:2007/01/06(土) 23:18:56 ID:4VOU1fvg
マンデルブローだけは速いベンチ専用CPUw
>>411 コンパイラをgccで統一したんだろうよ
cygwin使ったからって遅くなるような内容のプログラムじゃないし
コンパイラ統一って何の意味もネェじゃん・・・
gccは世界で最も多くのCPUとOSに対応しているコンパイラだからな。
他のコンパイラ使うよりも、互換が取りやすい。
そういう意味で楽だからなんじゃないの?
後、gccはCPU個別の最適化よりも、汎用的な最適化を頑張ってるから、
コンパイラを揃えておくとちょっとした指針にはなるかもしれない。
>>410 ソート対象をSPE数*xで等分して、
それらを空きSPEに振って各部分をqsort
その結果をマージするのが普通じゃない?
まあqsortの部分はデータの個数によって別のアルゴリズムに変わるけど。
かたっぽcygwin使ってるのは何故?
gccなら赤帽入れてsmpベースのコードで比較しないのは?
そもそもソースコードは何処に載せてるの?
>416
どうやってマージするんだ?
ベンチが不利な場合は相手の性能落ちる環境(コンパイラとかOS)で揃えて
この場合は同じ環境だから〜云々
差が付く場合は独自コンパイラ使ってどーんと差を付ける
この場合は結果でごり押し
昔から変わってないなwwwwwwwww
>>419 結局マージソートの細粒度な部分を別ソートで置き換えているだけだから
基本は変わらないだろ。
SPEに系統別にバッファを設けて、
各バッファの先頭のもののうち
一番小さいものから出力する。
見落とした。
cygwinの吐くコードはかなり遅かったはずなんだが、それらは直ってるの?
なんで、比較に赤帽使わないのかな?
ん、ソースのリンクが切れてるな
>>423 Cygwinの吐くコードは、普通のgccと全く同じ。
遅いと言われるのはライブラリ部分。
UNIX互換の為に必要なラッパーが重いわけ。
だからレイトレで演算やるだけなら、
Linuxで動かすのと変らない。
>>423 cygwinが吐くバイナリってそんなに遅いか?
コンパイラ自体はgccそのもののWindows移植版だからオリジナルのgccと比べて大きな差が付く
物じゃないはずなんだが
クイックソートは普通のマルチプロセッサならあっさり並列化できるのが重要。
このような性質を持つ重要なアルゴリズムは数多くある事も重要。
そのようなアルゴリズムが強引な並列化の性能を超える場合、PPEで処理となるPPEに対する負荷増大は半端ではなくなる。
気づけばSPEに対する指示ができなくなるほど忙しくなる。
あちらを立てればこちらが立たず、どうやってもピーク性能を見る事ができないCPUそれがCellの正体
公開されたスペックデータが役立たずになる理由その1
>>425-426 cygwinに入ってるgccは比較的古いのを使ってるから最適化甘いよ。
どっちにしろ一方にだけcygwin上じゃそれだけで不利だろ
何で、Linuxで比較しないんだよ
>>422 core2duo linux インストール
とかでぐぐってみれ
>427
クイックソートの各段数をノードが飽和するまで順次割り当てていけば良いというのは当然解る。
わかんないのは最初にデータを等分割してソートしてからマージするのが「普通」だといってる>416
本当にそれで速くなるの?
>>425-426 うんにゃ。
単純CPUパワーに依存するようなコードでだいぶ差があるはず。
Win用に同じ機能でcygwinのgccを使わないでコンパイルしてるソフトも大量にある。
比較用にcygwin使って良い結果出る訳ないし、赤帽で比較しない理由にはならんだろ
ごめん>421見落としてた
>>430 単純なCPUのパワーに依存する部分こそ差が出ないはずなんだがな
Linux上で比較しろなんてのは、ここで主張せずにそのサイトの人に言えとしか言えんな
単にCore2DuoのPCにLinuxインストールするのがめんどくさいって理由でも問題無いだろ
公的な機関じゃないんだし
>>432 gccのバージョンの差もあるし、あまりにもアンフェアだと思っただけ。
結局ソースコードも無いみたいだし。
>>428 すまんな。
×C2D E6400マシンにWindowsしか入れないんじゃないの?
○C2D E6400マシンにWindowsしか入れてないんじゃないの?
>>430 >単純CPUパワーに依存するようなコードでだいぶ差があるはず。
良かったらその事例を示してほしい。
>Win用に同じ機能でcygwinのgccを使わないでコンパイルしてるソフトも大量にある。
その理由は簡単。
CygwinでコンパイルするとCygwinをインストールしてない環境では動かない。
それとGPLの問題があるので、バイナリ配布に適さない。
空気を読まずにいうが、メーカー側が出してきたような比較はトリックを噛ましている
可能性もあるので、そんなに信用してはいけない。という説もある。
・・・まぁ、Cellに関してはIBM・東芝・特にSCEの言葉に耳を貸すよりサードのコソーリ
出したようなソース又は、個人単位での数字の方が良いかもしれん。
>>435 Cellに関しては第三者である大学から、性能に関する論文が出まくってるからそれ見るのが
一番良いだろう
ここ最近のフューチャーズの活動や、フォルツァみたいな捏造blogを考えると迂闊に個人単位の
情報を信じるのも怖い気がする
個人だと思ってたら実はMS公認捏造ブログでしたって例があるからなぁ
IBM東芝SCEの言葉は疑った方が良いからアラードが言うようにPXの整数演算はCellの3倍だ・よ・Ne☆
って事ですか。
>>434 横レスしとくと
バイナリ配付しているのはGNUのMinGWでコンパイルしてるぞ
cygwinでコンパイルしたバイナリ配付なんてほとんどありえないけどな
なぜ逆も然りと考えられない人ばかりなのか。
GK乙。フューチャーズ乙。
偏った人たちは、自分が偏ってるのに気づいてないから
ハタからみたら、どちらも両方一緒ですよ。
このスレは特にそれが酷いからね。
少なくともこのスレではCell側の人はソースを貼ってる人が多く、アンチは大抵貼らないけどな
アンチが英語の文章を読まずにグラフだけ見て貼ったソースで自爆とかもあったな、極最近
煽ってる暇があったら、自分でCell使えば良いじゃない。
このスレも最初のころは純粋なワクテカとアンチだったが
今はもう、ペーパースペックじゃないのだから。
ゲーム板としては、あと1年で具体的な成果を求められる。
他に絶対マルチできないような、Cellならではのゲームをあと1年で出せないと
2008年になったら、もう360とマルチで出るソフトしか出せなくなる。
マルチになったらもうCellのメリット生かすどころか、下手をするとデメリットの方が目立ち始める。
煽りあってる暇なんて無いよ。
>他に絶対マルチできないような、Cellならではのゲーム
それを個人に求めるなよ、、、、
俺はゲームプログラマーじゃないから、俺がCell使ったからってどうにかなるもんじゃないし
趣味で調べたり弄ったりはしてるがな
そもそも
>>408ってcygwin上でレイトレやってんじゃねーの?
cygwinのXなんてベンチに使うもんじゃねーだろ
しかもSPUの方はコード入りきってないみたいだし
こんなんソースに出してこられてもなぁ
>>444 ベンチに直接使った物じゃないが、元になったソース見るとGUI要素は一切使ってない
コンソールアプリって事が判ると思うんだがな
もしかしてGUI環境が無いとレイトレーシングできないと思ってんの?
ヴァカはほっとけ
>>445 なら、なおさらcygwinを使う理由が無くなる訳なんだが?
>>408のベンチが不公平なのは変わらない訳だし
C2Dとのベンチなら、最低限SMPくらいしてもらわないと
Cellマンセーベンチにしか見えない訳なんだが。
> ID:j/DNsgVY
必死だな
別に公平なベンチやろうと思ったんじゃなくて、
手元にあるレイトレコードを試しに動かしてみただけにしか見えなかったんだけど
気が乗ればそのうち最適化するつもりなんでない?
なんで個人が試してみた程度の記事にあれだけ噛み付くのかサッパリ理解出来んよ…
PPEが特定のプログラムでC2Dとそこそこ張り合う事がそんなに許し難く感じるのかね?
ちなみにPPEもマルチスレッドにしないと性能を使い切れないのはC2Dと同じだよ
それにしてもCellは何時になったら超ローレベル地獄から抜け出せるんですかね
この調子では五年たっても性能発揮できそうにないです。
>>450 GKの自演だろ?
いままでの事を考えると
顔を真っ赤にして必死に擁護する人がいないと盛り上がりませんからねぇ
必死擁護がいなくなったらたぶんこのスレ落ちるぽ…
そんなにレスもらいたいならテクスレいけばいいのに。
>>450 ちょwwww
C2Dと比較するつもりで
>>408貼ったんじゃねーのかよ
つーか、未だに必死にレイトレの結果貼られても
もっと他のプログラムないの?
爆速エンコ作る。って人居たよね
ID:XjY1wcNPって何者? と思ったら
>>444で
>cygwinのXなんてベンチに使うもんじゃねーだろ
なんて恥ずかしい発言しちゃったもんだから顔を真っ赤にして不自然にファビョってんのな
cygwinはdisk周りのアクセスが遅いよ。
ラッパの関係だろうけど。
458 :
名無しさん必死だな:2007/01/07(日) 11:47:48 ID:HDPLxkN2
こいつら去年とやってる事がまったく変わってねぇ ('A`)
ID:XjY1wcNPは顔を真っ赤にしてる奴の典型的な見本で面白いな。
>>444 >cygwinのXなんてベンチに使うもんじゃねーだろ
他の人から既にレスがついてるけど、面白いのでいじるが、
いきなり「X」なんて単語が出てくるのは思いこみが激しすぎ。
この発言はちょっと面白過ぎるぞ、お前。
>>447 >なら、なおさらcygwinを使う理由が無くなる訳なんだが?
小学校の通知簿で「他人の話を聞かない」と書かれた口だな。
Cygwinを使う理由なんて既に幾つも挙げられてる。
>C2Dとのベンチなら、最低限SMPくらいしてもらわないと
SMP化してるかどうか、どこにも書かれてないがw
しててもしてなくてもPPEにもC2Dにとっては、
有利にも不利にも働くぞ。
>Cellマンセーベンチにしか見えない訳なんだが。
SPEすら使ってない、素のPPEのベンチをみて
そう思えるお前があまりに素敵すぎるよ。
>>455 お前の脳内では、お前と意見の異なる奴はただ一人しかいないし、
単なる参考資料すらも、全力で討ち滅ぼすべき敵なんだな。
中途半端にCygwinを知ってたせいで恥をかいてしまったんだな。
Googleで検索した知識を披露するとダメという典型例か。
新年で楽しい奴だな。
SPEで、あるタスクを実行しながらDMAで次に実行するタスクのプログラムとデータを読み込み、遅延なくそれを繰り返すっていうことできるのかな?
462 :
名無しさん必死だな:2007/01/07(日) 14:57:31 ID:k6Gk9gKP
うけけけ
463 :
名無しさん必死だな:2007/01/07(日) 15:00:09 ID:k6Gk9gKP
PXってなによ?
WiiのCPU?
360のCPU?
あとさ、セルまんせーってはずかしくない?
別に誰もマンセーしてないよ?
このスレ自体がものすごく恥ずかしい
この板自体がものすごく恥ずかしい。
467 :
名無しさん必死だな:2007/01/07(日) 16:09:40 ID:UAWsTBRa
1から読んでみて、CoreMAはネ申ということが分かった。
おもしろいアーキテクチャーだから取り組んでいるだけだよ
全面否定しないのはマンセーに見えるんだろう
470 :
名無しさん必死だな:2007/01/07(日) 17:43:11 ID:k6Gk9gKP
ハァ?
CoreMAがネ申?
でだ、PXってなんなんだよ!
471 :
名無しさん必死だな:2007/01/07(日) 17:46:23 ID:k6Gk9gKP
てかよ
セルマンセーなんて恥ずかしくネ?
2010年の予想
・IntelやAMDのCPUがいつの間にかCellに追い付いている
・GPGPUはCellの10倍以上になっている
・スパコン用のアクセラレーターチップとしてもCellの役目は終わっている
組み込み用としても微妙ってことで、PS3の製造終了と共にCellは終わる
473 :
461:2007/01/07(日) 17:51:27 ID:oNdJEXRL
誰かいませんかー?orz
474 :
名無しさん必死だな:2007/01/07(日) 17:52:30 ID:UAWsTBRa
NehalemもホモジニアスマルチコアでFA。
Cell?ハァ?時期尚早だよ、バカジャネー(´,_ゝ`)プッ
というのがインテルの本音
亀レスだけど
CPUは新しいのに古いコンパイラ使って
Cacheも効き辛いようにしてるのが気になったかな
あとこれ386互換コード使ってるよね?
同等ってのはちょっと厳しいと思った。
>>461 設計では出来るようになっていますが、タスクスケジュールの管理ライブラリ自体ありませんので
自前で組まないとならないのですが学者さんとかアルゴリズムから構築出来るような人が
いないと無理ですね、ゲーム屋のプログラマ程度で出来る作業ではありません。
現状で出来る事はLSに待機スレッドを詰め込めるだけ詰め込んでSPEが待機状態に入ったら
別のタスクを起動するぐらいですかね。
477 :
名無しさん必死だな:2007/01/07(日) 18:21:02 ID:k6Gk9gKP
Cellの実態
・IntelやAMDのCPUはとっくにCellを追い抜いている
・GPUはCellの10倍程度になっている
・スパコン用のアクセラレーターチップとしてもCellなんか見向きもされない
組み込み用としても微妙ってことで、PS3とともに普及することもなくCellは終わっている
478 :
名無しさん必死だな:2007/01/07(日) 18:25:21 ID:k6Gk9gKP
ゲハハハハハハハハハ
479 :
名無しさん必死だな:2007/01/07(日) 18:28:09 ID:k6Gk9gKP
つーかさ
セルマンセー、マンセーいってる香具師さー
さっさと、セルマンセーが証明できるようなソフト公開してくれよなwwww
もう擁護も無理だろ。この過疎ぶりが証明してる
481 :
名無しさん必死だな:2007/01/07(日) 18:34:31 ID:k6Gk9gKP
そうだよな
PS3ってどこいっても売れ残ってるもんなwww
店主も扱いに困ってるんじゃねーかwww
ぜんぜん売れねーんだもんなwwwwwww
GkgKと単発のコラボレーションか、しょうもねえな。
483 :
461:2007/01/07(日) 18:48:25 ID:oNdJEXRL
本当に分かる方、お願いします。
484 :
名無しさん必死だな:2007/01/07(日) 18:49:27 ID:k6Gk9gKP
そろそろセルマンセー厨の反撃がほしいところだが
反論ネタ一つも用意できねーんだろうなwwww
ゲハというかフューチャーズすげえな。
ここでがんばっても意味ないぞ。
フューチャーズってなに?
ついでに聞きたいんだけど、痴漢(箱信者の事らしい事は判る)の語源って何なの?
どうなったらこんな言葉が出現したのか気になる。
>>461 無理だという根拠は特に無い。
出来るんじゃないの?
>>486 箱360の布教をすればバッヂが貰えるらしいぞ。
それと痴漢の語源は、Xboxと痴漢電車とかいうエロゲを買ってたピザデブ。
488 :
名無しさん必死だな:2007/01/07(日) 19:21:09 ID:k6Gk9gKP
なんかさー
過去ログみたんだけどさー
ゲハ板ってさー
バカばっか?
げらげらwwwww
489 :
名無しさん必死だな:2007/01/07(日) 19:21:59 ID:k6Gk9gKP
うぉ
Xboxと痴漢電車とかいうエロゲを買ってたピザデブかよwwww
さいっこーーーーだぜwwwww
490 :
名無しさん必死だな:2007/01/07(日) 22:37:55 ID:k6Gk9gKP
ゲハハハハハ
セルマンセー厨は反論一つできねーようだなwwwww
あれか。低脳な書き込みによってアンチに信頼感を損なわせるGKの戦略か?
492 :
名無しさん必死だな:2007/01/07(日) 22:58:38 ID:HDPLxkN2
PS3の売り上げとCellは無関係なんだけどな
開発をすすめず進化しないCELLは2・3年後にはもう化石
>>491 IDにGKがあるからって好きかってやってる馬鹿かと
PS3はソフトの開発コストを考えるとCellにする必要はなかったな。
PS3のソフトの開発コストはCellとはあまり関係ないと思う。
PPEのみ使用すれば普通のPowerPC+nVidia GPUだから、PS2より簡単なはずだよ。
RSXが強力だからPPEだけでも現時点では十分次世代を感じさせる絵は出せるはず。
メーカーの戦略上、SPEの活用は今後の余力に残しておくのが得策じゃないだろうか。
実際のところはよくわからんけど。
497 :
名無しさん必死だな:2007/01/07(日) 23:51:51 ID:k6Gk9gKP
セルマンセー厨乙www
>PPEのみ使用すれば
それじゃ、箱○以下もいいとこで
高性能のイメージが失墜するべ。
まぁ、中にはあってもいいと思うけど。
>>493 65nm版がISSCCで発表されるようだな。
実際に開発費をペイするには、ソフト20万とか50万とか
メーカーのコメントとして出てるし。
どうせ冒険するならIA-64+GPGPUとか見たかった
それでどうやって商売するんだ?
資金と開発力あるとこでないと厳しい。とはよく言われるね。
セガとかなら余裕だろうけど。
504 :
名無しさん必死だな:2007/01/08(月) 00:49:58 ID:RvNRetjz
IA-64+GPGPU?
バカじゃねーの?
505 :
名無しさん必死だな:2007/01/08(月) 00:51:07 ID:RvNRetjz
Intel CoreMA + nVidia G80 これ最高
今の状態ではマルチ展開じゃないとPS3開発のGOサイン出ないよな
PS3独占では諸費用をペイしてさらに利益を出せる可能性が事実上ゼロだし。
赤字出ても耐えられる所か、SCEからドーンと資金援助してもらわんと_
>>499 http://www.gamespark.jp/modules/news/index.php?p=790 これにもあるけど、ヘテロジニアスのアイディアだけは間違ってなかったよ。
意図的なのかお花畑なのか、それまでグリッドコンピューティングとかいう与太話を
吹かしてたクタと違って、IBMのアーキテクトは現実に有効なアイディアを確かに持ってた。
でももしこれがPCで必要なら、PPEじゃなくてx86でいいよね?
SPEにここまで賭けるより、メインコアも複数あったほうが使いやすくね?
そもそもキャッシュが普通にもう少しあったら、全然使いやすいよね?
…これ全部、あと2世代もあれば余裕で経済的なダイに収まっちゃうわけで
それの主役がIntelかAMDかはわからないが、結局何も今と変わらんのだろうなぁ。
PS3はともかく、プログラマはまだ将来Cell以外で多少は役立つからいいだろ。
誰かも言ってたが、時代はRISC!CISCのx86は時代遅れ!とか言ってた時と全く変わらん。
EE+GSは出た時期とコストを考えると結果的には成功だったわけで
Cellがどうなるかもこれからをみていかないと。
逆に初代箱はコスト面で散々だったわけだし。
509 :
名無しさん必死だな:2007/01/08(月) 01:38:04 ID:RvNRetjz
もまいら
いみふ
EE+GSってPSXでも使ったんだよな。
あれは一応家電だろうけど。
CellもCellプログラミングも、もともとPPEは必須じゃないだろ。
それなのにメインコアがPPE、ボトルネックもPPEっていうのが
結局、Cellの限界でもある…
第一(ゼロ)世代の夢と現実な感じ。
EE+GSの時と違ってコンセプトだけなら正しいが、そのコンセプトを生かせぬまま
同じコンセプトをこれ見てから欠点を改良して、他にやられてしまったらもう後は無いな…。
レファラをみてたら 2ch のスレッドがあったので関係ありそうなあたりリンク。
その中で言及がある、Cell の性能がどうこうとかいう LBNL な人達の論文。
偏微分方程式を解く速度を Cell ではチップ内に入るグリッドサイズで評価して、
それ以外ではキャッシュに入らない大きさで評価する(Table 5) のは結構論外。
で、それ以外ではベンチマークでの性能比はピーク性能の比とほぼ一致する
(IA64 だけ低い気がするけど、、、)というまあ真っ当な結果。
結局、今でもある 4core 4 演算の Xeon と 2008 年にでる倍精度版 Cell で
Cell が倍しか速くない、ということで、これから 1 年間 Intel が普通に性能を
上げると、あれ?みたいな話であるということではある。
数年サイクルでしか新製品がでないアクセラレータで性能を稼ぐには、開発時点
で価格性能比の差が 10 倍では足りない、というのの新たな例、という感じ。
ぶどうの怨念を感じる…
ところでこれの根拠になってるCell+って実物あるのか?
>>507 SPEとIA32コアの面積比は1:4、これで、数値計算系のアプリケーションでは
同等以上の性能がでるんだから、今の厳しくなりつつある半導体シュリンク
事情からすると、アーキテクチャの差で5年分ぐらいの時間を稼いでいる
計算になるな。
>>513 Intelの4 coreは比較の対象としてちょっとまずかろう。65nm、220mm2の
AMDの4コアBarcelonaならまだまし。仮に、IntelやAMDが45nmで(恐らく)
300mm2を超えるSiを投入して8コアを投入してきたとして、どの程度実効
性能でCellと対抗できるのか疑問。キャッシュが足かせになるからね。
ピークだけ高くても意味無いんだよ。
>>514 LANL-IBMのRoadrunnerに載るのはどうやら、倍精度SIMD演算をフルパイプライン
化したもののようだな。だとすると、Cell+の倍の倍精度ピーク性能ということ
になる。
517 :
名無しさん必死だな:2007/01/08(月) 05:16:40 ID:miWNwXKy
360が3コアだからPS3のPPEの3倍速いとか思ってる馬鹿が多そう。
単純にコア数増やせば早くなるわけじゃないっつうの。
何のためにCELLがLSっつう面倒な仕組みを導入しているのか
分かってない。
PS4が発売されるのは10年後くらいに設定してるかもしれんな。
10年あれば、PS4がCELLベースならかなり開発も楽になりそうだし、従来通りの6年で
これ以上ハードのスペックがあがると、サードが窒息しそうだ。
ハードのスペックが上がっても、それをカバーするだけの
開発が楽ちんな環境を整えられるなら何の問題もないわけだが。
使いやすさをとことん無視してスペックだけ無理やり上げるから
叩かれるのが解ってないな。
>>518 それくらい長いスパンでCellを使い続けるって前提じゃなきゃ大金かけて
作らないわな。…っつっても東芝とかIBMはそれぞれ自分の目論みがあるから
金払ったんだろうけど。
その頃に開発がこなれてくれれば、確かにPS4に新しいCellってのも悪い話じゃ
なさそうだけど、現状それ以前の問題だから心配だ。
>>515 > ピークだけ高くても意味無いんだよ。
Cellでピークに近い性能を出すのにはものすごい労力がいるわけで・・・
ちなみに、容量と帯域が同じとすると、
キャッシュ(DRAMとの暗黙の転送):
それほど苦労しなくてもそこそこの性能が出せる
LS(DRAMとの明示的な転送):
努力さえすればキャッシュより高性能
横軸に手間、縦軸に実効性能をとってどんな曲線に
なるのか想像しててみることが重要で、
CellがCore2Duoに対してほとんど競争力がないという
結果になる人は自分を含めてかなり多いと思う。
ついでに515=267(ということにして)さんは何の専門家さん?
文献はよく調べてるみたいだけど自分でコード書く仕事で
ないことは確かなようなのでゲーム評論とか?
>360が3コアだからPS3のPPEの3倍速いとか思ってる馬鹿が多そう。
さすがにいないだろ。
>何のためにCELLがLSっつう面倒な仕組みを導入しているのか
その面倒な仕組みのせいで、開発難度があがってりゃね
ノウハウが蓄積されるまえに、消えないことを願うよ
>>521 >ついでに515=267(ということにして)さんは何の専門家さん?
>文献はよく調べてるみたいだけど自分でコード書く仕事で
>ないことは確かなようなのでゲーム評論とか?
お前のような定性的な議論しか出来ない奴こそ何の専門家だか。
印象論言うだけならしろうとでもできる。
そもそも、専門家がこんなとこ見るのか?
>>523 いや、俺専門家じゃないしw
でも論文の数字鵜呑みにして実行効率がどうとか
いってる奴、しろうとの印象論以下だし。
>>525 >でも論文の数字鵜呑みにして実行効率がどうとか
どこから論文とか言うのが出てきたのかよくわからんが、
論に対する再現可能な根拠があるものなんだから、
不満があるなら検証した上で反論すればいいだろ。
>いってる奴、しろうとの印象論以下だし。
以下とか言ってる時点でお前は印象論に囚われている。
PS3のグラフィックが360よりしょぼいという現実があるだけだな。
>>521 >横軸に手間、縦軸に実効性能をとってどんな曲線に
>なるのか想像しててみることが重要で、
>CellがCore2Duoに対してほとんど競争力がないという
>結果になる人は自分を含めてかなり多いと思う。
現時点では用途次第だろう、あるいは適切なコンサルティング相手とそこに
相談する金があるかどうか。いずれにせよ、一度、アノ単純な仕組みで
性能が出てしまえばCore2Duoには出番が無い。
今後は、明示的なメモリ階層制御がどの程度メインストリームに近いところに
のってくるか次第だろう。
ちなみに「用途次第」と言ったのは:
キャッシュ(DRAMとの暗黙の転送):
とりあえず簡単に動くが実効効率は極めて低い、そこからの性能チュー
ニングは困難を極める
LS(DRAMとの明示的な転送):
事前の問題分析でデータ転送と演算をスケジューリングすれば、高い性能
を実現可能
という事例まで含め相対的な競争力に幅があるからだ。
529 :
名無しさん必死だな:2007/01/08(月) 11:56:49 ID:seQC7Lht
問題なのはCellの開発難度の原因と対策についてCell派が無知なこと。
自分たちが主張している事がなぜ実現出来ないのかを把握しないとCellの未来は語れないと思う。
530 :
名無しさん必死だな:2007/01/08(月) 12:03:03 ID:io0Q1ZBJ
『ホモジニアス』クアッドコアを活かすアプリ少ねーのに
ヘテロジニアスなCellを活かせる状況があるわけねーwwwwwww
epic曰く、マルチコアプログラミングのコストは2倍、ヘテロなCellの場合5倍のコスト、これに尽きるんじゃないの
SCEの見通しが相変わらず甘すぎたんだろうけど。
方向性が合ってる場合は、いったん環境整えば拡張してもそんなにコストかかることはないでしょ。
他がヘテロにしてきても、高コストが待ち受けてるのは同じことだし。
どんな優れた論理も検証できなければ、ただの妄想と同じということだな。
これからはRISCの時代、CISCは駆逐されると主張していた連中と同じで
純粋なRISCチップのSPEがクロックアップの恩恵無しにCISCに張り合えるのか疑問ではあるな。
Cellを単純な仕組みといえる人がいるとは思わなかった
ほんとハードしか見てないんだなあ
手初めになぜSPEが同時に稼働している個数と時間が短いのか、という問題から議論しようではないか。
ここで、薀蓄垂れてるのは評論家気取りのやからで
現物がでてきて、現実を見せられて、かなり減ったがね。
そもそもSCEがCellベースGPUをやめてnVidiaにしたのは何故?
>>535 のプログラムがおかしいから。
という冗談は置いといてkwsk
>>537 そこに時間と手間を掛けてるなら、餅は餅屋に頼んだほうが早いからだろ?
>>533 まったくその通り、簡単に参照できる論文すら読んでない奴が多いから
なおさらだな。1年前に比べれば、Cellの性能を論ずる上で参考になる文献
は飛躍的に増えている。あと一年すれば、もっと増えるでしょ。
一年後にPS3が生き残ってるかどうかの問題が先だろw
>>540 論文は仮定を元に理論を構築するだけで、その後に理論的に間違いが無いか検証して、実装に入りるが次々に出てくる問題点を根気よく潰していく。
この過程で実現出来ないものや金額面で現実的でないものは消去していくから論文に書かれたことすべてが実現出来るわけではないよ。
湯水のように経費や人員をかけられれば、少しは可能性が出てくるか、SCE自体がそれを放棄してるわけだし。
543 :
名無しさん必死だな:2007/01/08(月) 16:07:11 ID:io0Q1ZBJ
>>537 Cellで描画性能がダメだったからNVIDIAに泣き付いたんだしょ。
ソフトウェアレンダラとエミュレータの違いについての
議論もどきは飽きた。
実際にプログラムをする人間からみると、以下の部分が詭弁と感じる。
暗黙の前提が入っている、だからLSは効果しない。
しかし反論すると、それを詭弁でまた返てくるんだろうなw
それがGKクオリティー
>キャッシュ(DRAMとの暗黙の転送):
> とりあえず簡単に動くが実効効率は極めて低い、そこからの性能チュー
>ニングは困難を極める
>LS(DRAMとの明示的な転送):
> 事前の問題分析でデータ転送と演算をスケジューリングすれば、高い性能
>を実現可能
キャッシュでもプリフェッチ命令を仕込む手間を考えなければLS程度の性能はでるんだよな
しかもプリフェッチ命令はすでに動いているコードに対して割合簡単に仕込める
>>547 示すも何も、実際にコードを書いている人にしてみれば当たり前の事だから。
通常プログラムを作る時
プロトタイプ→チューニング
と進むのですが、この作業の流れを考えると、後からチューニングできるキャッシュと、
あらかじめチューニングの必要なLSでは、後者は激しく仕事がし難くなるという問題もあるね。
今このスレには小学生しかいません
>>542 Cell信者の痛いところは論文に書いてある事すべてが実現出来ると思ってる事だよな。
人は自分に都合の悪い事は考えない悪い癖があるから理論だけでは落とし穴がポコポコ空いている状態。
大学の研究室でも実験に入る前に複数の人間でディスカッションして穴を埋めていくわけだが、中には頑固な奴がいて間違いを認めようとしないまま実験に入るとハマる事が多い。
>>547 このスレは、お前のようなコードを書いてない奴が
当たり前とか常識を語るスレだからな。
>>551 アンチの痛いところは論文に書いてある事に、正当な反論ができない事だよな。
人は自分に都合の悪い事は考えない悪い癖があるから理論だけでは落とし穴がポコポコ空いている状態。
論文の読み方も知らないお前にお似合いのスレだよw
>>552 お前も何か技術的な事言うとか。自作のコードとか晒してみれば?
つまらない煽り合いを見ていると、お前のレベルもCellアンチと大して変わらないようだ。
ちなみに俺は全然駄目だがなw(知識&プログラミングスキル)
SPEで作った人工知能の論文はまだですか?
後藤と西川が教養のバイブル、それがゲハ板
実際にコード出されても、ほとんどのやつがポカーンだろうな
オレも含めてw
とりあえず
>>552が腹がよじれるほど笑える件について
SPEの利点LSは、結局のところメモリーの速度とCPUの速度ギャップを埋める為の一方法論でしかない訳で
Cellが成功して一時的に性能がでても、いずれは代替のよりよい方法がすぐに出るよ。
こんな猿でも思いつきそうな安直な解決方法があるかよ、技術をバカにしてんのかいな。
>>513 ISSCC 2007で発表される65nm版CELLは6GHzで動作可能。
インテルCPUだけ性能が伸びてCELLは頭打ちって、エモーションエンジンじゃないんだからさ。
もうちょっと頭使おうよ。
>>559 >いずれは代替のよりよい方法がすぐに出るよ
>こんな猿でも思いつきそうな安直な解決方法があるかよ
こんな事言ってる
>>559はインテルの上席研究員か何かか、それとも単なる池沼ですか?
Cell派は人が書いた論文引っ張りだすだけだし、アンチは市販ゲームを見て主観で
煽るだけというレベルからなかなか脱却出来ないな、このスレ。
アンチの要求に対するSPEのコードを書いて、こんだけ数字が出ましたという展開を
期待してんだけど。
>>562 既にPS3のCELLで動作するコードは多数出てるじゃん。どこを見てるんだ?
そもそもゲハ板でソースの話というのが無理難題
>>561 何を大げさに、問題を解決する方法としてLSにしてみましょう、こんな提案なら当時の学生だってできるよ。
そりゃすごいねー
グラの処理はGPUのハードレベルでやった方が圧倒的に速い。
CPUはゲームの判断周りだけだな。
>>565 俺もLSみたいなシステムを考えた事あるな、キャッシュとメインメモリのアクセス速度に
落差がありすぎるから、メインメモリとL1キャッシュの中間ぐらいの速度のスクラッチパッド
メモリが欲しいと思っていた。
CellのLSを見たとき「これだ、自分の求めていたのは」と思ってCellの論文を読み漁ったけど
L1キャッシュまで無くしてしまった上、DMAでしかメインとアクセスできないのがわかって
「うわ、めんどくせー」って気持ちから急に興味が失せた。
IntelやAMDはコアごとにキャッシュを持っていてコア間で共有できるスクラッチパッドメモリか
L3キャッシュを積んでいるので自分の希望に近いのはこちらかな。
Cellの構造はハード屋だけで考えてプログラマの意見なんか無視したようなつくりなのが萎える。
569 :
名無しさん必死だな:2007/01/09(火) 00:06:35 ID:ozLM8KKk
てか2チャンにどう考えてもトップガンいるわけないよな。
Cellを高レベルに理解しれいる人がいたとしても
このスレの人相手にしゃべってもものたりないだろうし。
てわけで素人が妄想あいっこが精一杯。
でも2チャンはそれでいいんじゃない。
それ以前に
>>513は誰が書いたものか知ってるのか?
GRAPE-DRの牧野日記からの抜粋だよ。
しっかし牧野もCELL意識しまくりだなw
一応、俺も反論しとくか。
>で、それ以外ではベンチマークでの性能比はピーク性能の比とほぼ一致する
>(IA64 だけ低い気がするけど、、、)というまあ真っ当な結果。
うそばっか。論文よく見ろ。
倍精度でピーク性能比よりも倍近い実効性能比叩き出してるじゃんか。
FFTで比較すりゃ、要素数上がるとキャッシュ効率が落ちて性能が
下がっていく86系CPUとは真逆の結果出してるのはLSの恩恵だよ。
http://www.ne.jp/asahi/comp/tarusan/main148.htm
>>569 Cellは作っている本人たちが自分の作っているモノがどのような性質を持つのか理解していない、間違いなく。
トップガンが居たとしても理解できるとは思えない、Cellを知れば知るほど。
>>571 いまだかつて製造過程でそんな事ってあったの?
>>572 プレスコットとか消えていった数々のRISCとかアイテニアムとか失敗作はたくさんあるな。
どれも前評判では高性能で高効率をうたっていたけどな。
CPUはアプリケーションが性能を出せて初めてパフォーマンスを発揮出来るわけだから
ソフト無視で演算性能だけ追求するだけでは駄目だという良い教訓ですな。
Cellに懐疑的になるのは、性能が出せてるのはベンチマークだけでアプリケーションで結果を出せてないからですね。
>>562 「SPEのコードを書いて、こんだけ数字が出ましたという展開」ってまさに
論文に書いてあることのように思うのだが、気のせいか?
アプリケーションで結果出したところで、
どうせお前ら懐疑的なままだろ。
例えばPS3で1080pのH264を軽々デコードしてるが、
それすら凄さも無視されたままだからな。
結局、技術の優劣なんて他のCPUと比較してなんぼだろ。
10年以上もLinpackという単一の性能比較でスパコンの優劣
争っているTop500が良い例だろ。
ま た デ コ ー ド か
578 :
名無しさん必死だな:2007/01/09(火) 02:25:54 ID:cNr4A99T
>>576 そういうのはアプリケーションとはいわん、せいぜいモジュールレベルだ。
いってみりゃ毛の生えたベンチだな。
BD再生ってデコード処理だけじゃないけどね
>>576 でもそれぐらいは箱でも出来てるし。
でもあっちは展開にGPU使ってるんだっけ?
cellは凄いことが出来るのかもしれないが、それが本当にゲーム機に必要な性能か?って事だよな。
たとえば、俺は目でピーナッツが噛めるが、それって凄いのか?って話で。
それ過去ログで散々ループしてる話題。
理由も書かれてるよ。
結局、同じ話題の無限ループ。
ここに、直にCellを叩いてるのがいないのがわかるな。
>>575 論文で書かれているコードはSPEが一番性能を発揮しやすいようになっているからね、
H264のデコードやFFTのようなタスク固定でデータを流すだけの処理は速いというのは
わかっているので異論は無いがゲハ板なのでゲームアプリで性能が出せるのかが知りたい。
PS3がただのBD再生機なら別に気にもしないのだがゲーム機だからそのへんのパフォーマンスは
どうなのかなと思って。
SPEを使わないと無理とか言ってたVF5もPXで移植出来ちゃうから、ゲームの分野で
Cellのアドバンテージは無いんだよな。
わらわらゲーはCellの方が強いかなと思ったが地球防衛軍3とか見るとPXでもかなりの
事がやれるからCellでないとという領域が希薄になりつつある。
Cellではアヒルデモを作っていたからソフト面でも目処がついていたのかと思えば実機でアヒルデモが動いているのを見たことないよな。
結局あれは演技だったって事なのか、ソニーの詐欺は手が込んでいるから期待を裏切られた時のがっかり感が大きいな。
去年のE3のデモ群を見てしまった後ではどんなゲームを見てもしょぼく見えてしまうよ。
ゲームでCELLがどう活かされてるかなんて、
GPUがある以上分からんだろ。
どの処理がCELLで、どの処理がGPUかなんて
雑誌かなんかで開発者が語ってくれなきゃ一生
分からん。
グラフィックがしょぼくても、中では凄い物理演算
をCELLにやらせてる可能性もある訳だし。
ゲームなんてCELLの性能語るにはあまりに
アバウト過ぎgて、やっぱHPCの方がCELLだけで
演算やってる分野だから分かりやすい。
>>570 他人の著作物を出典書かずに2chに貼ること自体褒められたような
行為じゃないんだけどな。
直接関係はない話だけど、FFTW(PC用のFFTのライブラリね)使って
なんか書いたとき、FFTそのものの実行時間はほとんど誤差のようなもので、
前後の処理の方がずっと重かった。そっちもSPE化できるような計算かと
いうと不可能ではないだろうけど負荷分散や排他制御は難しそう。
どういうことかというと、FFTにはメモリバンドのベンチマークぐらいの
意味しかなくて(あとπの計算もほとんどFFTだった)、もちろん
メモリバンドはとても重要でDDR2-800の4本分メモリバンドのある
Cellは大変結構、ということ。
結局Cellの使い道というのはエンコとかデコードみたいなDSP的な
用途であって、手間をかけてライブラリを整備すればDSPよりも
少ない手間で多彩なフォーマットに対応できるのは強みではある。
そういった用途でCellが成功を収めるには、P2Pやリッピングツール、
大容量の外付けHDDが普及することがキーになるものと思われる。
>>580 箱のは動画フォーマットが違う
H264より軽い規格だし
>>590 HD DVDもH264を採用してるぞ。当然360でも再生できる。
HD DVDは2系統じゃないのかな?
>BDでは映像ストリームを同時に2系統扱えますから、最大ではフルHDのストリームを2本並行してデコードしなければなりません。
HD DVDはビットレートがBDより低いよ
ビットレートが低いのはHD DVDではなくVC-1なんですが。
それにVC-1はビットレートが平均化されているだけでBDみたいに画像によって負荷が急上昇しないようになってるだけ。
エンコード画質も安定しているので人が見分けられるほどの画質の差はないんだよ。
>>588 FFTの前後処理まで入れるとPen4と差がつかなくなるから、都合のよいところだけ抜き出したってことか。
どうせバレるのになんでこんなことばかりやるのかね。
PS2で痛い目にあってなければ力業ででも使いこなすんだろうけどサードも今回は冷めてるからな。
598 :
名無しさん必死だな:2007/01/09(火) 13:20:18 ID:nzPDQxX6
一番差が出るのはフルHDを2本同時エンコードしなきゃらん部分だろ
あと可変ビットレートは平均化から来る劣化を少しでも解消する為の規格なんだから
退化してる部分を取り上げて”平均化されているだけ”で片付けちゃダメでしょ
>>594 お前日本語も読めないのか?
デコーダはソフトなんだがw
>>596 知ったか乙
全てのオーディオ/ビデオコーデックにおいてHD DVDの方が最大ビットレートが
Blu-rayのそれより低い
BDの54Mbpsに対してHD DVDは36Mbpsしか帯域がないから当然だけどな
>>597 都合の良いところだけ抜き出してるのはお前だろw マジわろたw
>>600 知ったか乙
BDの54Mbpsの帯域を必要とするのは速い動きの部分だけで、それは全体の数%程度。
ほとんどはHD-DVDと同じ36Mbps程度あればいい。
VC-1はこの数%の部分を抑えて帯域の変動を少なくしている。
PCでフルHDのH264を再生しても常にコマ落ちしてるわけでないだろ。
つまりブルーレイと比べたらHDDVDの方が画質の限界があるって事だな
箱○がブルーレイを再生しないと比較になりませんな
逆じゃね?
PS3においてブルーレイのソフト再生は必須条件だから
それに都合良く設計されてるだけという。
むしろ汎用CPUというよりH264デコーダチップみたいなもんだと。
それだけ得意で他の汎用プログラムは遅い。
そもそもHDDVD自体消えていく規格だからどうでもいいような
確か意味もなくフルレートのH.264を同時に再生できるようにしたとか言って気がする<CELL
>>603 半年ぐらい前のWinPCでH264とVC-1の比較をしていたがH264が画質悪かったという評価だったな。
H264は安定したエンコード品質を保てる技術を持っているのが松下ぐらいしか無いので
H264が悪いわけではないんだがしばらくのあいだはmpegかVC-1のタイトルが多くなりそうだとか。
>>602 コーデックや再生レート無視して数%とか言われてもなぁ
610 :
名無しさん必死だな:2007/01/09(火) 23:07:59 ID:vsMoUOPx
これだけのハードを作ってやれる事がムービー垂れ流しは確実にできますよ、だけか・・・
寂しいね
というか、Cellがあんな変態設計になったのはH.264の為だろ。
ゲーム用のCPUとして設計するなら、ベクトルプロセッサに6割もTr数を割かないと思う。
いつからCELLの6割がベクトルプロセッサになったんだ?
CELLの6割はやさしさでできています
カタログのスペックシートに256GFlopsと書くにはこの方法しかなかったんじゃないかな?
高層ビルの高さ競争でたとえるとこんな感じw
┃
┃
┃←SONY Cellタワービル
┃
┃ □←MS PXビル
┃ □
□ □
世界一高いビルくたー!
言った物勝ちスレに戻そうと頑張られておられますな。
>>614 PXの□は所詮Cellの□の出来損ないで、それを3つ集めただけじゃ直ぐに崩壊する。
言ったもの勝ちとはクタラギさんの事ですよね?
>>616 ゲームでは、その出来損ないが威力を発揮してSPEは眠ったままなんですが。
Cellは出来損ない以下と認める発言なのか?それは。
>>614 アンテナまで高さにいれるのか、すげーなそれ。
アンテナに人は住めないが、よじ登って掴まれば、一時的に住人の数が増えるだろうという思想はCellに通ずるものがあるな。
アンテナとしての性能は高いが住居としては、まるで不向きという。
PS3のcellのPPEのみとceleron3.2Ghzとは
どちらが性能が上なのでしょうか?
2007/1/9
確かにLBNL な人達の論文をみるとAMD64 で FFTW だとデータサイズが
2K*2Kとか大きくなると極端に性能が落ちている。でも、これって FFTW
の特性、というかそんな大きなところで使うことを考えてチューニング
してないだけっぽい。高橋さんのFFTE(サイトはこっち)だと別にデータ
サイズが大きくても性能あんまり落ちないみたいだし。高橋さんはこれ
は最近やってないのかな?と思ったらそんなことはなくて、 PACS-CS の
Xeon でも動かしてるのか。あ、それ以前に HPCC の FFTE がこれか。
この辺 によると巨大な FFT でも性能がでると。
出来そこないはCellというよりSDK
HDMIの策定をMSが邪魔したとか、サードがシェーダをつかえてないとか、Cellは腐るほどあるが青色LEDの生産がとか(笑 言い訳ばっかだな。
また穴埋め痴漢が焦ってるのか
明日辺りなにかあるかもね
>>620 そりゃPPEだけだったらceleronのほうがいいよ
>>621 また牧野日記か。
だから、著者出さずの無断転載やめろっての。
まあ、リンク張られるのも向こうは迷惑だろうが。
ただ、このスレを大学のお偉いさんが見てくれるとは
光栄だね。
ただ煽るだけの恥ずかしい箱厨共がこのスレに
書き込むのはご遠慮いただきたいものだ。
ついでにアンチに過敏に反応する輩もな。
628 :
名無しさん必死だな:2007/01/10(水) 21:22:31 ID:0pSp7ii/
>>616 当初はメモリー激遅と思っていたが、なれの問題だけだわ、使い込み始めたら結構パワー出てきた。
つか、チューンしても無駄に工数が増えない分いい
>>628 PXとXenos間の帯域が太い上にレイテンシが安定しているのがいいやね。
PXでの演算結果を停滞無しにストレス無くGPUに送り込めるのが気持いい。
PCだとCPU待ちでGPUがある程度遊んでしまうのだけどバランスがいいのかな。
PXとXenosを繋ぐバスってPOWER4とかのバスと同じなのかな?
まだアク禁解けないのか?
消防しかいないからツマンネ
prinは解除されたのかな?
テスト
633 :
632:2007/01/10(水) 23:09:26 ID:Fz5s3xtk
ウィルコム(ピッチ)はOKだったみたい。
他に携帯とかも規制かかっているのかな?
この図見てるとPS3がメモリ量足りねーとか言われてる理由が良くわかるねぇ
>>634 いや、普通にパラレルなのかそれともハイパートランスポートやG5やPOWER4のGXバスみたいなシリアルもどき(ヘッダつけてパケット転送)みたいなことしているのか聞きたかっただけなのだけど....
>>636 クロックドシグナルのシリアルを複数本束ねているがその上の層のプロトコルは解んね。
>>637 それじゃあなんとなくGXバスっぽいかな?
>>626 牧野はただの演算器バカだよ。
全ての比較を対ピーク演算性能でやるからせっかくいいこと書いてるのに
バカっぽくなる。
演算器敷き詰めるだけで使い物になるならこれほど楽なことはないっつうの。
640 :
名無しさん必死だな:2007/01/11(木) 00:58:11 ID:1b4rFEpQ
360の作りは、ゲーム機としては色々な点で無駄の無い良いつくりだよ、次は二次キャッシュを増やすとどうなるか色々調整してみて欲しいね。
逆にPS3のつくりはGKには悪いが無駄の権化だな、ハードウェアリソースの有効利用が上手くいっていない。
カタログスペックの予定通りに動かないのは、バランスの悪いCellだけの問題ではない。
隅の隅までいじってから言えよノウナイ開発者さん
>>639 だよなw
Intel4コアが出てきて、CELLの性能メリットも少なくなるとか
よく言ってるけど、コアが倍になって確かにピーク性能は
倍になるだろうが、実効性能が倍とはならんのは周知の
事実だろう。
643 :
名無しさん必死だな:2007/01/11(木) 01:22:10 ID:1b4rFEpQ
>>642 余程Cellに向いたベンチでもない限り、事情は一緒。
完成したアプリになれば、高速化した分だけ低速化する部分が発生して事実上プラマイゼロになる。
>>643 そりゃ今主流のプログラミングモデルがマルチコア向けに設計されて無いから当たり前
マルチスレッドでやってるって言ってもスレッドをうまく使えているわけでも無いしな
>>644 全てのプログラムがマルチスレッドになるというのがそもそも間違っている。
処理A、処理B、処理Cという三つの処理があって、CはA,Bの結果を必要とするといった場合、CとAまたはCとBはマルチスレッド化できない。
特に多いのは、処理A、処理B、処理C...とあって、AがBの結果を必要としてBがCの結果を必要として・・・
このような処理は結構ある。
と、ここまで書いておいてアレなんだが、Cellの場合マルチコア以前の問題が大きいような気がしなくも無い。
いつもゲームで思うんだが、人の動きが嘘っぽすぎるよな。
明らかに物理演算なんてしてなくて、あらかじめ用意したモーションを
無理やりやらせてるだけって感じで。
人間が物理法則にのっとた動きをさせることはまだ出来ないの?
ハードの性能的には可能だけど、それを実現するプログラムを作る能力がないだけ?
例えばモーションキャプチャで採った動きをそのまま人体モデルにやらせて
その動きから各部位に生じた応力を逆算して
その動作に必要な各部位の力を求めることができるでしょ?
このままだと、ちょっとでもバランスを崩すとモデルは転ぶけど
そこはゲームなんだからすこしバランスを失っても転ばないように強制的に立たせて
誤魔化せばいいじゃない。
そんなのCELLがあればゲームデザイナーとプログラマの技量次第で簡単にできるんじゃないの?
>>645 もちろん知ってるさ
日曜プログラマだが画像処理なんかやってるとそんなの当たり前に出てくるからな
Cell自体のマルチコアモデルが結構特殊なのは判るが、
それを槍玉に上げてどうこう言ってる事に問題がある
>>646 チャレンジしても、その処理を生かした面白いゲームが思いつくかは不明だからね
リアルな物理演算やらはあくまでもゲームの脚色だとおもふ
モタストがやってたっけ?ラグドール
648 :
名無しさん必死だな:2007/01/11(木) 02:29:00 ID:1b4rFEpQ
>>647 >それを槍玉に上げてどうこう言ってる事に問題がある
バランスが重要だな、特定の一点に性能を集中するあまり、必要不可欠な処理ができなくなっている事が問題だ。
PS3が何をする機械なのか忘れてしまってはいけないのではなかろうか?
いくら、マルチコア向けのプログラミングに
最適化したとして、コア倍で実効性能倍とは
ならんよ。
ハード的な要因が大きいから。特にコアが増えれば
キャッシュアービトレーションの複雑度が増す。
>>646 それはCellだからどうこうという問題じゃなくて演算にいくらでも時間をかけられる
プリレンダCGアプリでも実現出来てないので今のところ無理。
モーションキャプチャと物理演算の動きを合成するアルゴリズムどころか論文でさえ
発表されてないのにコードに落としこめるわけないっしょ。
>>649 キャッシュアービトレーションがメモリーアクセス時のレイテンシにできるなら
もし、対象となるコードが並列化可能なコード(パイプライン化できるなら理想的)なら隠蔽できるのでは?
勝負はやはり、対象となる処理に順序依存があるかどうかだと思う。
>>650 そりゃそんなものゲームでしか役に立たないもの。
そんな既存のアルゴリズムを使うんじゃなくて
力学の知識を動員すれば作れるってはなしだよ。
必要な計算式はおれでも書ける。
>>
>>644 正解は
>>645。
プログラムのうち、すべてが分散処理出来るわけではないのでマルチスレッド化
しても速くなる処理と逆に遅くなる処理がある。
たとえばCG用のアプリケーションならモデリングや質感設定などはマルチスレッド化
してもほとんど速くならない、プレビューなどもGPUの仕事でCPUは関係なし。
効果が高いのはレンダリングのうち反射・屈折・グローバルイルミネーションなどの
レイトレーシングを使用する部分。
ゲームの場合は分散処理すると遅くなる部分が多いからCellがカタログスペックを
発揮出来ないのは仕方が無い。
これはプログラマの能力がどうこうという問題より、現在のゲームデザインがマルチコアを
生かしにくいデザインになっているからゲームコンセプト自体を変えないと意味が無い。
任天堂はゲームコンセプトを変えるためにコントロールデバイスを設計したわけだが
SCEはデバイス設計が先で次世代ゲームのビジョンが無いね、これが問題。
>>647 たとえば格闘ゲームなんか最も使えるんじゃない?
こちらのパンチが相手に当たろうが当たるまいが同じモーションしかしない格闘ゲーはうそ臭い
パンチが当たればパンチを出したほうも受けたほうも力を受ける。
絵だけリアルになっても動くが嘘なら違和感だけが際立つけど、
ちゃんと物理演算すればよりリアルで自由度の高い表現と内容になるよ。
というかもうCELLと関係ないからこれでやめるけど。
>>652 じゃぁ計算式を書いてみなよ、自分も試してみた事があるが衝突判定とニュートン力学、
モーションキャプチャは相反する動きだから破綻するよ。
試しにカンフーなんかで空中に飛んで、その状態で敵キャラにキックするのをやってくれるかな。
>>651 結果のデータも並列化しなきゃならない。
SMPの場合、一つのCPUがメモリー内容を変更した場合に
その内容を含んだキャッシュのラインがフラッシュされるか、
単にキャッシュ全体をフラッシュさせる。
用は、コア数が増せば増すほど、効率は悪くなる
>>654 その場合ゲームバランスが問題になるな、VF5ならサラとジェフリーじゃ体重差が
ありすぎてサラがキック出しても跳ね返される。
格闘ゲームの動きはありえないモーションが多いからキツイと思うけどな。
スタントマンになるゲームとかつくったら面白そうだが、上手く体を動かさないと
死亡するルールとか(w
>>655 式を書けってこんなとこにかけないわかるだろ?
力学は建築で構造力学を専攻したから、その程度は造作もないことだよ。
ただし、人体モデルの計算は手計算では膨大な量になるのは
建築物のモデルの計算でも同じだから
そこはコンピューターを使えばいいって話だ。
単純な理想化モデルの計算が出来て理屈がわかっていれば
あとはどれだけ煩雑になろうと機械に式とモデルを落とせばいいだけだからね。
それと合成するのじゃなくて、モデルの動き(キャプチャした結果)から
そこに作用した力を逆算するってことだよ。
もうこのへんにしとくけどね。
>>653 突っ込むのはいいが、スレ読んでからにしてくれよな。
おやすみぉ
要はキャッシュベースSMPのボトルネックは
一つのコアがメモリにアクセスしている間は、
必ず他のコアは待ち状態になるってことね。
>>658 じゃぁ、式は書かなくていいから
>>655に書いた条件がどういう結果になるか推測ぐらいは出来るだろ。
まずキャラをジャンプさせる、この状態でキャプチャしたキックのモーションを出すとバランスをとってる
わけじゃないから重心がズレて体が回転するよな。
さらに相手のキャラに当たれば反対方向に体が移動すると、きりもみ状態になって、もう人間の動き
じゃなくなって変な生き物がダンスしているみたいになる。
これがリアルと言えるのかな?
>>658 机上の空論でプログラムした事が無い人の意見ですね、論理に穴や見落としがずいぶんとある。
その話はこのスレでもさんざん概出ですけど、結論としては物理演算の分野でなくロボット工学とかAIの範疇に入る分野ではないでしょうか。
つかもう失敗しただろ
>>661 あふぉか
自律的にキャラにバランスを保たせるのが困難なのはわかってる
だか先にもかいただろ
ゲームなんだから無理な部分はごまかせと
完全な物理演算だけでは歩行させるだけでも困難だが
ゲームだからいくらでもごまかせるだろが
あふぉと話しても永遠に平行線だな
いまの格闘ゲームにしても誤魔化しと物理的演算の合成だろう
俺が言うのは、いまは誤魔化しの割合が大きすぎて不自然だということだ。
まともな力学の知識すらないようなやつしかゲーム業界にいないからそうなんじゃないのか
というかこんなとこで話すのもあふぉらしいが。おやすみ。
どうでもいいが飛んでから回転のモーメントを発生させるなど不可能だろw
あふぉすぎて話にならん
667 :
名無しさん必死だな:2007/01/11(木) 04:38:03 ID:k8D5Sv2l
>>645 デッドライジングでのやり方を調べるといいよ。
マルチスレッド化する粒度とやり方を工夫すればゲームではかなり出来る。
デッドライジングだと8−9割はマルチスレッドで動いていたはず。
おかげでCPUの稼働率が上がって故障する360が続出したわけだが。
HD DVDは最大51Gだから
ビットレートはHD DVDの方が高くできる。
HD DVDの方が画質は上になる。
デッドライジングみたいなマルチコアの使い方だとモジュール化しているわけじゃなくて
Windowsで複数のアプリを起動しているようなものだからね。
本来ならコアごとにタスクを置いておくのはCellの方が得意だと思ったのだけど、LSの容量が
小さすぎてメモリの使い方に柔軟性が無いから大きなタスクを置くことが出来なくなってしまった。
Cellの設計でおかしいのはSPEがタスク固定型の処理を得意とするのにLSがスレッドを
意識した容量になっているという矛盾にあるようだね。
Havokのメインモジュールだけでも652kbあるからなー、256kbは少なすぎるよな。
スタックも入れてゲームに使うには1MBは必要だよな。
1つのタスクを2〜3個のSPEに分けて、頻繁にDMAでゴヒーレンシをとってなんて
手間だけ増えてメリット無いよな。
こりゃ、SPEの個数が増えれば増えるほど遊んでいるコアが増えるな。
>>668 ビットレートはメディアの容量が増えようが36Mbpsで頭打ち。
1MBってどれだけ巨大タスクを作るつもりだよ。
スタックサイズなんて10Kでも巨大だぞ。
タスクによって実行される可能性のあるコードを
すべてLSに常駐させる訳でもないだろに。
オーバーレイとか使えよ。
>>660 >>656 そういう事情が起こるところでは、キャッシュをLSにしたところでソフト的にやるだけなので状況は変わらないかと。
むしろ遅い?
>>668 >HD DVDは最大51Gだから
51G を今売っている HD-DVD のドライブで読めるのか?
>>675 カプのエンジンはタスク単位というよりプロセス単位でコアに割り当てているな。
WinXPでも待機プロセスのほとんどが1MB以上だから128kbというのは、お話にならないぐらい少ない。
プロセスをスレッドに分けるのは簡単だが、ほとんどの場合、パフォーマンスが落ちるので
手間にたいして得られる結果が折り合わない場合が多い。
ゲームではプロセスごとにコアを割り当てた方が性能がでやすいよな。
680 :
名無しさん必死だな:2007/01/11(木) 12:59:49 ID:hn1cUc1L
>>675 必要なタスクをXDRからLSにロードするまでのレイテンシはどうなんだろうか?
リングバスはクロスバーに比べてレイテンシ的に不利と聞くし、SPEは細切れにタスクをとっかえひっかえ出来る構造じゃないから、実用になるなら開発もこんなに苦労してないと思うんだけど。
いやべつに、スタックフレーム作らなくても、1フレーム処理したら
その都度returnしたらいいじゃん。
HD DVDのビットレートは平均8Mbpsで180分15GByteだね。
H.264は扱い難いし、各メーカとも良くやってると思うよ。
データ転送は36Mbpsであるが、当たり前だが音声も必要な為
映像には30Mbps以下しか使えないんだよね
音声無しにしても30Mbps以下しか使えない
http://techon.nikkeibp.co.jp/article/NEWS/20070111/126317/?ref=ML 次に,この鍵データを使って別のSPE内でMPEGデータを復号化していく。
ただし,SPE内のローカル・ストアは記憶容量が256Kバイトと小さいので,1枚の画面全体を保持することはできない。
このため,マクロブロック単位で復号化処理を行う。1つのマクロブロックの復号化が終わったら,
その処理結果を再び暗号化して(今回はAES方式を用いていた)主記憶にバッファする。
これを繰り返すことで,例えばMPEGのIピクチャを1枚得る。
MPEG-2などの復号化では,動き補償を使っているため,BピクチャやPピクチャを得るには前画面や後画面のデータを参照する必要があるが,
その際には,必要なマクロブロックのデータを主記憶中のバッファからSPEのローカル・ストアに取り込み,
先に施したAES暗号を復号化してから動き補償処理を行うといった手の込んだ処理を行っている。
>>680 サイズがある程度以上なら、レイテンシといよりメインメモリの帯域に依存するようになるよ。
4KB超えるとコードの消費と転送がつりあう感じかも。当然入れ替えなんて無駄だから
しない方がいいんだけど、キャッシュラインの制限がない分柔軟な扱いは出来るから、
賢く工夫っていうか自前でうまくやりやがれってのとのトレードオフだろうねえ。
開発の人達には、PS2に比べて天国なんていう変態マゾもそれなりにいるみたいだから、
どうなるかはこれからかもね。Cellを使いこなせて、ゲームに質的な変化があるのかないのかは
興味深いところ。
>>685 帯域=レイテンシでは無いぞよ。
GPUは一度にまとめてドカっとデータを送るので瞬間最大風速的に帯域を必要と
するからアドレス発行してから転送を開始するまでのラグは無視できるが
CPUはフラグなどの細切れデータをレスポンス良く持って来れた方がいい。
数kb程度の転送でGBクラスの帯域があっても意味ないぞ、転送待ちで他の処理が止まる方が痛い。
687 :
名無しさん必死だな:2007/01/11(木) 18:03:56 ID:Q8a+OG1u
クタがリングバスのレイテンシは転送待ちの間にほかのSPEを動かして隠蔽できるとか吹いてたが、これがまためんどくさいんだよな。
しかもこれじゃ、常に遊んでいるコアがあるし「SPEをすべて使いこなす」ことは出来ないときたもんだ。
688 :
名無しさん必死だな:2007/01/11(木) 18:29:31 ID:MwpWtfNk
>>672 Havokは物理演算をGPUでやろうというものなんだよね?
GPUは1MクラスのLS相当のメモリ積んでってこと
>>688 HavokはもともとCGアプリ用のプラグインだったもの、当然CPUでも動作する。
基本モジュールである剛体物理のほか簡易的なものだがゴムや布などのソフトボディダイナミクスもこなす外部モジーュルも付属する。
今のところマルチコアに対応しているのは剛体物理の部分だけだな。
必要メモリは衝突させるオブジェクトの頂点数に比例するので単純なオブジェクトを2-3個とかならPS2でも動くよ。
690 :
名無しさん必死だな:2007/01/11(木) 19:54:31 ID:MwpWtfNk
そうだよね、矛盾してからビックリしただけ
PS3はキャラクターベースの頂点処理はCELLでやって
背景はRSXで処理してると聞いたけど、それはCELLで計算したポリゴンモデルを
そのままコリジョンチェックに使えるからだよね、物理演算に有利だしさ
頂点演算は全てCPUで処理できれば理想的なんだろうけど
>>686 つダブルバッファ
128Kしか使えないとか言わんでくれよw
cellってアップルにボロクソ叩かれてたね
>>676 ソフト的に人間がコントロールできると、
ハードで強制的に行われるのとでは、
偉い違いだよ。
Cell関係の論文でX86系と比べて実効性能
が高いのはLSのコントロールが効くから
という理由をだいたい挙げてるな。
>>693 絶対性能ではなく実効/理論で語れよ。
x86も色々命令が拡張されてるし、開発ツールの助けを借りれば$方式でもかなりチューニングできる。
LSの利点なんて
>>685の「柔軟な扱いが出来ること」位だよ。
それだって人間が局所性や並列性を完全に表現できるか怪しいものだ。
「小容量でも何とかなるかも知れない」点だけだな。評価できるのは。
695 :
名無しさん必死だな:2007/01/11(木) 21:00:07 ID:LZwMH9fS
はやく素人がみてもスッゲーッと関心できるデモを公開してみてくれw
所詮クズチップでそんなことは不可能だろうけどな。
>>692 でもって今頃インテルに乗り換えた事を思いっきり後悔してたりして.....
上のPXのブロック図を見るとFSBはCore2クアを上回っているのね
つかなんでMAXがいまだに1066MHzなの?
かつてのG4をみているみたいだわw
このスレ観てると
カプチーノにユーノス500の3ロータリー
とか載せてみたくなるな。
>>697 ちょっw、それはいくら何でもオーバースペックw
WiiにPOWER5を搭載するようなものではw
どんな論文があろうと、PS3が売れない&タイトルが振るわないのは市場が証明している。
玄人が何をほざいても無駄。
市場が証明って、結局は出荷台数出してないだけだろ?
XBOX360よりはいいと思うんだが
アンチには何を言っても無駄だからスルーしとけ
703 :
名無しさん必死だな:2007/01/11(木) 21:47:47 ID:FRs5lgIT
>>700 ここはCellスレだよ。
巣に帰りな。
論文オナニーGKに払う人件費があるならKONAMI説得に金使えよ、と思う
705 :名無しさん必死だな :2007/01/11(木) 21:58:06 ID:v9f6t4Fb
論文オナニーGKに払う人件費があるならKONAMI説得に金使えよ、と思う
↑これこれ。
本気でそう思ってるから恐ろしい
本気だよ。
PS3ユーザー(@友人宅)として、ゲハ板住人としてね。
面白いゲームを提供して頂きたい。ただそれだけ。
>661
馬鹿がいるな。
たしかに物理演算で人体をロボットのように動かすのは難しい。
でもなんで難しいかと言うと、こういう問題は逆問題だから。
筋肉や間接にかかる力を計算していって動きを計算していったら
へたすると、1体分でCellの全性能を使ってしまうかもしれない。
でも、ゲームなんだからそんなことをする必要は無い。
入力されたコマンドによって、数フレーム先の体の形を決めてしまい、
その形からその動作に必要な体の動きや筋力を計算すれば、
順問題だからすぐに解ける。このときに規定値を上回る筋力が必要とかになれば
例外処理で転ぶとかすればいい。
>まずキャラをジャンプさせる、この状態でキャプチャしたキックのモーションを出すとバランスをとってる
>わけじゃないから重心がズレて体が回転するよな。
これにしたって、体が回転しない最終形をとるものとして、それに必要な動きを逆向きに計算して
それに必要な動作を自動的に取らせればこんな問題は起こらない。
俺業界人じゃないけどPS3上のLinuxで面白いソフト出してやるから待ってろ。
>709
馬鹿はお前。
リアルタイムで状況変わってくるのにどうやって計算するんだよ。
cellの演算性能はすごいけど、こんな事出来るほどの性能は無い。
格闘ゲームなら大量にモーション作って状況に応じてそれに見合ったモーションで
動かすほうが綺麗にできると思うぞ。
最近はモーションも繋ぎ合わせる技術も上がってきてるしな。
プログラムは人間が考えるもんでしょ。
だから、大多数の人間の思考を超えるような
複雑なマルチスレッドプログラミングモデルは
しばらくは流行らないと思うよ。
また無学な任豚が発狂してるのか
いや、マジな話よ。
>>717 論文の中では他のCPUと比較しなくても、
その著者に名を連ねてるJack Dongarra
はLinkpackベンチマークの発明者。凄い有名な人。
腐るほど、他のCPUの性能を把握している人でもある。
その人がCELLをべた褒めしてる。
>The Cell architecture allows for much finer
>granularity of parallelism then the traditional architectures.
伝統的アーキテクチャよりも並列の粒度に優れている
>By blurring the boundaries between shared and distributed memory systems
>the Cell has the potential to inspire new algorithmic discoveries in the area of
>numerical computing.
CELLのメモリシステムは数学計算分野にて新規のアルゴリズムを
生み出すポテンシャルがある。
ピコーン
ドンガラさんがゲーム作ればいいんだ!
何を恐れ多いことを
可能性の話はもうお腹いっぱいなんですけど…
「ますらをぶり」なんて流行んねーよ、これからは
「たをやめぶり」だよと?
本居宣長かよ
最近使い込み始めて思うことだが、LSどころかキャッシュによる方法でもマルチコアでは、ノウハウがまだまったく蓄積されていないという点がある。
スーパーコンピューティング関係の書籍をあさっても、ぶっちゃけ自分たちの方がノウハウが上かもしれないという事態が結構あるし。
まず、キャッシュで問題になる部分を洗い出して、その後に足りない部分を補うようなやり方の方がよかったのでは?
たとえば、キャッシュアービトレーションの問題が上の方に書かれているが、これにしても・・・
例えば、メインメモリー(ページングの付加情報でもいい)に対して適当な範囲を各プロセッサ専用として、他のプロセッサからのアクセスは例外にしてしまう。
専用メモリーではプロセッサ間の整合性は取らない。
これだけで、LSの小さなサイズをサクッと解消してかつ、キャッシュアービトレーションの負荷の増大を軽減することができるのでは?
これにキャッシュへの計画的な転送を加えれば、LSでなければならない必要性は無いような気がする。
最近のSMPのトレンドは、2次キャッシュに収まる範囲で
プログラムを簡潔させ、出来るだけメインメモリに
アクセスさせないことのようだね。入力与えて、結果を
出力させる回数を出来るだけ減らす。
そう組んでいかないと、コア数に比例して性能が
うまく伸びていかないようだ。
>>718 > >The Cell architecture allows for much finer
> >granularity of parallelism then the traditional architectures.
> 伝統的アーキテクチャよりも並列の粒度に優れている
これは何のことだかよくわからなかったが、↓を読む限り
伝統アーキというのは分散メモリ計算機のことだな。
Cellの扱える粒度が共有メモリ(マルチコア)より細かいわけないし。
> >By blurring the boundaries between shared and distributed memory systems
> >the Cell has the potential to inspire new algorithmic discoveries in the area of
> >numerical computing.
> CELLのメモリシステムは数学計算分野にて新規のアルゴリズムを
> 生み出すポテンシャルがある。
変態アーキに興味を持っているというのはわかるが性能や使い勝手が
優れているとはいっていない。
「工夫次第でいろいろできそう」を「既存のものより明らかに優れている」
に勝手に取り違えるのはいかがなものかと。
>>726 ゲーム用途等でわ , 必要性が軽減されますね .
730 :
名無しさん必死だな:2007/01/12(金) 06:51:32 ID:tYLza4B4
>>728 the 3.2 GHz Cell system is included in the LINPACK report
[25], where it outperforms a number systems based on modern
HPC processors.
The results also prove the huge potential of the Cell processor
for high performance numerical applications.
最近?
>>731 ほへ?
LSのアーキテクチャなら手間をかけてスケジューリングした
GEMMで性能出るのはあたりまえで、それすらできなかったら
正真正銘の欠陥品だよね。当時としてはピークでも抜きんでてた
わけだし。
実際のアプリについては「ポテンシャル」としかいえてないわけでしょ?
これじゃあカタログスペックが高いだけなのと同じ。
これこれのベンチマークでデータ構造とアルゴリズムをこうこう工夫
することでCellで性能が出せました、というのが論文になるというのが
Cellの現状なわけね。どういう意味かわかる?
Cellスレのナンバリングが100になるまでに結果を出せなければ、Cellダメポでいいんじゃまいか。
まるで八甲田山雪中行軍だな。
さあ
このスレを見てると、アホ主任が間違えて注文した、どうしょうもない糞商品を苦労して売りさばいたら「俺の目には狂いがなかった」と言われた事を思い出したよ。
>>728 >これは何のことだかよくわからなかったが、↓を読む限り
>伝統アーキというのは分散メモリ計算機のことだな。
>Cellの扱える粒度が共有メモリ(マルチコア)より細かいわけないし。
お前ほんと馬鹿だなw こんな初歩的な誤りしてる奴が何でこんなスレに
書き込んでるんだよw
>>739 初歩的な間違いとやらを具体的に指摘しておくれ。
ネックとなる共有メモリのアクセスがあるので、共有メモリのマルチコアの
粒度は通常キャッシュサイズ以上になる。Cellはリングバスによるプロセッサ間
通信があるので、それよりも小さい粒度を取れる可能性がある。
ってなところですか...
日本人は何やってんだ?
またアメリカとの技術格差が広がりそうな悪寒。
しかし今Cellいじってる俺らって何気に最先端なんだよな。
そう思うと感慨深いものがある。
744 :
名無しさん必死だな:2007/01/12(金) 22:04:24 ID:BuBSIE0v
PS3がゲーム機として失敗確定なので、
今後はスパコン専用CPUとしてIBMが頑張るだろう。
>>740 今年って、まだ12日なのに50件もかよ。。。
IBMはCellの改良を自前で出来るから意欲的なんでないかな。
PS3のCellは構成がマズいから性能が出ないだけで、クタみたいに頑固な考えを捨てて
ブラッシュアップしていけば、いいものになると思う。
PS惨転けたからCellも終了か?
ゲームプラットフォームがコロコロ変わったら開発が卒倒するだろが
749 :
名無しさん必死だな:2007/01/12(金) 22:38:05 ID:s5CRR0yA
PPEの代りにPowerコアを載せてSPEの代りにMC6800を積めるだけ積んでLSを1MBにすれば開発もウマーで最強だろう。
カーマックたんにまでダメアーキテクチャの烙印押されちゃって。
トップガンの中のトップガンに駄目だしされてちゃ立場ないよね。
>>319 >>499 >>560 ISSCC2007で65nmテクノロジーのCellが発表されるっていうから、
プログラム探しちゃったけど、マイクロプロセッサのセッションじゃねーじゃんw
だいたい、6GHzって、SRAMの動作周波数ってかいてあるぞw
去年のキーノートがボロボロだったから冷遇されてんのか?
6800じゃ死ぬほど積んでも486にすら勝てねえよ。
6GHzでSRAMが動くってとてつもなく速いな。。。
>>754 クアッドチャネルとか同時駆動だったら出来るんじゃね?
同期取りとか氏にそうだけど
>>726 キャッシュ階層の使いこなしではゲーム業界の方がずっと上なんじゃないかな。
大きな違いの一つは、ゲームではプロセッサの構成が変わらないことだと思う、
PCみたいに、新プロセッサが出るたびごとにキャッシュ階層が変わってチュー
ニング結果がリセットされるんじゃ、なかなかやる気にならんだろう。
ちなみに、キャッシュアービトレーションは機能があるだけで複雑、offに
できたからといってonにしたときより楽になるとは言えない。とはいえ、
L2と主記憶の間でデータ転送できるDMAとかは考える価値がありそうだ。
>>744 ゲーム以外でも多分駄目だ、Cellの各種問題はCellが解決した問題を殺さずに相当程度解消可能だと思うので。
>>756 PS2でがんばっとったメーカーにゃキャッシュ使いこなす
ノウハウねーっしょ。全部スクラッチパッドで解決だし。
俺が見た酷いやつなんかスタックアドレスをスクラッチパッド
に割り振ってたぜ。
>>758 CellのLSって何ポートなの?
256KBもの容量のLSが6GHzで動くなら凄いな。ちょっと研究する価値がありそう。
761 :
名無しさん必死だな:2007/01/12(金) 23:27:18 ID:6MA8XSuJ
>>726 >まず、キャッシュで問題になる部分を洗い出して、
>その後に足りない部分を補うようなやり方の方がよかったのでは?
普通に考えればその通りなんだし、実際そういう意見が妥当。
PPE+PX+3SPE(位?)なら本来最強の構成になったはず。
しかし久多良木は、ソフトの事が全く分からんものだから手下を含めてそういうプログラマー
優先の考え方を『所詮ギミックだろ』で片付けてしまう。
リングバススレッドの使い方の問題点(複数のSPEを同時に動かし辛い)とか、
SPEのLSの問題点とか”分かったつもり”で設計してるのを見れば明らか。
>俺が見た酷いやつなんかスタックアドレスをスクラッチパッド
PS2のスクラッチパッドは意味無かったな、VUにローカルメモリーがあるから機能重複だった。
PSでは重要だったが、PS2の場合はスクラッチパッドは全部通常キャッシュでよかった。
>>756 キャッシュ・メモリーチューニング用のコードと、動作を記述するコードが独立に書ける時が大変有利になりますね。
チューニングコードを変更しても、効率の上下はあっても挙動が変化しないタイプのものが使える。
コンパイラ任せのオプティマイズ、分岐やループ回数に関するヒント、キャッシュのプリフェッチ命令のようなものが良いです。
プログラムの結構な時間がデバッグ時間とテスト時間に食われているので、変更してもバグに繋がらない事が保障される時は思い切ったコードが書けます。
逆に挙動が変わる物は、自分が書いたコードを自分が使っている程度ならいいですが、誰がどういう使い方をしているか分からない時はチューニングできても、もう触れませんチューニングなんてできません。
挙動が変化しないタイプの物なら、チューニング結果のリセット上等、またやるぞですね。
マルチコアで、LS のような機構を考えなければ、キャッシュを
含め、メイン・メモリにアクセスする場合、コア同士が、コード
領域、データ領域、スタック領域の3つの領域をアクセスし合う
メモリアクセスの競合を考慮する必要がある。処理速度を上げる
ためにそれらのメモリアクセスの競合を手作業で最適化する
なんて、LS で最適化する以上に、やりたくないね。
SPEの最大のメリットは面積効率の良さだと思うぞ。既存のものに機能を追加
するやり方ではこれは実現不可能だろう。SPEにキャッシュ的なものをつける
なら、ソフトウェアキャッシュの効率を上げるSPU命令の追加というのもあり
かもね。
>>762 チップ上のメモリを最大限に有効活用しようとすると、データ構造やデータ
アクセス順の調整が要求されることが多いのでは?処理の論理的な結果を
変えずにそこらへんまで調整できるソフトウェア-ハードウェアツールが
あれば良いと思うのだが。
>>763 細いバスバンド幅の上にむやみやたらにコアぶら下げない限りあれほどの問題にはならないかと。
素直にバスバンド幅確保をするか、バランスをとってそれなりの物にするのが正解。
まあ、メモリ技術の進化がコア数の増加以上に
遅いからな。どんどんバスがか細くなっちゃう。
>>763 その為にトランザクションメモリがあるわけだが。
SPEもLS内で完結して結果だけ返せる処理も限られているからメモリ競合は起こるけどね。
容量もキャッシュより少ないぐらいだから競合する確立もたいして違わないと思う。
そういえば、IntelがCoreDuoからL2共有にしたのは、
まさにこの議論なんだよな。L2調停が非効率ってことで。
AMDは非共有でいくみたいだけど。
まあ、4コアと増えていった場合どうしていくのか
両者の方向性が興味深いね。
特にL2調停の問題は4コアで複雑さが増し、
深刻化してくるという話だし。
>>767 トランザクションメモリっていつになったら実用化されるんだよw
>>769 AMDは4コアでL3キャッシュを追加するみたいだけどね、コヒーレンシが必要な
部分はL3で整合性をとるみたい。
各コアがまったく依存関係が無い処理をする場合はLSでもいいんだけどマルチスレッドで
遊んでいるコアにどんどん処理を振っていくとそうもいかないからIntelのヘテロも
クリップボードみたいなシステムを入れるようだね。
Cellはプログラマがコアの整合性をチェックしないとならないが手間がかかるだけでエレガントとは言えないな。
複数のコアに同じ処理を振って並列化するのは情報の共有がネックになるので
レイトレースなど一部のアルゴリズムにしか効果が無いのが現状。
同じメモリに複数のコアがアクセスすればレイテンシ×コア数になるのでメモリの
速度を上げる以外に方法が無い。
そろそろインテリジェントメモリのようなものが出てこないかなって思っているんだけど。
まあ、そんな調停ロジックにトランジスタ
割きたくない、ということのもLSにした大きな
要因だろうな。そこら辺何も考えなくてすむん
だから。
それとキャッシュヒットミスのボトルネックを
避けられるってところか。
2〜3個のコアに共有キャッシュをつけたのを複数搭載するのがいいんでしょうね。
Intelのヘテロは4つのコアでキャッシュを共有して複数搭載する構造になっていますし。
古株のCPUメーカーは並列化効率を上げるための工夫を必ず入れてるところが
家電メーカーのSCEとは違うところと言えます。
プログラマさんならデータ共有がいかに大事かわかってる筈ですが、このスレの
Cell信者やSCEはプログラムを組んだこと無い人たちなのかな?
日曜プログラマか組み込み系あるいはライブラリ屋だろ、少なくともマルチスレッドプログラムは書いた事無さそうだ。
>>776 CELLのホワイトペーパーで再三述べられているとおり「何も考えずに済む」
ではなく「PPEでソフトウェア制御する」が正しい。これまでハードワイヤードだった
組み込み用ASICを汎用コア+ソフトウェアで代用するのと全く同じ思想。
>>777 SCEだけでなく、古株中の古株CPUメーカーであるIBMに
それを言ってくれ。そのIBMがCELLに傾倒してるのは、
強いメリットを感じているからだろう。
>>780 IBMはPXみたいなコアを提案してたんじゃなかったっけ、ただ技術計算のような
分野には強いからサーバー向けとして使えないか考えていると思う。
はなからCellが強い分野に絞っているからSCEよりは明確で可能性のあるビジョンをもっている。
日エレによると、65nmのCellは、微細化でメモリセルが誤動作しないように
SRAMだけ電源電圧を上げ、ロジック部は消費電力押さえるために
電源電圧下げてるんだそうだ。その上でのSRAM動作周波数が6GHzと。
はたしてロジック部も同じ速度で動くんだろうか?
>IBMはPXみたいなコアを提案してたんじゃなかったっけ
してない
やったのはコントロールポイントプロセッサのPPEもSPEと同じ命令セットにする予定だった所に
Powerコアを差し込んで命令セットを2種類にした事とか
SPEそのものは東芝とIBMの共同開発
そうなのか。
だからPPEをはずしてSPEのみのCellを作ろうとしてるのか?
金払ってまでPPE使う理由はないわな。
785 :
名無しさん必死だな:2007/01/13(土) 09:32:55 ID:7DjXWPUI
ISSCEの5MHz強の65nmプロセスcellのプレゼンはマイクロプロセッサのセッションだよ。
5−1だよ。SRAMの話は別のセッション。
786 :
名無しさん必死だな:2007/01/13(土) 11:39:55 ID:UQeXex8W
>>777 >2〜3個のコアに共有キャッシュをつけたのを複数搭載するのがいいんでしょうね。
これは大正解かも、今はWebアプリケーションが流行ってネットワーク間リモート呼び出しのライブラリが完成している。
数個のコア+オブジェクトをシリアライズして別のコアセットに転送する装置を作って。
ライブラリはXmlシリアライザを改造して、同一インターフェイスで実装する。
ソフトからの見てくれは爆速イーサネット接続のPC群といった所ですかね。
ネットワークライブラリとかなりの部分が共通ライブラリで実装可能になり、コードサイズの圧縮→キャッシュヒット率向上にも貢献しそうです。
またWebサーバーでのロードバランサー等のノウハウも活用できそうです。
788 :
名無しさん必死だな:2007/01/13(土) 11:57:37 ID:UQeXex8W
>>786 に追加、さらにコアを増やす時は、数個まとめては、また一つにして纏め・・と、このままツリー構造的に作っていく。
ここで通信方法として効率の高いWinyのアルゴリズムを使う。
>>786 それって大規模マルチプロセッサの
教科書的な実装法そのままじゃない?
790 :
名無しさん必死だな:2007/01/13(土) 12:01:15 ID:UQeXex8W
シンプルイズベストですよ、変化は一コアでやってしまうという所で、極太バスが使える点のみ。
オレの考えたCPUはスゲーのスレですか。
箱○CPUの未来が見えた
やっぱCellは間違いだよなw
>>792 ID:2Yp6RIEu
自分そこまで分からないから具体的にどう良かったのか、
その未来とはどういうものなのか教えて?
逃げるなよ
794 :
名無しさん必死だな:2007/01/13(土) 12:48:29 ID:UQeXex8W
ソフトウェアで現在興味深いアルゴリズムが実装しやすいのは Xenon の延長線上かも知れませんね。
現在ではハードの進化だけでは高速化余地は乏しくなると思います。
ある意味CELLもツリー型な様な気がするけど
>>795 可哀想だからID:UQeXex8Wはそっとしといてやれよ
797 :
名無しさん必死だな:2007/01/13(土) 13:03:58 ID:yCmDD7AF
このスレってまともなコードが書けない奴しか居なさそうだなw
798 :
名無しさん必死だな:2007/01/13(土) 13:05:48 ID:UQeXex8W
コードは書けなくてもいいので、どういうソフト技術が存在するか程度は知っておいて欲しいとは思う。
研究者にまったく相手にされないxenon (´・ω・`)カワイソス
ゲームソフト開発者に相手にされまくりの Xenon (・∀・)カコイイ!!
801 :
名無しさん必死だな:2007/01/13(土) 13:47:49 ID:fNvtsuMp
このスレって時々すごいのが現れるよな。斜め上向きに
802 :
名無しさん必死だな:2007/01/13(土) 13:49:26 ID:fNvtsuMp
このスレって時々すごいのが現れるよな。斜め上向きに
804 :
名無しさん必死だな:2007/01/13(土) 15:57:15 ID:qIIRzKKq
処理の粒度によって、取り扱うデータのサイズが大小が変化する傾向がある訳ですが
処理の粒度、効率の上昇するプロセッサ数、入出力されるデータのサイズには、同一の傾向がでると思うんです。
キャッシュはある意味最小の粒度でのデータ転送方式といえるかも知れません、DMAのような方式はかなり大きい粒度に向いているでしょう。
世代別ガベージコレクタという概念がありますが、生存時間別に最適なアルゴリズム実装されているものです。
プロセッサも、プログラムの粒度別の最適解を持たせて、それを階層化すると良いかも知れません。
805 :
名無しさん必死だな:2007/01/13(土) 16:01:20 ID:qIIRzKKq
SPEの最大の問題点は、SPEが上手く取り扱える処理の粒度が小さい事なのかもしれません。
>>786 こっちの方がグリッド構想に近いよな、イーサネット接続でも性能を期待出来そうではある。
Cellではデータの粒度が大きすぎてトラフィックが増えてしまうからネット向きではないんだよな実は。
Cellの欠点はコヒーレンシ制御を無視して制御プログラムも完成出来ないまま発売した事に尽きますね。
未来が見えてきたところでCellスレの役目も終焉を迎えているのかな。
808 :
名無しさん必死だな:2007/01/13(土) 16:20:59 ID:jZ2R8UI5
それはないから仕様をよく読んで
プログラム書いてから書き込みしろよな
>性能はPS3の方が上なんじゃないか?
上なんじゃないか?なんてどころじゃなくて、圧倒的に上だよ(笑
メモリ帯域倍、CPU性能倍 = トータル4倍の速度差。
>>809 7500万ポリゴン並みの表現だから実行性能は1/20に割り引とけよw
語ってる奴正確な数値さえ知らないだろ
>メモリ帯域倍、CPU性能倍 = トータル4倍の速度差。
ここに突っ込んで欲しかったんだが
814 :
名無しさん必死だな:2007/01/13(土) 17:36:01 ID:qNSaJe9r
クロックサイクルが少なくても周波数が高い方が基本的に速い。
実際にはゲームなんて同じような命令の連続だから、クロックサイクルより
命令数と周波数の高さが速さの鍵となる。
よって8bitよりは16bit、4Mhzよりは8Mhzの方がどんなCPUでもたいてい速い。
わかった?クズども。
>>812 ゆでたまご理論によればそれは問題ない。
>>808 プログラムコードを書けない大便GKがえらそうに言うなアホ。
>>
>>808 仕様書は嘗め回すように読みましたが都合の悪い部分は書いてないので、いじってみるとあれれぇ?ってのが山ほど出てきますけどね。
仕様書に書いてあるから出来る筈だという議論は不毛ではないでしょうか。
メールBOXでSPE間の小規模データ共有ってだれか試してみた?
最近は実例を挙げて反論されるから
>>808みたいに否定だけして具体的な反論もせずに切り捨てる低脳が増えたな。
もう、限界か?
どっちも仕様書持ち出すなら何Pの何行目とか書くべきだよなw
Cell派の反論といっても、1年前の妄想スペックをコピペしてるだけじゃん。
あとは仕様書読めばわかるとか、切捨てで逃げるだけ。
もともと、ここには低脳信者しかいない。
どっちもどっちってことね>Cell派、反Cell派
>808 がどれに対して答えてるのか不明な件について
>>785 5.1は同じIBMでもPower6なんだけど?
>813
そのスレのどこにもそんな記述は無いのですが。妄想ですかw
シム板で見たよ。
Cellスレに合わんが、CellよりRSXが足を引っ張ってるのは
明らかだろ? 詳しくは分からんが、RSXの負荷を軽くするための
Cell(ってかSPE)の活用方法って、あるのか?
モタストが720p30fpsになったのって、物理演算は足りてるけど
描画が足引っ張ってるように感じてしょうがない。
GTHDが1台しか走れないのもそうだろ?
いくらCellが頑張っても、見た目が箱と変わらないんじゃ意味ないんだが。
結局、ゲーム用途としてのCellが最大の需要なんだし。
このへん、どうなのかね?
モーターストームは、グラフィックだけじゃなくて
それに見合う挙動の大切さってのがよくわかる好例だと思うがね。
RSXが厳しいのはバス幅だろ、アウトプットが問題ならCellを使ってインプット側いじっても無駄かと
いや挙動を軽視してる訳じゃないんだ。
ただせっかく物理がんばってるなら、なおさら60fpsで見たいだろ?
で確かSPEはRSXの補助としても使えるみたいな記事を以前見たことあったから、
PS3ってのはどのぐらい可能性を秘めてるのか、気になっただけだよ。
興味程度の話を思ってくれればいい。
バーテックスシェーダーの代わり程度にはなると思うが使用するまでも無くRSXの機能で間に合っていると思われ
ここで聞く話じゃないかも知れないが
キャラ同士が突き抜けたり地面に足が突っ込んだりするのは何で?
やっぱ全部を"ある"って事には出来ないわけ?
車メーカーがやっている衝突シミュレーション
で使われるモデルと、かかる時間を考えれば
どんだけ無理な要求をしているか想像付くんでない?
>>835 そこに処理負荷を割くよりも別のところに処理負荷割いたほうが面白い事ができるから。
よく見ないと分からないような所は実際ゲームをやり始めたら目に入りようが無い。
>>836 衝突シミュレーションで使われるモデルが知らんw
>>837 そうかー。でもやっぱ不自然なんだよね。グラフィックがキレイになると余計に
その段階までいけるぐらいにゲーム産業は持ちこたえられるのかな・・・
CELLにしても物理演算をちょっと踏み込んだぐらいしか再現できないか。
キャラすり抜けについては、三体以上が衝突するところでは単純に難しいから。
それにdt=1/60だと高速移動でトンネル効果が発生してしまう、量子力学は楽しいぜw
dt=百万分の一秒程度までもっていければ、ほぼ完璧に抜けないは実現できるかも
それと、全ての計算が線形計算で済むので、計算楽チン。だが無理だwww
それとfloat、dtをあまりに小さくすると、ここにちょっと問題が出そうだ。
>>838 リアルタイムにソフトボディダイナミクスをやれれば衝突時に変形してめり込みはなくなるけどね。
不自然なのは接触判定が座標で計算されていて、頂点やポリゴン単位で判定しているわけじゃないから。
縦シューティングの自棄の当たり判定が中央部にしかなくて、多少かすってもゲームオーバーにならないのと同じだね。
PXはDOAX2みたいに軟体シムをやっているから出来なくも無いがCellは剛体物理を数こなすのは得意だが複雑なタスクをLSじゃまかないきれないから苦手と言われている。
>>841 >不自然なのは接触判定が座標で計算されていて、頂点やポリゴン単位で判定しているわけじゃないから。
あ。そうなの?へー。へー。へー。
ポリゴン単位で判定できないの?よくわかんねえけどそれにはMAP全体のポリゴン全認識が必要なのかな?
なんか想像するだけでもとてつもない物量になりそうだけど・・・
ポリゴン単位で凹凸汎用の当たり判定は、超高速に点から三角形への立体角計算ができると頂点数の二乗オーダー程度でできるようになるかも知れない。
良い方法はないかなと思っているのだが……
二次元版であるatan2でも散々なので無理か……
空間をボクセルに分割して、ボクセルごとに関係する頂点だけを分類して
その中だけで判定していくのが普通じゃないの?
メインメモリーは狭い、LSはもっと狭いPS3でボクセルはやばいかも
>>845 前処理でボクセル内の頂点数がLSに載るサイズになるまで
分割するようにさえできれば、各ボクセル内での判定は
完全に並列化できるからCell向きの方法だよ。
レイトレと同じようなことをするわけだし。
>>846 仮にできたとしても、計算量が分割数の三乗オーダーなので、あまりよい方法ではないかもしれないです。
>>847 当たり前だけど分割処理の計算量が無視できる範囲なら
分割数が増えるほど全体の計算量は減るよ。
>>848 それをやるのは無視すると大変な事態を引き起こすPPEなのではw
コリジョンデテクションにもPSのGTEのような専用ハードができるとちょっと面白いんですけどね。
とりあえず、積和計算は十分な性能が取れたので、初等関数、特殊関数周りに少し強化を入れてみたいところ。
それともう一つは、外積代数周りの計算を手際よくやれる機能ができると、また新しい世界が開けそうな気がします。
内容的に高度な内容を含むので作る時はPSの時みたいに使い方をサードに見せておく必要があります。
#PSのマニュアルの3Dの解説文はよかった、その辺の糞本読むくらいならPSのマニュアル読めといいたいぐらいだったですね。
>>840 速度ベクトルで衝突判定すればdtがどんなに長くてもすり抜けはないyo。
>>851 二次元なら簡単だが三次元になると、速度ベクトルで引き伸ばした物体は物凄い形になるぞぉ
どうやって判定すればいいのか脳みそとろけますよ
真面目にやるなら物体の外形の運動の軌跡を時間の関数で表して
其々の関数の接触時刻を求め、一番近い物が実際に衝突するとして
その後の運動を更新して・・・みたいにするしかないでしょ。
>>851 dtが長いと単一ベクトル表現じゃ済まないでしょ。
回転運動も含むんだから。
それに、速度ベクトル込みで判定するって事は面を速度ベクトルで
押し出したボリュームで交差判定にかけるって事だから、そりゃ
抜けないだろうけど劇重にならんか?
速度ベクトルを使ってまともに当たり判定のできるのは、回転しても形が変わらない、伸びても筒と半球のみのボールぐらいですかねw
モデルの形状で真面目に衝突判定したらそりゃ激重だろうけど、そこはごまかすですよ。
とりあえずオブジェクトの中心からベクトル伸ばして箱への衝突だけでも先にやっとけばスッポ抜けは防げるし。
それを体のパーツごとにやれば見た目には十分な効果は得られるっしょ。
857 :
名無しさん必死だな:2007/01/13(土) 22:05:07 ID:3U00zr2J
RSXは、基本的にスレ違い。
こういう事を言うと、
>ROPが8本
>ROPが8本
>ROPが8本
>ROPが8本
を繰り返すお馬鹿さんが現れるからやめましょう。
じゃあ次は狭いところにオブジェクトがぎゅうぎゅうのすし詰め状態で抜けない方法ですなw
859 :
名無しさん必死だな:2007/01/13(土) 22:08:26 ID:RuaNueUk
>>857 ハイエンドビデオカードと比べて半分程度のメモリ帯域しかない。
=ショボグラw
これでいいですか><
>>855 例えば回転する箱と箱の衝突の場合は箱の各頂点の回転運動後の速度ベクトルを使えばいいyo
人体みたいに複雑な形状でもそのやり方で正確に判定できるけど、普通はそこまでする必要はないだろうne
草を踏むときなんかが一番難しそう
呪文 「それでゲームが面白くなるの?」
863 :
名無しさん必死だな:2007/01/13(土) 23:02:40 ID:Y1ycboG4
SCEI理論ではグラフィックが実写映画みたいに綺麗になって、動きがリアルになって、音楽もリアルになって大容量のムービーがつけば面白いゲームが作れるんだよ、しらないのか?おまえ。へぼいな。
呪文2 「そのタスク 256kバイト(2Mビット(笑))でできんの?」
物理エンジンでソフトボディやるときはフリーフォーム格子でオブジェクトを
覆って格子の変形にオブジェクトを追従させるようにしてますな。
現在の判定オブジェクトよりはめりこみも軽減できるようです。
866 :
名無しさん必死だな:2007/01/13(土) 23:21:29 ID:Y1ycboG4
クタ理論によれば、海外のゲームクリエイターはすごい
僕たちが考えもつかないようなことをやってのける
彼らならどんなものでも完璧に使いこなしてくれる
まあ、海外において世界一のトップガンと称されそうな人に駄目だしされた訳ですが。
>>868 あぁ。ずばりっぽいッスね。
文系ながらに斜め読みしてみます
そうだ、アヒル軍曹の剛体をすっかり忘れてた・・・
871 :
名無しさん必死だな:2007/01/13(土) 23:52:12 ID:xoLMMbxS
おまえら騙されすぎ
>>860 またそんな適当な。
「くるくるくるりん」状態で抜けるでしょうに。
今の最速のスパコンがコンシュマー1機で使えるようになるには、後何年必要?
20年から30年
プログラマってのはサボってナンボなのね。
逆説的だけど、サボるために、頭を使わないために全精力を傾けるのがプログラマという生き物。
「頑張れば性能が出るアーキティクチャ」ってのは、
性能が出ない=頑張ってない、てなことなわけで、
開発者にとっては嫌なもの。
カーマックが言ってるのは、そういう事。
>>876 それなら「頑張らずにPS3の性能を引き出すライブラリなり
コーディングイデオムを作る事」に精力を傾ければいいんじゃねの?
頑張るっていうのが頭脳労働ならまだしも
まさにデジタル土方な単純作業だからなぁ。
Cellを絶賛するのは変態趣味人だけ
>>876 いや違うよ。
普通にゲーム用途として間違ったアーキテクチャだと言ってる。
それに対してPXは良いアーキテクチャだとも。
カーマックさんは他コアプロセッサそのものを否定する発言もしてるから(後に撤回発言もあるけど)
あの時点はCell固有の問題点について述べたわけじゃないよ
そりゃ、同じ労力使うなら、アプリケーション側に注力したいわな。
その昔、IMPPというプロセッサをNECが開発してなぁ・・・・
新聞も大々的に報じてくれたんだよ・・・・出来たソフトは指紋解析一つ・・・・
じじぃは帰れ!ですか?
>>883 その子孫かどうか知らんが、NECエレのIMAPCARがレクサスに画像認識チップとして搭載されてるね。
第五世代コンピュータというのは知ってる。
886 :
名無しさん必死だな:2007/01/14(日) 10:42:20 ID:O6zakRfR
>>857 R600が16ROP、メモリバンド幅140.8GB/sなのに
Xenosは8ROP、メモリバンド幅22.4GB/sかw
結局、変態過ぎて、ゲーム用途でも微妙だったでFA?
888 :
名無しさん必死だな:2007/01/14(日) 10:46:44 ID:waYR/dSj
努力して面白くなるなら、やる気もでると言う物ですが、努力してやっと普通というのは……
さらに追い討ちを掛けるのが、努力して性能を出してもインパクトが以前のようには無い所。
ではと、方向性に変化をつけようとすると、ソフトはちゃぶ台返しにされていている、基礎から作り直しorz
穴をほっては、また埋めてって、それは最悪の拷問です。
トップガンだってはだしで逃出します
>>887 PXなら、もっと大きくゲームを変えてくれるはず。
Cellが難しいとか努力しナイトとか言っている奴は
本物のトップガンとは言えないんじゃね?
Century's most
Excentric
Low
Level
プロセッサ
892 :
名無しさん必死だな:2007/01/14(日) 11:14:37 ID:O6zakRfR
Nehalem MA、Bloomfieldは4コア8スレッド
やっぱヘテロジニアスは時期尚早w
893 :
名無しさん必死だな:2007/01/14(日) 11:14:48 ID:hmCT9mY1
>>886 箱〇のGPUは、eDRAMが付いてるから帯域は大きく採ってある。
クタタンの脳内の中では、本当に
>>863が笑い話で言ってる冗談と同じことを言い出し
兼ねないんだよな。
>863 :名無しさん必死だな :2007/01/13(土) 23:02:40 ID:Y1ycboG4
>SCEI理論ではグラフィックが実写映画みたいに綺麗になって、動きがリアルになって、
>音楽もリアルになって大容量のムービーがつけば面白いゲームが作れるんだよ、しらないのか?おまえ。へぼいな。
脳内トップガン論を持ち出すクタタンに付き合わされるベンダーが正にいい迷惑。
894 :
名無しさん必死だな:2007/01/14(日) 11:14:57 ID:Nfd3N3iV
>>890 Cellが問題だと気づけないのなら、それは決してトップガンなどではなく知障プログラマーだ
でも誰もCellのどこに問題があるのか具体的に指定する人はいないんだよなあ
ただただ難しい難しい言っているだけで、それこそ知障プログラマーだと思うけどね
897 :
名無しさん必死だな:2007/01/14(日) 11:31:31 ID:O6zakRfR
インテル贔屓じゃないが、Cellの惨状見るとやっぱCore MAはネ申だろ。
899 :
名無しさん必死だな:2007/01/14(日) 11:33:53 ID:fS0ng3B4
>>895 多数指摘されている、君が問題点を理解できない池沼なだけではw
>>899 具体的な事を指摘しないで印象だけを語る典型的な例
>>890 トップガンは君の心の中にだけ存在するようだ、現実社会のプログラマはエスパーでもニュータイプでもない。
トップガン煽りに返答するのもどうか。
EEはプログラミングパラダイムの進化で対応出来たがCellは人類自体が進化しないと駄目みたいですね。
使いこなせるようになるには1億年ぐらい必要かな。
>>900 最近のレスでは
>>774以降あたりで少数のコアでのコヒーレンシ制御さえ問題だと指摘されてますね。
これに対するCell派の反論はとにかくプログラマががんばればなんとかなるという精神論しかしてないようですが。
具体的に通信ライブラリの例とか仕様書にあったメールボックスがどういう働きをするのかとか反論が欲しいところです。
905 :
名無しさん必死だな:2007/01/14(日) 12:37:35 ID:+hkMeymt
>>903 EEでも対応なんてできてねーよ、ベコベコになりながら進んでいるだけだ
まともだったのはR3000+GTEだけ。
>>904 >仕様書にあったメールボックスがどういう働きを〜
これも実際に書いてあるのかすら定かじゃないぞ。
>>895 ただ、プログラマががんばれとしか言ってないCell派が言えることかよ。
908 :
名無しさん必死だな:2007/01/14(日) 13:03:01 ID:Ymbpu5ki
>>904 コヒーレンシーの制御はハードウェアがやるのでプログラマーが悩む必要はない、以上
論破完了
やっぱりCellはすごい
ハード屋としてはCellは面白いのかもしれないが、ソフト屋からみて技術的に詰まらないというのも致命傷のひとつだな
プログラマががんばるために必要な資金を
SCEが援助すれば、いいんだよ。
いつまでループ続ける気?
実際にいじってるリナクス板の住人に聞いてこいよ
こことは違って住人が仕様書読んでるし、親切に教えてくれる
912 :
名無しさん必死だな:2007/01/14(日) 13:06:20 ID:Ymbpu5ki
>>909 理解できないからおもしろくないんだろw
俺みたいなトップガン級のプログラマーは結構面白く使ってるよ
>>912 何時までも低レベルな事やってんだ、バカじゃねぇーのって見解。
更なる上位層を使っての高度なプログラムをしたい今日この頃。
PXと比べてCELLは糞。
PXならゲームが変わる。
915 :
名無しさん必死だな:2007/01/14(日) 13:15:15 ID:Pgi15Ujp
けっきょくIBMだけは儲かるってことでFA?
916 :
名無しさん必死だな:2007/01/14(日) 13:15:51 ID:Ymbpu5ki
低レベルな事こそ高レベルなんじゃね?
これからは低レベルフレームワークを作れる高レベルな人間と
ゲームを作るだけの使い捨てのPGに2極化する気がする
>>916 ぶっちゃけDirectX程度で間に合ってます、変なフレームワーク要りません。
>>904 キャッシュコヒーレンシの問題がなんでCellに関係あんの?
CELLとPXの両者だと、どれぐらい変わってくるの?
>>918 最近はプログラムによる映像表現の向上等はほとんど見込めないんだよ、デザインレベルでほぼ勝負が決まってしまう。いい加減気づけ。
プログラマが暴れるべき場所は別のところにしないと、そのうち居場所がなくなってしまうよ。
メールボックスでどこモディファイしたか送ればトランザクションメモリみたいなのは
出来るんじゃないかなあ。LSはコピー作ってるのと同じだしね。LS以外の領域は
コヒーレンシは確保されるとか、他のユニットに対するMFCの同期コマンドとかあるけど
どうなんだろう。
そういえば、ジョブをSPEが取ってきたり発行したりを自律して行える機構がSDKにあるって
Byond3Dで読んだけど、コヒーレンシに問題あったら出来ないよねえ。SCEのワールドワイド
スタジオがすげえがんばった、とも書いてあったけど。
925 :
名無しさん必死だな:2007/01/14(日) 13:59:26 ID:Mp4XPMzB
スプライト時代からPSのポリゴン時代に移った時、プログラムはアセンブラからCへ、
ゲーム内容には上下のほかに奥行きという概念が付け加えられて、プログラム技術に大激変が起こった。
DS、Wiiと新しいディバイス、ネットワークが付け加えられて激変が起こっている、今回のハードではPSの時並みの激変が起こるよ。
古い技術でのすごかった筈のノウハウはすぐに役立たずになる、N64で任天堂がむちゃくちゃになった様に、これにPS3が巻き込まれる、絶対に逃げられない。
激変を詳しく。
て言うかPS3はギャルゲーやエロ下の移植が雪崩れ込んでPC-FX化して終わりと思うが。
>>927 PCから移植するならPS2しかないだろ。
PS3は殆ど普及しないんだから、PCから移植してもメリットが無い。
>>929 当時爆笑してたけど、ネタじゃなかったんだな。
我ながら先見の明のなさに orz...
スペック表をPS3と見比べてみると良い味でるなw
実際には、本体がすごく大きいのでコネクタが小さく見えるだけとか
4TFLOPSとか、消費電力1,200Wとか
精度いww
インプレスは7年前に予言できてたんだなw
>>929 ロンチがギャルゲーばっかりなのは
今のPS2を予見してたのかw
>>894 だな。
Cellを選択する時点でトップ癌でもなんでもない。ただの変態PG。
このスレってノイズ大杉なんだよなー。
ほとんど読むべきレスがない。
Linux板見てきたけど、ゲハ厨が湧いてて迷惑してたぞw
P4とCellの自前ベンチの結果出てたけど、思ったほどの差はないな。
これが、対PX、Core2なら、もっと差がなくなるんだろうな。
>>935 Linuxスレも苦戦してる感じだな、インストールしたところでSPEの開発がわずかな
ライブラリとC++だけでは何も出来ない、それと移植性の悪さで挫折するのがほとんどで
先に進めない状態、OpenMPさえ対応していなのでは厳しいよな。
さりげなくCore2DuoにPXを並べてるのが素晴らしい
ろくに開発環境がととのっていない事を指摘されると逆切れするのはゲハ房ですかね。
ほんとインストールまでで終わってしまっている。
つか、レガシーなスレッド風のAPI spe_create_thread()なんかもあるが、
隠蔽のオーバーヘッドがでかすぎて駄目駄目だから、ラッパなんかには期待せず、
はなからCELL向けの書き方でやれと巷のドキュメントにもあるな。
やっぱり、開発環境の整備はSCEが率先してやんなきゃ先がないな。
トップガンとか、そういう問題じゃないな。
IBMはサーバー用途でのライブラリは整備しているけどゲーム用途はあまり興味無いからな。
まぁ、シロートの議論だから、仕方ないんだけど... OpenMP はSMP用のライブラ
リなのでSPUには関係ないです。コヒーレンシーもキャッシュのことを指すなら、
SPUには、もともとそんなものないので関係ない。
逆に、EMT64/IA32系のメニーコアだと、通信はキャッシュ経由が必須なので、
コヒーレンシーの問題は大きい。結局、ビジーウェイトするしかないんだろう
と思う。コア間の通信命令とかが導入されるとは考えづらいし。メインメモリ
に負荷がかかるような並列化ではメニーコアの利点は活かせないし。
Cell は、メインメモリと複数のSPUの間にデータフローを構築するような
プログラミングをするように設計されている。なので、当面の課題はライブラリ
の構築でしょうね。コンパイラに頼れないのは当然だが、データフローは
人間が設計する方法がある。データフローのパターンは多すぎて、自動的な
最適化は難しいでしょう。って、70年代の研究の話そのものだけど。
この手のデータフロー型のプログラミングは全体的には決定的に動作するので、
非決定的な同期は不要。プログラミング的にも実は易しいです。ただ、台数
効果しか出ないので、つまらないとも言えるがね。
>>943 だからIntelはトランザクションメモリ検討してるんだろ。
>>944 > この手のデータフロー型のプログラミングは全体的には決定的に動作するので、
>非決定的な同期は不要。
ゲームの場合、SPEの処理時間が決まっているわけではないので決定的ではないけどね。
難しいのはXDRにアクセスするスケジュールプログラムかな。
池沼に質問なんだけどなんの苦労もなく性能が発揮される
CPUおしえてくんね?
3歳の甥っ子でも使いこなせるヤツをよ。
i4004
>>946 どういう処理を想定しているのかね。処理時間はSPEとLSで完結
している処理はサイクルレベルで決定的。
543 :陸奥 :2006/09/23(土) 10:52:58 ID:+hmnAAbj0
PS3用のCELLは3.2GHzと高速なコアが8つも動いているが、その内訳は、親分であるPPEが1つと
残り7つの子分SPE。子分はメインメモリから超遠い場所にあるので全て親分を通して仕事を
小分けにして貰っています。仕事は速いが記憶力は無いので命令は手短に。言わば直線番長。
MPEGのデコードや、核爆発のシミュレートなら問題は無い。決定論的世界。
「画面や空間を7等分して、自分の番号の区画を計算してね、式はこれ。」
「最初のデータは自分の番号に100を掛けた番地にあるよ。終わったら700足して次ね。」
「その計算終わったら、次の計算式は隣のアドレスにあるから、今の計算式を上書きしてOK。」
「38個の計算式全部終わったら教えて。」
親分はこれだけ指示を出して、次のフレームまでマインスイーパー。
だけどね、例えばレースゲーム、プレーヤーによる不確定要素多すぎ。
「画面や空間を7等分して、自分の番号の区画を計算してね、式はこれ。」
「最初のデータは自分の番号に・・・あれ?」
544 :陸奥 :2006/09/23(土) 10:56:02 ID:+hmnAAbj0
子分1「親分!予定ではインベタでシケインをクリアする筈が、この馬鹿プレイヤー急に
アクセルを踏んでコースアウトしました!!自分の計算担当区画は既に壁の中ですが
処理すべきデータ無し、暇、仕事無い?」
子分2「ああ、さらにパニクッてセレクトボタンで後方視点にしてるっ!一気に12台の後続車が自分の
区画に入ります、このままだとポリゴンが多すぎて一度に衝突計算できません。分割希望。」
子分3「タイヤのスキール音を鳴らしたいので、音色データアドレスと車速、相対位置、ブレーキ強度
のデータを8台分送ってください。あと疑似7.1chサラウンドの計算式を忘れました。再送求む。」
親分 「ええっと、じゃあ子分2のポリゴンを分割して子分1に送るから、ポリゴン分割は子分5に
任せた。子分1と2はコースデータを保持、それから子分3はなんでそんな事忘れてるの?
え、さっきのコースアウトで多重衝突の計算式とデータに入れ替えましたか、そうですか。」
子分5「え、今ポリゴン分割計算式貰うと、自分の区画の位置データと運動方程式、忘れるけどいいの?」
子分1「ひまー。」子分2「ひまー。」
親分 「ちょっと待って、サーバから対戦要求来てる・・子分7はシステム担当だよね?相手して。」
子分7「今サウンドプレイヤーのマイ・ベストランキングを暗号化しながらフレンドと交換中でーす。」
親分 「おい、水たまり踏んでるけど、パーティクル用意・・あ、フレーム落ちた。」
545 :陸奥 :2006/09/23(土) 10:58:19 ID:+hmnAAbj0
こうならない為に、ある程度事前に子分の負荷を予測して負荷分散してやらなくてはならないのですが、
核物理等の数値計算系と違い、映像、物理計算、音響、システム管理、通信処理等の負荷がインタラク
ティブに1/60秒単位で変化するゲームやOS処理では、複数のコアの全てを常に休まず働かせる事が
非常に難しいのです。だからカタログスペック通りには能力を発揮できません、コンパイラと、主には
プログラマの腕次第です。タダ乗り時代は終わった!!らしい。
512 :大将 [] :2006/09/22(金) 02:34:16 ID:5BcAUztB0
んー
cellはスパコン業界じゃ流行らないんじゃないかね。
結局数字の上でのspecと実際のspecの乖離が激しそうだからね。
linpackで鬼のようなスコアを出すBlueGeneが国内でどれだけ入ってるか知ってるか?
僕の知る限り、茨城辺りに1件だけだよ。(*実際は数件ある)
ところが、
>>1のサイト(tarusan)で散々叩かれてるItanium2ベースのスパコンなんて
国内で死ぬほど納入実績がある。
帯域だのピーク性能なぞで実際の計算が出来るワケじゃなくて
科学者が組んだ解析プログラムがいかに速く計算出来るかが問題なんだよ。
その点でItaniumは非常に優秀であって、cellがどうなのかは未知数。
少なくともウチ等近辺ではcellは話題にもならない。
価格対性能比ではまだしも、単体性能の比較では比べるまでも無いと思う。
長々書いた結論がこの通り。
>どうなのかは未知数
で、印象操作として
>ウチ等近辺ではcellは話題にもならない。
ちょっと知能が低すぎると思いますよw
GK乙
Cellオワタ
なんちゅー不自然な進み方、GK自演頑張りすぎワロタ
今日のGK
ID:7EUL80XW
まぁ、GKはともかく、データフロー型と捕らえるのは良い線いっていると思うよ。
ここまで書いたなら一歩進めないとね、関数型言語系への移行が必要となると思うけど、
クロージャーとかと絡めてやって欲しいなw
今日も今日とてアンチが必死だなw
■ おすすめ2ちゃんねる 開発中。。。 by FOX ★
このスレを見ている人はこんなスレも見ています。(ver 0.20)
Intel uPs Info 2 [新・mac]
Intel uPs Info 2 [新・mac]
【kboot?】PS3 Linux 初心者質問 Part 1【vi?】 [Linux]
【SPE】PS3 Linux Part 4【YDL】 [Linux]
nViDIA厨 vs AMDATi厨 vs S3厨 Part 38 [自作PC]
>>949 SPEとLSだけで完結してないから困ってるのでは?
パフォーマンスを求めるなら、PPEセントリックじゃなく、SPEセントリックな構成にするべき、
とドキュメントにあるわけだが。PPEは親ではなく、サービスコプロセッサと書いてある。
タスクが終了してXDRに書き出したあとSPEがボーっとほうけている時間もかなりあるよな。
SPEが自律的に動作するように全体の設計を変更しろよ。
自立的に動作しても依存性のある処理では要求するデータが来ないと駄目じゃん。
見積もりも出さずに経費を計上出来ないだろ。
ゲームの場合、60分の1秒毎に処理内容は決定されるから、上の長文君が言うようなことにはならんよ。
しかしよくもこれだけ長々とでたらめを書けるもんだな。そのバイタリティには感心するよ。
そしてこのスレもその手のが多い。というかほとんどがそう。
何もわかってないくせに専門用語を羅列しただけで何かを書いた気になってる奴がいるよね。
そして最後は必ずCellだめぽで締める。
まったく朝から晩までよくやるよな。
>>945 まだ研究段階の技術と既に世に出ている製品を比較しても...
それと、Intelが検討しているトランザクショナルメモリって
共有キャッシュが前提じゃなかった?
いずれにしても、8とか16とかの多コアで実用的に使えるように
なるまでにはまだまだ課題が多いように思うが。
>>967 処理のスライス単位は変わっても同様の事情は発生しまくるってw
長文コヒペ分かりやすくていいじゃんwww
Cellだめぽ
奇形児Cellはなんの為にこの世に生まれてきたのだろう
>>971 おまえマジで精神が醜悪で気持ち悪いよ。
技術屋さんの笑いを取るためじゃ
974 :
名無しさん必死だな:2007/01/14(日) 22:55:01 ID:Zf52+QnO
クタたんと愉快なイエスマンたちの社運を掛けた一発ギャグ、それがCell
GEMMをブン回してニヤニヤしたい人のため
MPEG動画48本同時デコードしてニヤニヤしたい人のため
大丈夫、数は少ないけれど奇形マニアはいるのです
彼らはこのスレで毒電波を垂れ流していますが暖かく見守っていきましょう
>967
GHzなCPUに取って60分の1秒ってのがどれだけ長いかってのがわかってない
から、「60分の1秒毎に状況が変わるからSPUが対応出来ない」みたいな印象を
持つんだろうなぁ。
PPUが状況が変わる毎にSPUの構成/スケジュールを調整するというような感じ
がCell設計者の意図だと思う。いくつか決まった構成を用意しておいて、それを
オブジェクト毎に選択するような感じか。状況の変化は実際には1/60よりは、
ゆっくりだろうし。オブジェクトの生成消滅や爆発イベント、ユーザの入力変化
などだよね。
そういう意味では、Cell プログラミングコンテストの課題が「ソート」ってのは、
理解に苦しむなぁ。もう少し計算量の多い例題でないと特徴をいかせないんじゃ
ないか? 比較演算のコストが高くて、データアクセスのコストが低いような例題
を設定しなきゃならない。
クソコテかつ変なたとえ話を持ち出す奴は間違いなく笑える文章書いてるな。
今までのソートアルゴリズムが効率的に動かないんだから
新しい手法を探ろうとする試みは普通だと思うが
リナクス板に迷惑かけんなよ
ゲハがなんで隔離されてるか考えろw
うめ
>>977 ただHDDなんかのI/O待ちが生じるシチュエーションだと16msもそんなに長くないのも事実。
ゲーム機や家電はリアルタイムシステムだからよいが、汎用OSではSPUのアクセスしたメモリブロックが
スワップアウトされてるかもしれない。そのときにSPUはコンテキストスイッチするのかストールするか、
判断が結構難しいんじゃないか?
I/Oアクセスそのものに対してイベント駆動で書くんだろうな〜
どの粒度で待とうが、待ちの間に簡単にはタスクスイッチできないでしょってこと。
>977
しかし現実問題としてPPEの付加が大きくて困ってるという話は良く聞く。
でているゲームからしてもCellスゲーと言える物は少ないのでは?
まぁCellスゲーってゲームは、箱○とのマルチでは厳しいと思うけどね。
良い意味でも悪い意味でもね。
箱の方がPS3に移しやすいが、逆はだめってのはあるよね。
PS2の時にもハードの使いこなしには時間がかかった。今回も1年ぐらいはかかる
だろう。SCEIも、そんなに早くPS3に移行されても困るだろうし。
エンチャントアームとか完全移植にはほど遠いし、箱○のゲームでもPS3に移植が無理そうなのはいくらでもあるが。
マルチ前提で作ってあるタイトルなら移植できて当たり前だろ。
あたま悪いんじゃないの。
990 :
988:2007/01/15(月) 19:07:13 ID:8rUp0VXd
>>989 あんま突っ込むんじゃねえよ!!!はり倒すぞ!!!
>>989 F1とかレジスタンス・MGS4を見る限りPGR3やGearOfWarやロスプラはPS3には無理そうだなと思うな。
地球防衛軍3はグラしょぼいからCellを使いこなせば出来るようになるかも。
>>994 じゃあPS3はエブリパーティーも無理だな。