ついにベールを脱いだマルチコアCPU「Cell」 SONY、IBM、東芝が共同発表
424 :
名無しさん@5周年:05/02/11 23:31:29 ID:mz5G0sVb
IBM TOSHIBA SONY が共同でフリーの最適化ブンブン回しコンパイラを
無償提供したら、X86アーキテクチャは死ぬな。
でもしないんだろうな。馬鹿だから。
とりあえずここまで読んでみたが・・・
マッタクワカラン!!!
ローマ字とカタカナと数字ばっかり。
だれかこのCPUのすごさをクマーで
「いまこの辺り」ってやって下さいm(_ _ )m
427 :
名無しさん@5周年:05/02/11 23:57:13 ID:mz5G0sVb
>>426 分からないなら分からなくて良いと思うんだけど…
なんでわからない事を分からないまま知りたがるんだ?
馬鹿でも良いじゃないか、馬鹿のまま生きていけばそれで幸せだよ。
馬鹿なんだから黙っとけと言われたら、黙れば良いだけ。
なんでそれじゃ駄目なんだ。それで良いじゃん。
無理してまで調べたく無いのなら、無理して調べなきゃ良いだけ。
そんなに馬鹿なのに、なんとなくで理解しても馬鹿なままじゃん。
偉くなるわけじゃないじゃん。クマで、10クマーなら凄いと思うの。
で、その知識をどうやって使うのよ?友達にCELLは10クマーなんだぜ、
凄いだろうって言うの?違うじゃん。そんなの全然駄目じゃん。
だったら馬鹿のままで良いと思う。そんな君が好きだとは言えない。
馬鹿嫌いだから俺。でも、そんな君のままで良いと思う。それが君って
物だから、無理に自分を変える必要無いよ。君は君のままでいい。
馬鹿でごめんなさい。
俺東大院だけど、パソコンの知識はなくて。
安心しろ。
本当に東大院なら必要なときにちょこっと調べればすぐ当たり前に
知識もついて使いこなせるから。
430 :
426:05/02/12 00:08:23 ID:lfw7GUMZ
>427
>そんな君が好きだとは言えない。
誰も藻舞なんかに「好き」って言われたないわい!!!
でも漏れはそんな藻舞がスキかもしれないゾ。コノヤロメ!
432 :
名無しさん@5周年:05/02/12 00:15:53 ID:V6JwcKZg
>>426 じゃあわかりやすく教えてあげまつ。
中心にあるPPEはいままで通りの働きです。
例えていうと一枚ずつ書類を読んで判を押します。
8個あるSPEはそれぞれ複数の書類を一度に読んで判を押すことができます。
これが一つのセクションに集中して固まっているので
互いの作業をすばやく大量にやりとりできる。
しかしSPEには欠点があります。
それは書類を読む形式が決められていること。
一度に3枚読もうとするなら、机の上にA , B , Cの3種類の書類を正確に順番に積み上げておかないと読んでくれません。
先にAだけ読むとかCだけ読むとかそういうことはできない。
A , B , Cを同時に読んで判を押してクリップで挟むを繰り返す。
PPEはどのような順番でも処理できるので汎用的。
SPEは決まった順番でないと処理できないので単位時間の処理は早いけどもの凄く扱いづらい。
433 :
名無しさん@5周年:05/02/12 00:17:46 ID:zH0Q8zKV
('A`)
434 :
426:05/02/12 00:29:28 ID:+FzZ/p+n
>432
そこまで噛み砕いて語ってくれたにもかかわらず
とにかくありがとうございますた・・・消えます・・・
435 :
名無しさん@5周年:05/02/12 02:30:35 ID:q3VfaRRX
436 :
名無しさん@5周年:05/02/12 02:33:30 ID:JG1YlCWC
SONYとか東芝とかIBMって優秀なコンパイラー屋抱えてるのかなぁ・・IBMならそこそこ
いるか。この分野はIntelとMSが根こそぎ人材さらってるから、えぐい最適化するような
コンパイラは出てこないんじゃないかなぁ。てかこのCPUで自動で最適化効かすって相当
無理があるだろ。やっぱ人がある程度考えてコード書いてやらないとどうしようもならなさ気。
>Cellの発表会で説明していた10倍の性能差というのは、理論上は誇大ではない。
メモリの帯域やストリームがストールした場合のペナルティギャップとかを全く無視して
「完全に滞りなくフル回転できたと仮定した場合のピーク性能」という、まったく意味のない数字だけどな。
まあ、これから5年やっていくゲーム用のCPUとしては、このくらいで妥当なところじゃないの?
439 :
LV14の勇者様 ◆zPDVctO00E :05/02/12 04:36:30 ID:PWvRAl7D
>>438 10倍の、元になっている数字も、理論値じゃねーの?
そんなら問題無くないか。
>10倍の、元になっている数字も、理論値じゃねーの?
「互いのピーク性能の比較である」と前置きするならば、問題はない。
>そんなら問題無くないか。
で、その前置きがない訳で。
高速なプロセッサになるほど、ストール時のペナルティはより大きくなるんだよね。
ここまで高速なプロセッサになると、むしろボトルネックがどこに存在するか、
ボトルネックの帯域がどのくらいあるかが重要になってくるわけ。
441 :
名無しさん@5周年:05/02/12 04:48:17 ID:JG1YlCWC
>>440 Cellのメモリ帯域は25.6GB/sec。これは、現行のデスクトップPCのデュアルチャネルDDR2-533の帯域8.5GB/secの約3倍。
Cellのチップ間インターフェイスの幅は96bitで帯域は最大76.8GB/secとなる。
PCI Express x16でさえ帯域は8GB/secなので、PCI Express x16の10倍近い帯域。
それと、これをマルチコアCPUと呼ぶのもどうだかって感じだよなぁ。
要するに汎用(メイン)CPUは1個しか載っていない訳だし。
ゲームというリアルタイムCG処理にその性能の大半を割く用途に、
CPU1個にSIMDの化け物を8個、オンダイで同居させました、ってだけの話で。
他社が汎用CPUでやっているマルチコアはSMP(Symmetrical Mulri Processor、
対照型マルチプロセッサ)コアと言って、今回のネタになっているもので言えば
単体のCPUとして機能するPPEコアに相当する部分のみを2個とか4個とか搭載しているわけ。
で、SIMDエンジンやベクトルエンジンを複数搭載したからと言って、普通はマルチコアとは言わない。
>Cellのメモリ帯域は25.6GB/sec。これは、現行のデスクトップPCのデュアルチャネルDDR2-533の帯域8.5GB/secの約3倍。
しがらみとか無視して専用設計できるから、このへんは羨ましいね。
それにしてもすごいね、そんなバスがもし止まったら大変だ。
>Cellのチップ間インターフェイスの幅は96bitで帯域は最大76.8GB/secとなる。
>PCI Express x16でさえ帯域は8GB/secなので、PCI Express x16の10倍近い帯域。
PCI ExpressなんてI/Oバスじゃん。なんでそんな遅いバスと比較するの?
それともそれしか知らないの?
>>442 ちょっとはマシなベクトル演算機が8個付いてるだけだからねぇ・・
たしかにこれでマルチコアなんて表現するのは暴挙だ。
当初の予定からは随分後退した実装になったとは聞くがまあこんなもんでしょ。
とりあえず見えないのがSPEのローカルに命令コードを置く形のようだけど
これが最大128ワードとかそういうオチだったりするんじゃないのかなとニヤニヤしてたりする。
445 :
名無しさん@5周年:05/02/12 06:21:20 ID:8QK/VH7X
CPU性能も最近頭打ちだから期待してるでぇ
>>424 そんな簡単にx86市場が死ぬなら
Intelもさっさx86捨てて
別アーキテクチャ持ってきていると思うんだが。
最も普及しているPCアーキテクチャが、なぜ非効率と言われながらも
レガシーを引き摺り続けているのか(特に腐れ林檎屋のハゲCEOあたりがぶちぶち言ってるが)、
莫大なコストを払ってまで互換性を維持し続けているのか、ということが
理解できない奴も居るんだよ。あまり責めるな。…まあ、俺も阿呆だとは思うけどな。
250GFLOPSなんて何処の一昔前のレンダリングクラスタですかって感じだけど、
蓋を開けてみれば何てことはない、普通のいまどきのCPUに8個のSIMDユニットをつけただけ。
特定用途に限定するだけで良いなら、RadeonやGeForceの最近のやつはみんな
20GB/sec前後のメモリ帯域を持っていて、200GFLOPS前後の処理能力がある。
まあPS3はこれにさらに外付けでほぼ同等のレンダリングエンジンを積むだろうから、
登場する時点でのハイエンドゲームPCの表現力や演算性能は上回るだろうけど、
それも1年しないうちに追い越されるのがオチだね。
で、ゲーム厨どもがスゲースゲー言ってるけど、ゲーム機の先進性なんて昔からその程度だし。
半導体の製造プロセスの制約を、互換性や汎用性ではなくピーク性能に全部振り向けても、
登場する時点においてその当時のPCよりもちょっとだけリードするのが限界。
ゲーム機はそのままのアーキテクチャで5年戦わなければならないから、製造プロセスが進歩しても
その恩恵を性能には転嫁できない。(チップをシュリンクして低コスト化する程度だ)
PCの場合は互換性や汎用性を重視するから、同じ製造プロセスでは効率上どうしても一歩劣る。
しかし技術が連続的に、速いペースで進歩するのがPCの強みであり、存在意義でもあるわけで。
結論から言うと、このCellプロセッサは(一般論的には)マルチコアなんて呼べない代物だし、
性能的にも製造プロセスから逆算しても、特にすごいことは何一つない。
単に「新製品が出ますた」ってだけのお話にすぎないね。
つうかさ、クタラキは以前、PS3はPS2の1000倍の性能とかフカシこいてたじゃん。あれってどうなるのよ?
CPUでこれだと、GPUには現在のRadeon X800の8〜16倍くらいゴツイやつ積まないと、PS2の1000倍なんて到底無理なんだけど。
メモリも軽く1G、VRAM256Mくらい積まないと話にならなくなってくるしね。
メインメモリはともかく、VRAMに256Mなんてオンダイ搭載は現在の半導体プロセスでは不可能だから、
オンダイ16M+キャッシュ/バッファに256、あたりが落とし所かねぇ…これでもPS2の1000倍は無理っぽいな。
で、そんだけメモリ積んだら一体いくらになるでしょう、みたいな。
赤字垂れ流しても5万円台からスタートならギリでやっていけるかどうか、ってところかと。
ま、そんだけ積んどけば、NTSC(640/720x480)には十分すぎる。HDTV(1920x1080)でもいけるだろうけど。
でもPS2の1000倍はフカシこきすぎってことで。
>>449 知らないというのはある意味とても滑稽だなw
心配しなくてもそのうちわかるよ。
フカシということがそのうちわかる、と。
だからといってそれまでうかうかとフカシを信じ込むお人よしは…信者だけだろ
こうした問題は、
IntelでPentium III/4などのアーキテクトを務めたBob Colwell(ボブ・コールウエル)氏が、
2004年2月、米スタンフォード大学で行なった講演
「Things CPU Architects Need To Think About」でも指摘されている。
同氏は、IA-32のパフォーマンス向上を、「ゾウを急坂に押し上げるようなもの」と形容。
無理な高速化により、アーキテクチャ上の脆弱性が増していると説明している。
例えば、現在のCPU設計では、正確なパフォーマンス分析ができる段階になって(性能上の)問題が発見されても、設計が進みすぎていて本質的な修正ができない。
そのため、ボロ隠しのような小手先の修正を加えることになり、複雑さの上に複雑さを重ねることになり、別な問題を招いてしまうという。
これは、実際にIA-32 CPUを設計していたアーキテクトの言葉だけに、重みがある。
Cellの場合、PPEとSPEともに、これまでのCPUと比べると極めてシンプルな構造になっている。
こうした構造のシンプル化は、泥沼のような設計地獄を避けることができるため、高速化を図りやすい。
それに対して、Pentium 4に代表される複雑なCPUは、いくら回路遅延を短くしても、CPUの設計段階で高速化が難しくなりつつある。
少なくとも、高速化に膨大な労力が必要となっている。
ちなみに、CellのCPUコアのシンプルさは、コアの規模でよくわかる。
Cellチップ上で1個のSPEが占めるサイズは2.5mmx5.8mm、面積は14.5平方mm。本当にツメの先程度のサイズだ。
トランジスタ数は2,100万トランジスタだが、このうち1,400万がSRAMで、ロジック回路は700万トランジスタに過ぎない。
トランジスタ数で見ると、世代的にはPentium IIIクラスの規模ということになる。
規模的には、CellはPentium IIIクラスの規模のCPUコアを8個搭載していると考えればわかりやすい。
454 :
名無しさん@5周年:05/02/12 13:22:36 ID:3dvmz4L7
しかし、どう考えても、この性能をゲーム機だけに与えておくのは惜しい。
普通のパソコンにも載っけてくれよん。
455 :
名無しさん@5周年:05/02/12 13:22:59 ID:Urq/4Cfy
>>449 > メモリも軽く1G、VRAM256Mくらい積まないと話にならなくなってくるしね。
PCじゃあるまいしゲーム専用機にそんなにいらねーだろ。PS2のは少なすぎだが。
> メインメモリはともかく、VRAMに256Mなんてオンダイ搭載は現在の半導体プロセスでは不可能だから、
> オンダイ16M+キャッシュ/バッファに256、あたりが落とし所かねぇ…これでもPS2の1000倍は無理っぽいな。
> で、そんだけメモリ積んだら一体いくらになるでしょう、みたいな。
> 赤字垂れ流しても5万円台からスタートならギリでやっていけるかどうか、ってところかと。
> ま、そんだけ積んどけば、NTSC(640/720x480)には十分すぎる。HDTV(1920x1080)でもいけるだろうけど。
> でもPS2の1000倍はフカシこきすぎってことで。
なんかウダウダいってるが、容量は128Mあれば十分だろ。
大体なんで容量ばっかり言及して帯域の話が出ないの?
>CPUでこれだと、
とかいってるなら当然スピードの話になるはずだが、VRAM容量に関係があるのはゲーム内容や解像度だろ。
>>PS3はPS2の1000倍
ネットワークでつなぐといっているけどどうやってゲームに利用するんだろ。興味あるな。
普通にグリッドだろ。Cellが何万個も搭載したサーバとつなげるらしいから
1000倍は回線速度によっては可能
460 :
名無しさん@5周年:05/02/12 19:41:23 ID:yBWxlpzq
まあチップの性能をどんなに上げたところで、
家庭用ゲーム機がPC用ゲームの表現力に迫るためには、
画像出力デバイスとしてハイビジョンテレビをもってこない限り無理でしょ。
PS3ってハイビジョンに対応するんだっけ?
つまりCellは最強ってことか
マルチコアっていうロシアの新鋭プロテニスプレーヤーとかかと思った
463 :
コピペ:05/02/12 20:02:52 ID:DkV98CE2
米トランスメタ、ソニーに省電力技術LongRun2を供与
http://news.braina.com/2005/0127/enter_20050127_002____.html 米トランスメタ社は1月24日、パワー・マネジメントとトランジスタのリーク電流制御により、
省電力の半導体製品を実現する技術「LongRun2」を、ソニーにライセンス供与したとを発表した。
LongRun2は、半導体プロセスの微細化で深刻化しているチップ発熱とトランジスタの
リーク電流に起因する、半導体デバイスの消費・待機・バーンイン電力を削減する総合技術で、
チップの性能向上とコスト削減を同時に可能にするという。
同社の第1世代技術LongRunでは、チップの動作周波数と電圧を毎秒数百回調整して
消費電力を削減をしていたが、LongRun2では、さらに、トランジスタのしきい値電圧を
動的に調整することで、リーク電流をも制御することを可能にしたという。
464 :
名無しさん@5周年:05/02/12 22:12:24 ID:Xo8jRGda
>>449 >つうかさ、クタラキは以前、PS3はPS2の1000倍の性能とかフカシこいてたじゃん。あれってどうなるのよ?
それがPS3の仕様だ。
>>458 グリッドと言ったところで、今の回線の幅と速度では、計算結果を
リアルタイムのグラフィック出力には使えないだろ?
と言うことは、グリッドは非グラフィックの部分、思考アルゴリズムとかに
使うしかない。でも、思考アルゴリズムにそんな計算性能が必要か?
使い途無いだろ。
実用的なAIのアルゴリズムがすでに完成していて、その為に処理速度が
必要だというなら分かるが・・・
>>465 複数のユーザーが存在する物理世界シミュレーターは?
467 :
名無しさん@5周年:05/02/13 00:47:14 ID:lREbUcQS
PS2いらいのGJか?
現在のオンライン3Dゲームは一つのサーバーに全負荷が掛かってしまう。
それを分散させるのがPS3だろ?
>>466 いわゆる多体問題にPS3-Gridみたいなアプローチは何の役にも立たないよ。
そういう事やるのであればGrape-2でも乗せた方がずっと役に立つ。
要するに一番安易で、最も扱いづらいハード屋のオナニー仕様です。
>規模的には、CellはPentium IIIクラスの規模のCPUコアを8個搭載していると考えればわかりやすい。
こういう記事を書く奴は、ベクトルエンジンとCPUコアの区別がついてないって
自分で言ってるようなもんなんだけどねぇ…。
>>470 規模的にって書いてあるし、純粋にトランジスタ数の事を言ってんじゃないの?
katmaiペン3が大体1000万トランジスタ弱だっけか。
トランジスタ数で比較するならダイ全体のトランジスタ数で比較すべきだし、
そういうときにPentiumIIIのSIMDエンジンは8086何個分のトランジスタを使っている
なんて書き方は普通しない。
バカなフリして、勝手に誤解した奴が悪いんだって論調には、うんざりだ。
CPUが8個組み込まれているようにミスリードを誘う書き方をするのは、
意味が違うことがわかっていないか、あるいはわかっていても
恣意的にそう読み取らせようとしているかのどちらかだね。
どちらが悪質かは、言うまでもないけど。
>>472 天下のIBM様が「コアは8個」つってんだからコアは8個なんだよ、
なにがミスリードだ馬鹿かおまえわ。