万人がチンポしごきながらも納得する有名な糞ゲー一覧
どのゲームも似たりよったりの糞っぷりで本当に愉快ですね。
ゼノサーガEp1、Ep2
バウンサー
我が竜を見よ
天外魔境3
ラジアータストーリーズ
ドラッグオンドラグーン1、2
シャイニングティアーズ
レジェンドオブドラグーン
マグナカルタ
グランディア2、X
WA3、4
ポポロクロイス物語ピノン編
幻想水滸伝3、4
(^Д^)
アークザラッド3〜
サガフロンティア2
アンリミテッドサガ
FF8、X-2
SO3
(`ω´)ゞ 乙!
Cellまとめ
東芝のR3000たくさんとか言って却下
IBMのCPU提案を却下
元NECの説得によりCache->LSに
IBMの根回しにより SIMDに
RISCの大御所により命令削減に
東芝のCell GPU開発断念によりNvidiaに
東芝のHDDVDと交渉決裂によりBD見切り発車に
SCEと東芝はなんか気の毒
SCEは自前でCPU設計したこと無しでは仕方が無いかと・・
半導体設計の肝はトレードオフのバランスにある、というところがわかってないと
煽っても面白くならない。
2005/07/21 ソニー・コンピュータエンタテインメント
英国SNシステムズ社の買収に向け基本合意
〜“ProDG”をPLAYSTATIONR3向けソフトウェア開発キットの一部に採用〜
2005/07/21 ソニー・コンピュータエンタテインメント
米国AGEIA社と戦略的ライセンス契約締結
〜最先端の物理演算ライブラリ“PhysX”を
PLAYSTATIONR3向けソフトウェア開発キットの一部に採用〜
2005/07/21 ソニー・コンピュータエンタテインメント
米国エピック・ゲームズ社と戦略的ライセンス契約締結
〜 “Unreal Engine 3”の評価版をPLAYSTATIONR3向けソフトウェア開発キットに併せて提供〜
2005/07/21 ソニー・コンピュータエンタテインメント
Havokと戦略的ライセンス契約締結
〜世界最先端の物理エンジンをPLAYSTATIONR3向けソフトウェア開発キットの一部に採用〜
http://www.scei.co.jp/corporate/release/
SCEI、ProDGを会社ごと買っちゃったんだ…
10 :
名無しさん必死だな:2005/07/21(木) 18:22:31 ID:GkJLJLxp
SNシステムズは英国ブリストルに本拠を置く、世界唯一の家庭用ゲーム機向け開発ツール専業企業です
1988年にゲーム開発者により創業されて以来、SNシステムズは世界中のゲームプログラマのための
業界基準の開発ツール・ソリューションを提供しており、欧米では約7割のマーケットシェアを持っています
これまでに、10種類以上のゲームマシンおよびコンピュータエンタテインメント・システムに対応した
開発ツールを提供しており、現在は"PlayStation2、NINTENDO GAMECUBE
Game Boy Advance向けの開発ツール群の開発販売を行っています
現在提供しているツール群には開発・デバッグツール「ProDG」の他、コストパフォーマンスに優れた
開発ソリューション「ProView Plus」、高速ビューイング・ファイルサービングツール「ProView」
キャッシュのパフォーマンスをリアルタイムにキャプチャ・表示する分析・最適化ツールの「Tuner」等があります
ttp://www.snsys.jp/ ふむふむ・・
ゲーム開発ツール会社か。
PS2、GC、PSP、GBA、NDS、、 などの開発ツールを設計してるのか
そこを丸ごと買収しちゃうのね
標準開発ツールとしてUE3を採用するのは凄くない?
といっても評価版だしな。
試して良い様だったらお金出して買ってねってな感じの
いわば体験版だろ?
いやUE3は完成してなかったけ?2006年にリリースするみたいが。
ブリストルと言うとアレか。
なんか知らんがめちゃくちゃ高いスポーツカー作ってる
サブライセンス権を獲得、ということは
標準開発キットにUE3の評価版(体験版?)が載る
ってこと?
お得じゃんー
SCEI必死、というか、ほとんど冗談みたいな感じだな。
ミドルウェア会社を丸ごと1つ買って、物理計算エンジン2つと3Dエンジンのライセンスを受けて開発キットに乗せる。
UE3の「併せて提供は」通常の開発キットとは別っぽい感じだけど。
やはりPS2の開発環境に関しては散々言われたからだろうね。
なんだかんだ言って一応反省して改善はするんだよな>SCE
PSの熱暴走を反省して冷却部を強化したPS2。
しかしそのおかげで、光ピックアップが汚れて読み取りが…。
PhysX と Havok はどっちも物理演算用のエンジン?
どう違うの?
Physxのほうがライセンス条件的に中小にやさしい
まあ好きなほう選べってことだろうな
それぞれのエンジンから使う分だけ追加で金払うと
SCEに一括で金払えばいいから楽だし
CELLはまだなんとも言えんが、RSXはやっちゃったっぽいな。
やっちゃったのはフロムだろ
また箱信者の餌が出てきたなw
Havok はHALO、HALO2などでとうの昔から使われてるしな
HLF2も箱で出るし
フロムがPS2で中の下レベルの会社だとするとPS3の出力はこんなものか
PS2の実績から考えると日本でそこそこの画面出せる会社は3社程度かもな
>22
それCELLだけで描画してるんだよ、偉い人に聞いたから分かる
UE3.0は評価版がなかったばあい、30万ドル払ってまずライセンス契約しないと
評価すらできないわけだが?
将来PS3が主軸になってSCEがたっぷり儲かったら、DCの時みたいに
ライセンス料をSCE持ちにしてくれるかもしれんし、今回はPS2の反省点を
かなり生かした形になったな。
UE3.0以外はSCE持ちになってる希ガス。
前スレID:R6F+kVF5、カワイソス(´・ω・)
逆に言えば、サードがわざわざ最適化作業をやる必要がないですね。
物理演算に関しては開発難易度が下がったといえるかも。
(´・ω・`)ショボーン…
(´・ω・`)
(´・ω:;.:...
(´:;....::;.:. :::;.. .....
物理エンジンより先にもっとまともなグラフィックライブラリ用意してやれよ・・・
nVIDIAやIBM、今回買収するSNシステムズ社にも
いろいろ手伝ってもらうだろうから
何とかなるかも・・
インタビューではあんなに夢見るクタタンだったと言うのに・・・
やっぱり経営者としては現実的クタタンだった・・・
>>33 フロムのはグライフィックライブライ関係ないでしょ・・・
現実的というか堅実というか・・・
PS2の反省を生かして、至れり尽くせりのサポートを揃えたか
特にSPEをある程度勝手に最適化してくれるのは大きいだろうな
・・・こんなのクタじゃねぇ(つд`)
もっと大々的に、「俺たちはこんな凄いものを作りましたが何か?見合うだけのモノは作って下さいねw」ぐらいの勢いを想像してたのに( ´・ω・`)
フロム(笑)
流石に続けてチョンボやらんのね
SCEは学習できる会社だな。
>>8のpdfを見る限り
使用料と規模の大きさ
UE3>>>>>>>>>>Havok>>>>PhysX
UE3が物理エンジンはもちろん様々な物を網羅した総合開発ツール
Havokが物理&アニメーションエンジンがメインのミドルウェア群
PhysX(Novodex)が物理ライブラリ
↑という感じなのかな
HavokとPhysXには「PLAYSTATION3のSDK(ソフトウェア開発キット)の一部としてコンテンツ開発者に提供する」とあるから
完全に開発機の中に取り込んで提供という形
UE3のみ「PLAYSTATION3のSDK(ソフトウェア開発キット)に併せて提供コンテンツ開発者に提供する」とあるから
開発機の横にそっと評価版を置いて、完全版に移りたいならEpic Gamesと個々に契約してね(高いけど)ってことだな
フロムもう駄目だね
会社の規模が小さい所は生き残れなさそう
グラフィックはGLをNVIDIAが作ってるしなぁ。
Mayaもサポートしてるんだし、あとは統合環境とかその辺次第なんでは。
ProDGとOpenGL ES2.0、それに対応した物理エンジンと、最高級ミドル
ウェアの評価版セットで、これ以上は望めないカタチになったと思われ。
最初からやっとけって感じではあるが。
さっきNHKでUE3のやつが流れてたね
カコ (・∀・) イイ!
havokはシングルスレッド、つまりPPEでの物理演算をする場合に使用、
PhysXはマルチスレッド、つまりSPEでの物理演算をする場合に使用というところか。
さすがにSPE使うだろうw
つーか、フロムはただの発表にあわせて短期のテスト画面を出したってだけだろう
見栄えは開発後期に手間かけりゃいくらでもあげられるんだし
バンダイの中の人って実質ナムコの人?
それなら、クオリティ高いのも分かるんだけど・・・
>>46 NovodeXは唯一のマルチスレッドの物理エンジンと発表されているが、
いつhavokがマルチスレッドに対応した?
>>48 何かしらの関係はあるだろ
バンダイは殆どが社外で作ってるぽいし
>>49 シラネーヨ。PS3のhavokみてねーし。
対応しないという根拠が意味不明。使って欲しくないのか?w
52 :
名無しさん必死だな:2005/07/21(木) 21:46:38 ID:JYl/Rd07
フロムの画像、ITmediaのやつの方が解像度合ってる希ガス。
impressのはただ引き伸ばしただけのような・・・
今こそCellの演算能力を利用した犯罪者リアルタイム察知システムがイギリスを救う
112 名前:名無しさん必死だな[sage] 投稿日:2005/06/28(火) 21:08:59 ID:wLriBS+3
それこそクタが言ってたみたいに映像内の特定の顔を
Cellが自動的に判断して録画するみたいなことが警備や軍事に応用できそうだ
町に設置した監視カメラの映像に写った指名手配されたテロリストを自動的に通報とかな
だいぶ前のTV番組でイギリスの警察の捜査でも似たようなものがあると聞いたことがある
その時のはリアルタイムでは出来てなかったか気がする(今なら出来るか?)
顔を整形しても顔のパーツを線で結んだ比率かなんかの関係でわかってしまうらしい
それが安価で各地に配備出来るのようになるは大きいかもしれない
(以上はクタが言ったことが本当に出来ればとしての妄想だが)
普通に実用化されてないか?それ
まるみえかなんかで見た気がする
>>55 まるみえだっけ?
だいぶ前のことなんで完全に何の番組か忘れてしまった
今の技術でやったら安価にリアルタイムで配備できるかなーと思ってね
こういう監視システムは隈なく配備するのが重要なんで
タイムリーだったんで再妄想してみました
老人ホームでカメラで顔認識して出入り管理するってのはやってたな
Cellとはカンケイないけど
>>57 最終バージョンはブレードサーバになるのか。
PS3らしいと言えばらしいね。
メモリは全てXDRになるんだね。
なんかE3のより薄くなった気がする・・・
>>59 ソニーピクチャーズは映画制作でPS3を導入したいと言っていたので
ぴったりじゃないか?
バンダイは人気シリーズ「ガンダム」のデモを行った。このデモではCELLプロセッサに
搭載された8つのコアのうち1つしか利用していないといい、「CELLのすべての性能を
使えばすごい世界が開ける」とバンダイ常務取締役ビデオゲームカンパニープレジデント
の鵜之澤伸氏は期待を寄せた
なんか、むしろ不安。
SPEってそんなに大変なのか?
いや使いこなせなくても、あんな絵が出るとは凄いと思うが。
>>64おまえの技術力はバンダイよりさらに下ということだな。
ガンダム動画みたいなー
メーカー間で差がある感じもしないし、SPEを使いこなせてないのは
開発ツールが開発中だからじゃないのかねー
PPEだけでもビルとか壊れたって書いてあるんだよなぁ、ガンダム。
まぁ、未だSPE使えてないと言うのは不安だけど、もしも本当に物理演算が得意ってなら、
SPE使ったらあり得ないくらい色んな物が壊れまくり動きまくりが可能って事なんかね。
SCE,ゲーム・ソフト開発ツール大手のSN Systems社を買収
http://techon.nikkeibp.co.jp/article/NEWS/20050721/106964/ >SCEがTransmeta社と提携したのは,マイクロプロセサ「Crusoe」に
>86系命令セットと互換性を持たせた同社のエミュレーション技術の
>供与を受けるため。この技術を用いて,Cellに搭載したSPEコア向け
>ソフトウエアの動作を最適化するツールを2005年第4四半期に出荷
>するほか,パソコン上で動くSPEシミュレータをデバッグ用途に向け
>に開発するという。
Transmetaの社員を受け入れてる理由はこれの模様。
すげえ。SPEのためにそこまでするのか。
なんつうか、本気なんだなクタタン
世界のソニーは器が違う
国内メーカーはどこもSPE使いこなせなさそうだな。
簡単にスレッド分割可能なXbox360と比べて目に見えて出来が悪くなりそうだな。
どうでもいいから、せめてID替わってから言えよ
12時過ぎたから、もう替わってると思ったんだろ、お前
TransmetaにはCELLを使った
x86エミュレーターCPUを開発してほしい
・・・と言ってみる。
ガンダムのトレーラーは8コアの内一つってことはPPEだけか?
フロムのやつ、ムービーで見ると結構凄いな
PS2の時を鑑みれば、期待できるか?
使いこなせなくても箱より凄い物作れるんだから問題無し
>>76 ワロタ MS工作員は25日にろくなもの用意できなかったらどうすんの?
264 :名無しさん必死だな :2005/07/21(木) 23:28:10 ID:mrHb912b
>バンダイの人が操作してたそうだけど
操作する振りをしていただけだよ。
指の動きと画面が明らかに合っていなかった。
84 :
名無しさん必死だな:2005/07/22(金) 00:18:55 ID:FMomN7/m
>>75 24:00じゃなくて5分は待ったがいいよw
MSの工作員はレベルが低いなぁw
技術系あんまりくわしくないんでアレなんですが・・・。
今回出たコーエーの関羽のリアルタイムデモに関しては、
発表されたミドルウェア周辺の技術は使ってなくて
コーエーが独自につくったもんだとか。例の女傑がステージ上で
「Havok使えるなら、最初からそれ出しててくれれば・・・」つってましたよ。
個人的には任意に弾撃ってたガンダムのほうがすごいよーに見えましたよ。
でもビルは崩れてなかった気がするなあ。
これから物理演算使って壊せるようにする、とバンダイの人がいってたような?
あ、んで、あのガンダムデモは開発ベックだそーです。
バンダイ下請けやるじゃんと思いましたよ。
こんな話もう既出っすかね?
87 :
名無しさん必死だな:2005/07/22(金) 00:23:05 ID:iBUffVBo
>>86 キタ━━━━━━(゚∀゚)━━━━━━ !!!!!
>>83 すげーなぁー
まさにああ言えばこう言う状態w
>>86 いえいえ、PS3スレかテクノロジースレでもっとおながいします
>>86 思い出せることがあったら何でもお願いしますorz
ベックすげぇな
是非この技術でスクランブルコマンダーの後継を出して欲しい。
ベック?ベックってことはもしかして『外伝シリーズ』キターーなのか?
>>89 んー、基本的に技術にうといんで、そっち系の目では見られなかったのでなんとも。
ただ、今回発表されたリアルタイムのデモに関して言えば、
国内ゲームメーカーのものは全体にシェーダーの機能をあまり使えなかったのか、
アンリアル3デモなんかに比べると映像の質感はどうしても見劣りする感じでした。
・・・というか、SPEやGPUはまだ全然使えてないのかな、という印象でしたね。
秋には発表されたライブラリやエンジンが入ったSDKがリリースされるとか言ってた気がします。
あ、あとアヒルデモも8月ぐらいからソースとかリファレンスとかをつけて
ソフトメーカーに渡して、サンプルとして研究してもらえる形で配布するって言ってたかな。
そんぐらいですかね。
あーあとwebzenもデモ出してました。
ファンタジー系の鎧のギャルが蝶と戯れる映像で・・・エンドレスサーガだかサガだかって名前で。
>>94 そういう情報はテクノスレに投下お願いしたいな
最近はテクノスレっぽくなってるけど、ここはCellスレだから
Cellのクロックダウンの情報はまだなのか。
>>96 あー、いや、一応PSミーティングだったし、
技術的にはCell関連要素のほうが強いかなあと思ってこっちに書いたんですけど。
とりあえず、印象に残ったのは以上のことぐらいなんで・・・おじゃましました。
>>98 ゲームクリエイターキタ━━(゚∀゚)━( ゚∀)━( ゚)━( )━(。 )━(A。 )━(。A。)━━!!!
もっとおしえてw
>>98 内容的にテクノスレに書いてくれた方が盛り上ると思ったんで、誘導のつもりでした
有益な情報サンクス
できれば一緒に行った技術系の人とやらの話も聞きたいところ
103 :
名無しさん必死だな:2005/07/22(金) 02:09:00 ID:e8mw+N7z
>>102 結局ビルも壊れないし、物理演算もナシかよ。
しかも15fps程度。
今でこれじゃ、SPE使いこなして、やっとE3のガンダムムービー並っぽい。
>>103 開発機はいつも実機よりメモリを大く積んでいる。
ID変わっても104が75なのがバレバレな謎
まぁよく動かしてる方じゃないか?
最初はこんなもんだろ
15fpsは、単に動画をそういう風にエンコしただけだろ。
>>108 他に60fpsで動いてる動画もあるのに、それは無理があるかとw
>パソコン上で動くSPEシミュレータをデバッグ用途に向けに開発するという
普通にリアルタイムデバッグできれば不要そうなんだけど、もしかして今SPEってGDBとかのデバッガ使えないの?
>>111 多分使えないんじゃないかな。VUも使えなかったし。
>>110 本田氏のブロブに乗ってた写真はエボリューションシステム(何となく嫌な名前だが)だったんだな。
初号機の大きさとか知らなかった。
>>114 なんだそりゃ。evaluationのこと?
進化じゃなく評価
>>114 evaluation エバリュエーション 評価(額)、見積もり、値を求めること、評定、計算
評価機、評価システムの事だよ
thx
シャレ抜きで間違えました。
まあ評価版でも今もらえてるところは幸せ、ということで。
とりあえずカプコン、コーエー、バンダイ、フロムには確実にあるってことですな
>>120 E3でデモを発表していた所も持っているんじゃないかな、国内だとナムコとコナミ
それにセガも持っているだろう
おっと、スクエニを忘れてた…
ガンダムムービーえらいしょぼいな・・・
PS3開発機の方かこええやん
>>125 あんな所に小さくコードネーム書いてあったのか、気が付かなかった
初代の評価機のは潰れてて読み取れないな、Shreck?
岡本さ〜ん、クタちゃんの手綱を握れるのは、あなたしかいない。
戻ってきて〜。
131 :
名無しさん必死だな:2005/07/22(金) 13:57:46 ID:IL5h4JEW
この暴走ともいえる技術偏重が良いじゃん!
もっと暴走して欲しい。SCE最高!
いや茶谷氏の方がバランスを取れているような気がする。開発環境周りは完璧だったし。
当時のPS2責任者は岡本氏だったな。ある程度に責任があると思う。
俺も岡本氏時代はイマイチな印象があった。
雑誌のインタビューでもクタと違う事を言ってたりして、意思の疎通が出来てないんかね?と思うこともしばしば
130はSCEの中のひとか?
CellはIBM、GPUはnVIDIAまかせ、
開発環境も気を使い、
で、 以前よりずっと進歩してるじゃないか。
「EmotionEngineで ウィンテルぶっ飛ばせ!」なんて寝言
言ってたころより100倍マシ。
自分だけでできることと、出来ないことの区別が付くようになったと言うことか・・
派手に夢を語りながら、その実 恐ろしく堅実で計画的、
無茶をせず、設計やクロックでも妥協する。
かと思いきや 数千億円の工場投資も恐れない。
クターの恐ろしさは この絶妙なバランス(アンバランス?)
そもそも打倒ウィンテルとか言ってたのは故・出井
自分が打倒されたわけだが。
つか、まだ死んでないだろw
もう死んだ方がいいかもしれんが
邪推すると、岡ちゃんはCELL-GPUに拘ってクタdと対立して辞めた、とか
129って低消費電力・ハードワイヤードのグラフィック専用チップを売る、っていう
Cellとは正反対のアプローチなのだが、やっぱり対極の方がバランスとれるんだろうか。
サムスン電子がソニー追い抜く世界100大ブランドで20位
サムスン電子が今年、企業ブランド価値で日本ソニーを追い抜き、世界第20位に浮上した。また、現
代(ヒョンデ)自動車とLG電子が今年初めて世界100大ブランド入りを果たした。
多国籍ブランド・コンサルティング業者のインターブランドは21日、「2005年の世界100大ブラン
ド」を発表し、「サムスン電子のブランド価値は昨年より19%増の149億5600万ドルで、20位に浮
上した」とし、「これにより、昨年よりブランド価値が16%下がったソニー(28位)を初めて追い抜
いた」と明らかにした。
現代自動車は34億8000万ドルで、日本日産(85位)を抜き84位に浮上したほか、LG電子は26億45
00万ドルと、97位になった。
http://japanese.chosun.com/site/data/html_dir/2005/07/21/20050721000078.html
「リンク先を保存」はhtmlを保存できるって事なのかな?
保存できるならオフラインでの閲覧も可能?
142 :
141:2005/07/22(金) 17:09:44 ID:KB5As+je
スレ間違えた……
すみません。
読めん・・ ( つω´)
誰かコピペしてん
PSBB関連のインターフェイスのトロさや糞さに、クタたんが激怒したという噂もあったな。
XMBなんてのも岡本氏が辞めてから出てきたし。
まぁ、クタとは水が合わなかった可能性も
それでもPS3に関わってるから、必要な人材ではあるんだろ
それよりも、茶谷氏が何かやってくれそうな雰囲気がある
>>145 岡本氏に触れてるところだけ、以下に抜粋。
DMPには,以前にソニー・コンピュータエンタテインメント(SCE)のCTOとして
プレイステーション2の開発に当たった岡本伸一氏が非常勤の取締役として参加している。
7月21日に開催した記者会見には同氏も参加し「グラフィックス技術は,オーサリング
(編集)とレンダリング(描画)で構成される。レンダリングは半導体の微細化で格段に
進歩したが,オーサリング技術は質的な変化がなく,いかに効率的にオーサリングできるかが
課題になる。DMPはオーサリング技術を提供できる」など市場の背景と同社の強みを解説した。
さんきゅー
オーサリング・・?
何のことを言ってるのかな?
HD映像の編集システムでも構築するんじゃないの?
PSの基になったのも業務用放送機材からだし。
オーサリングってレンダリングする為のデータをどう作るかって事じゃないのか?
記事にあるのはりあるタイムグラフィックス向けの製品だろうし。
岡本氏はSCE辞めてから開発環境に関連した仕事を中心にやってるっぽいし。
>>147 ミドルウェア関係の口利きみたいなことしてるだけでPS3とはもうほとんど
関係ないんじゃね?
岡本氏は何でもやってるな
ロジテックの役員になってみたりミドルウェア会社の顧問になってみたり
今度は携帯向けGPUか
なんか西○彦みたいな感じだねw
155 :
名無しさん必死だな:2005/07/22(金) 23:10:43 ID:CZbm88dr
RSXが間に合ってないからしゃーないんだろうけど、
なんつーか…無様な構成だな>PS3評価機
>>155 しかしRSXと同等のG70を積んでる。
グラフィックスに関しては実機に近い性能が
出せるはずなのでは?
>>155 CellもG70もオブジェクトレベルでまったく同じ。
MacG5にSLI接続GeForce2枚の箱α開発機よりずっとマシ。
今の段階ではシェーダ、Cellマルチプログラミングの基本を進めればいい。
実機でそのまま通用する。
>>153 >PS3の場合は、ゲームプレイのためにCell OS単独で使用する場合も、必ずハイパーバイザが起動し、その上に従来の定義のOS(ゲストOS)が立ち上がる。
注目はこの部分かな。
ハイパーバイザーって・・・それは開発者が作成したスレッドを直接SPEにバインドできないという事か?
箱○の開発環境はSLIのGFじゃないだろ
GoWが、SLIのGF68000だっただけだろ
>>157 MacにSLIは無いんだけど。
EpicがGears of WarのデモにWindows用UE3とWindows PCを使ってただけ。
そういうわけでUE3使ってPC上で開発してない限りSM3.0にサンロクマル開発者が
まともに触れるのは下手したら今夏からということになる。
ハードを直接叩けないのではPS2のように性能をフルに引き出すのは難しいような気がする。
本当はその分開発が楽になるはずなのだが、ソフトラインナップはそんなに充実してる
ようにも見えないし、ローンチから性能を引き出してるソフトがあるようにも見受けられないな。
直接叩いて性能を引き出すなんて、もはやどの機種でも無理。
箱○でも 恐らくOS上でしか動かないだろう。
もう 直接叩く時代じゃ無いってことだな。
今後の互換性にも関わる。
OS上でしか動かなければ、上位互換性の心配が無くなる
Windowsのゲームが異なった構成でも動くようにね
あと セキュリティの問題もあるし、Cellのレベル0カーネルレイヤーは
勝手に触ることができないらしいしな。
ゲーム用のゲストOSは 下から3層目だそうな。
その代わり 性能を引き出すサポートは充実させる、と。 (´・ω・)y─┛~~
>>152 第一線を退いた人によくあるパターンだね
優秀な人は役員や顧問の引く手あまただ
OSのAPIを通じてしか、の意味だな。Xboxゲームはハードウェアを直に叩くことがあった(らしい)。
GPUに関しては
NvidiaのCg言語があるから
箱○より直接叩けそうだよな。
あと気が付いたんだけど、OpenGLが絶対つかわないといけないってわけじゃないらしいね。
あくまでスタンダードAPIだそうだ。
>NvidiaのCg言語があるから
>箱○より直接叩けそうだよな。
お前はCgが何か知った上で言ってるのかと
>>165 でもX-GPUのエミュに苦労してる。
一部のゲームで直接叩いたものがあったから、らしい。
Windowsと違って、GPUが 1種類しかなかったからね。
今後はそういうことは絶対させないでしょう
許容されたAPIからしか。
>>167 意味わかんねーよ
ところで、以前にRSXは直付けVRAMの変わりに32MBのeDRAM採用という噂があったのだが、
今のRSXと、噂のRSXってどっちがよかったんだろうな?
32MBの中にフレームバッファって収まるかな?
ギリ?
個人的には今のRSXかな。PS2で懲りたし・・・
>>170 eDRAM(゚听)イラネ
256でも、まだ十分じゃないと思ってる。
俺、PS2のスペック発表の時からずっと「4MBじゃツラ過ぎる」って言ってたし。
>>170 多分、RSXみたいにして正解だと思う
プロセッサの集積技術は鈍化して、90nmから65nmへの移行でヒイヒイ言ってるし
リーク電流も問題
PS2だって本当はVRAM8M積める予定だった
>>170 32Mあれば1080pの各色16bitのHDRでも余裕で収まる、FSAAかけると厳しいけどな
720pなら16bitHDRで2xFSAAまでなら収まる、x4ははみ出るな
続きはテクノスレの方が良いと思うぞ
GPUネタはテクノロジースレかVSスレでお願いします。
>ゲーム用のゲストOSは 下から3層目だそうな。
ゲストOSとかの機能ってPS3でも載るのかな。
メモリ256MBだしゲームなんだからカーネル部分は小さいほうが開発者にとっては嬉しいだろうね。
>>175 > ゲストOSとかの機能ってPS3でも載るのかな。
Linux 出すって言ってるから当然あるでしょ
PS3に載る載らないの話ではなく、CELLに最初から実装されてる
仮想化機能でんがな。
調べました。
CELLに載ってるのがLPARで、それを使ってリソースを制御するのが「ハイパーバイザ」なんですね。
ハイパーバイザはファームウェアって書いてあるからメモリに載るわけじゃないのか。
いまどきのはメモリに展開されると思われ。
3MB4MB使われても問題にはならんと思うし。
使わない機能に3,4MB取られるのは嫌だなぁ。
さすがに展開しない事も選べると信じたい。
使わないわけないだろう。
どうせなにがどれくらい使われてるかユーザーにはわからんから
どうでもいい。
ハーパーバイザーを介してCELLを使う事による
オーバーヘッドの方が心配かな。
下手なスケジューリングなどはゲーム機においては
致命傷となりかねない。
183 :
182:2005/07/23(土) 03:59:21 ID:hWXMCTfC
ああ勘違い。SPEの管理なんかもハイパーバイザーが担当するのか
と思ってたらそうではないようだな。
しかしリソース管理を行うんだったらSPEの管理もハイパーバイザーが
行ってそうな気がするがよくわからんな。
違う。ゲストOSが走るのはPPE。
つまりはハイパーバイザーが管理するのは、
ゲストOSに対するPPEリソースの割り振り。
Linuxには30%、uITronに20%とか。
SPEというのは、そのゲストOSで走っているタスク上の
プログラムを実行しているに過ぎないので、
当然SPEのリソースを管理しているのはそのゲストOS。
SPEに関しては、
・ゲストOS-Aに、SPE6個
・ゲストOS-Bに、SPE1個
みたいな割り振りを行えると、どっかで読んだ希ガス。
NEだったかな。
>>181 ここはユーザーからの観点で話をするスレなのですかい?
NEよく読んだら、SPEスレッド管理専用の「リアルタイム・リソース・スケジューラー」の説明の所に
「また、SPEスレッドのスケジューリングのための正確なタイミング確保の為、前述した複数のOSの動作に向けたハードウェア機構であるLPARを利用している。」
って書いてあるね。
それは東芝の開発環境の記事だね。
リアルタイム・リソース・スケジューラはゲストOSの階層
と同じところにある。だからスケジューラはゲストOSの機能
と言っても良いんだが、スケジューラ自体はどのゲストOSで
も共通に使えるように、ゲストOSとは分離して実装されてる
点がポイント。
分離しているからこそ、スケジューラもゲストOSと同様に
ハイパーバイザーを介してLPARを利用しなきゃならん訳だ。
PS2はμITRONベースでないの?
PS2って基本的にOSらしきOSは載ってないかと。
ハード初期化するだけのブートローダ走る
だけで、ほとんど無OSに近いだろ。
今回は電源入れるたびにOSがインストールされるのかしら?
192 :
名無しさん必死だな:2005/07/23(土) 15:24:39 ID:FF0FS6wn
電源入れるたびOSをインストールなんてやってられるか!!
>>191 HDDから起動しないソフトは
ゲームディスクからのブートに伴ってOSもロードされるんだろ
嫌になるねぇ・・
OSが解ってないのがいるし・・・
>>186 ソフトウェアを語りたいなら微妙にスレ違いだと思うけど
リッチなOSよりプアなOSの方が良いというのがわからん。
ミドルウェアライブラリ使うと使わないコードも当然入ってくるけど
それを気にするようなレベルじゃなくなっただろう?
こうやってPS3はダメとかつまらない話になるから
スルーしたかったんだけどもね。(笑)
ゲームはスタティックリンク。これ基本。
PS3はハードウェアルータ機能を削ってLinuxによるソフトウェアルータに切り替えるんだよ。
ゲーム中でも機能するように常にLinux部分が常駐してる関係でXDRが約100MB使われちゃうけど
NUMAだし高性能だし問題ないよな。
200 :
186:2005/07/23(土) 17:02:54 ID:Pwz6CiI7
カーネルって書いたのに何故かOSの話になってるな。
>>196 CELLのリソースを管理する話がスレ違いとは厳しいですね。
別に汎用のリソーススケジューリングの話してる訳じゃないんだけど。
その後に私は
>ろくなスレッド機構も載ってないPS2カーネルから比べると凄い進歩ですね。
って書いたんだけど、それが
>こうやってPS3はダメとかつまらない話になるから
に該当するの?
そもそも複数のOSを一つのハードで動かす必要性があるのかな?
OSっつーのはコンピューターを統合的に管理するソフトな訳だから
複数のOSを一つのハードで動かす事自体がおかしいと思う。
いまごろだけど
>>155 確かに実機とは程遠い、PS2の時はこの時期にはほぼ同じもの(バススピードが66%)が来てたのに
しかし、もしかしたら今のG70バス幅256bitのVRAMだけで512Mの方がパフォーマンスが高いかもしれん
俺のPC、MS-DOSとWindowsが走ってるぜ。
>>201 理想を言えばそうなんだけども、ある別のOSで動くアプリケーションを動かしたいときに、
手元のOS用に移植するより、OSごと持ってきて動かしちゃった方が開発工数が少なく
品質も良いという現実的な事情がありまして。
>>204 過去の資産の無いCellではその理屈は当てはまらない罠
>>204 理想じゃないよ。
隔離された環境を必要になる事はあるから、別OSを起動する事に意味がある
複数OSを試したとき、何を使ってたのかねぇ・・・
まぁ、教えてくれんだろうが。
隔離された環境って必要かなぁ・・・
別OSで隔離しなきゃいけないケースって
少なくともコンシュマーでは無いと思うんだけど。
業務用だと日立が作ったシステムで、WindowsとLinuxが共存してて、
Linux側にデータを置いておいてセキュリティを高めるというのがあったな。
情報漏洩を防ぐために暗号化されてて一定の手順でしかデータを触れない。
>>205 過去の資産はCellではなく既存のOS側に付随してる
Cellは受け皿を工夫してそれを利用させてもらう立場
例えばWEB系の開発で、VMWareとか使って各サーバ上の環境を一台の
PC上で構築するのは良くある事。
これは開発マシン購入費が抑えられるので意味がある。
多分IBMはその辺のニーズを狙ってサーバ用途にCELLを
使いたがってるのだろうが、それはゲーム機の場合関係無いわけで・・・
IBM的にはCELLは役に立つけど、ソニーや東芝はどうなんだろうね。
というかCELL上ではいわゆるOSたる部分はレベル0-1にある部分でlinuxとかはレベル2でしか動作しないらしいから
もうそれは最下層のカーネルから見たらアプリ扱いでしょ。
それこそ感覚的に言えばJavaVMや.Net Frameworkをwindows上で動かしてるようなもんじゃない?
隔離された環境の必要性については、著作権保護とかあるけどたとえばクタが言ってたことで例にするなら
Linuxを動作しているのとは別に完全に別で著作権保護フラグのついた地上波デジタルの録画ファイルを再加工するとかあるとおもうよ。
サーバーか開発現場での利用でなければやはり一般向けでは著作権保護しかない気はするが。
あれだけセキュリティを考慮して作ったPSPでも、UMDがdumpされてP2Pで流通しているからね。
SCEも慎重になるでしょう。
>>212 OS無しかTronなりLinuxとか任意のOS上のゲームを動かしながら、
ファームウェア上のコミュニケーションソフトが別に動いたり、
Linuxが動いたりするんじゃないかな。
携帯とかで電話機能はTron系のOSで制御して、
リッチなコンテンツをLinuxで動かすというパターンがある。
変な奴がソフトウェアルータという話を持ち出してるが、
あながち間違いじゃないかもしれないね。
Linuxで実際にルータ組めばわかるけどメモリもCPUリソースもほとんど喰わない。
>>216 そなの?
房機でCPU一つ通信に丸々割くとかの話だから
回線監視とか結構重いんじゃないかと思ってたのだけど
>>217 実際に組んでみればわかるよ。
カーネル内のパケットフィルタリング、ゲートウェイ等を有効にしても決して重い処理ではない。
GbE 3つでも3.2GHzからすれば数%にもならないような微々たるものだよ。
家庭用のルータのCPUとか見ればわかるけど数百MHzとかで十分でしょ?
Xbox360でLiveに1コアをどうこうという話があるのは、
色々とリッチな処理を考えてるからじゃない?
NEによるとXbox360の1コアはNTカーネルとLiveに専念という話じゃなかったっけ
>>201 NE7/4号の日立のコンポーネント技術の記事には
「新機種に実装するソフトウェアの7−8割は既存資産の流用」って書いてあるので、ITRONの資産を流用しつつLinuxも使えるってのは魅力的なんじゃないかな。
確かにゲームだと関係ないけどね。
>219
単にCPU指定でLiveの処理のスレッドを走らせるだけだった気が。
すれ違いなんで、テクノロジスレの方が詳しい人居るんじゃない?
>>220 ITRONの資産なんて意味あるの?
あれは組み込み向けOSだからその上に載る
アプリケーションまでは活用できないし、
そもそもITRON自体も改変して使われるのが
一般的だったはずだが。
>>208 サンクス。
マークだけは見たことあったけど、これだったのか
いや、だからITRON上で動いてるアプリーケーションごと
持ってくれば良い話だろ。昨今はLinuxがメインストリーム
になりつつあるが、そのITORN上で動いてる既存アプリをLinuxに
移植する手間を考えれば、複数OSを使ってそのまま持ってきた
方が速いって言うだけの話。んで、Linux上では新アプリを
実装していくと。
ITRON上で動くアプリケーションって何?
組み込みOSで動かすソフトウェアとは
一般的なアプリケーションではないのだが。
ついでに言えば、ITORNに優位性なんか存在しない。
今までは「フリー改変」という点のみが他のOSに対する
アドバンテージだったが、組み込みに向けLinuxが登場した
今となってはアドバンテージゼロ。
早晩シェアを奪われるだろう。
そうは問屋が卸してくれないのが組み込みの世界というやつで。
あとITORNは恥ずいのでヤメレ。
CELLを制御用として使う場合は、リアルタイムOSの意味はある。
RT-Linuxは実装が乱立してるし、まだまだ枯れてない。
ただ、所詮は1/60秒で反応すりゃいいゲーム機の場合は、リアルタイムOSはいらんと思われ。
リアルタイムOSの本領は、マイクロ秒単位での反応速度保証が欲しい場合。
リアルタイムOSは、ハードリアルタイムタスクの反応時間を保証するために、
仕事があろうが無かろうが一定のタイムスライスを強制的に予約してしまう。
CPUサイクルを100%絞り尽くす気のゲーム会社にとっては、邪魔扱いされるだけだろうな。
ちょっと聞いてみたいのだが、LPAR で hard-realtime を保証する場合、
LPAR 毎に割当てる time slice の粒度などが問題になると思うのだが、
そのあたりに関する技術情報の断片とかって何か出てましたかね?
μITRONは別にOSでハードリアルタイムなんかサポートしていない。
いや、そういう実装もあるのかもしれないが、そんなものはゲームでは使わんだろ。
普通は単に最大割り込み禁止時間を保証してるだけ。
μITRONには、資源を過度に仮想化しない・独自拡張が容易・カーネルがコンパクト、
といったメリットも思いつく。PS3がμITRONとLinuxをゲームでどう使いわける
つもりなのかまだよくわからない。EpicはLinux上でUE3を実装したようなので、
メーカごとに開発者が慣れてる方を選べということかもしれない。
>>229 実際、LPARとハードリアルタイム処理とは相性悪いのは想像に難くないよね。
1つのLPARにリソース100%割り当てれば、事実上ハイパーバイザが停止するような作りに
なってりゃだいぶマシかも。
思うにCELLは、組込用に使う場合、リアルタイムOSでがりがり動く制御用じゃなくて、、
画像処理・画像認識とか、MPEGのエンコードデコードといった、ハードリアルタイム処理は
いらんがとにかく演算性能が必要な処理を狙ってるんじゃないかなぁ。
実際、普通の制御用に使うには熱いし高価いしもったいないと思われ。
>>230 SCEは、PS1/PS2/PSPでもゲーム用には独自カーネル提供してたわけだし、
PS3でも、わざわざμITRONなんか持ち出さず、独自カーネルで行く可能性が
高いと思う。
CELLベースPSXなら、μITRON採用される可能性あるかな。
LinuxOSもアプリケーションのひとつのように見えるなら、ゲームはその横に並ぶってことかな。
コンシューマゲームの基本はすべてがスタティックリンクされた、OSも含むひとつのバイナリだし。
GPLなコードは一切使えんのね。
>>234 LPAR には GPL 汚染を防ぐ防波堤の意味もあるのではないかと。
Cellのハードウェアリソース管理と仮想OSのメリットをお勉強するのがいいんでは。
ゲーム動作中もなにかしらのサーバー的役割をしたいだろうし、そんなサーバーが
ゲームが落ちたくらいで巻き添え食ってるようじゃ話にならんし。
さらにTRONはいるイラネでいえばCellを外販したいんだから動くようにしておいた方が良いだろう。
TRONいらねって馬鹿か?
Linuxでスレッド切り替えの間隔ぐらい知っとけ
よく知らんけど、数百usecのオーダじゃない? 3GHzのCellでそれは問題にならないでしょ。
Linuxはちょっと悪いときで10ms超えるぐらいじゃないっけ
スワップなしの環境で、待ちに入る要因ないのにmsのオーダはありえんでしょう。
・∀・)b アヒルイイ!!
タイムスライスとそのオーバーヘッドがごっちゃになってる悪寒
アヒルかわいい(*´∀`*)
>>242 Linuxは、2万個くらいプロセスが動いてたりすると、プロセススケジュールが
回ってくるまで、もの凄く待たされる。
普通のLinuxでは、
「何があろうとも200usecで反応しろ。例外は認めんぞ(#゚Д゚)ゴルァ」
という要求があった場合、これを満たせない。
リアルタイムOSは、この要求(ハードリアルタイム処理)を満たす事に特化したOSと言っていい。
この手の要求は、衝撃センサー検知後のエアバック起動などの制御で必要となる。
逆に、ハードリアルタイム処理の要求がなく、メモリに余裕がある場合は、Linuxでも問題はない。
とりあえず話をPS3に限れば、タイムスライス間隔を10msより小さくしたり、
2万個プロセス動かしたり、エンジンを制御したりすることはないと思うんだけど。
PS2はハードリアルタイム処理が必要な周辺デバイス部分はIOP(R3000カスタム?)が担当して、
ゲーム処理をやっているEEとは分離されていて、くたたんも自慢げに語っていたのを読んだ気がするけど、
PS3ではCellがその辺のつまらない処理までやることになるのかねぇ?
予測できない割り込みオーバーヘッドやキャッシュ汚染はゲーム屋さんは嫌う気がするけど。
やっぱアヒルデモはええなぁ、ここらで伝説の恐竜デモ復活希望
いや、やはりマンタで。
>>248 細かいI/Oはサウスブリッジチップ積んでるんだし、そちらが担当してくれると思うがね
ゲーム用途で使うなら頻繁なスレッド切り替えなんて、性能落とすだけだが
汎用CPUとしてのCellならハードリアルタイムな処理も必要になってくるだろうから
対応できる設計になっていると思うぞ
Cellの発表会でもCell is a Real-Time Architectureと発表しているんだし
>>248 SBがやるのかCELLがやるのかは知らないが、1/60秒という長時間単位で動く
ゲーム機ならば、ハードリアルタイム処理は必要ない。
今までどおり、バッファリングと割り込み処理(ソフトリアルタイム処理)で問題ない。
システム的には処理落ちも許容するだろう。(客は許容しないかもしれんが)
というか、過去ハードリアルタイム処理を実装したゲーム機なんて無いと思われ。
いや、画面描画とゲーム処理なら1フレーム単位で充分だけれど、
周辺デバイスは1/60秒以下のリアルタイム性が必要でしょ。
サウンドとかネットワークとかHDDとかUSBとか。取りこぼしは致命的になる部分だし。
>>253 ネットやらUSBあたりは元々反応速度が良くないから
それこそデータを流しっぱなしにしておいたほうが良いとおもふ
>>253 I/Oのチップ自体で最低限のバッファ持ってるのが普通だと思うけれど?
サウンドもI/Oも、「ストリームを取りこぼさなけりゃいい」わけで、
スケジューリング時間を保証する必要はない。
このへんはゲーム機に限らず、WindowsでもLinuxでも全く同じ状況。
今までどおり、バッファリングと割り込みで問題ないと思う。
仮に取りこぼしやエラーを起こしたらリトライ/再送要求するだけ。
CD/DVDのリードエラーなんて日常茶飯事だ。
どうでもいいよ、つまらん
バッファリングですむデータ転送レベルの話でなく、デバイスハードのハンドリングの話。
IOポートとか叩くドライバを書いたりした経験のある人は少ないのかな。
PS2のゲームディスクの中を見たりすると、HDD.IRXとかUSBMOUSE.IRXとか、
IOP用のドライバとおぼしきバイナリファイルが入って入りするけれど、
SBが固定機能ASICではなく、こういうバイナリ実行ができるハードなのかが気になるのだけど。
>>258 PS3のデバイスドライバを、Cellが実行するのかSB内サブプロセッサが
実行するかは、SBの概要が未発表なので不明。
ただ、サウンドチップを廃してCellでサウンド処理やる等の内容を見るに、
SBはシンプルなI/Oチップにして、細かいことは全部Cellでソフトウェア処理
させようとしてると予想。
つ〜かPS3に特化した話はスレ違いだろ?
Cellの具体的なプロダクトがPS3なんだから、そこからCellの実際を考えるわけ。
くたたんの昔の言葉では、遅いIOに足を引っ張られてCPUが割り込まれたりするのは無駄だと言っていたわけで、
そこから考えれば、CellがIOに煩わされない特別な仕組みがあるのではないかと。
なんだかんだ言ってPPEがゲーム処理のメインを担うとすれば、独立したSPEがIOを行う仕組みがあるのか、
それならLSの256KBにすべてのドライババイナリが置かれるのかとか、それが現実的なのかとか、疑問が続くわけだけど。
>独立したSPEがIOを行う仕組みがあるのか、
>それならLSの256KBにすべてのドライババイナリが
>置かれるのかとか、それが現実的なのかとか、疑問が続くわけだけど。
このしょーもない妄想がどう現実的なのかとw
Cell世界ではI/Oとかの下回りの仕事をするのがPPEの役目だべ。
SPE様の手さえ煩わせなければ(クタタン的には)いいのさ。
Cellでやる場合にしろ、SPEにドライバはありえんだろ。
普通にPPEのカーネルとセットでドライバをロードするだろう。
PPEは、in-orderでパイプラインが短く、マルチスレッド対応で、
コンテクストスイッチが軽い。
ドライバコードを常駐させておいて割り込み駆動させるのには
けっこう向いているコアだ。
割り込みが入ってくるのはPPEだけど、
ハンドラをSPEで実行するようにすることは
可能だろう。
ありえないとか役目とかは置いといてSPEからIO叩く事は可能なの?
直接は不可能だろう。
そこら辺の制御線は全部PPEから伸びてるかと。
>>264 確かに可能だとは思うが、それやっちゃうと、ドライバをロードしたSPEを、
割り込みが来るまで待機状態にしておく必要がある。
もったいなくね?
割り込み入ってから、SPEにドライバロードしてるようでは遅延時間がアレだし。
可能なら一個くらいIOP的に使ったっていいんじゃないの。
特にSPEを持て余してる間は。
圧縮ファイルを展開しつつメインメモリに展開とか。
ゲームにスレッドは必要ないよ。
実際、PC上のゲームがスレッドを利用してないのと同じことだ。
OSの導入で最高にうれしいのは、仮想メモリーを利用して
メモリの断片化がおきないようにすることだ。
現状は、それこそ涙ぐましい努力でどうにか乗り切ってるんだろうから。
これさえあれば、あとはオマケみたいなもんだ。
釣れますか?
まあ、くたたんがEE時代に言っていた、高速CPUへの割り込みペナルティは大きすぎる、
という話に納得したので、印象に残っているんだよな。
パイプラインのクリア、コンテキストスイッチ、キャッシュの汚染、予測の不可能性、とか
いちいち例を挙げられていたので、くたたんは根っからの技術屋だなと思った。
それハッタリ…かどうかはともかくとして、
CPUが速くなると、全体に占める割り込み処理の割合は小さくなるので、
CellのPPEのスピードならば、I/Oも処理しても別に問題は生じないのではないかと。
速度にシビアな部分はSPEに逃がせるでしょ。
PPEはOSとかI/Oの割り込み処理とか、タスクのスケジューリングとか、汚れ役に徹すればいいんじゃないの?
ディスク読み込みで当たりもしないデータキャッシュがぶっ壊れる上に
キャッシュにあわせて最適化してたプログラムもキャッシュストールするよう
になるわけですよ。
そういった面倒くさいことをまったく考えなくて良いXBOX360は開発楽だろうね。
>>274 ?
共有L2キャッシュしかないXBOX360の方こそ、
そういうことに気を遣わないといかんのではないのけ?
xenonのL2キャッシュのアクセスレイテンシは 推定31クロックサイクル
キャッシュミスによる主記憶アクセスには 推定525クロックサイクルを消費するという膨大なロスが
UMAで、CPUがメモリコントローラを持たず、主記憶がGPUの向こう側にあるという弱点
一方、cellのSPEのLSは L1キャッシュと同じスピードなので、容量内で上手く回せば、
レイテンシ 4クロックサイクル前後の超高速メインメモリを持つのと同じで
途方も無い”実効性能”を発揮する。 1サイクルあたり最大 8個の並列演算が史上最小のレイテンシで行われる
レイテンシは適切に管理され、”キャッシュヒットミス”などは もはや存在しない
そして この「上手く回せば」を実現するため、PS2発売直後から
1年間のアーキテクチャ構想 、2年間の設計・試作、 更に2年間の改良・コンパイラ・OSの設計期間を費やした
Cellの開発の大半は この「いかに上手く、効率的に回し、ロスを無くすか」 の努力に懸けられていると言ってもいい
他のCPUのように カタログスペックを追求することは、重要では無い。 大事なのは、「実効性能」
上手く行くかどうかは別として、面白いね。
277 :
名無しさん必死だな:2005/07/24(日) 11:31:05 ID:1vBi7BUl
>>276 比較の仕方が意味不明。
箱○CPUにもL1はあるしLSとL2のレイテンシを比べてどうするのかと。
Cellの場合LS間の共有フラグや入り切らないデーターはXDRに読みに行くしかないが、箱○はL1→L2→GDDR3だからCellよりメインメモリを読みにいく頻度は低くなる。
>>277 >箱○はL1→L2→GDDR3だからCellよりメインメモリを読みにいく頻度は低くなる。
こないだのRambus ForumのSCEプレゼンテーションは全然違う結論になってたな。
ああ、ちょっと迂遠になったんで説明しておくと、L2でヒットする確率は処理
データが膨大になると非常に低下してしまうってことね
>>277 箱○のL1は普通の32+32KBの命令/データキャッシュ。
SPEのLSと同等の速度(レイテンシ)なのはここだけ。
L2は圧倒的に遅い上に キャッシュミスが常時起きる。
扱うデータが膨大になればなるほど、キャッシュミスは起きやすい。
それが判明した後で 初めて主記憶に取りに行く。 これはCellには存在しないロス。
>>データーはXDRに読みに行くしかない
それはxenonCPUも含め全てのCPUが同じ。
と言っても、XDRと異なり GPUの彼方にあるUMAだからペナルティが巨大。
単にコアを増やすだけでは実行性能は上がらない。
xenonCPUは 避けられない主記憶アクセスで 絶望的なレイテンシが発生する。
と言っても、これは普通のPCも同じことだから、悲観するほとのことは無い。
Cellが特殊なだけだ。 Cellも レイテンシがあるのは当然。
要は、それを改善する努力をしたCell、全くせず、PC同様にしたxenonCPU、というだけ。
箱○CPUのキャッシュはロック出きるというのは無視でつか、そうですか。
>>281 xenonCPUで実行性能を出すにはL2をソフト側で制御する必要があり、
開発は思ったほど簡単ではない。
という結論になる訳だが。
CPUってグラフィックに影響しないので、べつに遅くても関係ないね・・
LSのように扱う、というわけですか。
でも、それだとSPEの劣化版ですよ。
上の批判にあるように、CellのLSシステムは常時 XDRから
ロス無くデータを供給し続けないと実効性能が出ない。また、そのための専用設計。
UMAでレイテンシも帯域も不利なxenonCPUには 酷というもの・・。
しかも、xenonL2のレイテンシは 上に書いたように L1≒LSより 1桁遅い。
だったら、いっそ特許料払ってCellを採用すれば良かったのに
>280
追加すると、LSにはキャッシュミスペナルティが存在しない。
DMAで明示的にデータの入れ替えを行うから。
その代わりDMAスケジューリングをしなければならない。
この辺がうまくサポートされないとPS2の時のように使うのが難しいとかの評判が立つかもしれないが。
>281
キャッシュロックは同じデータ領域を維持しておくにはいいけど、データが膨大になるとかえって足を引っ張らない?
ロックで減った残り領域でキャッシュヒットしなきゃペナルティだよ。
GPUの能力を超えるだけの要求をMPU側が発行できないと、
どれだけGPUが高性能でもそこで頭打ちになる。
>>286 SPEでその発行はできるの?
PPEだけなような気がするが・・・
>>285 >>その代わりDMAスケジューリングをしなければならない。
>>この辺がうまくサポートされないとPS2の時のように使うのが難しいとかの評判
それこそが決定的なキモであると、IBMの”老練”アーキテクタさんも気づいていたよね。
ここが上手く行かないと PS2の悪夢ふたたび・・
逆にここさえクリアすれば、実効性能は桁違いに。
あまり知らないんだけど、NECの「地球シミュレータ」もキャッシュに頼らない設計なんだっけ?
山崎剛さんが キャッシュを廃止し、LSシステムを強く主張したのはおもしろいね。
暖めていたアイデアなんだろうか?
FFTベンチは 座標演算などに最も多用する積和演算で 悪くない結果を出してたようだけど。
さてゲーム開発ではどうなることやら・・
>>287 SPEのDMA→EIB→FlexIO→RSXという径路で直接データ送れるわけだが。
>>287 マルチプロセッサでストリーミング処理(GPUへのデータ流し込みもこれ)なら、メインメモリを介さずバケツリレーしたほうが効率良いんだから、もし出来なかったらありえないほどの設計ミス。
http://pc.watch.impress.co.jp/docs/2005/0722/kaigai199.htm これまでのアーキテクチャでは、CPUとGPUのどちらかがボトルネックに
なって処理できないと、それ以上のことができなかった。それに対して、
PS3アーキテクチャの場合は、GPUがネックだったらCellへ、Cell側が
ネックだったらGPUへと負荷を分担させることができるという。例えば、
ソフトウェアによってはCell側でもっとグラフィックスを処理させて表現を
向上させる、あるいはその逆に、Cell側は物理プロセッシングにもっと割きたい
から、グラフィックスはGPUにまかせるといった調整が容易になると説明する。
つまり、CPUとGPUという2つのプログラマブルプロセッサの間での、
フレキシブルなバランス調整が可能になるというわけだ。
xenonのL2キャッシュロックシステムって、
LSのように扱うんじゃなくて、
L2から消されたくないキャッシュデータを明示的に残しておく
って為だけのもの?
正直XBOX360はAthlon64改の2コアで良かったんでない
>>290 SPEの細切れデータを取得するより、
XDRから纏まったデータを取得した方が効率的では?
>>289 >>290 できないよ。公開されている情報をよく読め
SPEのDMAはメインメモリとしかデータをやり取りできない。
ID:Zi6tKtQEは大人しくVSスレに篭ってフロムの画像でもコピペしてろよ
297 :
名無しさん必死だな:2005/07/24(日) 13:29:22 ID:wObS1uNd
しっかし、ゲーハーとは思えないほどのレベル高いし、内容も濃いスレだな。
ROMばっかだけど、いつも楽しみにしてます。
>>295 メモリマップトI/Oって知ってるかい?
>295
素人なんで間違ってたらスマンが、このサイト見る限りそんなことは無いんじゃないか?
ttp://pc.watch.impress.co.jp/docs/2005/0212/kaigai157.htm >Cellでは、各要素はElement Interconnect Bus(EIB)と呼ばれる広帯域のリング型バスで接続されている。
>SPEはDMA転送でEIBを経由して、システムメモリなどにアクセスする。DMAリクエストは、
>最大で16トランスファをオンザフライで発行することができる。
って書いてあるよ。
流石にPPEと同様にリングバスに繋がっててメインメモリ以外にアクセス出来ないってことは無いだろ。
こんなこと言ってるカスなんだからまともに取り合う必要無し
いつもの捏造君だよ
54 名前:名無しさん必死だな[] 投稿日:2005/07/24(日) 08:09:14 ID:Zi6tKtQE
>>51 スレッド分割をほとんどコンパイラとOSでやってくれる360でこれだけ難しいと言われているんだから
全部手でコーディングしなきゃならないcellは、押して知るべしってとこだな
>>290 VRAMならともかく、GPUに直接データを流し込もうとすると、
GPUとの同期が必要。つまり、GPUがデータ受け取り可能に
なるまでSPEのDMAが待たされることになる。
逆に非効率だ。
とりあえずXDRかVRAMに吐き出しておいて、都合の良いタイミングで
GPUに読ませた方が良い。
なにげにチカン自ら360が難しいと認めてるなw
>300
でもほっといたらこれを二次ソースにしてどんどん噂が広がってくよ?
パッと見でどうしようもないレスなわけでもなく、騙される人もでるかもしれない。
雑魚ならなおさら瞬殺してかないと。
304 :
名無しさん必死だな:2005/07/24(日) 13:50:09 ID:Zi6tKtQE
対策は、早めに。
駆除は、確実に。
1匹見かけたら、30匹はいる。
>>303 広がっても実害ないでしょ。
いつものソース無しコピペとかの捏造と同レベル。
これだけ叩かれて、自演GK乙か
308 :
名無しさん必死だな:2005/07/24(日) 13:59:30 ID:Zi6tKtQE
事実を書いているんだからGKの誹謗中傷・個人攻撃なんて
痛くも痒くもないもんでね。
>>308 ソースも出せない事実?
脳内での事実は、事実とは言わんよ。
310 :
名無しさん必死だな:2005/07/24(日) 14:05:07 ID:Zi6tKtQE
反論できなくなるとソースソースと言い出すのは典型的なGKの特徴
今なぜ構ってはいけないのか解った。
構うと増長するのか。
正直スマンカッタ >all
cellがあればPS2よりゲーム作りの手間が省けて
コストダウンウマー?
>>310 そしてソースを出せないのが典型的な痴漢の特徴
反論できなくなるとソースソースと言い出すのは典型的なGKの特徴
とか言って逃げようとするのがいつもの捏造君の特長
>>295で言ってる公開されている情報とやらをとっとと出せば済む問題だろw
>>301 ってか、GPUとの同期が必要って当たり前じゃないのか?
物理計算やるにも同期とるだろうし。
過去ゲーム機だけじゃなく、CPU-GPUで成り立つどんなシステム
もそうやって同期取ってきてる訳だが。
本日のゲハ担当GK
z1dVfUcj
tcRFEg83
rG3WiPSd
なんかチップレベルの信号の同期とデータの一貫性を保つための同期が
いっしょくたになって語られてるんじゃねぇかと思う
せっかく良スレなのに・・・
皆様、あんまり餌を与えない方がよいんではないでしょうか?
つ[虫リスト]
>>295のような言説でありながらソースを出せないという、
いつもの敗北宣言(
>>310)を出してるんだから、もうほっとけばいいんじゃない?
他のスレに貼り付けて嘘ソースとして使われる事があるんで、とりあえず否定を
しとかないとね
まぁいつもソース出せずに逃げるだけだから放っておいてもいいんだけどさ
325 :
305:2005/07/24(日) 14:18:19 ID:ZVVjzTfN
水だけで数ヶ月間 生存します
食べ残しや 人間の垢・毛髪などを食べても生きられます
駆除・予防の秘訣は、餌を徹底的に排除することです
エサを与えないでください
虫リストじゃなくてマーキング機能のあるブラウザないですかね?
ID覚えられないし・・・
>>316 その同期の間、ずっとSPEをストールさせておくのは非効率と言ってる。
LSの内容をメモリに吐いちゃえば、SPEは次の仕事を始められる。
メモリを同期バッファに使えと言うこと。
雑談は他所でやれ。どうみても結果としてスレ荒らしてるのはお前らだぞ。
>そういった面倒くさいことをまったく考えなくて良いXBOX360は開発楽だろうね。
補足すると、MSが全部ライブラリでやってくれるんだろうということで。
>>329 おまいはライブラリをゲームツクールか何かと勘違いしとらんか?
>>327 DMA転送中もSPEの演算ユニットはストールしないし、
DMA転送自体も16トランスファをオンザフライで発行できる。
SPEにはLSというバッファがあるのに、
わざわざ別にバッファを用意する必要なんてないでしょ。
>>331 DMAがストールしてると、ダブルバッファの裏でのSPEの仕事が
終わった瞬間、次のデータが用意できてないので完全停止するよ。
ただでさえメモリ帯域の関係で「DMA裏読みがSPEの処理速度に負けるかも」
とか言われてたくらいだし。
256KBしかないLSは貴重。同期バッファに使うなんてもったいなさすぎ。
とはいえ、この辺はアプリの作りによるか。SPEが余ってるようなら、
こういった贅沢な使い方もあるかな。
ふと思いついた。
SPEのバケツリレー機能をつかって、隣のSPEのLSを、
FIFOバッファにしちゃうってのも可能だな。
んな使い方ばっかりされたら、山崎タンが草場の陰で泣いてそうだが……
>>332 なら、トリプルバッファ?にして、
・メインメモリ→LS
・データ処理
・LS→GPU
を並行して実行できるようにすればいいのでは?
ていうか、GPUへのデータ・コマンド転送ってそんなの遅いのけ?
ここが爆速なのがPS3の特徴のひとつだと思っていたのだが。
>>332 ただ逆の発想で
SPE処理がプリフェッチで行わている場合は、
GPUはメインメモリから取得する必要は無いんじゃないかな、
あとGPUのキャッシュに直接流し込むっていう手もあるのでは・・。
さらにGPU側の受け手準備が整いさえすれば、あとはSPEから流し込むだけなような
気がするのは気のせいか?
ビデオストリームの再生プレゼンなんかを見るに、SPEまわりの演算能力や
転送能力に不安はないでしょ。CELLのボトルネックはSPEよりPPEと思われ。
PPEが過重な処理に忙殺させられると、SPEの面倒を見切れなくなるんじゃないかな。
描画コマンドを一度に大量に送られてもGPUが処理できないし、
VRAMにバッファリングしたらそれこそ貴重な描画用帯域を消費して無駄では。
描画コマンドバッチはメインメモリに置いておいて、GPUのコマンド処理に同期して
GPU自身がDMAで取ってくるというのがストールも起こらないしスマートかと。
>>337 いくらなんでも、GPU内にコマンドバッファくらいあるだろ、普通。
いや、だからコマンドバッファを超えるようなデータ量が送られてきたら、
それを転送しているSPEなりが描画待ちでストールしてしまうでしょ。
さらに、複数のLSから同時に送りつけられる可能性もある。
瞬間最大風速的には速そうに見えるが、
効率的に処理できるかは疑問だなぁ。
>>339 GPUの細かい設計がどうなってるかしらんけど、
そのときはGPU自身がVRAMに待避しておくとか、手段はいくらでもありそうだが。
いずれにしても、GPU側で解決すべき問題。
>>341 それって、SPEがメモリ上の同期バッファに吐いておくのと何が違うんだ?
GPUの負荷上げるだけで、システム的にバランスの良い設計とは思えないが。
>>341 わざわざ
>>337でその方法は疑問と書いたのに。
そもそも描画コマンドは1フレーム内で順序よく並んでいなければいけないので、
一旦メインメモリ上でリンクリストなりでシーケンシャルな参照ができるようにしなければならない。
それぞれのSPEが勝手にコマンドを送っても画面がぶっ壊れるだけ。
>>342 GPUの処理が間に合ってる時には無駄なメモリ転送が発生しないし、
GPUがせっせと描画してる間に、Cell側では次の処理に専念できる。
>>343 え、そうなの?
何のためのZバッファなんだろう・・・。
>描画コマンドは1フレーム内で順序よく並んでいなければいけない
タイリングペインドなPVRでもない限りこんなことはありませんな
なんのためのZバッファなのか
>>343 ていうか、複数のSPEが勝手に送ったら、そりゃあかんだろうな。
>>345 Zバッファというのはあくまでポリゴンの奥行き描画で破綻しないため。
例えば、SPE1が背景の描画コマンドを送っている間に、
SPE2がキャラの描画コマンドを送ったら、まともに描画するには、
テクスチャキャッシュも、シェーダーコードも、その他多くのコンテキストもいちいち切り替えなければならない。
そんな無駄は許容できないでしょ。
>>348 いつから複数SPEで片っ端からGPUにデータを送りつける話しになったんだっけ?
そもそもそんなSPEの使い方自体がおかしいとおもうんだけど。
なんで背景描画中にオブジェクトを描画するのやら
当たり前だけど別々に描画するもんだろ
ああ、オブジェクトをSPEでT&Lしてどんどん描画していくのになんか問題があるのか?
背景とか意味不明な難癖つけてるのが351だろ
>>351 290は、バケツリレーの話しだよね?
バケツリレーってのは、データがA→B→C→Dって流れていく様を表現した言葉だと思っていたのだが、違うのか?(笑)
>>349 複数存在するSPEの演算資源を描画(コマンド作成)に関して効率的に使うには、
一旦メインメモリにデータを吐かせる必要があるという話をしているだけ。
一方で、SPEをピクセルフィルタ処理などに使うのなら、メインメモリを介する必要はないので、
Cell-RSX間の帯域は有効に使えるということ。
355 :
名無しさん必死だな:2005/07/24(日) 15:53:44 ID:ybxpUKHI
cellがあればPS2よりゲーム作りの手間が省けて
コストダウンで値下げウマー?
>>353 351がなにを勘違いしてるのかようやく理解できたw
サンクス
ここを読んでいるとSPEを使いこなすなんて簡単に見えるがなぜSCEもサードもあんなに苦慮しているのか不思議だ。
>>354 描画コマンド作成ってそんな重い処理だったっけ?
当たり判定とか物理演算とか散々やった後に、えいやって実行するだけちゃうの?
SPE同士のバケツリレーは有効だが、そのまんまGPUへのデータ流し込みは非効率。
漏れの言いたいことはこれだけだが、漏れは何を誤解していたんだ?
>>354 おまえはPS2のVUの仕様でも調べておけと。
>>362 そのVU1とGSが直結された細〜いバスが、どれだけ非効率だったかを
反省した結果が、今回のNUMA構成だと思うが。
>>361 GPUへデータを流し込むのはSPEバケツリレーの最後だから、
受け側のGPUの設計がまともなら非効率にならないってはなしだよ。
>>364 RSXの仕様が不明だから、そのへんの詳細は不明だね。
以後の情報を待ちませう。
366 :
名無しさん必死だな:2005/07/24(日) 16:14:20 ID:DpuHa3ml
そもそも既存のマルチプロセッサはどうやって同期をとってぃるんだ?
>>362 PS2のUVは今で言うバーテックスシェーダー+トライアングルセットアップの一部の
仕事までこなす必要があったから比べるのはおかしいぞ
RSXのVSを限界ギリギリまで効率的に使う為に、頂点演算の一部をSPEでこなしながら
RSXに流し込む方法も、事前にSPEで処理したコマンドリストをメインメモリに置いておいて、
それをRSXが読む方法も両方使える仕様なんだから、開発者がゲームに合わせて使えば
良いだけの事じゃないか
>>366 ハードを叩くのはドライバで、ドライバ部分はシングルスレッドで動くよね。
ソフトでも例えばsocketなんかは複数スレッドで読み書きすると動作が保証されないとかあるよね。
ライブラリとかでもスレッドセーフかどうかってあるし。
ANSI-Cのstrtokなんかはインターフェース上どうしてもスレッドセーフにはならないので、
Linuxなんかではstrtok_rというスレッドセーフバージョンが用意されている。
SPEアクセスに関しては仕様がわからないのでなんとも。
ドライバもマルチスレッド化しているのは結構ある。
シングルスレッドのドライバーは大体I/Oを直に叩いてるだけ。
仮想化でI/Oを隠蔽すればマルチスレッド化は容易い。
ただ誰がコード書くのかは知らん。
>>366 とても大雑把にいうと、
コード上に、単一のスレッドだけで走る区間(クリティカルセクション)を作って、
デバイスにアクセスするような、複数スレッドが同時にしちゃいけない処理をその中で行う。
クリティカルセクションを何かのスレッドが実行しているとき、他のスレッドが
同じセクションを実行しようとすると、待たされる。
スレッドを待たせるためにmutexという仕組みを使う。メモリ上にフラグを用意して、スレッドが
クリティカルセクションに入るときにフラグを立て、セクションを出たらフラグをクリアする。
入るときにフラグがすでに立ってたら、クリアされるまで待つ。
その時のフラグ領域へのメモリアクセスは、バスをロックするような、コア間同期のための専用の命令を使う。
あるいは別のアプローチとして、複数スレッドから生じる要求を順に一列にキューに格納し(シリアライズ)、
シングルスレッドで動作するドライバが、要求を一個ずつ処理して、結果を返す。
mutexとsemaphoreの違いがよくワカラン。
mutexはロック済と未ロックの2状態しか持たないが、semaphoreはカウンタを持ち、
スレッド2個までは同時実行、とかできる。さらに実装によっては細かい仕様が違ったりする。
ちなみにpthreads仕様にmutexはあってもsemaphoreはない。μITRONとLinuxでスレッドAPIが概念から違うので、
二つの環境を行き来する開発者は頭の切替が大変そう。
次世代機スレがVSスレと化してるのに、ここはこんなにも良スレに・・・
保護のためにsage
375 :
名無しさん必死だな:2005/07/24(日) 21:43:01 ID:ZVVjzTfN
Cellはある程度知識が無いと叩けないからな。
vs住人には荷が重い。
そもそもxenonCPUの不利は隠しようが無いし・・
xenonはもう少し練った設計に出来なかったのかね?
GPU側にメモコン搭載したり、明らかに手抜きなんだけど
GCのGekkoもPPC750をベースに演算器とキャッシュ回りの追加ぐらいなので、
PowerPCカスタムというのはだいたいそういうものでは。
Xenonが手を抜いたというよりは、Cellがあまりにやりすぎたというのが適切かと。
ちょっとスレ違いだが、
mutexにはできなくてsemaphoreだと可能なことにマイナス値を持つことができるってのがあるな。
どれだけのスレッドがそのリソースを使いたがっているかが分かったりする。
>>376 UMAの利便性を重要視したんだろ。
UMAならCPUからテクスチャデータ直接操作
するような事が簡単にできるらしいぞ。
PS3もCELLからGDDR3に直接アクセスすることもできますが。レイテンシ的には
XBOX360のCPU→GDDR3とあまり変わらないかもしれんよw
>>379 もうちょっとスレのレベルと空気よんで書き込んだほうがいいよw
UMA構成でも、CPU側にメモリコントローラを置く設計はありうる。AMD Athlon系のように。
CPUよりGPUの方がメモリアクセスのレイテンシに寛容なので、CPU側に置く方が合理的かもしれない。
でも設計は難しくなるらしい。そこまでするのが正しいかどうか。
PS3ってメインメモリとVRAMの2つのメモリがあるんだよな。
この辺のアクセス方法ってどうなっているんだろう・・・
共通のアドレス空間持っていて暗黙的にVRAM弄ぶとかできるの?
・設計をシンプルにしてコスト削減
・レイテンシ隠蔽としてのSMTが存在
・CPUとGPUを比べると3:7程度でGPUがより大きく帯域を消耗する
・ハードウェアプリフェッチの適切な利用を期待
だろ。
それよりL2が8wayしか無いって言うのが一番ひどいとおもうのだけど。
仮想関数用のジャンプテーブルで一個使うし、
レジスタが山盛りあるとは言え大きい関数だとスタックに積んじゃう上に、ライトスルーだし。
L1が4wayっていうのも、L1プリフェッチの利用を考えると少し足りないわな。
>>373 ゲームだと大半の場合プロセス間通信は行わないので、
単純ロックのEnter/LeaveCriticalSectionを使うのが標準。
しかしMSに(変動費ではなく)固定費である設計コストを削減する強い動機はないはず…とも思う。
金さえ出せばIBMはなんでもやる会社だろう。
IBMに惚れこんだSCE(くたたん)に比べて、MSはあまりIBMとは話がしたくなかったのかもしれない。
> 単純ロックのEnter/LeaveCriticalSectionを使うのが標準。
そのAPIを、mutexを使って実装する。
387 :
383:2005/07/24(日) 23:35:01 ID:l5op6tsU
無視するなぁヽ(`Д´)ノ ウワァァン
NUMA構成ってVRAMにアクセスする時どーするのか誰か教えてクレクレ
>>385 それは1コアあたりですか?Power4は1コアに対してそれだけですよね?
L2-8Wayが6スレッドから。
L1D-4Wayが2スレッドから。
L1I-2Wayが2スレッドから。
ライトスルーであることを考えれば少しキツイ仕様だと思いますが。
L2を有効に利用するために出来る限りソースデータはL1プリフェッチを利用しなきゃいけないわけだけど、
末端の展開された関数以外ではほとんどそれは不可能になってしまう。
大半のアプリケーションは末端の関数でほとんどの処理を費やすから、ある意味理に適ってる部分はあるけど、
入力が2系統からくるような処理も存在するわけでそういう場合は
このL1-4wayはかなりの足かせになりうると思うんだがどうか。
アドレス空間は共通で、32bitのメモリ空間のどこかに256MBのメインメモリが、
別のどこかに256MBのVRAMが割当てられるのであろう。
>>389 てことはテクスチャや頂点データだけでなくて音楽データや
キャラ座標データもVRAM側に置こうと思えば置けるわけですね。
プログラムから「あのデータはVRAM側に置け」とか、そーいう指定もできるんですか?
でもC言語ではデータの保管場所まで指定できる文法って無かったですよね・・・
出来なかったら、本来VRAM側に置くべきでないデータまでVRAMに
置かれてしまうとか、そういう弊害も出そうな気がするのですが。
>>でもC言語ではデータの保管場所まで指定できる文法って無かったですよね・・・
あると思ったけど
メモリマップドI/Oとかあるし
あれってほんとはライブラリの中ではアセンブラで呼び出してるんだっけ?
APIとしては、メインメモリ上にメモリ領域を獲得するmalloc()/free()とは別に、
VRAM上に獲得するvmalloc()/vfree()とかそーゆー非標準なものが追加されるのであろう。
標準C/C++のセマンティクスは均一なメモリ空間を仮定しているので、
たとえばC++オブジェクトをVRAM上に置こうとすると厄介。そういう必要はまず生じないが。
ソフトウェアからアプローチするMSがUMAにこだわるのも一理ある。
どーせPS3につられて512MBにするなら、256bit幅にして帯域増やせばよかったのにねえ。
>>392 初期型は8つのメモリ積むので256bit接続も出来るんだけど、将来メモリの使用個数を
減らせないからね。SCEはメモリもカスタム品にして個数を減らすらしい。購入するのと
生産できる会社との差だね。
まあやろうと思えば簡単では。中身も全部作ってるわけだし。
さすがのSCEもメモリは生産できない(東芝はXDRは作るけど汎用DRAMからは撤退済)。
立場はMSと同じであろう。くたたんは絶対認めないが、PS3はシュリンクで苦労するのではないか。
次世代のCellとRSXをまとめてXDR2に移行し、ピンあたりの帯域を増やしてビット数削減、
なんてアクロバティックな方法はあるかもしれない。
>>393 いや、SCEIはXDRは生産してないぞ。
大手購入先だからそういう特注もできるということでは。
>>395 nVIDIAとの契約も1チップ化も含める柔軟なものだから、コスト削減に余念はないだろ
ぶっちゃけPS3全体に占めるチップコストはPS2とかと
比べると数段下がってると思うけどね。
何よりコスト高なのはBDドライブだと思うが。
PS3を起爆剤にしてBDを普及させることによる、
青紫レーザーだのその他関連部品のコスト削減効果
の方が効いてきそうだが。
>>398 書き込みをサポートしないから、標準のBDドライブより安くなるっしょ
前にもテクノロジースレに書いたんだが、シュリンクでメモリチップを減らすとして
64bit幅のGDDR3やら32bit幅のXDR-DRAMなんて規格無いよな?どうするんだ。
仮に後者を6.4GHzの第二世代XDR-DRAM(1Mbit、16bit幅)で置き換えられたとしても
実効帯域へのレイテンシの影響とか、CPU(メモリコントローラか?)との同期の
問題が出てくると思うんだが。
まあ型番商法にならないのなら、それで良いんだが。
>>397 CellとRSXのワンチップ化なんて、この先プロセスルールが進んでも
(物理的に出来ても)熱的に出来るのか?
単に2つのメモリダイを1チップにまとめた物を使うという話がないでもない
>>401 何か某驢馬を思い出させるな。問題は無さそうだけど、
そんな変な物エルピーダや東芝、三星が作ってくれるかな?
intelに(ry
>>400 メモリチップのシュリンクは箱○の方がやり易いとかアラードが言ってたなぁ。
今は別ダイのeDRAMもGPUとワンチップにするとか言う話だし。
>>404 ありがとう。ようするに自分らが最大の消費者である事を使って
メモリメーカーに物を言うわけか。クタタンらしいというか。
>>406 まぁ殆どPS3専用メモリみたいなもんだから、融通も利くだろうよ
向こうもデカイ商談だし、悪い話じゃない
前にどっかでSPEとオブジェクト指向との親和性が高いみたいなことを言ってた記事があったけど
OOPL、特にC++との相性はむしろ悪そうだな。SPE用のフルセットのコンパイラがあったとしても。
XDRとLSが隔絶されているという制約がある以上
他のオブジェクト参照したりメッセージやり取りするのは不可能なわけで。
>>408 C++みたいな抽象的なオブジェクト指向よりCORBAとかDCOMみたいな分散環境に近いと思うが
>>408 LSのメモリアドレスってSPE固有のアドレスという話だが、同じアドレスが7つも
あるというのが今いちピンとこないんだが。
DMAでXDRに送る時はいいんだが、LSにロードする時がよく判らん。
411 :
名無しさん必死だな:2005/07/25(月) 03:52:51 ID:Hdhl17S2
>>410 そんなん、(抽象化したものでも直接的なものでも)
SPEを示すIDを指定出来る様にしときゃいいだけだろ。
>>411 仮想SPEを物理SPEにマッピングする方式だったはず
クラスの粒度ではSPEに移せない気がする。同期通信機構もないし、
特定メソッドの実行を高速化するアクセラレータ、と捉えた方がよいのでは。
>>410 固有てのは全てのLSが同じアドレスを持つという事じゃないぞ
LSは全てメインメモリの別の領域に割り当てられ、システム内で一意のアドレスを持つ
そうでなければLS間での転送できないしね
固有のアドレスというのは、SPEで走るプログラムから見た場合に、どのSPEであっても
LSは同一のアドレスを持つように見えるという事だろう
SPE間のストリーム転送はできるけどLSへのアクセスは無理、なのでは?
>>415 SPE間のストリームというのはLS間のデータ転送に他ならないよ
ストリーム転送は、送り手と受け手のSPEがそれぞれ自分のLSのアドレスを指定するので、
他のSPEのLSがアドレス空間に存在する必要がない、という違いが。
>>416 プログラムから見て同じアドレスに見えるという事は他のLSを読み書きする
場合、どうやってアドレスを指定するのかがわからないんだが。
DMAでは絶対アドレス指定なのでは?
>>417 送り手はともかく受け手がアドレス指定?
それに、他のSPEのLSがアドレス空間に存在する必要が無いとはいえ、結局物理的に
どのSPEかを指定する必要があるわけで、わざわざアドレス以外の別のスキームを
用意するとも思えないが…
>>418 他のSPEのLSを指定する場合はシステム内で一意のメモリアドレスで指定
全てのSPEとPPEでアドレス変換テーブルを共有してるようだから、物理アドレスである
必要は無いが、システム内では一意のアドレスだろうね
自分のローカルLSを指す時は専用のローカルアドレス空間を指定するだけだろう
C/C++のポートではLS内指定は32bitポインタ、システムメモリは64bitポインタで
扱っていたし
次世代とか次々世代Cellでは、SPEはネットワークの向こうにあるかもしれないのに
SPE間転送をLSのアドレス指定でやってたら破綻するでしょ。
メモリマップせずにパイプで繋ぐだけなら破綻しない。
>>420 PS3のDMAがどういうものかは知らないがDMA転送する場合SPEがDMACにアドレスを
セットするとSPEは元の処理に戻り、あとはDMACが勝手に転送するわけだが
これにはメモリマップ上のアドレスが必要になる。
LS=>XDRもしくはLS=>GDDR3への転送は問題無いのだがLSがメモリマップ上から
隔離されているか、メモリマップ上の同一のアドレスに7つのLSにロードするバッファーが
ある構造だとDMAで他のLSを読み書きする事は出来ないからカーネルをSPEにロード
して仮想化するか一度PPEを経由して転送する必要があるんだな。
サードがSPEの使い方に苦労しているのは、このあたりが原因ではないかと予測して
いるんだが。
>>421 処理のレベルが違うような、そういうネットワーク間の転送までを含めた物なら、
パイプなりなんなり別のスキームが用意されているでしょう
今はDMAというローカルなローレベルでの話をしてる
>>422 そういう構造ならそうかもしれないが、現在公開されている情報を見る限り、
それぞれのSPEのLSはシステムのメモリ空間の一部の別のアドレスにマップされて
いるようだから、その推測は当てはまらない
シンプルに個別のメモリアドレスを割り当てれば済むのに、わざわざそのような使いづらい
構成にする意味が無いだろうし
SPEの物理位置がローカルにあるかリモートであるかでSPEコードを書き分ける
必要が生じたら、Cellオブジェクトはネットワーク透過にならんでしょ。
もうすでに小島組あたりはSPE6個ぐらいまで使いこなしてそうだな
>>424 ネットワーク透過なソフトウェアCellプログラムでは、それ用システムコールを呼べば
済む、そしてそのシステムコールが通信先のSPEの位置に合わせて別の処理をすれば
よい、当然その時のSPEの特定に使うのは当然物理アドレスじゃないだろうね
ハードウェアの実装とその上で動くOSを含めたソフトウェアの話を混同してないか?
でもCell2つまではグルーチップ無しでマルチプロセッサ構成にできるんだよ
FlexIOの向こう側にあるSPEに透過的にアクセスできるにちがいない
>>423 LSのアドレスが別々でもDMAでのLS間通信はCellの設計思想に反するので出来ないと思うな。
LSがL1キャッシュ並のスピードを出せるのは割り込み処理を排除したからであって
クタも「高速CPUでの割り込みはペナルティーが大きい」と指摘している。
XDR・GDDR3の読み書きはバッファーをとってDMACにまかせればほんの一瞬でSPEは
仕事を邪魔されずに専念出来るが、いつ他のLSからアクセスがあるか判らない状態では
処理にかかる時間も予測出来ないしバッファーから溢れるとパフォーマンスも出せないからね。
たぶんネットワーク透過なLS間通信はリアルタイム性を要求されるものでは
なくてOSで管理された仮想的なシステムではないかと思う。
リアルタイム性を要求されるゲームでは使えないほど遅いと見てよいだろうね。
ゲームでのLS間通信は、DMA転送を使うがLS=>XDR=>LSと経由する事になるとおもわれ。
というかLSがふつうのCPUのL1並みのレイテンシでアクセスできるってのは誰が言い出したんだ
>>427 その場合はそのシステム全体で一つの64bitアドレス空間を持つ事になるのでしょう
>>428 >>314 使うかどうかはともかくとして、ハードウェアとしては可能なのは間違いないみたいですよ
自LS内でのDMAも可能なようですし、LSは複数バンクに分かれているようなので
DMAからのアクセスがあっても、なるべくペナルティーの無いように設計されているのでしょう
他のSPEのLSへアクセスする場合は、当然同期を取る必要があるでしょうけどね
432 :
名無しさん必死だな:2005/07/25(月) 12:42:14 ID:WyJO11xA
>>429 上のほうか、前スレかで
IBM.comのサイトで Cell開発者がコメントしてた。
>>430 他のSPEがアクセスしているバンクに読み書きしようとするとどうなるんかね?
DMAは一度セットすると終了まで止められないからローカルSPEの方が待つしかないけど。
LS=4サイクルってRambusのやつ以外になんかソースある?
>>433 Memory Flow Controllerが調停機能をもってるんじゃないですかね
そこまで詳しい話になると、まだ公開されてないようですが
>>435 ロード・ストアのレイテンシ6というのなら、Cellが当初発表された時の資料で
ちらほら見かけますが、Rambusフォーラムでの発表が最新の公式発表でしょうから
改良されたのかもしれませんね
当初のは4GHz動作の物で、RambusのはSCE発表なのでPS3向けの3.2GHz動作用に
改良した物かもしれませんし
なるほど。DD2が出てきたCool Chipsではその辺のは出なかったのかなあ
来月のHot Chips待ちだね
「L2の無いうんこCPU」
って思われるのが関の山
と予想してみる。
LS間転送できるのか。陳謝。でもin-orderでSMTは嘘だと思う。
>>442 IBMのLinuxカーネルの移植責任者がP4のHTTと例を上げてまで説明しているのだから、
嘘という事は無いでしょう、in-orderとSMTは排他では無いのですし
でも他にSMTに言及してるソースが見つからないのは不自然では。
>>442 いや、ARMもMIPSもインオーダでSMTだよ。TCを複数個持ってメモリストールしたらそのスレを飛ばせば
立派に性能が上がる。
SMTのメリットはout-of-orderのロス回避だけじゃないだろ。
分岐予測失敗とかキャッシュミスによるロスの埋め合わせにも有効だろ。
ロジックの複雑化を割引いても、対応ソフトでは性能向上が優れている。
十分 元は取れる、と トータルのトレードオフで 採用決定したのでは?
>>444 ソースと言えるかどうかはわからんがw
これはどう?
ttp://pc.watch.impress.co.jp/docs/2005/0208/kaigai153.htm >さらに、PPEはIntelのHyper-Threadingと類似のSMT(Simultaneous Multithreading)機能も搭載し、
> 2つのスレッドを同時に実行することができる。2wayのSMTを実装したPPEと、8個のSPEで、
>Cell全体では10スレッドを並列に実行できる。
>つまり、ソフトウェア側から見るとCellの中に10個のCPUがあるように見えることになる。
>>ソフトウェア側から見るとCellの中に10個のCPUが
正しく SMTのことじゃないの。
インオーダは実行ユニットにたいしての話、SMTはその前段の話で基本的には別のところの話だと思ってるんだが、
でも開発関係者はDD2が出てからSMTって言い出した印象。
1命令発行でSMTってなんかパチモンぽいし。
ウェハをラインに入れてから出てくるまでってどのくらいかかるん
(゚д゚)ナゲー
ナガー
・・何か誤解があるようだがw
ウェハーをラインに入れてまともな歩留まりになるまでが1ヶ月とか2週間とかなのであって、
別に1枚が焼かれて出てくるのに2週間かかる訳じゃないだろ?知らんけど。
そりゃそうだな
>>454 いや普通にウエハが出てくるまで一ヶ月だよ。
超特急とか言って他のウエハを後回しにして3倍速で仕上げまでしてくれるのも
あるけどお値段も3倍になる罠
歩留まり改善はウエハ流しながら試行錯誤して、ある程度まとまって元が取れると判断したらマスク改版。
ちょっと待て。
俺の少ない知識じゃ2週間や1ヶ月じゃまともな歩留まりにならないよ。
ウェハがラインに入って、完成品として出てくるまでに2週間から1ヶ月かかるんじゃないのか。
ウェハって、切り出した状態だろ?
そっから2週間・・・ ('A`)スゲー
>>457 それであってる。
どこかの工程で遅れると二ヶ月ぐらいかかる事も、ままある
ナゲー
ラインの総延長が何千メートルもあったりするのかな。
マスクROMの生産が時間がかかるってのも、それが原因なの?
半導体は同じ工程を何度も繰り返すから、物理的な距離は短い(同じ場所をぐるぐる廻る)んじゃないか?
膜付けて露光して薬につけて蒸着して……を延々と数百行程やるわけだから。
回路規模にもよるが、スッピンのウェハー入れて、切り出せる形で出てくるまで
1ヶ月っていうのは標準的な時間だと思う。
ただ、自社工場もってるSCEは、かなりの無理無茶が効きそうな気もするけど。
とにかく、テープアウト後の半導体開発者は、1ヶ月後のできあがりをガクブル
しながら待っているわけだな。
インゴット切り出し→ウェハ研磨→ウェハ酸化→フォトレジスト塗布→ウェーハ表面にパターン形成→
エッチング→酸化・拡散・CVD・イオン注入→平坦化(CMP)→フォトレジスト塗布に戻る(繰り返し)→
電極形成→ウェーハ検査
ここまでが前工程。
ウェーハのダイシング(切り分け)→チップのマウンティング→ワイヤーボンディング→モールド→トリム&フォーム
→バーンイン(温度電圧試験)→製品検査・信頼性試験→マーキング→出荷
これが後工程。
前工程のフォトレジスト塗布からCMPは繰り返し繰り返し。
まぁ物によるけど、だいたいこんな感じ
(=゜ω゜) ためになる。
マジ?物理的にできるまでに2週間かかるのか。('A`)スゲー
前に失敗して、パーにした事が有る……
二年間、ボーナス無しになった orz
その程度ですんで首にならなかっただけ、マシだった
>>469 経験者キターw
試作品の失敗って何億(何十億)円ぐらいの損失になるの?
>>469 ワロタ
ウエハ1枚何万だもんなw
工程が進むほど高くなるし、そこで不良だすると大損害
472 :
458:2005/07/25(月) 22:51:20 ID:jxIaF7eb
>>462 そそ、俺が言いたかったのはそれ
CELLのチップ印刷したヤツ持ってる写真、何処あったかなぁ・・・
>>470 時間がなくなるのが痛い
金額は……、(∩゚д゚)アーアーきこえなーい
インゴッドって1本いくらくらいかな?
>>474 さぁ・・・相当高いだろうねぇ〜
だって純度99.999999999%だし
>>473 お疲れ様ですた(‐人‐)ナムナム
損害も、
・マスク切り直し費用
・商品投入遅れによる損害
どっちの被害がデカイかは状況によりますな。
スレ違いだけど。
ATiのR520って3回ほどテープアウトやり直したって話だけど、
208億×3やったってことなのか…?
130nm 100億円
90nm 208億円
65nm 400億円
65nmの壁が厚いと実感するな・・・
ウェハ自体は安いんだよ。
単なる砂の結晶だからね。
一枚2000円ぐらいだった。
気が遠くなるね ( ´ω`)
484 :
名無しさん必死だな:2005/07/25(月) 23:04:54 ID:rC0rAsfE
みなさま、勉強になります。
アリガト!(´▽`)
>>478 全部のマスクが悪いってことはありえないので、
交換したマスク×数億ってぐらいの損失
>>481 そんなに安くないよ
5インチとかでも数万してた
今は8インチとかだろ?
>>487 うぇー? いや、そんなに高くなかったよ。
話を聞いたのが大手の人からで、大量に買い付けるからかな。
もしかしたら、最近はウェハの切り出しが昔よりも凄い薄くなってるんで、
それで一枚あたりの値段が低かったのかも。
>2003年の世界のウエハ総出荷面積は51億4900万平方インチ(前年比10%増),売上高も58億ドル(前年55億ドル)
1平方インチ辺り1ドル弱ってとこだべか。
インゴットの塊が3000万ぐらいとかいうのはたしか月アスかなにかで昔見たことがあるな
>>425 まだ2個ほど。 ってテストしてる最中だけどね
>>491 小島組キタ━━(゚∀゚)━( ゚∀)━( ゚)━( )━(。 )━(A。 )━(。A。)━━!!!
という、夢を見るために寝るよ
>>491 ホンモノキタ━━(゚∀゚)━( ゚∀)━( ゚)━( )━(。 )━(A。 )━(。A。)━━!!!
今時のでかいサイズの切り出しって、内周刃ブレードとピアノ線、どっちが主流なんだろう
なんで一個単位なの?並列化しろよw
複数の処理を個々にスレッド化するのですら難しいのに
一つの処理を複数のスレッドに分割するのがどれだけ困難か。
>>497 それ以前に、スレッドに分割すべき処理なのか
が問題でしょ
499 :
名無しさん必死だな:2005/07/26(火) 10:38:56 ID:pedR4Lb8
じゃあ俺も小島組ごっこする〜
PS3作りづらい
初期PS2の方が、まだ作りやすかった
おら小島、Cell第2形態と戦っているところだ。
PPEはOSやIO処理でゲームに使えるリソースは70%といったところ。
SPEに投げた処理もPPEの処理待ちで相殺されてパフォーマンスが出ないし振れる処理も限られている。
箱○みたいにOSとゲームで使用するコアが分かれているクリーンな設計ならやりやすいんだが。
〃∩ ∧_∧
⊂⌒( ・ω・) はいはい箱○すごすすごす
`ヽ_っ⌒/⌒c
⌒ ⌒
やっぱり素人目にはコアが「OSとゲーム」とか明確に役割分担してる方が性能良さそうに見えるのか。
そうでもないです。機能じゃなくて依存関係をみて分けないといけない。
立ち食いそば屋で「麺茹で係」と「盛り付け係」に分けたりしないでしょ?
駅とかの繁盛してるとこではあるぞ
流れ作業で神速の給仕。
「天そば一丁!」っつたら30秒後には出てくるの
そういや立ち食いそばで繁盛してるところは完全分業制が多い気がする
客のの少ないときは一人で十分だろうけど
それは、常に処理要求が発生するタスクをSPEに固定で割り付けて高速化する例だね、と言ってみる。
>>505 シングルCPUに慣れているゲーム屋なら、まずそこから入るだろ。
マルチスレッドっーてもリアルタイム性が要求されるような分野には使われてなかったし。
PPEスレッド1・・・次々に注文を受ける、バイトに指示を出す。
PPEスレッド2・・・代金を受け取る、お釣りを返す
バイト1・・・神速で麺を茹でる
バイト2・3・・・神速で湯切りをして丼に入れる
バイト4・5・・・神速で盛り付ける
バイト6・7・・・神速でつゆを注ぎ、客に出す
バイト8・・・全く働かない。なぜ雇われているのか誰も知らない
>>507 スレッド間に同期がありすぎてなかなかうまくいかないと思われ
バイトには
PPEからの指定量ひたすらネギを刻む
PPEからの指定数ひたすら天ぷらを揚げる
ゆでるお湯の温度をメチャ性格に保つ
などが良いと思う
そばとうどんばっかり注文する客を大量に捌く店だとそうやって並列に処理できるけど、
それをやるのはGPUの方で、
ゲームでのCPUの処理は懐石料理作る料亭の方に近いかと。
お前うどんばっかり茹でてないでとっとと魚を捌け、それが終わったら刺身の盛り合わせだ、みたいな。
>>510 たとえ話を広げると収集付かなくなるぞ。
そこまでにしとけ
>>413 ヒント : ハイスピード非リアルタイム
恵比寿西口店店員を思い出した
>>507 >バイト8・・・全く働かない。なぜ雇われているのか誰も知らない
ワロタw
オチの付け方巧いわ。
>514
自演かとオモタ
>>515 自作自演ばかりしてる人ほど
他人の書き込みがすぐに自演に見えるものですよ
MSは日本で売れるには一にブランド、二に信頼性という事が
全く分かってない。ソフトとかオンラインとか売りにしても
実際の製品から選別する日本人にすれば逆にチープに見える
誤爆orz・・・
>>507 バイト8・・・返事がない、ただのしかばねのようだ(w
>>507 客は一人ずつしか来ないからそういう使い方だと死ぬほど効率悪い。
一杯ののラーメンを出す速度は向上しないし
中身を豪華にすることもできない。
つか
>>507は喩えがおかしいだろ
PPEスレッド1がバイトに指示を出すのに
バイト1-8は同じことしかできない
これは指示が出てないよ
ゲームでは互いに依存性のある処理が多く
無闇に処理を分割しても効率が上がらないという結構重要な指摘ではある。
>>521 かと言って、麺をゆでる前に盛りつけるわけにはいかないんだな。
ラーメン屋にたとえるのは案外的を得ていて面白いな。
教科書に載るかも(w
例えなんかどうでもいいけど、ラーメンで言ったら麺打ちのプロとして
SPEを使うって感じじゃないですかね、一部の高負荷な処理って事で
朝の駅そばだから 客は殺到してるんだよ
後ろに並びながら、注文だけどんどん溜まっていく
それぞれのバイトが、手が空き次第あらゆる仕事をやるのも一つのやり方だが、
このそば屋は 調理スペースが狭いのだ。スペースが狭くても、効率的に客を捌くのが このそば屋の特長
バイト1は、大鍋と冷蔵庫の前に陣取っており、そばをどんどん茹でる作業が早い
バイト2・3は、大鍋の反対側で受け取り、手元には大量の空き丼が
バイト4・5は、手元に あらゆるそばの具が揃っており、盛り付けが誰より得意だ
バイト5・6は、1周して客の目の前で つゆの鍋を手元に置いており、そのままカウンターへ置く
バイト8が、隅っこの方でジャンプ読んだり携帯メール打ったりしている。 バイト仲間の生ぬるい視線が…
作業場は円環を描くように流れ作業に適した構造になっており、各人 ほとんど場所を移動しなくても作業できる
各バイトがバラバラに作業するよりずっと早く 切れ目無く出来上がるそばの供給は
朝のラッシュ時を捌くに相応しいスピード
SPEは バラバラの作業を割り振るより、バケツリレーの流れ作業の方が 結果としては早いのでは?
そしてバイト7は最初の出社のときに交通事故で亡くなった。
;y=ー( ゚д゚)・∵. ターン
いつのまにかIEEE XploreにSymposia on VLSIで紹介されたCell関係のPaperがうpされとるわ。
>>527 運良く交通事故に合わないでやってきても、
まったく仕事が周ってこないバイト7カワイソス
バイト5が今朝 過労死しているところを発見されますた
>>525 麺を打つのはプロ級だがスープ作るのは苦手で結局PPEさんお願いって事に、PPEさんも仕入れやら経理やらで忙しいのに・・・。
SPEを増やすよりPPEが2個あったほうが効率良さそうだが。
> たとえ話を広げると収集付かなくなるぞ。
> そこまでにしとけ
PPEは コア・L2でそれぞれ 10%程度の面積を消費。
一方 SPEは1個あたり6%程度。
カタログ上の演算性能が30%ほど落ちてしまうぞ
しかも 2PPEって、効率的なのか?
うどん!?そばじゃない!?
>>526 バケツリレー式は円滑に流れている時は早いんだが工程のどこかが滞ると、その後の工程が止まってしまうんだな。
実際のマルチスレッドでも同様の事が起きてリニアに性能が伸びなくなってる。
停滞している処理があったら他のSPEが動的に作業内容を変更して手伝えるようなアルゴリズムが要求されると思う。
そしてだれも食器を洗ってくれないw
537 :
名無しさん必死だな:2005/07/26(火) 19:14:00 ID:Ur0L4uJL
ようやく彼の出番ですなw
バイト8・・・全く働かない。なぜ雇われているのか誰も知らない
でもタスク切り替え 苦手だからねぇ
滞らないよう、スケジューリングを効率化させることが
Cell開発のキモだったのねん
>>536 食器洗いもバイト5に・・
2:8の法則で全作業の8割の時間がかかる2割の部分を効率化するのがSPEの主な役目。
SPEがやるのはスープや麺や仕入れや経営であって、作るのはPPEにやらせておくという感じだと思うんだが。
窓口が複数ある時に一列に並んで待ってて順番にかたづけていく窓口みたいな?
別に3人である意味は無いような…
>>540 何個セットがいいかは処理によるでしょ。
代表的な処理の大まかな配分はオートマチックにやってくれるだろうけど、
細かい配分はプログラマがコントロールする/できるんだろ。
つか今での流れの中で一番わかりやすいな>例え話
非常に有意義だ
大まかな仕事割り振りは3種類
★ジョブ・キュー・モード
・・・PPEが全ての仕事を割り振る。
並べ替え・整頓はせずに 空いたSPEに片っ端からジョブを投げ込む。
メリット・・・プログラムが簡単? SPEのリソースに空きが生じない
デメリット・・・頻繁にタスクが変更されSPEに無駄が?PPEの負担が大きい
★セルフ・マルチタスク・モード
・・・SPEが横の連携を保ちながら、自分の判断でジョブを取ってきては逐次処理。自律モード
メリット・・・PPEの負担が軽い。SPEが効率的に使える。バケツリレー的な使い方も?
デメリット・・・使いこなしが難しい? SPE毎に小さなカーネルを入れて制御する必要?
★ストリーム・プロセッシング・モード
・・・動画デコード・エンコなど
メリット・・・Cellを最も効率的に使える。 処理の並列性が最大に。
デメリット・・・依存性の無いストリーム処理の分散にしか使えない?
こんな感じだっけ? 間違ってるかもしれん
いつからバイト雇ったんだよ
パートも雇え
>>546 その頃にはIBMがCellを使った激速なスパコンを発表してる予感
10ペタFLOPS、、 1秒間に1京(けい)回の演算。
・・速そうだな。。
予算は800億〜1000億円。 安いのかな?
ふふふ・・ やはりスパコンは孤高の存在でなくてはな。
ゲーム機ごときに近づかれては困るのだよ
SPE向けにチューンしないと性能が出ない、というのはスパコンとしてどうよ? って感じですが。
1000万台くらいのPS3で分散処理やったほうがいいんじゃないのかな
参加に応じてポイントもらえるようなシステム作って
551 :
512:2005/07/27(水) 00:02:22 ID:0Lr0wjPz
アースシミュレーターの次の名前の予想は何?
ギャラクシーシミュレーター
ギャラクシーシミュレーター
女体シュミュレーター
ぴゅう太
ソーラーシステムシミュレーター
>>549 スパコン上で動かすソフトはそれこそ気の遠くなるような手間暇かけて
0.1%の性能を稼ぐためにカリカリにチューンされてるそうな。
>>562 その前に、スパコンに限らずどれでも良いから
一切のソフトウェアチューン無しで最高性能が
出るコンピュータ教えてくれって感じ。
>>546 むしろ、国立大の全鯖とクライアントでグリッド組んだ方が効率的のような。
スパコンの0.1%は大きいからな
スパコンはそもそも特定用途に特化した上で、チューンしまくって性能出すものじゃねぇの?
ギャラクシアン4
ってか、膨大な金払ってスパコン用意して、
汎用ソフト動かしてる姿が想像できん。
世界一のスパコンは男のロマン
>>569 文部科学省もそう思っている模様。実によいことだ。
>>569 男のロマンなら、次は自爆装置もつけておけ
ポチッとな
自爆装置も男のロマン
>文部科学省
ついでに、他の男のロマンとしてドリルも付けといてくれ
だんだん変なものになっていってるな
じゃ、漢のロマンとしてセーラー服とブルマとスクうわなにをするやめ
スパコンの話はスレ違い棚。
一切全く全然かすりもしないよ。
578 :
名無しさん必死だな:2005/07/27(水) 07:49:49 ID:bFsNBUMu
>>577 ラーメン理論により箱○CPUの方がコーディングも楽で性能も出し易い事に
GK信者が気付いてしまったので話をそらそうとしているだけだよ(w
マルチスレッド性能を上げるには動的に処理を配置しなければならないが
SPEはタスク切り替えが苦手、処理の負荷を予測してコーディングしなければ
性能が出ないからプログラムが難しくなる。
うちの実家もらーめん屋なんだがバイトが暇な時は全員揃うんだが忙しい時期になると用事があるとか言って来なくなる。
シフトもあらかじめ決めてあるのに。
朝から、コーディングが楽ということと性能が出易いことが別だということを
煙に巻こうとする痴漢であった。
581 :
名無しさん必死だな:2005/07/27(水) 08:32:43 ID:nYTA23Y2
しかし、有効な反論が出来ないGKは、ただ悔し涙を流すしかなかった。
各SPEのLSはプロセス空間にマッピングされるんだよ
物理メモリ空間でも仮想メモリ空間でもなく
つまりプログラマにとってPPEから見てもSPEから見ても同じアドレス空間
?
こりゃ思ったより性能差が縮まりそうだな。
例え話はおかしくなる元だからやめておけというのが技術系スレで言われてる事なんだけどね。
本質を突いてるようで間違ってる事が多いからね。
> マルチスレッド性能を上げるには動的に処理を配置しなければならないが
動的に処理を配置とやらが必要な根拠は?
TLPで性能を上げる為に必要なのは、並列度の向上、相互依存性の排除。
あとさ、箱○CPUにおける、動的に処理を配置とやらに対して、
Cell-SPE上での動的に処理を配置するのはどれ位のペナルティがあるの?
具体的に説明していただこうか。そうじゃないと話は始まらないわけだが。
上の方で言われた麺がどうのってのは
パイプラインの話かと思た
荒らしにマジレスするのもやめておけと言われてない?
Xenonかとオモタ
登録ぐらいしろよ
>>591 Niagaraは4スレッドを同時実行可能なCPUコアを8個集積するマイクロプロセサである。
マルチコア技術とマルチスレッディング技術を組み合わせた同社のマイクロプロセサの第2世代に当たる。
Webサーバや動画のストリーミング・サーバなど,
処理の過程でネットワークを利用する頻度が高く,複数のスレッドを並列処理しやすい用途を想定する。
現時点では1.2GHz程度で動作させており,消費電力は70W以下という。
もともと1.2GHz程度の動作周波数を想定して設計しており,ある程度高める可能性はあるものの「2倍に高めるようなことはない。」
Niagara概要
・SPARC V9 準拠
・最大構成時には8個の4wayマルチスレッド化コアにより32のスレッド同時実行に対応
・各コアは90GB/sのクロスバ・スイッチにより接続
・チップ上に4-way共有型二次キャッシュ(3MB)を実装
・DDR2チャンネル(23GB/s)x4
・消費電力70w以下
・トランジスタ数約3億個
・ダイサイズ378mm2
>>593 ( ・∀・)ノ ありがとう。
対称型の8コア、L2キャシュ3MB、
4チャンネルDDR2で 帯域は20GB/s 程度だっけ?
ずいぶん大きなチップになりそうだね
Cellとは用途が違うかな?
ゲームにゃ使わんだろうな。
CELLの大規模バージョンが出たら競合するだろうけど、
そのころにはこのチップも世代交替してるんじゃね?
てか、でかくね?約3億で300平方メートル後半って。
8コアのクロスバー
というか、CELLが捨てたクロスバー方式な訳だから、スケーラビリティは無いわな
歩留まりもヤバス
Niagaraのダイ写真見るとコアは小さくて8つあわせてもダイの1/4ぐらいか
Cellもリングバスとメモリ&バスインターフェースに結構な面積使ってたがそれ以上だな
某PPE*3のダイサイズがCellの半分だとするとそういう
無粋な突っ込みはあらゆるユーザーから批判されるのである。
半分なん?
面積割合で Cellは PPEが10%、L2キャッシュも10%程度、
SPEが 1個6%で 8個で48%。LSはSPEの面積の30%分。
XDR+IO+EIBの通信ロジック部分で 25%程度。 残りでその他。
2億5000万トランジスタで 235mm~2。
xenonが同じPPEを使ってるなら、大体の推測はできそうだな
>>609 >>LSはSPEの面積の30%分
48%のSPE全体の さらに30%分、という意味ね。
LS単体では 1.8%、 8個分でCell全体の15%弱程度。
6SPEなら、LSを512KBにできた計算。
611 :
名無しさん必死だな:2005/07/28(木) 00:01:31 ID:zeLIl++g
>>609 PPE×3で30%のL2キャッシュ1MBで20%、通信ロジックは20%ぐらいだから70%。
ダイサイズを小さくして歩留まりを上げるか、残り30%に何か仕込んでくるのか?
バケツリレー方式のラーメン家も良いが・・・
1人でも新人が入ってきた場合は、最悪なラーメン屋になりそうだね。
相当、各SPE処理が、他と連動&効率的に処理しないと、SPEのどれか?一つでも
SPEが重い処理をした場合は、他が待つハメにならないの?
もうたとえ話はいいよ
素人にもわかりやすくてよかったんだがなぁ
わかったと勘違いしてるだけ
Xbox360は建坪もメニューも全く同じラーメン屋を3軒ならべて立ててるって感じか?
つか、いつの間にラーメン屋になったんだ?
いや別に専門家になろうって訳じゃないんだから
ちょっと砕いてくれる方がおもしろい
CELLはラーメン屋のバイトにそろばんの達人を8人雇って
一人は会計・帳簿つけて一人は精神障害で働けず
残りの六人は役に立たなくてクビって感じだな。
たとえばSPEにzlibを移植して、圧縮/伸長を高速に行う、というのは可能だと思う?
SPEの制御命令はそんなに充実してないらしいので
制御がある程度複雑なプログラムの移植は
向いていないのではなかろうか・・・
まあ圧縮解凍くらいならSPEでも十分かもしれないが。
zlib(deflate)はストリーム型だから、圧縮・伸張ともSPEと相性は良いと思われ。
軽すぎてSPEには役不足(誤用に非ず)かもしれんが。
SPEには普通のRISCチップ並の命令がある上、C/C++コンパイラも用意されているのに、
充実してないというのは何を言いたいのかさっぱり。
むしろ分岐オーバーヘッドを隠蔽するために、ILBやBTBなどの特別な機構が用意されているのだが。
zlibみたいな圧縮伸張や、DES/AESみたいな共通鍵暗号は、典型的なストリーム処理。
LSダブルバッファ&DMA裏読みをフルに生かし、ストリームプロセッシングモードで
かっ飛ばせるだろうから、かなりの実効性能(ほぼメモリ帯域分の速度)が期待できる
と思われ。
RISCにはもともとPUSH/POPなんてありませんがな。
全部コンパイラが制御する。
627 :
625:2005/07/28(木) 02:01:09 ID:g76qEjMJ
一応注釈。アセンブラでスタックを実装ってのは、CやC++の関数呼び出しを
コンパイラが「プログラムカウンタをスタック用アドレスに格納、スタックポインタ+1、
JUMP」みたいに、PPEなら一命令で可能な処理を数ステップに分解して
実行する事を指していますので。念のため。
レジスタ128本あるから極限までループ展開。
>>527 RISCではそんなアセンブラは不可能ですが。
ロードストアアーキティクチャって聞いたこと無い?
あと、SPEのパイプラインは短いので、分岐の影響は限定的。
分岐によるパイプラインの乱れなんかより、LS上でのキャッシュミスゼロが保証
されてる。そのため、キャッシュミスによるパイプラインストールゼロの効果の方が
圧倒的に大きい。
>>625 その表は別に命令セットが書いてあるわけじゃなかろうに。
ちゃんとBranchとLocalStoreの処理ユニットが用意されていることが分かるくらい。
分岐予測(学習)は無くとも、投機実行機構と指示フラグはあるので、
ループのペナルティは普通の実装と比べて特別にあるわけじゃなし。
>>629 LS上のキャッシュミスゼロは保証されていたもLSの容量以上のアルゴリズムの場合は・・・
LS上で行っている処理が排他的にするためには・・・そのLSにパッピングしたメインメモリー上も
場所を固定しないと駄目で、他のSPEから参照が出来なのでは?
LS上で行っている処理が排他的にするためには・・・そのLSにパッピングしたメインメモリー上の
場所を固定しないと駄目で、他のSPEから参照が出来ないのでは?
つかパイプライン短すぎない?最高7段に読めるけど・・・
7段で128Regsって滅茶苦茶オーバースペックじゃないのか。
>>631 その辺は全部プログラマーがやる。
当然、アルゴリズムによって相性の善し悪しはあるだろう。
SPEははじめからストリームプロセッサと言われているのであって、
万能の魔法のプロセッサではない。
しかし。FFTくらい広範囲のメモリにアクセスするアルゴリズムでも
何とかなってるんだから、zlibくらいなら楽勝だろう。
多分漏れでもできる。
で、A列車やシムシティーや将棋は速くなるんか?
はやくなることは間違いない
周波数が全然違うし
SPEは、AI系(広範囲メモリ探索系)には向いてないと漏れは思う。
ただ、漏れの知らない有効なアルゴリズムが開発されるかもしれん。
頭の良い香具師ら、チャンスだぞ。
>>637 それなら・・・それを面白がってする人が、楽しく出来るくらいのサポートが無いと・・・
10万くらいで簡単な開発キットを分けてくれるのなら・・・面白がってする人も
出てきそうだが(LinuxKitでなくてWindowsXPと連携が取れる物で・・・)
SPEはプロセッサの性能を大量に食うSIMD処理のタスクを
専用のストリームプロセッサに分けて実性能と効率を上げ
ようとする思想で作られたもの。
逆にいうと、民生品において汎用向けの性能は必要十分の
領域に達している。
なんでWindowsとの連携が必要なんだよw バカだろオマエw
>>633 いや、この表は演算部のみのパイプラインなので、実際には+8段。
>>640 会社でするのなら、別にLinux専用でも良いが・・・
他の仕事の片手間にするのなら、パソコンが何台も家に
置ける状態ではないので・・・WindowsXPパソコンに・・・
USB?か?、PCI専用ボードをつけて、開発機と繋がって
WindowsXPで開発とテストをして欲しいと思ったのだが・・・
つまり、USBで開発機を繋げるだけで・・・済むようにして欲しいですね。
WindowsXP用に開発ソフト(VisualC++みたいな)を作って
そこでコードを書いて、ボタン一発で、そのコードと使うデータがUSBを通して
開発機に流れて、実行というボタンを押すと、開発機でPS3の処理をしてくれて
その画像がUSBを通して、今度はWindowsXPに流れてきて・・・
WindowsXPでそのゲーム動画と見られるように・・・
で・・・コントローラ(パソコン側でも良いし、開発機側でも良いが)・・・コントローラで
操作出来るように・・・
PS3Linux買ってVNCなりSSHなりで開発すりゃいいだろ。
VSと比べたら劣悪な環境だがロジック書くならそれで十分。
PS3Linuxはクタのはったり
>>644 ディスプレイがPS3LinuxKit用に必要じゃないの?
PS2LinuxKitは買ったけど、ディスプレイを付け替えながら
しないと駄目だったので・・・使うのを辞めてしまった。
部屋が広い人は良いが・・・俺の部屋はいっぱいいっぱいで
ディスプレイを2つ置く場所がないから・・・
多分、PS3LinuxKitが出ても買わないなぁ〜・・・
(CRT交換機に対応してくれれば買ってもいいけど)
Windows上でSPEの開発できるようにトランスメタががんばってる訳だが。
最終的にはPS3LinuxとWindowsPCで十分な開発ができるようになると思われ。
逆だろ
>>648 もともと出井前会長もSCE取締役だったよ。
で、解任で空いた席に現会長が座っただけ。
??
前ソニー会長・社長が退任したから、新ソニー会長・社長が
入れ替わってSCEの役員になった、
ってだけだろ?
子会社とはいえ、最大の利益を出す中核会社なんだから、
ソニー会長・社長がSCE役員になるのは別に不思議じゃ無い
逆に言えば、SCEの取締役会で決定されたことは、
現ソニーCEO・社長が承認した、バックアップしている、
ってことじゃないか。
クタは犬猿の仲であるストリンガーに首根っこつかまれるし
CELLは相変わらずゲームには全く向かないしで先行き暗いな。
いつから犬猿の仲になったんだ?
クタが犬猿の仲だったのは、 出井。
有名な話だ。
クタとストリンガーは良好。
アメリカやEUとの人脈も多く、SCEとしてはありがたい存在だろう。
欧米にも 出井が行くより ストリンガーが交渉に出た方が有利。
>>653 むしろ、犬猿の仲だった出井が去って話のわかるストリンガーになった。
鬼に金棒とはこのこと。
ってかIBMはPS3Linuxとか作ってくれないのかな?
>>658 問題はライブラリとかだよな。
PS2Linux の時も花火とかサンプル付いてきたけど、
メガデモとか付けてほしいw
アンチが必死に叩こうとして、墓穴掘ってるな
ストリンガー氏がSCEA社長してたときから、
クタは一緒に昼食を食べてたりしてた仲だとか前にどっか書いてたな。
↑間違った。SCEA社長じゃなくて、米ソニー社長の書き間違いな。
>>661 PSPが米で好調なのも、ストリンガーのお陰だからな
ある意味、今回の人事周りはクタにとって美味しいかも
ところで出井との仲の悪さは結構聞くけど、マジ?
>>658 以前ここに貼り付けられていたUSの掲示板にPS3Linuxに関わっているIBMエンジニアの
インタビュー記事があったが、Linuxは主にIBMが担当していた気がする。
コンパイラー、OSなど各社に割り振って分担させていた。
現行のLinuxか次のバージョンには、CELLを対応させるがまだ外部に出すには
ライブラリが欠けているらしい。Linuxのプロジェクト自体は、あまり大きいという印象はなかったな。
>>663 出井はPS反対派だった。
で、大賀氏がクタを応援、PS発売して大ヒット。出井はいい顔はしないわな。
出井は退任のとき「新社長は人の話をよく聞く人」とか皮肉ってたし、
クタがソニー取締役から降格されたのも、出井が道連れにしたと言われてる。
>>クタがソニー取締役から降格されたのも、出井が道連れにしたと言われてる。
本当なら、かなり冷え切った関係だったんだな
なるほど、それでクタタンが
最近かなりご機嫌に見えるんだな
>>665 いや、別に出井はPS立ち上げる頃は反対派でもないよ。
ってか、その頃の出井は反対できるほど権限ある立場
じゃなかったし。
その後社長になったとき、10数人抜きの大抜擢とか言って、
話題になってたろ。
と言っても、クタみたいな典型的な技術畑の人間と、
出井みたいな典型的な文系人間が合っていたとは
全く思えないけど。
出井は早く辞めろよ
天下りくさい役職に就いてんじゃねーよ!カス!
ソニーピクチャーズを改革し、その中でストリンガーを引き立てたのは出井だろ。
お荷物部門を黒字化させた。
経営陣に外国人を増やしたのも。
世界中のいろんな国出身の人間が重要な地位についている。
金融・保険分野も利益を生んでいる。
出井の失敗は、エレクトロニクス部門を弱体化させたこと。
>>670 本業を弱体化させたことが他の事を吹っ飛ばすくらいの悪印象だからね。
アンチソニーの巣窟であるソニ板でさえ、出井の交代が望まれてたぐらいだからなぁ
あいつ一代で強いソニーは・・・orz
>>670 ・広告畑出身の文系人間で技術を単なる商品としてしか把握できない
・優良収益源のソニー生命を早々に売却しようとして社内に不協和音もたらす
・韓国企業に提携土産として自社の特許情報を実質無償で譲渡、
クタはそれに抵抗し自分の担当分野をその適用範囲から切り離させる
・ワースト経営者として選出される
zlib、既存のコードを無視してスクラッチから実装すればSPEで実行できるのはわかるけど、
SPEへのマイグレーションがいつもそんな感じだと、開発工数的にきつくないか?
クタはサムスン合弁会社には賛成
安藤がブランドイメージ損なうから日立とやるべきだって言ってたんじゃ
なかったっけ?
zlib自体はそのまま動きそうな気がするけど。
コンパクトなヒープルーチン位は書かないといけないかもしれないが。
当時は重役はそれぞれ担当業種を持っていたと思うが
社長の安藤は統括者として関与してたけど
クタは液晶担当ではない脇役なのでそもそも関与できなかったんじゃないか
確かに綺麗だけど
この絵を見てる人物ってどこよ?と思わないでもなかったり
幽霊か吸血鬼の類か
プレーヤーのアバターもレイトレで描いて
壺や鉄球にその姿が映り込んでるってのをやってもらわないと
ゲーム画面としてはインパクトがないな
できるんじゃない?
カメラマンが映りこんでは意味がありません
>>682 レイトレCGとしてはそれが定石なんだろうけどさ
ゲームじゃやっぱり映り込んでもらわないと面白くないじゃん
>>677 うわめっちゃコーフンする!
これがどの程度なのかで評価が決まるよー。ゲームがどうこうより。
>>382 カレーのCMで
カレーをすくったスプーンの裏に
カレーがついてないのと同じ理屈。
カレーカレーカレー
Saarland大学が関わってる時点で評価高いのは決定じゃん
自前でレイトレチップ作るようなところのお墨付きだもん
688 :
名無しさん必死だな:2005/07/28(木) 16:16:03 ID:onoGB0WD
この前申し込んでおいたEETIMESがさっき届いたお^^
何かおもしろいネタあったら教えてー
Cellについて2ページ割かれてるが、要約すればIBMが採用に向けて頑張ってるよ、というだけで、
あまり具体的な話はないな。
ソニーの森尾氏へのインタビュー記事でクタのことをちょっと触れているよ。
>>685 Cellはゲームよりレンダリングサーバーの方が向いてるよな。
Q3 TVはCELLを載せていきたいと言っているが、それは実現できるか?
A3 ベガエンジンをCELlに置き換えても意味が無い。 CELLでは新しい機能を付けたいが、
それがどんな機能かは検討中 今年に出ることは無い。
あれ?
今年に出ないのは前から言ってることじゃないのか?
そうじゃなくてさ、今だにこんなこと言ってんだぜ
「あとはセルの量産を待つだけ」とか言えないのかと
マジでSCEがTVつくっちまえよ
>>698 「検討中」をそこまでネガティブに取る必要もないやん。
ベガエンジンの変わりに使っても意味が無いというのも正論やろうし。
まぁ、テレビにCellを使うアイデアなら東芝の方が進んでるかも知れないね。
前に東芝の戦略発表会?みたいなので、Cellについていろいろ喋ってたし。
東芝のスカパー!連動HDDレコにCELL積んで、PCとの連携やらGUIの高速化やら
色々やってくれれば激しくうれしい・・・
あ、PSP用にムービーエンコードも追加して(実時間の何分の一かで)。
他のモデルと値段差が1〜2万に抑えられたら売れまくると思うなぁ、10万高いと駄目だけど。
レイトレーシングというのは どの時期の処理として入るの?
Cellがやるの?
ビデオ見ると、アスロン64の 3400+とかでも数fps程度っぽいけど、
Cellなら行ける?
FFTだと桁違いにセルが早いから問題ないでしょう。
Saarland大学のRay TracingはFPGA使って数fpsだから、
90nmで専用ASIC作れば30fps行けそう。
汎用Processorでどこまでイケるかは未知数。
Siggraphのデモを待て。
ここの住人的には何fpsぐらい出ると思う?
もしくは出せれば満足?
VGAで15fpsくらい出ればゲームに使え無い事もないかも。
被写体と屈折によって全然違うんじゃないの?<fps
>>702 元々レイトレーシングはリアルタイム処理するには重いし、反射等を何段階まで
計算するかとか、どんなオプションを使うかとかでずいぶん違いがあるからなぁ。
でも、どこまでできるかは楽しみだね。
709 :
512:2005/07/28(木) 20:32:57 ID:2CVgqwXG BE:78326584-
CellTVなら熟成の応用でウッボーだろ , タダで教えるのわ勿体無いが .
Matrixネットワーク対応 HDビジョン ( 動き適応型デジタル4次元Y/C分離機能 搭載 )
TVはTV
711 :
708:2005/07/28(木) 20:43:00 ID:2CVgqwXG
712 :
512:2005/07/28(木) 21:05:32 ID:2CVgqwXG
連パピすま祖 .
VAIOラップトップを廃盤に追い込んで発売される携帯CellTV にわ
発売半年後にモザイク除去機能が付加されまつ .
>>708 反射3回ぐらいで320×240ドット程度ぐらいならなんとか30fpsいきそうだが、屈折はちょっと無理っぽい。
うちのAthlonMP2.4GHzDuallでもレンダリングに15分ぐらいかかるからなぁ。
LWとかだと随分昔から、レイトレのが速いなんて言われたりしてたし、
条件次第としか言いようがないのでは。
>>714 LightWaveはスキャンラインとレイトレースのハイブリッド。
反射・屈折だけレイトレだがめちゃ遅い。
静止画のレイトレースと比較したら、そりゃ相当のヘッポコピーでしょうね。
そこを敢えてやってみるという無茶がこの企画の面白いところ。
以前はPCを繋げたネットワークレンダリングでリアルタイムに
挑戦してなかったっけ。
CELLによるレイトレデモは無茶苦茶楽しみなんだだが、
それ以前にこのデモの情報は外部に公開されるのかが
心配だな。シーグラフってあんまり取り上げるメディア少ないし。
>>718 ☆ チン
☆ チン 〃 ∧_∧ / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
ヽ ___\(\・∀・) < いつもの人ま〜だ〜?
\_/⊂ ⊂_ ) \____________
/ ̄ ̄ ̄ ̄ ̄ ̄ /|
| ̄ ̄ ̄ ̄ ̄ ̄ ̄| |
| |/
ゲームにレイトレ使うんだったら、
現在の画面をキャプチャする感じで、
その場面をレイトレで書き直して保存とか出来たら面白そう。
フォトモードですか
GT5のフォトモードはやっぱ色々とんでもない事出来たりするんだろうか。
つても、メモリがなぁ。
スワップも出来ないし、スキャンラインでめいっぱいメモリ使ったシーンとかをレイトレその他諸々は難しそうかな。
一時的に作業領域が必要なときは、HDD等の外部ストレージにスワップアウトするより、
Ram Doublerの要領でメモリ to メモリで圧縮保存するのが手っ取り早いかもしれない。
RAM Doublerてまた懐かしい単語だな
うちのMacにそれインスコした覚えがある…
おや? 708=716≠711っつことで。
>>716 >以前はPCを繋げたネットワークレンダリングでリアルタイムに
>挑戦してなかったっけ。
Quake2でやってた気がする。
10数台繋げてやったみたいだけど、
15fps位しか出てなかった。
しかも、元のゲームが古いものだし、
圧縮された動画なんであまり凄さが分からなかった。
>>726 レイトレじゃないけど、Cellサーバー2台で分割レンダリングしてその結果を画像で
ネットワーク転送、受け取った画像を繋げてリアルタイムで再生ってデモを
やったと聞いたような
E3の時の地上を飛ぶような映像がそれだったはず
Cell鯖二台でやっとあの程度か…。
おいちゃん素人だから、Cellに夢見すぎちゃったよ
発売されるまで何にもわからないだろうから
別のことやって暇つぶししたら?
( ´,_ゝ`)プッ
うーむ、レイトレだった気もする、だれか確かめといて
>>732 それそれ、レイトレースだったみたいだね
>>728 オプションつけまくりの高解像度分散レイトレなんかだと、
絵1枚に最新鋭の4発マシンで一晩とか3日とかの世界だから。
だからこそ、みんな「ほー」と感心してるわけで>リアルタイム
屈折や反射は無かったと思うけど、1280x720のレイトレ画像を作りそれをJpeg圧縮しても
リアルタイムで可能というのは、十分凄いよな…
1画像1/30(1/15か?)秒でレンダリング完了か
>>734 CGの世界でもレイトレーシングって絶滅危惧種だけどな、屈折が必要な時ぐらいしか使わない。
アルゴリズム自体はGIのプレパス計算に使われているけどドット単位で視線探索している
んじゃあまりにも効率悪いから適当に間引いてブレンディングしているがそれでも遅い。
>>735 いや、それじゃぁレイトレ使う意味全然無いし(w そんなもんスキャンラインでやれ。
>>736 CPUの性能お披露目なんだから、
「レイトレースの処理」を、「1280x720の解像度」で、「リアルタイムにこなせた」と
言う事が重要なのであって実用的かどうかは別でしょ
屈折や反射の為のレイトレーシングなのに、それを無くした実行結果を、
素直に受け入れる気には、まぁなれないわな。
レイトレってのは単に綺麗な絵を書くという目的で
実用的か効率的かどうかは別として、
光の物理世界を再現する究極のCGシミュレーション技法
だからね。「レイトレがリアルタイムでサクサク動いた
らなー」っていう夢はCG屋のどこか心の片隅にはあるはず。
コンポジットの手順や技法に慣れたCG屋さんはそうでもないかも
>>741 CGの世界ではレイトレが主流だよ。
静止画も映画(いわゆる『プリレンダ』っつ奴)もほとんど全てレイトレ。
レイトレが使えないリアルタイムジャンルでこそ皆無だけれど。
>>739 10年前ぐらいは、CPUの性能がムーアの法則どおりあがっていくと考えられていた
のでレイトレ信仰みたいなものはあったね。
CGのプレビューでレイトレ出来るというプラグインや専用のレンダリングサーバー
(LightWave用)の開発もされていたけどリアルタイムにはほど遠かったな。
その後、反射は環境マップを自動生成する事で高速化してレイトレのはっきり
しすぎる影が敬遠されるようになってからは屈折オブジェクト以外に使い道が
なくなってしまった。
レイトレーシングは通常のレンダリングが遅いこともあってスキャンラインとの
ハイブリッドレンダラーに置き換えられていったんだな。
その後のトレンドはサブサーフェーススキャッタリングやGIの方がリアリティーに
大きく貢献するという事でレイトレは過去のものになってしまったのだ。
>>742 息をするように嘘をつく奴がいるな(w
映画やムービーに使われているMayaや3DStudioMAX・レンダマンはスキャン
ラインレンダラだよ、屈折のみレイトレでGIやコーティクスはフォトンマップ。
純粋なレイトレーシングは静止画CGに使われているShadeぐらいじゃないかな。
Cellのピーク性能を試すという点においては適任だが実用性を語るとレイトレは
かなりつらいぞ(w
リアル(現実の光)をシミュレートするレイトレと、リアリティを求めて
進歩し続けるラスタ処理の競争は実に興味深い。
とはいえ、ワールドシミュレータとも言われるCellとあっては、
究極の物理演算とも言えるリアルタイムレイトレに挑戦したくなる
気持ちは分かるぞ。これぞ漢のロマン。
とはいえ、限定的に応用できる成果はいろいろと期待できそうだが。
Cell世代での実用化は無理だろうなぁ。いつかは可能になると信じたいが。
>>745 究極はフォトントレーシングだな。これぞ漢の夢。
>>744 すまん。少なくとも映画は、レンダーマンからこっちスキャンラインが主流だね。
MayaなんかはManta Rayを組み入れたりし始めてるけど、レイトレースが主流とは言い難い。
けれど、嫌われたのはあくまでも膨大なレンダリング時間であって、「レイトレの
はっきりしすぎる影」なんてことはなかったはず。そもそも影の落とし方の調整なんて、
レイトレースの最も得意とするところだし。あと、743も書いている通り、屈折処理は
レイトレースでないとどうしようもない部分もあるから、ガラスや水のような表現の
ある限り、「過去のもの」になることはないだろう。
ラジオシティ... は応用できるのかねー うーん。
ん、リアルタイムレイトレってのは近頃のGIなんかの研究で
さかんになったパストレとかの応用でないの?
レイトレだから時代遅れというのは少々違うのでは?
>>741の
>レイトレーシングは統一されたシンプルなモードで動く
> → 必要な効果ごとにベストの手法を選ぶべきである
これは俺は逆だなあ、全てのシーンを唯一の統一された手法で
出来るならそっちの方がいいよなぁ。
反射・屈折したいなら環境マップ、影落としたいならシャドウマップ
とか煩雑。
できるならそっちの方が良くても、現実的な速度ではできないからやってないのでは。
最終回 見果てぬ夢を追って
ハードと並行してCellで動作するソフト開発も順調に進んでいた。
シミュレータ第1版は01年末には完成。02年にはその上でLinuxの
ブートに成功。Cellの性能を引き出すには、プログラミングに新しい
発想が必要である。ハードの複雑さを隠蔽するために、
「ハイパーバイザ」と呼ぶ仮想化ソフトを作り出した。
03年半ばになると、技術者の忙しさは増していく。基本レイアウト
設計が終了し、バグ修正が始まったためだ。SPE8個にしたため、
レイアウトには余裕がないオフィスと家とを往復するだけの毎日が続く。
そして03年のクリスマスイブ。Cellの設計データがマスクメーカーに送られる。
04年4月のある日。IBMのEast Fishkill工場で製造された試作チップ
がSTIに到着する。出荷前のテスト結果で既に動作することは確信
しているが、目の前で動作を確かめたい。
ケースを開けるとBGAパッケージが現れる。誰とはなくため息が漏れる。
1階にあるラボには動作検証用のボードが主役の登場を待っていた。
更に続く・・・
┃ ━━ /\ /:\ ■
━━ ┃━┃ /::::::::ヽ ━━━━━ /:::::::::ヽ━━━ ■
┃ ┃ /:::::::::::::::ヽ______/ : :::::::::: ヽ ■
━━ ┃ /::::::::::___ :::::: __ ヽ ★
┃ ┃ /::::::::::::/ 。 \:::\\// / 。\ \
/::::::::::::::: / ̄ ̄ ̄ヽ ヽヽ_ /_ ̄ ̄ ̄ ̄\ ヽ
/ | :: :::::::::::/:::::::::::::::::::/ ―――――ヽ ヽ :::::::::::|
/ |::::::::: :::/ |┘┘┘┘┘┘\ :::::::::|
/ /| :::: | |/::ニニニ⊃ | | | .:::|\\\\
// /|:: i し / | |::::::::::/::::::|. | | : |.;*;;∵+・;;\
////|: ノ ( | |::::::::|:::::::::| | | :|∵ \\;*;\
//// | '~ヽ | ┐┐┐┐┐┐
キタコレ!!(゚∀゚)
755 :
名無しさん必死だな:2005/07/29(金) 20:58:27 ID:NtrSLJvQ
キタキタキタキタ━━━(゚∀゚≡(゚∀゚≡゚∀゚)≡゚∀゚)━━━━!!!!!!!!!!
キタ━━━━(゚∀゚)━━━━!! 続きまだ?!ハァハァ
小出しにしないで一気に連貼りしろといったい何度言わせれば・・・
なんかいきなり2年くらい飛んでるね
「それじゃ、いこうか」
電源投入し、PLLの動作を確認。次にレジスタを操作して、チップ上の
SPE動作を動かす。
1GHz,1.2GHz,1.4GHz....担当者がダイヤルを回すと、クロック発生器の
数字が増えていく。ついに4GHzに到達。
誰からともなく拍手が。これで十分満足だ。今晩は終わりにしよう。
貴重なチップだ。ここで壊す訳には。誰もがそう思った。
ところが、IBMの開発責任者だったVice PresidentのChekib Akrout
は違った。
「よし、周波数をもっと上げよう。どこまで動くか挑戦だ」
4.2GHz、4.4GHz....「パチン」白煙が上がる。想定以上の大電流で
電圧レギュレータが壊れたのだ。
「もっと大容量の持ってこい」事もなげにChekibが言う。
結局5.6GHzまで動いた。予想を大幅に上回る成果だ。
試作チップの検証はその後も順調に続き、CPUコアを含むチップ全体も
4GHz以上での動作を確認、数日後にはLinuxのブートに成功。
更に続く・・・
キタ Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒(。A。)!!!
>>757 消えろ
5.6GHzキタ━━━━━━━━(゚∀゚)━━━━━━━━━━ !!!
>>757 全部出揃った頃に見計らってくればいいよ。
「よし、周波数をもっと上げよう。どこまで動くか挑戦だ」
4.2GHz、4.4GHz....「パチン」白煙が上がる。想定以上の大電流で
Cellがぶっ壊れたのだ。
「あ、死んだ・・」事もなげにChekibが言う。
なんつって
>>759 乙!
マイペースでやってくらさい。
いつもお疲れさまでつ
感謝!
5.6GHzてSPE単体の数値だったんか
ここまで見届ければ、後の開発は日本や米国の同僚に任せて
おけばいい。チームの任務は04年末に予定していた第2世代の試作
チップの設計。その目的は量産を想定してチップ面積と消費電力を
出来る限り削減する。検討に取り掛かったエンシニ゙アたちに寝耳に
水の事態が。
IBMのJimがCPUコアの変更を申し入れてきたのだった。
第1世代にはできるだけシンプルにするために1サイクルに1命令を
発行するスカラ型のコアを採用していた。
それを1サイクルに2命令を発行するスーパースカラ型のコアにしたいと
譲らない。これに激しく抵抗したのは東芝林とSCE大澤正紀。
2人は共にCPUコアを担当していた。第2世代ではどこを修正すれば
良いか手に取る様に分かっていた。ゴールはすぐそば。
今更別のコアに入れ替えるとは何事だ。
そこで久多良木に断られるのを承知で直談判を申し入れる。
更に続く・・・
(IBMひでーな・・・というか最初からそうする気だったのか?)
クタタンは了承するに 1cell
しなけりゃDD2が無いだろうがw
む・・ 知らない名前ばっか。
でも決定権はクターか。。
y=-(゚ω゚)・∵. ターン
クタタンは・・・天使か悪魔か・・・さてさて
IBM裏切りキタ━━(゚∀゚)━( ゚∀)━( ゚)━( )━(。 )━(A。 )━(。A。)━━!!!
久多良木は拒まなかった。
「IBMの言い分には納得できません。何とか説得して下さい」
「君達の主張は理解できる。ただし、最後は総合的に判断
することになるよ」
自分も技術者だからこそ、痛いほど2人の気持ちが分かる。
久多良木もまた苦悩していた。
結局、IBM社の主張は通った。サーバ機などへのCellの利用を想定
していた同社にとって、高性能MPUの常識であるスーパスカラ構造
の採用は不可避だった。かくして04年春コアの設計が始まる。
林と大澤も一緒に。程なく、作業は暗礁に乗り上げる。
IBM社の基本設計に大きな見落としがあることに発覚したのだ。
急遽、対策会議が。
「誰か解決策を思い付いた人は?」
「あっ、あのう」
声の主は大澤だ。これまでスーパスカラに反対した分、気後れしていた
のは事実だ。それでも大澤は解決するアイデアがあった。
「よし、君のアイデアでいこう」
経験が少なくても実力があれば認められる。Cell開発チームの
一員である喜びを噛み締めていた。
更に続く・・・
クタタン・・・(´・ω・`)
IBMが提案して自爆して、それを解決したのが反対してた大澤とは、泣ける。
いきなり暗礁かよ
これでずいぶんクロックが落ちただろうね。
規模も大きく、複雑に。
PPEのスーパースケーラなんかより、
全体が4GHzで動いた方が速いに決まってるのに・・
サーバー向けに、ほどほどのクロックで動かすつもりだな
クタラギどうした?wwwww
ちょっとIBMが好きではなくなりかけた自分ガイル
ていうか日本人バンザイの流れにし過ぎ
05年2月7日。ISSCCの初日。CELLの記者発表が行われようと
していた。前方の席には鈴置、Jim、増渕が着席。
会場の最後列にはリーダー達の発表を暖かく見守るメンバーが3人いた。
中でも取り分け満足そうだったのは山崎だ。この時、第2世代の試作
チップは完成し、あとは量産に向けた最終調整をするだけだった。
彼らの満ち足りた表情はこの場限りである。Cellの量産、
PS3の発売まで気の抜けない。
久多良木を筆頭に鈴置、山崎らエンジニアたちは既に次を担うMPUに
夢を馳せているに違いない。それでも彼らには信念がある。
情熱さえ失わなければ、あらゆる困難は必ず乗り越えていけるはずと。
終わり
i _.,,,,.,.. リ,;;;;;;:: ;;;;;:: ;;;;; ::;;;;;; \ |! 人 从
i | .;';;;;゙;;゙;ミミ (彡ノり/リノ" ミ;;;;;;,,,.. ゝ |! ) お (
i| |i i;;;;;;;;;;;;;rj );;; ヾ、;;;;...__,, );;;;;;;; ヾ ) わ (
i| |.i ':;;;;;;;;;;' j. i:::) ` ;;ー--、` 〈;;;;;;;::;;; i ) た (
i| i i ;'.⌒''~゙,.. `⌒'ヽ.i i::/ ^:::::::.. i ,ll/ニi ;; l ) / (
l| | i ;i::! ..;ノ ::;.... i )i l ヾヽ'' ゚ ))ノ;; / ) っ (
l | i. `i ::: : .::: :| 'ノ | | iにニ`i, (_/i;;; | ) !! (
| i. | ::. .:: ::l / || ! `ー‐'" / ゞ:l つ (⌒
,-‐‐! ::;: ::|i_.,-||、 ! " ̄ ,,,. /,; ミi |l
. i, `';:〉 ....;:::::.. ..:::゙ |.|i ヾ二--;‐' ,;; ,; ミ ||i i|
\.i'´゙゙"' ;:: '''゙゙"'; ,,l | _|彡" ,' ; /' ̄^ ̄''''\||
YsJAX6DK 乙
久多良木先生の次回作にご期待下さい。
(*´□`) はわわぁぁぁ
開発のみんな、乙です!
YsJAX6DKさんも 乙。
>>790 とりあえずPPCへの期待のとこで「作りが美しい(好みの問題)」に笑った
>790
何のおまけ写真だよwwwwwwwww
>>サーバ機などへのCellの利用を想定していた同社
どう考えても、最初から1命令発行を修正するつもりだったんだろ。
汚ねーな
でも まぁ サーバ用途に本気で使うつもりではあるようだから、
その意味では心強いかな?
DD2って何?
なんで5.6GHzで動いていたCELLがPS3では3.2GHzの7SPEになっっちゃったの?
5.6GHzはSPEのみのクロックのようだ。
CELL単体でそこまで動いてた訳じゃない。
このスレでは全角使ってると馬鹿だとみなされるので気をつけましょう
読んだ感じじゃ、SCE側もずいぶん活躍してるじゃないか。
LSのシステムを提唱した山崎さん、
PPEのスーパースカラ化に貢献した大澤さんなど
設計の中枢に関与してるし
>>795 Cellの第2世代設計。PS3には これが載るらしい
PPEを より高性能にした代わりに、複雑化して 少しトランジスタが増えて、
クロックが下がった。
あとは 各部の細かい改良・調整など。
あと、5.6GhzはSPE部分のみ。 全体では4Ghzちょっとだな。
100万個、1000万個単位で大量生産するPS3向けには
クロックの低下はやむをえない。 電力・熱の問題もあるしな。
7SPEにしたのは さらに製造歩留まりを上げるため。
歩留まりが2倍近くに向上するらしい
ぶっちゃけ、Pipelineの段数増やせば10GHzだっていける。
>>795 マジレスしてもしょうがなさそうだと思いつつレスするけど、DD2は第二世代のCELLのコードネーム。第一世代はDD1。
PS3に搭載されるCELLのクロックとSPEの数については、歩留まりや発熱、コストetcの問題。
大体、研究室で出た最高クロックでそのまま製品化する馬鹿がどこにいるんだよ…。
研究所での最高クロックで発売できるなら、
今頃 P4プレスコは 6GHzくらいになってるだろ
じゃあ製品版もSPEのみ4GHzとかできる可能性も?
Xbox 360 CPUのコアはPPEという俗説は否定されたわけだ
誰もほんとにPPEそのままだなんて思ってないだろ
規模的に同程度の性能になるかもしれない、って事だろ
>>804 Xbox 360 CPUのダイサイズとかトランジスタ数とか公開されてたっけ
されてないねぇ
ほとんど何も
>>801 店頭デモされていた液体窒素冷却PCの出番がついにきたな
じゃガス冷で今の倍以上の大きさになってうるさいけど
CELLでAmigaみたいなPC作って市販キボンヌ
メンテナンスの手間考えるなら多段ペルチェ不凍液冷じゃねぇの?
放熱器は家の外で騒音も無く快適
その代わりバカみたいな電気食いになるが
>>811 手間はかからんかもしれんが結露に怯える精神的ストレスのがいやん>>ペルチェ
今までの話を見ていると日本にも沢山優れた技術者がいるんだと改めて思った。
だけど、その反面ちょっともったいないと思った。
開発者の人自身も5年に一回、最高のCPUを作る事を楽しみにしているだろうし、
日本のゲーム機が世界で活躍するのもうれしいと思う。
ただ、日本でもPCゲームが普及していればAMDやnVIDIA、ATiに対抗できる
(Intelは流石にブランドと金で適わないだろうけど)チップメーカーが存在してたのかもなんて思ってしまう。
まあ、歴史にifを求めてもしょうがないですね。
「Cellの動画エンコPCIカード」って言われてるけど、
もしかして、ディスク2枚で実現できなくない?
Windows用アプリケーションと、PS3用アプリケーション
の 2枚組み製品。
Windowsに簡単なPS3連携制御ソフトをインストール
→LANかUSB2経由で PS3へエンコ用データを転送
→PS3はCDドライブから専用エンコ用アプリを起動・連携動作
→演算終了したデータを PCのHDDへ書き戻す
これならソフトと ケーブル1本だけで出来る
PS3側には HDDも要らない
いやリナックスにもエンコソフトくらい有るでしょ?
単純にHDD買ってそれ使えばええやん
でもクソ高価い2.5"HDDとか買わないと・・
PS3Linux入りソニー価格で、高くつくのでは。
USB2.0の外付けハードディスクが使えればなー。
家庭用ゲーム機である以上、環境はなるべく統一されるべきかと。
容量に応じてグレードが用意されればいい気がしますよ。
LinuxモデルのHDDは最高グレードだけ、とかで40GBは1万とか?高い?
普通にcell外販してwindows用のエンコカード出してもらうとかじゃだめなん?
>>814 ネットワークドライブが使えるんなら、
それをPCとPS3Linuxで共有するだけOK。
>>820 外販は兎も角 やるつもりならVAIOで始めると思われ。
>>822 なんかもう底なしって感じだねえ 性能も消費電力も
カードが出ればいいけど、外販は高価いだろねー >Cell
上のシステムなら ソフト2枚とケーブル1本。
3000〜5000円くらいで出せるんじゃね?
ビデオトースター乗っけたAmigaみたいなCELLマシン出せや。
マルチチップ・モジュールで1TFLOPSの演算性能を達成するという当初のゴールは残念ながらあきらめざるを得なかった。アーキテクチャや実装方式をめぐる方針の大転換に,チーム内が上を下への大騒ぎになったことも1度や2度ではない。
2001年ごろの予想だと、2005年は 65〜45nmプロセスとか、6〜10Ghzだとか。
気楽な時代だった
まさかこれほど微細化が困難になるとは思わなかったのでは
1Tflopsの設計は、現実のプロセスルールにより阻まれた、と。
>>825 PS3LinuxをベースにスキンだけAmigaにすれば出来上がりなんじゃ。
X68Kスキンとかも出て来そうな気がするな。
俺は幻のMSX3スキンに挑戦してみたいが(挫折前提)
>>825 PS3にAmigaOSを乗せちまった方が面白そうじゃね?
コモドールがフリーウェア化に同意すれば可能なんかな?
>AmigaOS移植
>>826 つまりその方針の大転換がなければ、
マルチチップ・モジュールで1TFLOPS達成できたってこと?
2006年春に65nmは厳しくないですか?
コモドール社は倒産して、今は全ライセンスをAmiga社が持っているらしい。
>>829 AmigaOSだけじゃ役に立たんよ、カスタムチップの塊みたいなマシンだったから。
>YsJAX6DK
毎月有り難う、楽しませてもらった。
>>813 それを言えば世界初の1チップCPU誕生の話とかTRONの話になって欝になる ('A`)
836 :
512:2005/07/30(土) 02:18:36 ID:tiq6ENs2
>>833 役にわ充分立つ . 魅力半減だが . 只 それでもビデオトースタ的環境わ実現できる筈 .
更に , AmigaOS4.0以降わ 変態カスタムチップ群emu を含めたシステムらしい .
最後のIBMの裏切りによって
糞チップになったな・・CELL
cellはDD2なの?
(´・ω・`)DD2なのでし。
既に3.2GHzに落として発表してると言うのに、
何故いまさらDD1を・・?
複雑で一般的な処理はPPEに一任するのだから、
改良は決して無駄では無いはず
>>837 解からないのは設計委託されているだけのIBMが、なんでここまでCellの設計に
ついて口を出せるのか?だな。
Cellの開発費と生産設備ってSCEがお金を出しているんだろ?
PPE部分はIBM持ち、と考えないと、PPEが360 CPUにも塔載されている理由がわからなくなる。
845 :
名無しさん必死だな:2005/07/30(土) 11:18:10 ID:a+J347ii
Blue Gene/L マイクロプロセサの数は13万個以上に達し,
発生する熱量は2万5000Wにも達するという。
ボイラーみたいな発熱 ドラッグレースですなw
箱丸のは、G5からいらん機能を取っていったものだ、とアラードが言ってたと思うが。
G5とは別物だよ。命令セットとかVMXが似てるだけ。
>>843 設計委託されたんじゃくて、共同研究共同開発でしょ
うむ。
委託は xenonCPUの方だな
委託されてるだけだったら特に口出しする必要なし、そつなくこなして金貰うだけだから
でも共同研究共同開発となれば良いモノが出来ないとお話にならないので積極的に口出すだろうな
Cell自体の開発研究費は、IBM、Sony、東芝で1/3ずつ出し合ったはず。
結局記事中では1TFLOPS諦めた理由ちゃんと書いて無い?
>>844 サンロクマルのがPPEってのはありえないって、
>>774とか読めばわかるべ
その言い方だとCellの外販をIBMがやるのもありえないことになりそうだな。
それともSCEにいちいち許可貰いにいってるのかな?
>>854 いくらなんでも、たとえばIBMはゲーム機用とか家電用には勝手に販売しない、
ソニーや東芝はサーバ用には勝手に販売しない、とか最初から契約で取り決めて
あるだろ、馬鹿じゃないんだから
Cellのメインコアはなんでもいいわけで、PPEがIBMの汎用コアだとすれば
別にXBOXに使おうが、なんに使おうが問題ないだろう。
つーかXBOXにCellが乗れば、SCEもIBMも東芝も儲かるわけですが。
>>856 >PPEがIBMの汎用コアだとすれば
わざわざソニーや東芝が技術者をPPEの開発に投入してるっていう話は無視?
なんでIBMから買わないでそんなIPを複雑にした上にコストを上昇させかねない
ことをするのか説明が付かない。PPEの元になったPowerプロセッサならIBMの
コアかもしれんがね。
普通に考えてコアはIBMの比重が大きいんでしょ
PPC970から思い切り良く制御機能を剥ぎ取った物がPPE
無論どれが制御機能なのか知っているのはIBMだけだろうからPPEの
論理設計はIBM以外に有り得ない。
コイツをそのまま他のダイに押し込んだ所で性能なんぞ全く出ない
と他ならぬIBMが一番良く知っているはず。
何より物理層の設計は生産する3社で行った事は明白で 例えPPE
もどきの設計をIBMが外販したとしても買った側がそのまま作れる
物ではない。
というかDD2でPPEの拡張要件をわざわざSCEに求めたって事はCell
をIBM単独でいじる事が出来ない=PPE自体IBM単独で使う事は出来
ないつーこったろ。
>>859 >PPC970から思い切り良く制御機能を剥ぎ取った物がPPE
PPEの元は
A 1.0-GHz single-issue 64-bit PowerPC integer processor
Journal of Solid State Circuits, Vol. 33, No. 11, Nov 1998. (J. Silberman et al.)
だからPPC970とは直接の関係は無い。
360のCPUは1億6000万と言ってたから、
1MBキャッシュや通信ロジック引くと、
1コア当りPPEと同じ2,3000万だよな。
>>860 お? 要するにケストレルが
>>860でAV8BがPPC970 FRS1がPPEみたいなもん?
360CPUの1億6000万TrってL2抜きの値だろ
>>863 なぜわざわざL2分を抜いた値を公表する必要があるのかとw
どうせPower5かG5あたりから類推したんじゃねーの?
しかし360は12月発売なのにCPUもGPUもなんも出てこないなぁ
4ヶ月前なら少しは影ぐらいは出てもよさそうだが
TGSまで完全に隠すつもり(なんのメリットがあるか知らんが)なのかな?
この時点で出てない物はずーっと出ないのでは。
要はcellのPPEに○箱のPPCが乗っていたらよかったんだ
わかった! CellのPPEをコソーリそのまま使ってるから 公表できないんだw
なんてな
ところで、xenonってSMTなの?
PS3の載るCellはDD3だよ
IBMの仕様変更案って、そんなに悪いモンなんですかい?
変更前、変更後で何がどう変わるのかサパーリ。
まぁ、素人だから教えてもらってもサパーリなんだろうがw
>>875 --------------------
IBMの仕様変更案って、そんなに悪いモンなんですかい?
--------------------
常識的な判断す。RISCの場合メモリにアクセスするだけでもアドレスを算出する命令とロード/ストア命令
の二つに分割されたりするのが普通すから。非常な単純な演算でも演算命令とロード命令の組み合わせに
なることが多いし。。。
組込みコアのPPC440でも2-issueす。
ttp://pc.watch.impress.co.jp/docs/2005/0212/kaigai157.htm >ちなみに、CellのCPUコアのシンプルさは、コアの規模でよくわかる。Cellチップ上で1個のSPEが占めるサイズは2.5mm×5.8mm、面積は14.5平方mm。本当にツメの先程度のサイズだ。
>トランジスタ数は2,100万トランジスタだが、このうち1,400万がSRAMで、ロジック回路は700万トランジスタに過ぎない。トランジスタ数で見ると、
>世代的にはPentium IIIクラスの規模ということになる。規模的には、CellはPentium IIIクラスの規模のCPUコアを8個搭載していると考えればわかりやすい。
CELLのP3規模のコア8、xenonの1億6000万でコア3個のどっちがゲームを動かす上で
性能が良いのかよくわからんなぁ。
いまだ真偽の確認とれていないけど、言われてるように360がPPEx3なら、
メインコア以外の追加分はPPE2コとSPE7コのどちらがいいか、という話になり、
有難味はCellの方があるかと。
まぁどちらも最適化すればそうとうな性能発揮できるからそんなに心配すんな
両儲は幸せだな、かわいそうなのはあともう一台のあの次世代機の儲だ
おそらくマルチでは完全にシカトされるであろう、それぐらいの差がある
まぁもともとあそこの儲は自分の所のソフトしか買わないから関係ないけどw
つーかよく考えてみると
7コアって尋常な数じゃないよなぁ。
Z80のメイニーコアなら6万コアが可(ry
両プロセッサを十分使いこなしたときどうなるかはわからないけど
Xenonは普通にやってりゃゴッサム3程度のものができるのに対して
Cellだとショボガンダム程度にしかならない。
ロンチで差をつけられたらちょっとつらいよね。
NE905号 mark papermastar氏インタビューより
--IBM社にとって、CELLはどのような意味があるのでしょうか。
一つの技術ですべての応用分野をカバーする事はできない。
産業分野ごとに個別のイノベーションを引き出す必要がある。IBM社が
これまで、技術開発を続けてきたPowerPCを基に、ゲーム機で必要な
イノベーションを持ち込んだマイクロプロセッサ、それがcellである。
cellは画期的なプログラミングモデルを採用している。歴史を振り返れば一般に、
新しい技術の扉が開くのには時間がかかる。cellのプログラミングモデルが熟成するのは、まだ先のことだろう。
ただ一度、新しい方向に進み始めれば急速に時代が変わる可能性がある。
cellのような技術を利用したいと言うような声が聞かれるようになれば、IBM社はいつでも
速やかに対応できる。かつて、マイクロプロセサを開発してきた経験と多くの複雑なASIC開発を
請け負ってきた経験が生きるだろう。
885 :
名無しさん必死だな:2005/07/30(土) 21:05:19 ID:EkihSLTP
R3000x100個とか 馬鹿やらないでよかったな。
ほとんどの処理がストールするところだ・・
つーか、どうやって処理割り当てるねん?
いや実際にとんでもない時間がかかるよ、ソフトウェアの熟成には。
Cellを扱うための抽象概念すらまだ確立してないのだ。
ここで風呂敷広げても非現実的な響きしかしない。
cellで展開すると3社で特許料分割しなきゃいけないからでは?
普通にcellとは別にメイニーコアのカスタムCPUの設計受注だけやってれば
自分ところで全部とれるし
>>888 まあ、そうだろうな。
既存の顧客に対しては頼まれれば応えるが、自分から積極に展開しようとはしない、
新しい顧客に対しては、ある程度積極的に展開するというスタンス、だろう。
>>852 本当?
本当だとしたら、わりに合わないね
BDにイチャもん付けるはずだ
そりゃこんな歪なプロセッサ本腰入れて売るわけないだろ。
それでもCELLを作ったのはIBMは以前インタビューで我々は2・3割は失敗する覚悟で
手広く研究開発をするんだ、失敗しそうなところにもちゃんと投資することで
真の成功を収めることができるんだ見たいなこといってたから。
あっ東芝の事です
>>890 BDにいちゃもんは関係ないだろ。
ちなみに研究開発費SONYは200億円出してる
>>895 全部で約500億だから
残り300億をIBMと東芝で出してるはず
IBMの研究開発部隊は当時他に仕事がなくって、
合同プロジェクトは渡りに船だったな。
>>896 う〜ん・・
東芝ってTV位しかCell仕様用途ないよね
PS3の互換でも出さなきゃ。やってられないね
やってられないなら最初から参加しねーよw
技術レベルの維持の為なのかな
ガンバレ東芝
>>898 普通にDVDレコとかあるが。
確固たる地位を築いたRDシリーズも持ってるし、あとは獅子身中の虫である
HD-DVDさえ始末できればCellの使い道はAV家電で多岐に渡る。
テレビと言ったって、液晶やプラズマや今冬予定のSEDなどはデコーダの
性能が画質に直結するからCellのようなパワフルなチップを持ってると有利。
こいつにはそんな親切に解説してもムダっぽい
HD-DVDにはデコーダ載らんのか?
レコーダはNECがエンコ専用チップ開発してるから
そっちのほうが効率いいだろうな。
Cellが売れれば一個いくらでSony,東芝、IBMそれぞれに金が入ってくるんだから
やってられないなんてことはないだろ
結局Cellは専用チップに劣るのか。
家電分野でボリュームのある用途には必ずハードワイヤードされた専用チップが現れ、
汎用のCellは消費電力で勝てない。
Cellは専用チップの及ばないニッチ領域で生きるか、
拡張性と短納期に活路を見出すか。
ソニーは世界最大のAVメーカなんだから
放送局向けの業務用機器とかで使えないのかね
そっち方面の方が強いからなぁ
そりゃほかの家電メーカーが採用してくれたらいいんだろうけど
なかなかそうもいかんだろうし
>>907 専用チップを起こすのはコストに見合わなくなってきてる。
それに、Cell1個でいくつものカスタムチップの役割を代わる
ことが出来るし、Transmetaの技術も導入する。
次世代以降はCellの出番だよ。
いちおう、Transmeta、負けた会社なので。思い出すのは時々でいいんじゃないか。
Cell家電にはXDR DRAM載せなきゃならないのかな。
XDR DRAMは普通に家電向きだと思うが
>>910 コストに見合わなくなってきてるのは「自社でしか使わない専用チップ」を起こすことじゃないだろうか
>>914 cellは一応、東芝のTVとレコーダ
IMBの鯖にsonyのTV、レコーダ、PS3といくつか有るだろ?
まぁ、IBMの鯖は正直どうなるかわからんが、TVとレコーダには使える
性能は、下手な専用よりヨサゲっぽいからなー
嘘かホントかシランが、松下やサンヨーからも、cell使えるのか?って聞いてきてるようだぞ
>>915 あとプリンター複合機
TOYOTAも何かに使おうとしてなかったっけ?
Cell無くても作れるものばかりだな。
日本バンザイ物語は嫌いじゃないからCellは応援したいけど
でもなー
TVやレコーダー開けてみてもPC並みのヒートシンクとファンが付いてるのは見たことが無いぞ
それをいっちゃぁおしめーよ
複合機は地味に景気がいいからなぁ、そこに食い込んだなら安泰だな
そうだった、汎用目的だったよな
osも、ゲストを入れ替えたら色々対応できるのかね?
まぁ、ゲームが動くぐらいだからその辺は何とかなるんだろうな
東芝もTVやらの民生機器以外に軍事用途とか医療用途とかIBMがやってるような
面での営業をしそうなもんだがな。そもそも自社で医療機器とかセキュリティ
システムとか作って売ってるわけだし。
Cellと他のSolutionを比べて見れば使い道が分かるんじゃないか。
処理容量の少ないアプリケーションでは、Cellよりも値段が安くて低消費電力なMPUを使えばいい。
処理容量が多くても、販売台数が多くて(数千万以上)かつ設計・製造・販売後に
処理機能をアップデートする必要のないアプリケーションでは専用ASICや専用ASIPを作ればいい。
処理容量が多くて、販売台数が少なくても、x86とかSPARCとかのソフト資産は必須な場合は、
そのソフト資産の使える別プラットフォームを使えばいい。
処理容量が多くて販売台数の多くないアプリケーションか、処理容量が多くて機能変更が必要なアプリケーション
High Performance, Middle-Low VolumeかHigh Performance Reconfigurable Solutionで
かつ(今のところは)スクラッチからシステムを組むために売ることになるんじゃないのか。
>>924 デジタル家電というよりはHPC向きな感じですね。
ユーザは一般消費者ではなく企業だな。
画像認識機能つき監視カメラとかの類の応用で使われそうではないだろうか。
>>925 HPCって知らないんだけど、High Performace Computingかなんかの略なのかな。
でも、単にReconfigurableでHigh Performanceっていうだけなら、
x86とか従来のPower PCとかに比べてどれだけ優れてんだ?
今すでにあるx86やPPCの過去資産やノウハウを捨てて0から新しいプラットフォームを使うだけの価値はあるのか?
って話になっちゃうから、よっぽど他のプラットフォームと比べて性能高くないと、使ってくれんのよ。
>>926 結局、動画処理関係しかRealtime Comuting Intensiveなアプリケーションってないのかね。
ロボット制御分野でも、用途ありそうかも。
Cell塔載のコンパクトなワンボードマイコンが必要だなあ。
ロボットっつーと今はCPUの処理能力よりも、
制御ソフト・センサー・アクチュエーターがネックな気もするんだけど、
万博で紹介されてた会話ロボットとかぐらいになるとHigh PerformanceなCPUが必要なのかな。
ピンが1000本もあってコンパクトなワンボードマイコンが実現できるわけナイダロ
しかもADもDAもコンパレータもたぶんタイマーも無いんだぜ
じゃあ、誰か分散でも並列でもないSPEを利用したSynegiticなComputing Solutionみたいなの考えつく神キボンヌ。
特許取ればCell3会社から金ぶんどれるぞw
あんまり調べてなんで分からないけど、IBMはその辺りもういくつか考えてるのかな。
934 :
512:2005/07/31(日) 02:53:26 ID:hDe06L0o
ハードワイヤード 従来のCPU Cell
性能 ◎ △ ◎
消費電力 ◎ × ○
機能性 × ◎ ◎
柔軟性 × ◎ ◎
移植性 × ○ △
コスト ◎ × ×
これからは組み込み製品は、高性能だけではなく高機能も要求される。
レコーダを作るのに、高性能が要求されるvc-9,h.264のそれぞれエンコード、デコードが必要。
さらに同時録画、同時再生、録画中再生、メディア化など様々な要求にこたえる必要がある。
従来のCPUではvc-9,h.264のエンコードは性能面で不足して難しい。
ハードワイヤードで実現するとなると、vc-9,h.264,mpegそれぞれのエンコード回路、デコード回路
さらに同時録画や同時再生を実現するのに複数回路を搭載する必要があり、冗長になってしまう。
ここにcellが参入できる。
各社の Hardware codec は、若干の専用回路を hard wired で持つものの、
その実体は DSP や RISC を組み合わせた構成の物が殆ど。
各種 codec への対応も、内蔵 procesor で実行される firmware の変更で
行なわれ、専用回路はそれらで共通に使われる個々の要素技術に対する物。
> ハードワイヤードで実現するとなると、vc-9,h.264,mpegそれぞれのエンコード回路、デコード回路
> さらに同時録画や同時再生を実現するのに複数回路を搭載する必要があり、冗長になってしまう。
複数 codec の対応で増えるのは回路よりも firmware の規模。
同時録再も、ch 数分の回路を載せるのではなく、複数 ch を処理可能な
性能を持つ単一の回路で時分割処理する方が一般的である。
これは、HD 対応などで性能要求が跳ね上がる場合にも親和性が良い。
基本的に、比較表の「ハードワーヤード」に相当する製品が皆無であり、
有りもしない物との比較に意味があるとは思えないが。
新規に開発するのに比べて安くできるかどうかがすべてじゃないの?
廃熱処理なんかも含めて。
SDTV/MPEG2 を前提とした既存の media processor 程度ならともかく、
HDTV/H.264 の複数 stream の codec をそういう方法で実装した場合、
柔軟性の欠如から応用が限定され、単一製品の生産規模を上げる事が
難しくなり、急増するマスクコスト等からコストも大幅に上昇する。
新規に開発するにしても、
>>936 の云う様な「ハードワイヤード」な
実装を選択するメリットは少ないし、今後更に減少していく。
だから既存の Meida Processor はそういう実装を選択していないし、
今後も松下の UniPhier みたいなアプローチが増えているのだし、
Cell の方向性も大筋においては同一線上の物ではないかと。
排熱の問題にしても、既存の Media processor には SDTV x48 もの
MPEG2 同時 decode に対応している製品は無く、数W に対し数十W と
大差がある様に見える消費電力も性能当たりでは大差は無い。
HDD/HD DVD recorder などで必要になると思われる HDTV/H.264 の
Multi stream 処理に対応するには、最低で一桁は性能向上が必要で
より柔軟な汎用 Processor である Cell を越えるとは思わないが、
Media processor でも同様に熱の問題が付き纏う事になるだけでは。