【ゲームハード】次世代機テクノロジー23【スレ】

このエントリーをはてなブックマークに追加
952名無しさん必死だな:2005/09/07(水) 16:00:12 ID:HG2v3jkb
>>951
アーキテクチャーの話だろ、普通
953名無しさん必死だな:2005/09/07(水) 16:02:59 ID:AMMnQLnV
作りの話。
簡単にはマルチタイトル作れないよ…というお話。
954名無しさん必死だな:2005/09/07(水) 16:03:58 ID:3EkUM3g8
360は普通にPCも上回ってるんだけどな
もちろん開発者のお墨付き
これは単純な性能のことをいってるんじゃないと思うが
PCなんてメモリ2GとかVRAM512Mとか平気であるしな
955名無しさん必死だな:2005/09/07(水) 16:18:01 ID:fCKWHFZJ
DD1 PPE compared to DD2 PPE and PPC970 core
ttp://www.realworldtech.com/page.cfm?ArticleID=RWT072405191325&p=4

XboxCPU Die
ttp://news.teamxbox.com/xbox/9057/Xbox-360-New-Tech-Specs-Details-Surface/

かなり違うといえば違うけど、XboxCPUのコアはDD1仕様ではなくDD2に近いっぽいな。
あとは、何が違くてXbox360のCPUコアが1.5でCellのPPEは2なのかだな。
956名無しさん必死だな:2005/09/07(水) 16:26:06 ID:jAIbY3Ad
>948
サイクルごとにスレッドを切り替えるのは箱○CPU
957名無しさん必死だな:2005/09/07(水) 16:26:36 ID:xTXASlYJ
>>954
>PCなんてメモリ2GとかVRAM512Mとか平気であるしな

はいはい、わろすわろす
こんな環境の人なんてマニアでもほんの一部w
958名無しさん必死だな:2005/09/07(水) 16:30:00 ID:701bc/MD
>>924

貼られた掲示板の参加者のコメントなんぞ要らんて
959名無しさん必死だな:2005/09/07(水) 16:34:34 ID:rmiDHGSs
DD2はxenonより後に完成したんだっけ?
どちらかが参考にしたなんてことがあるかな
960名無しさん必死だな:2005/09/07(水) 16:37:55 ID:1+G2MqO6
>それぞれのスレッドのクロックは実質的に半分に 2.5Ghz/0.7GHzという風に自動で割り当てられる

これをマルチスレッドとかいってる頓珍漢ワロス
クロック自体(CPUパワーともいえる)をリソースとして分けられるハードウェア機能が
ついてるんだよ。 これが付いてるCPUは聞いたことないな。
961名無しさん必死だな:2005/09/07(水) 17:41:20 ID:LGlZdKGh
つうかCellの文書丹念に読んでる人はPPEのMTの正体を知ってるはずだよね。
教えてプリーズ。
962名無しさん必死だな:2005/09/07(水) 17:43:35 ID:nL+baajQ
>>951
最初PS3とXBOX360間には、PCとゲーム機間ほどの違いはないだろうと
思ったが、開発機が来たら、こりゃびっくりしたとのこと。

>>953の言うとおり、マルチタイトルは作りづらい。
963名無しさん必死だな:2005/09/07(水) 18:02:45 ID:7s61LQh8
PS3の場合PPEはお飾りで仕事をするのはSPEだからな
恐らく多くの開発者はPPEがメインコアでSPEはサブコアと
錯覚してたと思われる
964名無しさん必死だな:2005/09/07(水) 18:26:36 ID:2UiRSucy
SPEじゃほとんど何も出来ないだろうと思ってたらあらびっくりってところじゃないのかね。
965名無しさん必死だな:2005/09/07(水) 18:59:19 ID:2VUm+uST
ttp://pc.watch.impress.co.jp/docs/2005/0822/kaigai204.htm
>同じマルチスレッディングでもPentium 4のHyper-Threadingとは異なり、異なるスレッドの
>命令を1サイクルに混在させて実行することはできない。Xbox 360 CPUは、サイクル単位
>でスレッドを切り替えて実行するファイングレインドマルチスレッディング(Fine-Grained
>Multitheading)を実装する。これは、CellのPPEと同じだ。

ttp://game10.2ch.net/test/read.cgi/ghard/1125721254/
>the Cell processor can use simultaneous multithreading (SMT) like the IBM
>POWER5(TM) processor or Intel(R)'s Pentium 4 processors with Hyperthreading.

MTに関する情報は、知る限りだとこの2つかな
公開されたPDFではPPEのMTについては検索しても引っかからなかったし
966名無しさん必死だな:2005/09/07(水) 19:22:49 ID:rmiDHGSs
http://pc.watch.impress.co.jp/docs/2005/0208/kaigai153.htm
PPEはIntelのHyper-Threadingと類似のSMT(Simultaneous Multithreading)機能も搭載し、
2つのスレッドを同時に実行することができる。2wayのSMTを実装したPPEと、8個のSPEで、
Cell全体では10スレッドを並列に実行できる。
つまり、ソフトウェア側から見るとCellの中に10個のCPUがあるように見えることになる




後藤ちん、こっちは撤回したのかな?
967名無しさん必死だな:2005/09/07(水) 19:30:43 ID:2VUm+uST
>>965 訂正、URL間違ってた
ttp://www-128.ibm.com/developerworks/power/library/pa-cell
>the Cell processor can use simultaneous multithreading (SMT) like the IBM
>POWER5(TM) processor or Intel(R)'s Pentium 4 processors with Hyperthreading.

>>966
6月25日付けのIBMの資料でHTのようなSMTだと言ってるから、DD2での話だと思うん
だが、どこかからFine-Grained式に変わった情報でも入ったのかねぇ
968名無しさん必死だな:2005/09/07(水) 19:31:38 ID:701bc/MD
>>965-966
残念、後藤タン記事は推測が多すぎてソースたりえませんので
969名無しさん必死だな:2005/09/07(水) 19:40:36 ID:701bc/MD
検索してみるとXbox 360のCPUコアがfine-grained multithreadingなのはHOT CHIPS
発表から明らかだけどCELLのPPEがfine-grained multithreadingだと言ってるのって
後藤タンだけなんじゃね?
970名無しさん必死だな:2005/09/07(水) 19:41:16 ID:s/aRpiRf
XBOXCPUコアとPPEのマルチスレッディングは別物なのは確かなのか?
971名無しさん必死だな:2005/09/07(水) 19:47:39 ID:701bc/MD
いや、
http://www-306.ibm.com/chips/techlib/techlib.nsf/techdocs/D9439D04EA9B080B87256FC00075CC2D/$file/MPR-Cell-details-article-021405.pdf
見ると
The Cell Power core has hardware fine-grain multithreading.
The multithreading design supports fine-grained
multithreading with round-robin thread scheduling. If both
threads are active, the processor will fetch an instruction from
each thread in turn.
とあるので外部の評価記事ながらDD2もfine-grained MTで合ってるのかな。
972名無しさん必死だな:2005/09/07(水) 19:54:01 ID:LGlZdKGh
SMTを実装するのにはOut-of-order型のコアが有効で、PPEには相応しくないという話もあった。
973名無しさん必死だな:2005/09/07(水) 20:03:04 ID:2VUm+uST
>>971
それ2月の記事なんでDD1ベースの話なんじゃなかろうか?
…と思ったが、中の図見るとDD2っぽいな
個人的にはIBMの6月発表の記事の方が正しいのじゃないかと思うんだが
さすがに、Fine-Grained MultithreadingはSMTとは言わないだろうし
974名無しさん必死だな:2005/09/07(水) 20:16:15 ID:rmiDHGSs
むぅ・・
OoOを実装していれば、普段から1本のスレッドに対してやってる
命令のスケジューリングを、複数のスレッドに拡張してやるだけで済むので、
ロジック拡張が僅かで済む点が大きい。

効果としては、むしろOoOを実装していないコアの方が性能向上には資するかもしれんが、
何しろ 増加ロジックも馬鹿にならない。
「SMTを実装するくらいなら、OoOも実装しとけ」と言われてしまうだろう。

Fine-grain方式の方がロジックも単純で PPEには向いてるのかも知れないが、
それにしても、DD2であんなにロジックが増加してるのに 違うのは発行命令数だけなのか?
何かヘンだな・・
975名無しさん必死だな:2005/09/07(水) 20:33:32 ID:2VUm+uST
ttp://pc.watch.impress.co.jp/docs/2005/0816/kaigai203.htm
>IBMはSMTは、消費電力に対するパフォーマンスの面で有効だと評価している。
こんな話もあるな

IBMのフォーラムで聞くのが早そうだが、敷居が高いしなぁ
976名無しさん必死だな:2005/09/07(水) 20:45:31 ID:LGlZdKGh
しかしそもそもゲーム機でSMTとかFine-grained multithreadingとか
実装する価値あるのかな。
977名無しさん必死だな:2005/09/07(水) 22:08:03 ID:opTpWkyy
PSPドイツは初日で7万5千台かな? フランス10万 イギリス18万5千 か

Sony sells approximately 75,000 PSP in Germany 07.09.05 -
http://www.gamefront.de/
Sony CED communicates that in Germany in the first sales days almost everything of
the 75,000 delivered PSP was sold;
the Handheld came to 01.09.05 on the market.
On the part of the software Ridge Racer and WipEout pure one in the
Top 3-Verkaufs-Charts could platzieren themselves.
Into the Top 10 MediEvil (place 5) and World route Soccer (place 8) created it.
978名無しさん必死だな:2005/09/07(水) 22:12:25 ID:2VUm+uST
最近Cellスレとテクノスレの内容が入れ替わってきてるな…
979名無しさん必死だな:2005/09/07(水) 22:25:58 ID:60EScweA
新しくIBMを迎えて5年かけてCellを作り、nVIDIAと組んでGPUと豊富なソフト資産を手に入れたソニーのPS3。

GCから継続して粘り強くIBM&ATiと提携し続け、性能面では妥協しつつも互換性は磐石な任天堂のレボ。

無茶な卸値で揉めてnVIDIAと縁が切れ、ハイエンドで劣るインテルでは次世代を戦えなくなったMSの箱○。



次世代機の負け組は箱○だけってことか。
980名無しさん必死だな:2005/09/07(水) 22:33:07 ID:x6CbkuAe
あんま関係ないが、R520の32パイプが今まで10個しか取れてないらしいな(笑
歩留まり3%とかで笑ってたが、現実はその斜め上だとは思わなかった
981名無しさん必死だな:2005/09/07(水) 22:40:10 ID:G5fdNHph
歩留まり3%は24パイプの話
微妙にスレ違い
982名無しさん必死だな:2005/09/07(水) 22:40:12 ID:iWh/iuA6
PPEはfine-grainedである意味正しい。

PPEは最大IPCが2で非常にパイプラインが長い(整数パイプでも10段以上、浮動少数/VMXパイプだと30段以上)、
命令に依存性があったりするとこの長さが仇になって簡単にIPC1以下に低下する。
このような命令依存やその他さまざまな影響によるIPCの低下を防ぐ働きをするのが今回のSMTの正体。

2つのハードウェアスレッドが両方ともIPC2が達成されるような完全に最適化されたコードを実行するとき、
それぞれのスレッドが入れ子になって実行されるため、それぞれのスレッドではクロックが半分になったように見えるが(FineGrained的)、
コアから見れば本来出しうる最大IPC2を達成することが出来る。このときの演算性能は 6.4G op/sになる。

同様の条件で、それぞれがIPC0.5相当のコードを実行するとき、入れ子になることでコアからすれば1op/clockを実行できることになる。
この場合コアから見るとIPC1を達成することになる。このときの演算性能は3.2G op/sになる。
もしSMTがなければコアはIPC0.5しか達成できないわけでこれは大幅な性能向上が見込めると言える。
983長すぎた:2005/09/07(水) 22:43:40 ID:iWh/iuA6
結論としてSMTは平均IPCを高く維持するために有効であると結ぶことが出来ると思う。

参照(ソースの信憑性が微妙だが、大きく間違ってるところは無い)
http://pc.watch.impress.co.jp/docs/2005/0518/kaigai01.pdf

個人的な推測だが、PPEのコアから見た平均IPCは1.0+程度になるのではないかと思う。

ちなみにCellのPPEと360CPUのPPEは、ロジック部に関して95%以上同じもの。
キャッシュ的にCellのものの方が少しリッチなので(主にアソシエイティビティの影響)、
若干Cell側の方が1コアあたりの性能は上になるだろうが、ほとんど差は無いと思われる。
984名無しさん必死だな:2005/09/07(水) 22:44:32 ID:LGlZdKGh
> それぞれのスレッドが入れ子になって実行されるため、それぞれのスレッドではクロックが半分になったように見えるが(FineGrained的)、
Fine-Grained的というか、それはFine-Grainedそのものでは? どこがSMT?
985名無しさん必死だな:2005/09/07(水) 22:55:46 ID:iWh/iuA6
>>984
基本的にfine-grainedなのは間違いないのだけど、キャッシュミス等の纏まったストールがあった場合、
入れ子にならないと言う部分が単純にfile-grainedと言い切らない理由なのではなかろうか。
986名無しさん必死だな:2005/09/07(水) 23:23:00 ID:2VUm+uST
>>983
>ちなみにCellのPPEと360CPUのPPEは、ロジック部に関して95%以上同じもの。
これって何かソースある?
XenonのコアはVMX部に関してかなりPPEと変更が加わってるようなので

でも、確かにVMX以外ではほとんど同じに見えるんで、あのインタビューで言うほどの
差が出るとは考えにくいんだよな、でも実機で評価しての感想のようだから
実際には差が出てるんだろうなぁ
987名無しさん必死だな:2005/09/07(水) 23:53:35 ID:Y7NC7lw4
確実に遅くなる要素としてはやっぱL2キャッシュと
メモリバスあたりかな。

CellのPPEが1コア512KBフルに使えるのに対して、
360のは3コアで1MB、GPUとのバファリング領域と
しても使用されるから、実質的には更に少なく。

仮に256KBをGPUとの通信用に確保すると
1コア当り256KBで、Cellの半分。

それでも1コアあたり256KBは大したもんだけど、
1仮想コアあたり128KBと考えると心もとないし、
メモリが遠い事からヒットミスのペナルティの
影響も受け易いだろうし。
988名無しさん必死だな:2005/09/08(木) 00:04:13 ID:LGlZdKGh
キャッシュ容量もそうだし、メモリ帯域からいっても、
6スレッドをフルに使う状況は想定していないような気もする。
2コアにして余ったトランジスタでキャッシュ増量した方が
開発者も嬉しかったのではないかと思うが、
ライバルとのカタログ性能差が開くのを気にしたのかねえ。
989名無しさん必死だな:2005/09/08(木) 00:37:49 ID:rDx2VYOv
それ言っちゃうと痴漢がおとなしくなっちゃうから
990名無しさん必死だな:2005/09/08(木) 00:42:11 ID:OA/p+u6A
そこら辺はMSも分かってるらしく>>784みたいな事言ってるわけで。
ようはPS2の時みたいに普通に使っても性能出ないから
プログラマに血反吐吐く思いでチューニングしてくれって事でしょ。
991名無しさん必死だな:2005/09/08(木) 01:01:13 ID:YywmrUil
しかし本当にPS2見て作ったハードだな箱○は
992名無しさん必死だな:2005/09/08(木) 01:02:04 ID:ZSUJZQpS
いやPS2なんか参考にしてません
参考にしたのはGCです
993名無しさん必死だな:2005/09/08(木) 01:05:24 ID:hmI2//yH
>>992
どの辺が?

まさかATiつながりかとかw
994名無しさん必死だな:2005/09/08(木) 01:05:42 ID:AqohTnMf
>>990
さすがにEEのベクトルプロセッサーみたいな血反吐を吐くチューニングが必要に
なる程じゃ無いだろうけど、メモリアクセスの事を意識しないと、思ったよりも性能が
上がらないって事だろうな

メインメモリへのアクセスがボトルネックになるという事が解っていたから
Cellは明示的にアクセスを指示&裏読みさせてレイテンシを隠蔽できるように
LSという仕組みを選択したわけだし
995名無しさん必死だな:2005/09/08(木) 01:09:42 ID:1+uQgi4T
偏屈者が作った偏屈なCPU = CELL
996名無しさん必死だな:2005/09/08(木) 01:21:51 ID:/WfQB95H
発売前からボトルネックかよ
997名無しさん必死だな:2005/09/08(木) 01:49:46 ID:06A3zFCE
現行のプロセッサの技術でも前もって分かりきってたことだし。

それを克服するテクノロジージャンプとして提示されたのがCell。
あと1〜2年ばかり騙し騙し使おうと言っているのがXenon。
998名無しさん必死だな:2005/09/08(木) 02:14:19 ID:jgl8MEHP
spec2000でintで400、fpで500ってどうなのよ?いいの?悪いの?
999名無しさん必死だな:2005/09/08(木) 02:46:28 ID:q4svmAE3
999
1000名無しさん必死だな:2005/09/08(木) 02:47:29 ID:q4svmAE3
1000げと〜
10011001
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。