そしてCPUはDRAMダイも統合する

このエントリーをはてなブックマークに追加
1不明なデバイスさん
http://pc.watch.impress.co.jp/docs/2008/1226/kaigai483.htm
>CPUとGPUが一緒になるだけでなく、CPUとメモリも一緒になろうとしている。
>数年後の高スループットCPUは、DRAMダイ(半導体本体)をCPU と同じパッケージ
>に封入する可能性が高い。マルチコア化とベクタ演算能力を
>強化(またはGPUコア統合)したCPUに、DRAMもくっつく。
>言ってみれば、「CPU+GPU+DRAM」という姿へと変わることになる。
5年もかからずやってくる問題だ。
2不明なデバイスさん:2008/12/26(金) 02:26:09 ID:7ZFGa1Ea
>理由は簡単だ。TFLOPSパフォーマンスを狙うCPUが、数百GB/secのメモリ
>帯域を必要とするためだ。フル性能を発揮するために必要なピーク数百
> GB/sec帯域を実現するためには、現在の数十GB/secから一気に10倍へ
>メモリ帯域を高めなければならない。しかし、3〜4年にデータ転送
>レートを倍々に引き上げるDRAMロードマップでは、この帯域を到底実現
>できない。メモリインターフェイス幅を広げることも、限界に近づいている。
3不明なデバイスさん:2008/12/26(金) 02:28:23 ID:7ZFGa1Ea
>次に、Intelはプラン(1)を取り、アグレッシブなDDR2へのシフトを計画し、
>DDR2自体も高速化へ向かった。しかし、メモリの移行はIntel の想定して
>いたペースでは進まず、ロードマップは順調に踏破されなかった。DDR4
>ではプラン(3)の折衷案で、従来のDDR系メモリの延長となる
>「DDR4 Single-Ended」と、高転送レートを狙う「DDR4 Differential」
>の2本立てのプランが提案された。しかし、これもうまく行かず、
>DDR4自体が白紙に戻った。
VIDEOカードで採用されたDDR4はこない。
いまのDDR3かRAMBUSだろう
4不明なデバイスさん:2008/12/26(金) 07:49:48 ID:XFld62vC
それなんてeRAM?
5不明なデバイスさん:2008/12/26(金) 10:14:58 ID:6YhzxVFo
エルピーダオワタ\(^o^)/
6不明なデバイスさん:2008/12/26(金) 10:38:02 ID:6YhzxVFo
大容量3次キャッシュで解決
7不明なデバイスさん:2008/12/26(金) 13:47:52 ID:JpZa7Lyp
キャッシュとはちがうん?
メモリの一部が早くなるん?
8不明なデバイスさん:2008/12/26(金) 14:33:12 ID:7ZFGa1Ea
>>6
大容量になると配線距離が増えて応答性能(待ち時間)が悪くなり
キャッシュ効果は薄くなる。大容量にするなら3次じゃなく4次だろ。

>>7
キャッシュにヒットしなければキャッシュはメモリ動作の足かせにしか
ならない、あまりにも大容量にすればレイテンシーが増え逆に遅くなる。
CPUとの距離が問題になっていることに気がつけ。
キャッシュとCPUの物理的距離と、DRAMまでの物理的距離が
どれだけ違うか考えることが必要だ。2cmも離れれば致命的に
遅くなる。
帯域を2倍にするには、配線数を2倍にするか、周波数を2倍しなければ
ならない。配線数も物理的に限界に近づき、周波数は距離で決まる為、
CPUとDRAMの距離が問題視されている。
いまのDIMMが大きすぎてCPUとの距離が長すぎる。
距離は見た目の直線距離ではなく実際の電気配線距離です。
DDR3のIFバスクロック波形は200〜266MHzぐらいだ。
周波数があげられるならDDRが2とか3とかにならない。
同じ規格で周波数だけあげるさ。SDRAMだと66〜133MHz
周波数で2倍になっているが、転送帯域はチップあたり16倍になっている。
9不明なデバイスさん:2008/12/26(金) 16:03:42 ID:44kD+17e
ダイ4次キャッシュ大戦
10不明なデバイスさん:2008/12/26(金) 16:21:16 ID:7ZFGa1Ea
2次と3次の比だけ4次も巨大になるんだろうけど、4次のサイズが
主メモリより大きくなければまったく意味なし
故にCPU統合の4次を入れるより、DRAMを4次の位置に入れるだけの
話さ
11不明なデバイスさん:2008/12/26(金) 16:52:22 ID:JpZa7Lyp
いや、単純に実装されたとき、
意識しなくても効果があるのか(キャッシュ的)、
明示的に使用しないと効果がないのか(ローカルメモリ的)を知りたいんだけどね。
はたまた、クルーソーの時みたいに「コードモーフィングが入る部分だけDDRで早くしてみました」的なアプローチなのか……とか。
12不明なデバイスさん:2008/12/26(金) 17:10:58 ID:7ZFGa1Ea
主記憶が内部メモリと外部メモリが分けられたとして、
外部メモリはディスクキャッシュやテンポラリーだろうね。
RAMDISK的な存在。

効果あるなしではなく、外部はデータ入出力用の補助的存在でしょうな、
DMAでの外部I/Oで主記憶のメモリ帯域を失うのも愚かだろうし。
統合された主記憶の内部メモリが主であって、ほかの効果など考えるなど
愚か。
一般的アプリがすべて統合されたCPUの内部メモリに入れば問題ないわけで
それと激しく遅いSSDやHDDとの速度差に利用するのがメインだろう。
内部メモリとなれば、GPUのメモリと同等以上の劇的な速度向上が見込める。
現状でも常時メモリアクセスされる部分など主記憶の極一部なわけで
それが近未来の予測の部分まで入りきるサイズかどうかが問題といえる。
13不明なデバイスさん:2008/12/27(土) 03:01:49 ID:rt2VqQKc
今のメモリモジュールDDR3−DIMMを考えてみたまえ。
あのDIMMモジュールの基盤にはメモリチップが8個とか9個とか
あるいは16個とか18個とかついているわけだ。それらも
それぞれLSIだぞ。だったら、その1個のチップを単なるDRAMに
するのではなくて、チップ内部のメモリバンク(内部はそうなっている)
を持つ一種の単純なショートベクトル演算専用のCPUコアのようなものを
1個ないし数個同居させてやれば?
そうすると1個のDIMMモジュールの中にはたとえば両面で18個の
CPUコア(のようなもの)あるいはその数倍のコアを持たせることが
できる。それが4スロットとか8スロットとか16スロットとかを持つ
マザーボードに挿されている。そうして、より汎用のCPUから
DIMMスロットに対してコマンド(プログラム)やデータが送付されて
送り込まれると、DIMMスロットのDIMMモジュール内のチップのそのまた
中の計算コアが起動して動き出す。そうして計算が出来たら汎用CPU側に
DMAで割り込みをかけるか、あるいは汎用CPUがDIMMのメモリ空間に
ポーリングに行って終ってたら結果を回収する。
 つまり一種のGPUがDIMMのスロットに挿さっているような具合にするんだ。
14不明なデバイスさん:2008/12/27(土) 13:02:19 ID:wFii85wx
数百MB単位でDRAM統合するのって出来るのかな?

出来たとしてもすげーコスト高くなるよね。
今よりさらにプロセスシュリンクしちゃうから相殺? つまり今とさほど変わらず?
15不明なデバイスさん:2008/12/27(土) 15:21:40 ID:bjjG8Utz
>>14
基盤代は浮く、メモリの部分ばかり見ている人がいるけど、
いまのメモリの低価格から考えれば、実装基盤がかなりの価格を閉めている。
組み立てコストとかも工程が増えれば馬鹿にならんね。

>数百MB単位でDRAM統合するのって出来るのかな?
DRAMの面積を考えてみろ。統合するのはURLの中の図でも見てみれば?
16不明なデバイスさん:2008/12/29(月) 22:02:31 ID:Z9PRKZzF
発送を変えてメモリにCPUを統合すればいいんじゃね?
17不明なデバイスさん:2008/12/30(火) 03:52:19 ID:69DNfZd3
>>16
インテル製のメモリしかなくなるぞw
18不明なデバイスさん:2008/12/31(水) 21:04:18 ID:s4FbPigB
市販のCPUって何GFLOPSぐらい?
19不明なデバイスさん:2009/01/01(木) 20:03:49 ID:H1W3zitr
>>18
Core i7 965
>理論値的には3.2GHz動作×4演算/Cycle×4コア=51.2GFlops(SSE3を使った場合)
http://journal.mycom.co.jp/special/2008/nehalem01/005.html
20不明なデバイスさん:2009/01/01(木) 20:20:37 ID:JC763Ycw
DRAMメモリチップの内部では、数ビットを読み出すために、1列数千ビット
が同時に読み出されており、それから選択された数ビットだけがチップの
パッケージの外部に出て行ったり、書き直されて記憶され直す。
なんという無駄づかい。
 その数千ビットで単純並列なベクトル的演算を行う機能をDRAMチップ
内部に取り付ければ、非常に高速な計算がメモリチップ内部で可能になる
のだがに。
21不明なデバイスさん:2009/01/08(木) 00:51:57 ID:b4O9ewFM
CPUの周辺とりこみの道は避けられないね、
Core i7やAMDでもDRAMコントローラは内蔵、
今年末にはGPU内蔵のintel CPUが出荷される、
その次は?イーサネットも内蔵、DRAM内蔵、
いまのOSだってプログラム用のコミットチャージメモリと
ディスクキャッシュメモリは別に管理している。
コミットチャージで確保されるメモリは2GB程度でいいわけで
外付けDRAMを高速の仮想記憶としてメモリに使う感じになるのかな?
描画やゲームで必要なメモリはGPUと繋ぐメモリなので
テクスチャー用では大容量メモリは必要だがZバッファなどの演算部分は
小規模でいいはずなのでこの構成なるのは必然なんだろうね。
22不明なデバイスさん:2009/01/18(日) 10:09:08 ID:4gnTGYd9
L4を巨大化すればいいと思っている奴がいるけど、
巨大なL4をつけるにはメモリ帯域を数倍に増やすのが必須となることも
知らないんだろうな。
最上位にくるNehalemは4chメモリなのでDDRのパラレル接続は
事実上不可能に、4chにするのにFBDIMMで逃げているが、
これ以上の多チャンネル化はRAMBUSを避けて通れないのは明白、
故に基盤配線を減らすにはメモリをCPUのすぐ隣に設置する話になっただけ。
近接のすぐ隣ならGPUのようにDDR4、DDR5でも繋げるからね。
23不明なデバイスさん:2009/12/31(木) 19:26:01 ID:IFp5/XY/
(7:24) AKB48 (2) 「RIVERサプライズ!紅白Remix」
(7:27) flumpool (初) 「星に願いを」
(7:34) いきものがかり (2) 「YELL」
(7:38) こども紅白歌合戦 加藤清史郎「かつおぶしだよ人生は」、さくらまや「大漁まつり」
スノープリンス合唱団「スノープリンス」、大橋のぞみ「ノンちゃん雲に乗る〜崖の上のポニョ〜」
(8:04) 水樹奈々 (初) 「深愛」
(8:08) FUNKY MONKEY BABYS (初) 「ヒーロー」
(8:16) ポルノグラフィティ (8) 「アニマロッサ」
(8:36) 大塚愛 (6) 「Is」
(8:40) レミオロメン (初) 「粉雪」
(9:00) 第60回紅白テーマソング「歌の力」 久石譲、アン・サリー、出場歌手
(9:05) スーザン・ボイル 「夢やぶれて -I Dreamed A Dream-」
(9:14) aiko (8) 「あの子の夢」
(9:18) 徳永英明 (4) 「壊れかけのRadio」
(9:22) 平原綾香 (6) 「ミオ・アモーレ」
24不明なデバイスさん:2009/12/31(木) 19:27:26 ID:IFp5/XY/
(9:26) TOKIO (16) 「太陽と砂漠のバラ」
(9:30) 秋元順子 (2) 「愛のままで…」
(9:35) Perfume (2) 「ワンルーム・ディスコ」
(9:55) マイケル・ジャクソン スペシャルステージ SMAPほか紅白歌手有志
(10:05) 木村カエラ (初) 「Butterfly」
(10:15) 中島美嘉 (8) 「流れ星」
(10:20) ゆず (3) 「逢いたい」
(10:25) アンジェラ・アキ (4) 「手紙 〜拝啓 十五の君へ〜」
(10:30) 布施明 (25) 「MY WAY」
(10:40) 福山雅治 (2) 「はつ恋」
(10:50) 嵐 (初) 「嵐×紅白スペシャルメドレー」
(10:57) コブクロ (5) 「STAY」
(11:17) 絢香 (4) 「みんな空の下」
(11:22) SMAP (17) 「そっと きゅっと〜世界に一つだけの花」
(11:27) DREAMS COME TRUE (13) 「その先へ 〜紅白スペシャルヴァージョン〜」
25不明なデバイスさん:2010/12/28(火) 08:36:44 ID:fd7XIOpo
?
26不明なデバイスさん:2011/05/23(月) 22:03:35.35 ID:FciXUANE
>>1
これって、自作PC板向けスレだよね・・・

避難所として利用するつもり??
27不明なデバイスさん:2011/05/23(月) 22:18:57.77 ID:BBquz8BO
実際帯域が広けりゃ速いかっつーと
ベンチですら誤差で
クロックに勝る狭い帯域のメモリにボロ負けしてたりするんだけども

よく見りゃ超珍ライターの三年も前の記事かよ
28不明なデバイスさん:2011/05/23(月) 22:24:17.07 ID:FdJd35Ed
とうとう俺の虎の子のEDO RAMの時代が来たのか
29不明なデバイスさん:2011/11/05(土) 22:30:33.74 ID:2vb6A4CV
age
30不明なデバイスさん:2012/01/04(水) 17:00:12.48 ID:VdkgfnH8
31不明なデバイスさん:2012/01/04(水) 17:01:16.40 ID:bc/EWJdw
32不明なデバイスさん:2012/01/04(水) 21:26:43.20 ID:AjUBreuu
.
33不明なデバイスさん:2012/01/04(水) 21:27:23.40 ID:p7AZvzDV
.
34不明なデバイスさん:2012/01/05(木) 12:59:05.41 ID:Y2G6utkm
35不明なデバイスさん:2012/01/05(木) 13:14:34.08 ID:FU+RKkBs
.
36不明なデバイスさん:2012/01/05(木) 16:27:50.59 ID:FU+RKkBs
37不明なデバイスさん:2012/01/05(木) 16:30:24.64 ID:7LNw5hMC
38不明なデバイスさん:2012/01/05(木) 16:32:04.07 ID:QAdL/Rxn
39不明なデバイスさん:2012/01/05(木) 17:22:53.64 ID:IS2G3/6C
40不明なデバイスさん:2012/01/05(木) 17:23:50.65 ID:ZltDDZUh
41不明なデバイスさん:2012/03/28(水) 20:14:21.78 ID:MuRU9sWo
tst
42不明なデバイスさん:2012/11/17(土) 15:27:51.84 ID:KZaY7FlF
「メモリスロット接続では遅すぎる」そう言われる時代が目前に

>2015年には、このようにWide I/O系がついに50GB/secを越えるラインに達する。
>デスクトップPC用メモリでは、これに匹敵する帯域は
>DDR4 3.2Gtpsの2チャネル128-bit構成となる。
>2015年のデスクトップPCは、メインストリームでは3.2Gtpsに達していない見込み
>であるため、モバイルデバイスがメモリ帯域でデスクトップPCを追い抜くことになる。
http://pc.watch.impress.co.jp/docs/column/kaigai/20121112_571924.html
43不明なデバイスさん:2013/05/18(土) 19:28:01.73 ID:MfRPxvcE
後藤弘茂のWeekly海外ニュース Intelの次期CPU「Haswell」のeDRAMの謎
http://pc.watch.impress.co.jp/docs/column/kaigai/20130510_598739.html

> Haswellのうち、GPUコアが最大構成のGT3ではeDRAMをパッケージに取り込んだ「GT3e」(コードネームCrystalwell)構成が用意されている。
44 忍法帖【Lv=6,xxxP】(1+0:8) :2013/11/24(日) 23:56:19.92 ID:yQ9WdyLG
こんばんは。
45不明なデバイスさん
数世紀後には小型デバイス用の現行のようで数層立体的に重ねた薄型と大型デバイス用のキューブ型または円柱型に分かれたりして