そしてCPUはDRAMダイも統合する

1 ：不明なデバイスさん：2008/12/26(金) 02:24:45 ID:7ZFGa1Ea

http://pc.watch.impress.co.jp/docs/2008/1226/kaigai483.htm
>CPUとGPUが一緒になるだけでなく、CPUとメモリも一緒になろうとしている。
>数年後の高スループットCPUは、DRAMダイ(半導体本体)をCPU と同じパッケージ
>に封入する可能性が高い。マルチコア化とベクタ演算能力を
>強化(またはGPUコア統合)したCPUに、DRAMもくっつく。
>言ってみれば、「CPU+GPU+DRAM」という姿へと変わることになる。
５年もかからずやってくる問題だ。

2 ：不明なデバイスさん：2008/12/26(金) 02:26:09 ID:7ZFGa1Ea

>理由は簡単だ。TFLOPSパフォーマンスを狙うCPUが、数百GB/secのメモリ
>帯域を必要とするためだ。フル性能を発揮するために必要なピーク数百
> GB/sec帯域を実現するためには、現在の数十GB/secから一気に10倍へ
>メモリ帯域を高めなければならない。しかし、3～4年にデータ転送
>レートを倍々に引き上げるDRAMロードマップでは、この帯域を到底実現
>できない。メモリインターフェイス幅を広げることも、限界に近づいている。

3 ：不明なデバイスさん：2008/12/26(金) 02:28:23 ID:7ZFGa1Ea

>次に、Intelはプラン(1)を取り、アグレッシブなDDR2へのシフトを計画し、
>DDR2自体も高速化へ向かった。しかし、メモリの移行はIntel の想定して
>いたペースでは進まず、ロードマップは順調に踏破されなかった。DDR4
>ではプラン(3)の折衷案で、従来のDDR系メモリの延長となる
>「DDR4 Single-Ended」と、高転送レートを狙う「DDR4 Differential」
>の2本立てのプランが提案された。しかし、これもうまく行かず、
>DDR4自体が白紙に戻った。
ＶＩＤＥＯカードで採用されたＤＤＲ４はこない。
いまのＤＤＲ３かＲＡＭＢＵＳだろう

4 ：不明なデバイスさん：2008/12/26(金) 07:49:48 ID:XFld62vC

それなんてeRAM?

5 ：不明なデバイスさん：2008/12/26(金) 10:14:58 ID:6YhzxVFo

エルピーダｵﾜﾀ＼(＾o＾)／

6 ：不明なデバイスさん：2008/12/26(金) 10:38:02 ID:6YhzxVFo

大容量3次キャッシュで解決

7 ：不明なデバイスさん：2008/12/26(金) 13:47:52 ID:JpZa7Lyp

キャッシュとはちがうん？
メモリの一部が早くなるん？

8 ：不明なデバイスさん：2008/12/26(金) 14:33:12 ID:7ZFGa1Ea

>>6
大容量になると配線距離が増えて応答性能（待ち時間）が悪くなり
キャッシュ効果は薄くなる。大容量にするなら３次じゃなく４次だろ。

>>7
キャッシュにヒットしなければキャッシュはメモリ動作の足かせにしか
ならない、あまりにも大容量にすればレイテンシーが増え逆に遅くなる。
ＣＰＵとの距離が問題になっていることに気がつけ。
キャッシュとＣＰＵの物理的距離と、ＤＲＡＭまでの物理的距離が
どれだけ違うか考えることが必要だ。２ｃｍも離れれば致命的に
遅くなる。
帯域を２倍にするには、配線数を２倍にするか、周波数を２倍しなければ
ならない。配線数も物理的に限界に近づき、周波数は距離で決まる為、
ＣＰＵとＤＲＡＭの距離が問題視されている。
いまのＤＩＭＭが大きすぎてＣＰＵとの距離が長すぎる。
距離は見た目の直線距離ではなく実際の電気配線距離です。
ＤＤＲ３のＩＦバスクロック波形は２００～２６６ＭＨｚぐらいだ。
周波数があげられるならＤＤＲが２とか３とかにならない。
同じ規格で周波数だけあげるさ。ＳＤＲＡＭだと６６～１３３ＭＨｚ
周波数で２倍になっているが、転送帯域はチップあたり１６倍になっている。

9 ：不明なデバイスさん：2008/12/26(金) 16:03:42 ID:44kD+17e

ダイ4次キャッシュ大戦

10 ：不明なデバイスさん：2008/12/26(金) 16:21:16 ID:7ZFGa1Ea

２次と３次の比だけ４次も巨大になるんだろうけど、４次のサイズが
主メモリより大きくなければまったく意味なし
故にＣＰＵ統合の４次を入れるより、ＤＲＡＭを４次の位置に入れるだけの
話さ

11 ：不明なデバイスさん：2008/12/26(金) 16:52:22 ID:JpZa7Lyp

いや、単純に実装されたとき、
意識しなくても効果があるのか(キャッシュ的)、
明示的に使用しないと効果がないのか(ローカルメモリ的)を知りたいんだけどね。
はたまた、クルーソーの時みたいに「コードモーフィングが入る部分だけDDRで早くしてみました」的なアプローチなのか……とか。

12 ：不明なデバイスさん：2008/12/26(金) 17:10:58 ID:7ZFGa1Ea

主記憶が内部メモリと外部メモリが分けられたとして、
外部メモリはディスクキャッシュやテンポラリーだろうね。
ＲＡＭＤＩＳＫ的な存在。

効果あるなしではなく、外部はデータ入出力用の補助的存在でしょうな、
ＤＭＡでの外部Ｉ/Ｏで主記憶のメモリ帯域を失うのも愚かだろうし。
統合された主記憶の内部メモリが主であって、ほかの効果など考えるなど
愚か。
一般的アプリがすべて統合されたＣＰＵの内部メモリに入れば問題ないわけで
それと激しく遅いＳＳＤやＨＤＤとの速度差に利用するのがメインだろう。
内部メモリとなれば、ＧＰＵのメモリと同等以上の劇的な速度向上が見込める。
現状でも常時メモリアクセスされる部分など主記憶の極一部なわけで
それが近未来の予測の部分まで入りきるサイズかどうかが問題といえる。

13 ：不明なデバイスさん：2008/12/27(土) 03:01:49 ID:rt2VqQKc

今のメモリモジュールDDR3－DIMMを考えてみたまえ。
あのDIMMモジュールの基盤にはメモリチップが８個とか９個とか
あるいは１６個とか１８個とかついているわけだ。それらも
それぞれLSIだぞ。だったら、その１個のチップを単なるDRAMに
するのではなくて、チップ内部のメモリバンク（内部はそうなっている）
を持つ一種の単純なショートベクトル演算専用のCPUコアのようなものを
１個ないし数個同居させてやれば？
そうすると１個のDIMMモジュールの中にはたとえば両面で１８個の
CPUコア（のようなもの）あるいはその数倍のコアを持たせることが
できる。それが４スロットとか８スロットとか１６スロットとかを持つ
マザーボードに挿されている。そうして、より汎用のCPUから
DIMMスロットに対してコマンド（プログラム）やデータが送付されて
送り込まれると、DIMMスロットのDIMMモジュール内のチップのそのまた
中の計算コアが起動して動き出す。そうして計算が出来たら汎用CPU側に
DMAで割り込みをかけるか、あるいは汎用CPUがDIMMのメモリ空間に
ポーリングに行って終ってたら結果を回収する。
　つまり一種のGPUがDIMMのスロットに挿さっているような具合にするんだ。

14 ：不明なデバイスさん：2008/12/27(土) 13:02:19 ID:wFii85wx

数百MB単位でDRAM統合するのって出来るのかな？

出来たとしてもすげーコスト高くなるよね。
今よりさらにプロセスシュリンクしちゃうから相殺？つまり今とさほど変わらず？

15 ：不明なデバイスさん：2008/12/27(土) 15:21:40 ID:bjjG8Utz

>>14
基盤代は浮く、メモリの部分ばかり見ている人がいるけど、
いまのメモリの低価格から考えれば、実装基盤がかなりの価格を閉めている。
組み立てコストとかも工程が増えれば馬鹿にならんね。

>数百MB単位でDRAM統合するのって出来るのかな？
DRAMの面積を考えてみろ。統合するのはＵＲＬの中の図でも見てみれば？

16 ：不明なデバイスさん：2008/12/29(月) 22:02:31 ID:Z9PRKZzF

発送を変えてメモリにCPUを統合すればいいんじゃね？

17 ：不明なデバイスさん：2008/12/30(火) 03:52:19 ID:69DNfZd3

>>16
インテル製のメモリしかなくなるぞｗ

18 ：不明なデバイスさん：2008/12/31(水) 21:04:18 ID:s4FbPigB

市販のＣＰＵって何ＧＦＬＯＰＳぐらい？

19 ：不明なデバイスさん：2009/01/01(木) 20:03:49 ID:H1W3zitr

>>18
Core i7 965
>理論値的には3.2GHz動作×４演算/Cycle×4コア＝51.2GFlops(SSE3を使った場合)
http://journal.mycom.co.jp/special/2008/nehalem01/005.html

20 ：不明なデバイスさん：2009/01/01(木) 20:20:37 ID:JC763Ycw

DRAMメモリチップの内部では、数ビットを読み出すために、１列数千ビット
が同時に読み出されており、それから選択された数ビットだけがチップの
パッケージの外部に出て行ったり、書き直されて記憶され直す。
なんという無駄づかい。
　その数千ビットで単純並列なベクトル的演算を行う機能をDRAMチップ
内部に取り付ければ、非常に高速な計算がメモリチップ内部で可能になる
のだがに。

21 ：不明なデバイスさん：2009/01/08(木) 00:51:57 ID:b4O9ewFM

ＣＰＵの周辺とりこみの道は避けられないね、
Core i7やAMDでもDRAMコントローラは内蔵、
今年末にはGPU内蔵のintel ＣＰＵが出荷される、
その次は？イーサネットも内蔵、ＤＲＡＭ内蔵、
いまのＯＳだってプログラム用のコミットチャージメモリと
ディスクキャッシュメモリは別に管理している。
コミットチャージで確保されるメモリは２ＧＢ程度でいいわけで
外付けＤＲＡＭを高速の仮想記憶としてメモリに使う感じになるのかな？
描画やゲームで必要なメモリはＧＰＵと繋ぐメモリなので
テクスチャー用では大容量メモリは必要だがＺバッファなどの演算部分は
小規模でいいはずなのでこの構成なるのは必然なんだろうね。

22 ：不明なデバイスさん：2009/01/18(日) 10:09:08 ID:4gnTGYd9

Ｌ４を巨大化すればいいと思っている奴がいるけど、
巨大なＬ４をつけるにはメモリ帯域を数倍に増やすのが必須となることも
知らないんだろうな。
最上位にくるNehalemは４ｃｈメモリなのでＤＤＲのパラレル接続は
事実上不可能に、４ｃｈにするのにＦＢＤＩＭＭで逃げているが、
これ以上の多チャンネル化はＲＡＭＢＵＳを避けて通れないのは明白、
故に基盤配線を減らすにはメモリをＣＰＵのすぐ隣に設置する話になっただけ。
近接のすぐ隣ならＧＰＵのようにＤＤＲ４、ＤＤＲ５でも繋げるからね。

23 ：不明なデバイスさん：2009/12/31(木) 19:26:01 ID:IFp5/XY/

(7:24) AKB48　(2) 「RIVERサプライズ！紅白Remix」
(7:27) flumpool　(初) 「星に願いを」
(7:34) いきものがかり　(2) 「YELL」
(7:38) こども紅白歌合戦　加藤清史郎「かつおぶしだよ人生は」、さくらまや「大漁まつり」
スノープリンス合唱団「スノープリンス」、大橋のぞみ「ノンちゃん雲に乗る～崖の上のポニョ～」
(8:04) 水樹奈々　(初) 「深愛」
(8:08) FUNKY MONKEY BABYS　(初) 「ヒーロー」
(8:16) ポルノグラフィティ　(8) 「アニマロッサ」
(8:36) 大塚愛　(6) 「Is」
(8:40) レミオロメン　(初) 「粉雪」
(9:00) 第60回紅白テーマソング「歌の力」久石譲、アン・サリー、出場歌手
(9:05) スーザン・ボイル「夢やぶれて -I Dreamed A Dream-」
(9:14) aiko　(8) 「あの子の夢」
(9:18) 徳永英明　(4) 「壊れかけのRadio」
(9:22) 平原綾香　(6) 「ミオ・アモーレ」

24 ：不明なデバイスさん：2009/12/31(木) 19:27:26 ID:IFp5/XY/

(9:26) TOKIO　(16) 「太陽と砂漠のバラ」
(9:30) 秋元順子　(2) 「愛のままで…」
(9:35) Perfume　(2) 「ワンルーム・ディスコ」
(9:55) マイケル・ジャクソン　スペシャルステージ SMAPほか紅白歌手有志
(10:05) 木村カエラ　(初) 「Butterfly」
(10:15) 中島美嘉　(8) 「流れ星」
(10:20) ゆず　(3) 「逢いたい」
(10:25) アンジェラ・アキ　(4) 「手紙～拝啓十五の君へ～」
(10:30) 布施明　(25) 「MY WAY」
(10:40) 福山雅治　(2) 「はつ恋」
(10:50) 嵐　(初) 「嵐×紅白スペシャルメドレー」
(10:57) コブクロ　(5) 「STAY」
(11:17) 絢香 (4) 「みんな空の下」
(11:22) SMAP　(17) 「そっと　きゅっと～世界に一つだけの花」
(11:27) DREAMS COME TRUE　(13) 「その先へ　～紅白スペシャルヴァージョン～」

25 ：不明なデバイスさん：2010/12/28(火) 08:36:44 ID:fd7XIOpo

26 ：不明なデバイスさん：2011/05/23(月) 22:03:35.35 ID:FciXUANE

>>1
これって、自作PC板向けスレだよね・・・

避難所として利用するつもり？？

27 ：不明なデバイスさん：2011/05/23(月) 22:18:57.77 ID:BBquz8BO

実際帯域が広けりゃ速いかっつーと
ベンチですら誤差で
クロックに勝る狭い帯域のメモリにボロ負けしてたりするんだけども

よく見りゃ超珍ライターの三年も前の記事かよ

28 ：不明なデバイスさん：2011/05/23(月) 22:24:17.07 ID:FdJd35Ed

とうとう俺の虎の子のＥＤＯ　ＲＡＭの時代が来たのか

29 ：不明なデバイスさん：2011/11/05(土) 22:30:33.74 ID:2vb6A4CV

age

30 ：不明なデバイスさん：2012/01/04(水) 17:00:12.48 ID:VdkgfnH8

。

31 ：不明なデバイスさん：2012/01/04(水) 17:01:16.40 ID:bc/EWJdw

。

32 ：不明なデバイスさん：2012/01/04(水) 21:26:43.20 ID:AjUBreuu

33 ：不明なデバイスさん：2012/01/04(水) 21:27:23.40 ID:p7AZvzDV

34 ：不明なデバイスさん：2012/01/05(木) 12:59:05.41 ID:Y2G6utkm

。

35 ：不明なデバイスさん：2012/01/05(木) 13:14:34.08 ID:FU+RKkBs

36 ：不明なデバイスさん：2012/01/05(木) 16:27:50.59 ID:FU+RKkBs

。

37 ：不明なデバイスさん：2012/01/05(木) 16:30:24.64 ID:7LNw5hMC

。

38 ：不明なデバイスさん：2012/01/05(木) 16:32:04.07 ID:QAdL/Rxn

。

39 ：不明なデバイスさん：2012/01/05(木) 17:22:53.64 ID:IS2G3/6C

。

40 ：不明なデバイスさん：2012/01/05(木) 17:23:50.65 ID:ZltDDZUh

。

41 ：不明なデバイスさん：2012/03/28(水) 20:14:21.78 ID:MuRU9sWo

tst

42 ：不明なデバイスさん：2012/11/17(土) 15:27:51.84 ID:KZaY7FlF

「メモリスロット接続では遅すぎる」そう言われる時代が目前に

＞2015年には、このようにWide I/O系がついに50GB/secを越えるラインに達する。
＞デスクトップPC用メモリでは、これに匹敵する帯域は
＞DDR4 3.2Gtpsの2チャネル128-bit構成となる。
＞2015年のデスクトップPCは、メインストリームでは3.2Gtpsに達していない見込み
＞であるため、モバイルデバイスがメモリ帯域でデスクトップPCを追い抜くことになる。
http://pc.watch.impress.co.jp/docs/column/kaigai/20121112_571924.html

43 ：不明なデバイスさん：2013/05/18(土) 19:28:01.73 ID:MfRPxvcE

後藤弘茂のWeekly海外ニュース Intelの次期CPU「Haswell」のeDRAMの謎
http://pc.watch.impress.co.jp/docs/column/kaigai/20130510_598739.html

> Haswellのうち、GPUコアが最大構成のGT3ではeDRAMをパッケージに取り込んだ「GT3e」(コードネームCrystalwell)構成が用意されている。

44 ：忍法帖【Lv=6,xxxP】(1+0：8) ：2013/11/24(日) 23:56:19.92 ID:yQ9WdyLG

こんばんは。

45 ：不明なデバイスさん：2014/01/24(金) 02:46:12.08 ID:jLa1Xc52

数世紀後には小型デバイス用の現行のようで数層立体的に重ねた薄型と大型デバイス用のキューブ型または円柱型に分かれたりして