【ISSCC2011】Intel「Poulson」、AMD「Bulldozer」など各社が次世代64bitプロセッサの概要を公表

このエントリーをはてなブックマークに追加
1 ◆BB2C/xRDfM

●AMD:次世代プロセッサ「Bulldozer」の64bit CPUモジュール

 AMDは、次世代PC用マイクロプロセッサ「Bulldozer(ブルドーザ)」に向けたAMD x86-64アーキ
テクチャの64bit CPUモジュールの概要を発表した(講演番号4.5および講演番号4.6)。発表した
CPUモジュールは、2個のCPUコアを統合している。これまで AMDが同社のイベントなどで概要を
公表してきた通りだ。整数演算ユニットと16KBの1次データ・キャッシュなどで構成されるCPUコ
アと、共通の周辺回路(浮動小数点演算ユニット、64KBの1次命令キャッシュ、命令デコード回路、
分岐予測回路、2MBの2次キャッシュ)でモジュールを構成する。

 CPUモジュールのトランジスタ数は2億1,300万トランジスタ。シリコン面積は30.9平方mmであ
る。電源電圧は0.8V〜1.3V。製造技術は32nmのSOI高誘電率膜/金属ゲート(High-k/Metal gate)術、11層金属配線である。

 高速動作と消費電力抑制を両立させるため、論理回路の基本ブロックであるフリップフロップ
を見直している。位相のわずかに異なる2本のクロックを使った3種類のフリップフロップを基本
ブロックとして用意した。2本のクロックを使うことで高い精度で同期がとれ、動作周波数が向
上するとともに、消費電力が低下する。さらに、製造プロセスによるトランジスタの特性ばらつ
きを吸収できる。用意したのは消費電力の特に低いフリップフロップ (LPXSEF)と、消費電力の
低いフリップフロップ(LPSEF)、高性能だが消費電力が高めのフリップフロップ(HPSEF)である。
ただし従来のフリップフロップに比べると、シリコン面積がやや増える。

 また1次キャッシュのSRAMに、標準的に使われている6トランジスタのメモリセルではなく、8
トランジスタのメモリセルを採用した。6トランジスタのメモリセルに比べると、電源電圧が下
がるとともに動作周波数が高まる。これもシリコン面積が増える方向に働く。

 これらの工夫により、従来と同じくらいの消費電力で論理ゲートの動作周波数を20%程度、向
上できたとする。3.5GHzを超える動作周波数を達成できると、講演では述べていた。

「Bulldozer」のCPUモジュール。AMDが2010年8月に「HotChips 2010」で講演した資料から引用
http://pc.watch.impress.co.jp/img/pcw/docs/428/720/04.jpg
2 キタッピー(東京都):2011/02/23(水) 21:54:57.90 ID:Ff1IZMXB0
●AMD:次世代プロセッサ「Bulldozer」の64bit CPUモジュール

 AMDは、次世代PC用マイクロプロセッサ「Bulldozer(ブルドーザ)」に向けたAMD x86-64アーキ
テクチャの64bit CPUモジュールの概要を発表した(講演番号4.5および講演番号4.6)。発表した
CPUモジュールは、2個のCPUコアを統合している。これまで AMDが同社のイベントなどで概要を
公表してきた通りだ。整数演算ユニットと16KBの1次データ・キャッシュなどで構成されるCPUコ
アと、共通の周辺回路(浮動小数点演算ユニット、64KBの1次命令キャッシュ、命令デコード回路、
分岐予測回路、2MBの2次キャッシュ)でモジュールを構成する。

 CPUモジュールのトランジスタ数は2億1,300万トランジスタ。シリコン面積は30.9平方mmであ
る。電源電圧は0.8V〜1.3V。製造技術は32nmのSOI高誘電率膜/金属ゲート(High-k/Metal gate)術、11層金属配線である。

 高速動作と消費電力抑制を両立させるため、論理回路の基本ブロックであるフリップフロップ
を見直している。位相のわずかに異なる2本のクロックを使った3種類のフリップフロップを基本
ブロックとして用意した。2本のクロックを使うことで高い精度で同期がとれ、動作周波数が向
上するとともに、消費電力が低下する。さらに、製造プロセスによるトランジスタの特性ばらつ
きを吸収できる。用意したのは消費電力の特に低いフリップフロップ (LPXSEF)と、消費電力の
低いフリップフロップ(LPSEF)、高性能だが消費電力が高めのフリップフロップ(HPSEF)である。
ただし従来のフリップフロップに比べると、シリコン面積がやや増える。

 また1次キャッシュのSRAMに、標準的に使われている6トランジスタのメモリセルではなく、8
トランジスタのメモリセルを採用した。6トランジスタのメモリセルに比べると、電源電圧が下
がるとともに動作周波数が高まる。これもシリコン面積が増える方向に働く。

 これらの工夫により、従来と同じくらいの消費電力で論理ゲートの動作周波数を20%程度、向
上できたとする。3.5GHzを超える動作周波数を達成できると、講演では述べていた。

「Bulldozer」のCPUモジュール。AMDが2010年8月に「HotChips 2010」で講演した資料から引用
http://pc.watch.impress.co.jp/img/pcw/docs/428/720/04.jpg
3 キタッピー(東京都):2011/02/23(水) 21:55:06.12 ID:Ff1IZMXB0
●IBM:5.4GHzで動くメインフレーム用プロセッサ

 IBMは、同社の最新メインフレーム「zEnterprise 196」用に開発した高性能マイクロプロセッ
サの技術内容を発表した(講演番号4.1)。開発したプロセッサの動作周波数は最大5.4GHzときわ
めて高い。製品版の動作周波数でも5.2GHzに達する。前世代のメインフレーム「z10」用マイク
ロプロセッサの動作周波数が4.4GHzだったので、動作周波数は20%近く、向上したことになる。

 z196用マイクロプロセッサは、4個のCPUコア、CPUコアごとの1次キャッシュSRAM(命令キャッ
シュ64KBとデータ・キャッシュ128KB)と2次キャッシュSRAM1.5MB、共有の3次キャッシュ
DRAM24MB、暗号化と復号化のコプロセッサ・コア、DDR RAIM(Redundant Array of Independent
Memory)メモリコントローラ、入出力バスなどで構成される。トランジスタ数は14億トランジス
タ、シリコンダイ面積は512平方mmとかなり大きい。製造技術は45nmのSOI CMOS、13層金属配線
である。

 講演で興味深かったのは、z196用プロセッサのマイクロアーキテクチャにアウト・オブ・オー
ダー実行を採用したことと、メモリサブシステムとしては4次キャッシュを別チップで開発した
ことだ。いずれも演算性能の向上に寄与する。

 4次のキャッシュメモリはDRAMマクロを内蔵しており、196MBと大きな容量を確保する。この
キャッシュメモリは、複数のz196マイクロプロセッサが共有する。

「zEnterpriseシリーズ」メインフレームに使われたプロセッサの動作周波数の推移。IBMが2010
年8月に「HotChips 2010」で講演した資料から引用
http://pc.watch.impress.co.jp/img/pcw/docs/428/720/07.jpg
zEnterprise 196(z196メインフレーム)用高性能マイクロプロセッサの概要とシリコンダイ写真。
IBMが2010年8月に「HotChips 2010」で講演した資料から引用
http://pc.watch.impress.co.jp/img/pcw/docs/428/720/08.jpg
z196のシステム構成例。IBMが2010年8月に「HotChips 2010」で講演した資料から引用
http://pc.watch.impress.co.jp/img/pcw/docs/428/720/09.jpg
4 フジ丸(千葉県):2011/02/23(水) 21:55:16.45 ID:vppB7ZZF0
sandy bridgeは?
5 ケンミン坊や(京都府):2011/02/23(水) 21:56:43.25 ID:l5uN+hLx0
これサンディーのパフォーマンス上回ったって奴?
6 スカーラ(東京都):2011/02/23(水) 21:57:12.51 ID:yVUe8L/n0
そんなCPUで何するんだよw
7 暴君ベビネロ(福岡県):2011/02/23(水) 21:57:29.28 ID:36AqXtm+0
ivy bredgeとは別なのか
つかsandy はもう見捨てるのか
81ページ目ミスった:2011/02/23(水) 21:58:45.54 ID:Ff1IZMXB0
●Intel:次世代64bitプロセッサ「Poulson」を公表
 Intelは、Itaniumアーキテクチャの次世代64bitマイクロプロセッサ「Poulson(ポールソン)」
の技術概要を公表した(講演番号4.8)。8個のハイパースレッディングCPUコア、総容量54MBの
SRAMマクロ、4個のフルQPI(QuickPath Interconnect)インターフェイス、2個のハーフQPIイン
ターフェイス、2個のSMI(Scalable Memory Interconnect)を内蔵する。

 Poulsonは、トランジスタ数に換算すると31億個という膨大な数量の回路素子を集積した、超
大規模プロセッサである。このため 32nmと微細な製造技術を採用しているにもかかわらず、シ
リコンダイは544平方mm(29.9×18.2mm)と巨大になっている。消費電力は 170W(TDP値)とかなり
高い。といってもプロセッサの規模を考慮すると、消費電力は相当に努力して抑えた値になって
いる。現行世代のItanium プロセッサ(Itanium Processor 9300シリーズ、開発コード「Tukwila
(タックウイラ)」)は65nm技術で製造しているが、このプロセッサを32nm技術で縮小したチップ
に比べ、CPUコア当たりのTDP値は約60%減少したと講演では述べていた。

 Poulsonでは整数演算パイプラインやデータ・パイプライン、浮動小数点演算パイプライン、
命令バッファなどを新しく開発したという。CPUコアのマイクロアーキテクチャは、イン・オー
ダー実行や11段のパイプライン処理、最大6命令の並列フェッチ、最大12命令の並列実行などの要素技術で構成されている。

 キャッシュメモリの階層は3次まである。1次は16KBの命令キャッシュとデータ・キャッシュ、
2次は512KBの命令キャッシュと256KBのデータ・キャッシュで、いずれもCPUコアごとに用意した。
3次は32MBの共有キャッシュである。

http://pc.watch.impress.co.jp/docs/news/event/20110223_428720.html
「Poulson」のシリコンダイ写真。製造技術は32nmの高誘電率膜/金属ゲート(High-k/Metal gate)技術、9層の銅配線
http://pc.watch.impress.co.jp/img/pcw/docs/428/720/01.jpg
「Poulson」のレイアウト。
http://pc.watch.impress.co.jp/img/pcw/docs/428/720/02.jpg
PoulsonとTukwilaの概要
http://pc.watch.impress.co.jp/img/pcw/docs/428/720/03.jpg
9 auシカ(岩手県):2011/02/23(水) 22:02:22.64 ID:EzhufdFl0
ARMのまるで原子炉のようなCPUまだかよ。
x86なんてぶっちぎりなんだろ?
10 リッキーくん(チベット自治区):2011/02/23(水) 22:03:03.28 ID:2RQXRG5A0
そんなことよりLightPeak
11 ちかぴぃ(中国地方):2011/02/23(水) 22:05:05.59 ID:HXqrOC770
サンディはいらない子
12 チィちゃん(catv?):2011/02/23(水) 22:05:53.69 ID:4ZMDqbwl0
ポールソンってアイテニアムの後継ってこと?
HP-ux専用か?
13 ガリ子ちゃん(東京都):2011/02/23(水) 22:08:01.11 ID:M5dFcRnfP
財務長官は関係ないだろ
14 コロドラゴン(宮崎県):2011/02/23(水) 22:08:05.02 ID:JIeJd76l0
>Poulsonは、消費電力は170W(TDP値)とかなり高い。

要水冷すなぁ
15 うさぎファミリー(東日本):2011/02/23(水) 22:08:57.32 ID:2eChIiFG0
でも俺、使うのギコナビだけなんだよな。。。
16 ぎんれいくん(北海道):2011/02/23(水) 22:09:29.45 ID:a3xuCHq00
何でもいいからサンディを買ったほうがいいのか待ちなのかはっきりしろ
17 アイちゃん(catv?):2011/02/23(水) 22:16:47.96 ID:JztTo1Ns0
パソコン先生どういう事か教えてくださいよ
18 マーシャルくん(東京都):2011/02/23(水) 22:29:28.56 ID:pC+3FTJN0
8コアを実売25000円でだせ
19 ピーちゃん(神奈川県):2011/02/23(水) 22:45:32.87 ID:WfGzz8kyP
>>14
170W…
爆熱プレスコの再来か。。
20 さっしん動物ランド(東京都):2011/02/23(水) 23:54:48.63 ID:GS0A5QAf0
ソケットって140Wの制限なかったか?って思ったけどこれ汎用品じゃないから問題ないのか
それにしてもデフォで5GHz越えとか凄いな
21 暴君ハバネロ(大阪府):2011/02/24(木) 00:07:33.02 ID:o6hq0PH4P
メインフレームクラスのマシンに載せるので、TDP170Wなんか大したことないよ。
それに合わせて筐体やら冷却やら設計するんだから。
POWER7の4GHzオーバーは200Wとか言われてるんだし。
22 きららちゃん(長屋):2011/02/24(木) 01:52:29.62 ID:pXD1Guow0
そもそもカスタマー向けの製品じゃなくね
23 ピースくん(大阪府):2011/02/24(木) 02:13:32.66 ID:c/1SGTxW0
もう4次のキャッシュの時代か
しかも196MBて
24 キョロちゃん(埼玉県):2011/02/24(木) 02:16:58.47 ID:gfYJqteCP
>>23
5次キャッシュの時代になったらDRAM要らなくなるかな
25 リッキー(愛知県):2011/02/24(木) 02:20:34.69 ID:Ye+Du1N70
IBMのはなんだよ5.4ギガヘルツって
26 ロッ太(宮城県):2011/02/24(木) 02:40:19.29 ID:96mxh3AG0
AMDもやっとHigh-K/MG採用CPU量産に到達したか。
プロセスも32nmだしこれで少なくとも製造技術の基盤そのものは半導体業界の化け物Intelにこれまでよりも肉薄する事となる。
27 かもんちゃん(catv?):2011/02/24(木) 02:48:45.80 ID:XBVMUWva0
>これらの工夫により、従来と同じくらいの消費電力で論理ゲートの動作周波数を20%程度、向
>上できたとする。3.5GHzを超える動作周波数を達成できると、講演では述べていた。
なんかAMDは一時期はクロックで争う時代じゃないとか言ってたのにまたクロックをぐんぐん上げてく時代になったんだな
消費電力そのままでクロックアップってことはPen4のような電熱器じゃないのは分かってるけど

なぜかPoulsonがPollutionにみえた
28 暴君ハバネロ(チベット自治区):2011/02/24(木) 02:50:49.41 ID:zIthuEBMP
>>3
これってISAはなんなの?
MIPS?
29 しんた(関西地方):2011/02/24(木) 04:26:10.33 ID:KsditdF90
インテルがgdgdだから次はAMDで組むか
30 はやはや君(catv?):2011/02/24(木) 11:58:33.74 ID:MTFn4qyKi
一台組んだらよくて数百万、下手したら数億でWindowsが動かないがおまえそれでいいのか
31 ベスティーちゃん(関西地方):2011/02/24(木) 12:15:11.78 ID:EXfDaHpF0
PoulsonってHP-UX専用?
32 暴君ハバネロ(大阪府):2011/02/24(木) 13:06:17.79 ID:/qX2GAcZP
専用じゃないけど、実質そうだな
いつまで、hp以外のベンダーが採用するかわからないし
33 冒険の書【Lv=1,xxxP】 :2011/02/24(木) 18:34:00.52 ID:9cmM25rp0
テス
34 冒険の書【Lv=9,xxxPT】 :2011/02/24(木) 19:35:18.36 ID:NtwVAh4D0
テス
35 BEAR DO(長屋):2011/02/24(木) 20:21:04.49 ID:xYvt1UnT0
インテルのIVYの次から時系列で出荷予定表書き出してくれ。
36 あかりちゃん(チベット自治区):2011/02/24(木) 20:25:51.25 ID:df8jcbaz0
>3.5GHzを超える動作周波数を達成できる

さ・・・さすがAMD・・・・・・すごいなあ・・・・・・・・・・・・・・・・・・・
37 ピーちゃん(神奈川県):2011/02/24(木) 20:40:51.64 ID:r/L00a5t0
>>8
>消費電力は 170W

CPUだけでこんな電気食うのかよ
38 プリングルズおじさん(埼玉県):2011/02/24(木) 21:07:04.46 ID:FDnJuw2t0
8コアでL2が2M、すかもパイプラインの段数を増やさずに3.5GHzって、確かに凄いな
39 やまじちゃん(埼玉県):2011/02/24(木) 21:15:32.74 ID:uLtAYE/90
ファンレスノートPCが欲しいんだが
この流れだと望み薄だな
40 宮ちゃん(愛知県):2011/02/24(木) 21:26:56.35 ID:R3BiHHIX0
よーわからんが処理速度はもうバイオコンピュータ(笑)な域にいるのか?
人間の記憶は2TBとかいう話を以前聞いたし、エロボット社会も間近だな。
41 ドコモダケ(関西地方):2011/02/24(木) 23:48:00.10 ID:rBXyEXWk0
>>40
2TBなわけないだろ
お前の脳内には映像で思い出せる記憶が無いのか

しかしブルはダイサイズ心配だ
これ2万円台で無理じゃない
42 黄色のライオン(関西地方):2011/02/25(金) 00:41:50.49 ID:3ELTuEzZ0
28.5mm2×4+L3 8MB+GPU統合のSandy Bridgeが216mm2だから
整数2浮動1+L1+L2で30.9mm2、最大のX4でも123.6mm2+L3 8MB他(GPU無)だったら
でかくても300mm2未満、200〜250mm2程度でおさまるんじゃないかね
43 チョキちゃん(東京都):2011/02/25(金) 01:25:26.75 ID:v9/T/V1f0
44 ドンペンくん(catv?)
恥股