【AMD】2011年登場のAMDの8コアCPU「Zambezi」とは【Bulldozer】

このエントリーをはてなブックマークに追加
1 ウィンナー巻き(新潟県)

Bulldozer
・32nmプロセスで、8コアを搭載
※Intelも32nmのパフォーマンスCPUは、当面のWestmere(ウエストミア)世代では6コア(Gulftown:ガルフタウン)
CPUコアをマルチスレッド処理に最適化することで、単位面積当たりの“コア数”を増やすことができる。
結果として、CPUの面積当たりのコンピューティング性能を上げることができる。


・クラスタードアーキテクチャ
CPUコアの中を分割して、整数演算部などをスレッド専用のリソースにする一方で、浮動小数点演算部をスレッド共有リソースにした。
「我々は、Bulldozerモジュールの中に、2つの整数演算ユニットと2つの整数スケジューラを分離して実装した。
この2つの整数演算コアは、それぞれが1スレッドを、完全に独立して並列に走らせることができる。そのため、最高パフォーマンスを達成できる」(Akrout氏)。

AMDの判断は、Hyper-ThreadingのようなSMT技術では、整数演算リソースが充分でないとリソースの競合が発生して性能が抑えられてしまうというものだった。
それより、使用頻度の高い整数演算パイプは、それぞれのスレッド毎に分離したクラスタベースマルチスレッディングの方が、パフォーマンスを上げられる。
その一方で、スレッド間で競合する頻度が低いと予想される浮動小数点演算ユニットは共有とした。
「通常は浮動小数点演算ユニットはあまり使われない。だから共有は完璧に自然なことだ」とMoore氏は説明している。

http://pc.watch.impress.co.jp/img/pcw/docs/331/235/kaigai6.jpg


・ヘテロジニアス
「BulldozerはAPUになる能力を持っている。つまり、ヘテロジニアスコンピューティング機能を統合できる」(Akrout氏)。
おそらく、AMDの戦略は次のようなものだ。今後のワークロードで、増えることが予想される浮動小数点演算のニーズの多くは、
CPUに載せるGPUのようなデータ並列型エンジンで吸収する。その方が効率的だからだ。
CPUコア側の浮動小数点演算機能の拡張は、APU化を前提として、やや控え目に抑える。
Bulldozerのもう1つの重要なコンセプトはヘテロジニアス化にあることを考えると、アーキテクチャの選択が納得できる。

詳細は以下にて
http://pc.watch.impress.co.jp/docs/column/kaigai/20091126_331235.html