【ネイティブ()】AMD Bulldozer告別式会場【土下座】

このエントリーをはてなブックマークに追加
935Socket774
ttp://www.agner.org/optimize/blog/read.php?i=187
・省電力機能が過剰にクロックを抑えすぎ
・Bullのコアがリソースを共有していることを知らずにOSがタスクを割り振る可能性がある
・2コアに負荷がかかるとフェッチ帯域がコアあたり16B/clkに落ちる
・2コアに負荷がかかるとデコード帯域がコアあたり2命令/clkに落ちる
・D$のバンクコンフリクトが頻繁に起こる
・I$の2-wayは2スレッド同時実行するには不足
・長いパイプラインで分岐予測ミス時のペナルティが大きい
・パイプライン自体は4命令/clkだが整数ALUが2個しかなく持て余し気味
・整数SIMDユニットで実行されるfp SIMD命令がありデータ交換に余計なレイテンシがかかる