AMDの次世代APU/CPUについて語ろう第175世代
FXとマスクを共用しているOpteron 3300番台(Piledriver 8コア)が
同クロック帯で投入されたAtom C2750(Avoton 8コア)に性能で
追いつかれたのは何故なのか思考実験してみた。
実はSilvermont世代のAtomでもフェッチ・デコードは8バイト/clkで
最大2命令デコードでしかなく、かなり貧弱。
Bulldozerの32byteで4命令でフェッチ・デコードだから命令供給には
見た目上ネックは無いように思える。
1コアあたりの演算ユニットもAtomよりむしろリッチだ。
ではデータ供給は?
PiledriverはL2・L3の容量は大きい(2MB×4および8MB)
Avotonは1コア毎に512KBのL2キャッシュがあるのみ(×8コア)
じゃあ劣る部分は?
・L1Dが小さい&Way数少ない
・L2が遅い(レイテンシが大きい)上に2コア分をクロスバーで共有
→L1でフェッチ・リタイヤ連発されると詰まる可能性がある?
L1Dのサイズ・Way数の改善とL2の高速化が今後のパフォーマンス
改善の鍵になると見た。