201 :
MACオタ:
>>186の後、もっとマシなNehalem画像を探していたすけど、無いので
>>186のリンク先のスライドの
写真を元にした感想す。
・まず興味深いのわ、Barcelonaのレイアウトとの類似性す。
(
http://img62.imageshack.us/img62/6079/dieoi4.jpg 参照)
共に中央ににノースブリッジを配置し、下に最終レベルのキャッシュ、左右にI/O、上にメモリインター
フェース。。。といったレイアウトに見えるす。
周辺側のコアわNBから遠くなるすから、コアの隣にNBを配置するという動機より、電源を分離する
ために、この配置が都合が良いのだと思われるす。
・L1とL2が妙に遠い
見たところ、4つ並んでるコアの上にL1があり、下に並んでいるキャッシュから随分遠いす。Barcelonaの
L3もL1から見ると遠くてレイテンシも大きいす。実わNehalemの最終レベルのキャッシュわL3なのか、
L2から直接データを読み込む機能があるとか、何か予想外のしかけがあるような気もするす。
ヒント:movntdqaってL2以下から16バイトをダイレクトに読む命令だよな?
>>202 メモリ->レジスタの転送命令わ、マルチメディアISAを備えるアーキテクチャで特に珍しい命令じゃないす。
>>201で書いた話わ、メモリ引数がL2ヒットした場合にデータパスが特別な扱いを受ける(例えば、
実行ユニットの入力として直接使用される)可能性を考えているすけど。。。
POWER6でもロード/ストアキューに存在するデータわ、レジスタを介さずにそのまま演算器の入力と
して使えるらしいすから、L2が遠くなったことの代償として間のバッファを大容量化し、多機能化する
というのわ可能性があるかと思うす。