P4-PCやXeon-PCてPMG4より速いんですか?その6

このエントリーをはてなブックマークに追加
683MACオタ
少しばかり誤解もあると思うす。
>>675
データに限定といいつつ,分岐なんかの命令依存の制約が含まれているす。例えば,
(c)の投機実行わデータ待ちの状態からわ不可能す。
>>676
(5)もL3タグ管理をサボるためで,キャッシュのヒット率が落ちるのでマイナスす。
それに(1)のハイパーパイプラインと(3)のトレースキャッシュの組み合わせも,
見方によってわ命令バッファが非常に大きくなったものと見ることができるす。
HTわある意味,Fetch - Execute間のステージが多くなったことで命令の組
み合わせを再構成できるようになってはじめて実現できたと考えられるす。
似た例でわ,POWER4もステージの追加で,VLIW的な命令の再構成をしているす。
>>679
ここで結局命令がボトルネックになるケースに戻っているすけど,注意すべき
なのわ,クロックがメモリアクセスに比べて十分高ければ分岐ペナルティが多
くても「時間」で見た無駄わパイプラインが長かろうが短かろうが差がなくな
るということす。