基本的にフレームワークはIntelが用意する。
あと、CUDAのプログラミングモデルよりはより柔軟なのは間違いない。
x86コア+512ビットSIMD改という構成は、NVIDIAのストリームマルチプロセッサと比べても
効率が悪いとは言えないし、とりあえず倍精度と整数では圧勝の可能性大。
NVIDIAの提供するスカラって、結局は、32ビット×8Way×4サイクルインターリーブ(=1024ビット単位)の
データレベル並列演算にすぎない。
Larrabeeの提供する「柔軟なSIMD」と比べてもかえって制約が多いくらい。
ぶっちゃけCUDAでやれることはLarrabeeでも殆どできる。
ATIのは、GPGPUってレベルじゃねーぞってことで。