Intel uPs Info 4

このエントリーをはてなブックマークに追加
1名称未設定
Intel製マイクロプロセッサの情報局スレッドです。
情報投稿よろしくです。Intelプロセッサの昔話もOK。
自作板のIntelスレに負けないようにしよう。

※妄想、珍説・珍論、誇張表現は控えめに。
※アムチュー、モトチュー、IBMチューからの書き込みはご遠慮ください。
※チュー流入防止のため、意図的にわかりにくいタイトルにしています。ご了承ください。
※マターリしましょう。

前スレ
Intel uPs Info 3
http://pc11.2ch.net/test/read.cgi/mac/1190013206/

前々スレ
Intel uPs Info 2
http://pc11.2ch.net/test/read.cgi/mac/1159817811/

前々々スレ
Intel uPs Info
http://pc7.2ch.net/test/read.cgi/mac/1121683774/
2名称未設定:2008/06/26(木) 15:29:51 ID:I3hfESaw0
いちおつ
3名称未設定:2008/06/26(木) 17:48:17 ID:3kddYdrL0
うっぷすいんほって何?
4名称未設定:2008/06/27(金) 11:48:53 ID:TPhqu8PIO
5名称未設定:2008/06/29(日) 17:45:37 ID:6xhzC9U60
ho
6名称未設定:2008/07/02(水) 00:14:19 ID:rwYkpwLh0
su
7名称未設定:2008/07/04(金) 17:19:16 ID:fgLIt9p50
年末にはNehalem搭載MacProが出るのかね
8名称未設定:2008/07/07(月) 19:17:47 ID:6WIpDbt10
年末に出るのは1s向けのNehalemでXeonは遅れるんじゃないのか。
Appleのことだからフライングで供給してもらうかもしれんが
9名称未設定:2008/07/12(土) 22:10:45 ID:X2NY0d4t0
ho
10名称未設定:2008/07/16(水) 21:37:41 ID:2tJDaSEC0
ze
11u:2008/07/19(土) 16:54:24 ID:TT3/04Gc0
Intel Roadmap indicates multiple Havendale incoming Q3′09
http://en.expreview.com/2008/07/16/intel-roadmap-indicates-multiple-havendale-incoming-q309/#more-543

- Lynnfield/HavendaleもHyper-Threading有り
- LynnfieldはTurbe Boost Technology有り。

# Lynnfieldは4 core + PCIeなので200mmsq切るのは厳しいか??
# Havendaleも2 core + GMCHのMCMなのであまりV2, V1は45nmでは無理の予感。
# Nehalem系のV2,V1はWestmere世代待ちか、DC Atomかなあ。
# Westmereへの以降時期がかなり謎。TickTockはやっぱ難しいのか…。
12u:2008/07/19(土) 16:56:23 ID:TT3/04Gc0
というわけで、小さいネタのみだがこのスレ復活。
以前より漏れのレベルが落ちているので、存在価値は多分微妙だが。
13u:2008/07/19(土) 17:07:40 ID:TT3/04Gc0
Intel's Larrabee GPU based on secret Pentagon tech, sorta
http://arstechnica.com/news.ars/post/20080708-intels-larrabee-gpu-based-on-secret-pentagon-tech-sorta.html

Larrabee P54C-based説について。
かなり以前、IntelはP5世代が引退させたあとに、米国国防総省にP54CのRTLコードを提供した。
で、国防総省はP54Cをベースに対放射線版のを軍事用途向けP5を作った。
数年後、そのPentagon版P5も引退したあと、今度はIntelにPentagon版P5のRTLが返された。
それをMany-Core向けに拡張したものがLarrabeeのcoreってことらしい。

# ちなみに漏れはこれを読んでもP5-basedだとは思ってない派。
14名称未設定:2008/07/19(土) 17:14:12 ID:tdFjqt3o0
詳細が発表されたらされたで、
各自が思うところのホニャララベース論で
また不毛な議論に花を咲かせようじゃないか。
15u:2008/07/19(土) 17:24:23 ID:TT3/04Gc0
議論は表スレで(なら個人の見解書くなとかいわれそうだが)。
ここはまったりいきたいのです。

# 2-issue in-orderってだけじゃAtomもそうだし、P5だとはいわん。
# やっぱuop変換なしで、U,Vパイプベースじゃないと。
# 最近のx86のFPU/SIMDに使われているトランジスタ数がオリジナルP5よりも大きい(はずな)こと、
# SMT, SIMD拡張, 64bit化, 仮想化などなど、P5以降にしなければならない拡張があまりにもありすぎること、
# などからなんとなくバランス悪いし無理かなあと。なにしろuopもregister-renamingもないんだ。
# 一体どうやってx86 decodeするの??ってかんじ。
16u:2008/07/19(土) 21:02:02 ID:cm1TEuNQ0
Runtime Environment for Tera-scale Platforms
ftp://download.intel.com/technology/itj/2007/v11i3/4-environment/vol11-i3-art04.pdf
Intel VCGの論文。

# ここでシミュレーションしてるTS-CMP processorってのが微妙にLarrabee似かも。
# SIGGRAPH 2008で論文発表する人が著者にいるだけあって、
# よく知らんがRun-Timeで都合が悪いところは吸収して、多数コア+HW MultiThreadingを分回すってのも
# Larrabeeの方向にやはり近い気が。

TS-CMP processor
- 16 in-order core
- HW Multi-threading, round-robin each cycle
- 32KB L1D, 2MB shared L2, 4MB off-chip L3
- L1: 3 cycle, L2: 12 cycle, L3: 40 cycle

>We used a cycle-accurate simulator to evaluate McRT’s
>performance on a TS-CMP processor. The simulated
>platform consists of an array of up to 16 in-order cores,
>each of which has four threads. Each core will select a
>different thread each cycle, round-robin, unless the thread
>is stalled due to, for example, a cache miss, being in the
>sleep state. The memory system consists of a 32 KB L1
>data cache that is shared by all four threads in the core, a
>2MB L2 cache that is shared by all the cores, and an
>off-chip 4MB L3 cache. All caches were simulated with
>an 8-way set associative configuration. The L1 cache
>access time is 3 cycles, the L2 cache access time is 12
>cycles, and the L3 cache access time is 40 cycles.

Doug Carmean, Visual Computing Group, DEG
Eric Sprangle, Visual Computing Group, DEG
17u:2008/07/20(日) 00:27:34 ID:MiB13c6B0
対応表(仮)
XE $999 → Bloomfield-3.2G
P1 $530 → Bloomfield-2.83G → Lynnfield
MS3 $316 → Bloomfield-2.66G($283) → Lynnfield, Havendale
MS2 $266 → Lynnfield, Havendale
MS1 $183 $224 → Havendale
E2 $163 → Havendale
E1 $133 → Havendale
V3 $113 → Havendale
V2 $64-$84
V1 $34-$53

# 一応考えたが今いち正確な対応がわからない。
# Bloomfieldの価格=$284はシステムで高価になることに対するIntelの普及のための配慮??

# 32nm Westmereがいつ出るのか知らないが、
# Westmereもサーバ向けの6 coreを先行して開発していていて
# デスクトップ向けのClarkdaleが遅れているとすると、
# Bloomfieldと同じ状況でまた巨大なダイをデスクトップ向けにバーゲンしなきゃいけなくなる。
# サーバ用に4 core Westmereを開発していればよいが、
# その場合でもQuickPathのサーバ用マザー&socketをまた転用することに。
# いずれにしろsocketが異なるであろうLynnfieldとDesktop Westmereとの間の移行関係に無理がある。
# 逆にClarkdaleが早期にでたとするとLynnfieldが恐ろしく短命に終わってしまう。
# Lynnfieldはしばらく32nmに移行しないで粘ることにすると、
# ClarkdaleとSandy Bridge世代の関係がよくわからなくなるな。
# とにかくLynnfield/HavendaleとWestmere世代の移行は無理がある予感。

# 実はLynnfieldも4 coreなのであまり安売りできないはずで、バーゲン状態に近い。
# つか、4 coreって32nmでもIntelの過去のMainstreamと比べてでかいんで。
# 調子に乗ってcore数増やしすぎなんじゃ??
# 今のRoadmapは無理がありすぎな気がするのだが早くに考え過ぎか…。
18u:2008/07/20(日) 00:28:27 ID:MiB13c6B0
x Bloomfield-2.83G
o Bloomfield-2.93G
19u:2008/07/22(火) 21:52:11 ID:D1B6505E0
Intel Bloomfield CPU pricing reveals pleasant surprise
http://www.digitimes.com/news/a20080717PD222.html

Bloomfield 3.20GHz $999
Bloomfield 2.93GHz $562
Bloomfield 2.66GHz $284
20u:2008/07/22(火) 22:00:14 ID:D1B6505E0
32NM ATOM ON IDF 2008
http://xtreview.com/addcomment-id-5880-view-32nm-atom-on-idf-2008.html

8月のIDFでは、32nm版Atomをデモ。
Cell PhoneやiPhoneのサイズが可能に。

# 32nm Atom = Lincroft
21u:2008/07/22(火) 22:07:40 ID:D1B6505E0
Intel: Atom Will Not Substitute Celeron Processors.
http://www.xbitlabs.com/news/cpu/display/20080717121547_Intel_Atom_Will_Not_Substitute_Celeron_Processors.html

Intelは現時点でAtomでCeleronを置き換えるつもりなし。
22u:2008/07/22(火) 22:23:55 ID:D1B6505E0
Nehalem arrives in week 40 and 44, possibly
http://www.bit-tech.net/news/2008/07/14/nehalem-arrives-in-week-40-and-44/1

Bloomfieldは10月末。 # …かもしれない
X58チップセットはそれだけで$70のコストであり、マザーボードはかなり高価になる
(nVIDIAのnForce 790i Ultra SLIは$100+なのでさすがにそこまではいかない)。

>We've also been told that Intel's premium X58 chipset alone will cost $70,
>making the boards quite expensive, but this is not unexpected and by no means
> completely insane like Nvidia launching the nForce 790i Ultra SLI
> with a chipset that cost $100+.
23u:2008/07/23(水) 19:24:34 ID:XaNk5EyX0
>>20 訂正
More Details on the Intel Atom Emerge
http://www.anandtech.com/printarticle.aspx?i=3254

>Moorestown will allow Intel’s Atom CPU to exist in larger smart phones (4 - 5” size),
>while its successor in 2010/2011 will use the magic of Intel’s 32nm process to finally
> get into something iPhone-sized.

表スレでいわれている通り、Lincroftは45nmだった。
AnandTechの過去の記事によれば32nmはMoorestownのさらに後継ということらしい。
# にしちゃやたらデモが早いんですが…。
24u:2008/07/23(水) 20:20:43 ID:XaNk5EyX0
# ちょっと発見。
# $530 → $562 ($32アップ)
# $316 → $284 ($32ダウン)

# 2.66GHzを貧乏人向けに従来より安く設定しているかわりに、
# 2.93GHzを同じ価格差分上昇させただけ??
# 2.66GHzを買う人は2.93GHzを買う人には感謝しなきゃ(・∀・)
25名称未設定:2008/07/23(水) 20:24:57 ID:w8379Ch40
ごめんなさい
それでも買えない貧乏人で
ごめんなさい、ごめんなさい
26u:2008/07/28(月) 00:45:51 ID:/r4YWaPu0
Nehalem-EP......BLOOMFIELD
ttp://www.xtremesystems.org/forums/showpost.php?p=3168831&postcount=816

xtremesystemsの掲示板にNehalemのES品をベンチした結果がそこそこあり。
# 例によってマルチスレッドものが多い。
27u:2008/07/28(月) 00:57:32 ID:/r4YWaPu0
以下、シングルスレッドよりの結果(Yorkfield vs Bloomfield)を抽出
QX9650 = Yorkfield 3GHz
Bloomfield = Bloomfield 2.93GHz

・Cinebench R10 Single Core # ← Single Threadのことなはず
- QX9650 3.263
- Bloomfield 3.396 (+6.6%)

・Cinebench R10 Multi Core
- QX9650 11.437
- Bloomfield 14.299 (+28%)

・Whestone
- QX9650 3.124
- Bloomfield-HTなし 3.152 (+3.3%)
- Bloomfield-HTあり 2.786 (-8.7%)

・Dhrystone
- QX9650 6.468
- Bloomfield-HTなし 7.652 (+21%)
- Bloomfield-HTあり 7.045 (+12%)

()内は同クロック換算での性能比 vs Yorkfield

# CinebenchはSingle Threadで+6.6% Yorkfieldより早い
# Whestone(=FPU)は+3.3%で、HT ONだとYorkfield以下にまで落ちる
# Dhrystone(=ALU)は+21%も速い。HT ONだと約-10%落ちる

# Dhrystoneみたいな単純ベンチだとBufferやらにうまくはまんのかな
# HTだと静的分割で容量や帯域が減る部分あるからおちんのかな
# あとで誰かが詳しく解析してくれるだろう(・∀・)
28u:2008/07/28(月) 01:08:55 ID:/r4YWaPu0
訂正

ぜんぜん違う。
BOINC ManagerのWhestone/Dhrystoneがper CPUだから、
HT ONの結果が悪く見えるってだけ。
というわけで、>>27のコメントは無かったことでよろしく。
29名称未設定:2008/07/28(月) 13:41:12 ID:oSKc0BSx0
CPUの速さって頭打ちなん?
ムーアの法則は終わり?
30名称未設定:2008/07/28(月) 18:37:31 ID:XAvBqRmv0
ムーアの法則はCPUの処理速度について言及した物ではないから。
31名称未設定:2008/07/28(月) 19:29:42 ID:Gu7w0ktk0
じゃあアムダールは?
32u:2008/08/01(金) 14:10:00 ID:phykfOmM0
Via's Nano L2100 takes on Intel's Atom 230
http://techreport.com/articles.x/15204/1

Low-end grudge match: Nano vs. Atom
http://arstechnica.com/reviews/hardware/atom-nano-review.ars/1

VIAのNano(Isaiah)とAtom 230(Diamondville)の比較ベンチ記事。

# 正直、Pentium MとAtomの中間程のクロック当たり性能
# (PC Mark2005 CPUでAtom +33%)でしかなく思ったより速くない。
# Performance per Watt でも90nm Pentium M(Dothan)に負けているのでCPUとして旨味がない。

VIAスレよりコピペ。

Atom
L1:3 cycles
L2:16 cycles

nano
L1:4 cycles
L2:24 Cycles
33名称未設定:2008/08/08(金) 00:39:39 ID:HHyF/lKu0
ho
34名称未設定:2008/08/13(水) 22:51:52 ID:8VyxyAHL0
ze
35名称未設定:2008/08/18(月) 09:15:33 ID:AGnF5NVe0
m
36名称未設定:2008/08/25(月) 22:35:02 ID:btW8gkhH0
tai
37u:2008/08/25(月) 23:59:07 ID:j8jktXaM0
あまりにも暇が無く、IDFの情報を確認できるのも再来週くらいだ。
幸い、今回のIDFは新情報がすくないようだけど。

>>29
ムーアの法則については、ロジック部が1世代のシュリンクでも0.7倍くらいにしか
縮小されてないってところが味噌。
http://www.chip-architect.com/news/2007_02_19_Various_Images.html
cacheなどのSRAM部はロジック部よりもトランジスタ密度が高いので、
同じ面積でもトランジスタ数が多いし、縮小率もいい。
で、Intelはムーアの法則が続いていることをSRAMが9割を裕に超えるItaniumを引き合いにだして
宣伝しているの(それでも24ヶ月で2倍くらいが実際の値だけど)。
http://ja.wikipedia.org/wiki/%E7%94%BB%E5%83%8F:Moores_law.svg

個人的にはマイクロプロセッサにおけるムーアの法則なんて少なくともシングルコアで見れば
既に(P6〜NetBurstあたりで)終わっていて久しい。
(logic部分のトランジスタ比の平方根が実際の性能向上率に近いのでL2 L3やらのSRAM部はカウントにいれる意味性が薄い。)
38u:2008/08/26(火) 00:07:28 ID:5q0LAF8B0
余談だが、
ロジック部が1世代のシュリンクでも0.7倍くらいにしかならないってところから
逆算すると、結局1世代のシュリンクで増やせるコア数はせいぜい1.4倍くらいにしかならない。
しかも、シングルコアでの拡張が全くないわけではないのでまあ本当はコア数なんて
むやみやたら増やせないはずだが、Intelはやたら増やしたいみたいなんだよね。
ネイティブ4 core化したためにBloomfieldやLynnfieldは価格を下げられない。
WestmereやSandy Bridgeもコンシューマでは4 coreで強気のはずで、
最近でてるロードマップは正直あまり信用できないと思ってる。
39名称未設定:2008/08/27(水) 01:12:17 ID:8N+4VQn+0
CPUアーキスレの団子とToHeart(仮名)とオタの漫才を
誰か三行でまとめてくれ
40名称未設定:2008/08/27(水) 08:24:24 ID:XzDDiX1J0


チな回路(笑)(笑)
41名称未設定:2008/08/27(水) 09:04:13 ID:1hzLwNu40

イコール
正義
42名称未設定:2008/08/27(水) 18:36:28 ID:HhyGN9g90
MACオタ
名無しと団子
三兄弟
43名称未設定:2008/08/30(土) 00:22:40 ID:db5LjGcM0
ついに荒らし始めたよw
44名称未設定:2008/08/30(土) 17:21:42 ID:H6XJQM9R0
MACオタが
まともに
見えてしまう
45MACオタ:2008/08/30(土) 18:22:39 ID:DJepu+s80
>>44
二人とも『難しい言葉を知っている方が勝ち』と思っているフシがあって、自身で理解できない
概念をやりとりしているのが紛糾する元のように見えるすね。。。

団子さんも『マニュアルにも載ってる  常  識  で  す。』とか叫んでる割に、Developer Manual
3Aで懇切丁寧にストアバッファの説明があることを知らなかったようだし、例の粘着名無しさんわ、
正しい知識の中に、ところどころトンデモが混ざるというマッド特有の論理展開を見せてくれるす。

それにしても二人とも社会人とかこの道20年とか主張しているのに、平日昼間から熱く議論を
戦わせているのだけわ不思議としか言い様が無いす(笑)
46u:2008/08/30(土) 22:49:12 ID:3ORPufOw0
http://www.spec.org/cpu2006/results/res2008q3/cpu2006-20080711-04753.html

Sunスレで見つけたけど、富士通のSPARC64 VIIが
SPECfp2006(rateじゃない方)でXeonを振り切って世界最高スコアを出した。

# Nehalemで超えられそうな範囲ではあるが、これにはびっくり。
47u:2008/08/30(土) 22:56:54 ID:3ORPufOw0
http://www.spec.org/cpu2006/results/res2008q2/cpu2006-20080527-04430.html
# Wolfdale-DP 3.4GHz でこのスコアか。やっぱNehalemで超えられるか怪しいな。
# 無論、これでもPOWER6 5GHzには勝ってる。
48MACオタ>u さん:2008/08/30(土) 23:21:04 ID:DJepu+s80
>>46-47
これわ、SPEC2000時代の"179.art trick"の再来す(笑)
当分世間でわ最適化とチートの違いについての議論で喧しくなるのでわ?
49MACオタ@補足:2008/08/30(土) 23:28:19 ID:DJepu+s80
50u:2008/08/30(土) 23:34:02 ID:3ORPufOw0
http://www.spec.org/cpu2006/results/res2008q3/cpu2006-20080712-04768.html
こっちが正解だな。Sunのと全然ちがう。
Blogといいなんといい、さすがSunは素晴らしい。
51u:2008/08/30(土) 23:46:35 ID:3ORPufOw0
なんだたんなる自動並列かよ。漏れのはやとちりだった…。
http://www.spec.org/cpu2006/results/res2008q3/cpu2006-20080711-04734.html
52u:2008/08/31(日) 00:24:20 ID:JuyuLJNV0
明らかになるCore i7の秘密〜DDR3メモリサポートとTurbo Modeのカラクリ
http://www.4gamer.net/games/043/G004345/20080825042/

>この点について,Intelで「Overclock Guru」としても知られるDunford氏は,
>「Smackoverでは,BIOSメニューに『TDP値を任意に指定する』設定項目が設けられる。
>例えば,この値を190Wなどと高めに設定すれば,Turbo Modeによる恩恵も大きくなる」
>と説明する。

TGdailyにも書いてあるが、
NehalemではTDPをデフォルトの値から任意にBIOS上で変更でき、
冷却能力依存でTurbo Modeの恩恵を拡大できる。(例:130W→190W)
53名称未設定:2008/08/31(日) 00:35:08 ID:RSd9rRSC0
>>52
MacじゃEFIでの変更は無理だな
Penrynのターボモードは2コアのうち1コアをオフにするから、OS Xじゃサポートしないと思っていたが
今回のデスクトップ(は採用製品ないけど)やサーバー向け機能だとしても、アップルは使わせないだろうな
54u:2008/08/31(日) 22:45:37 ID:JuyuLJNV0
Larrabee paper review
http://lucille.atso-net.jp/blog/?p=585

# もっと詳しくレビューして欲しいなあ。
55名称未設定:2008/09/05(金) 22:50:19 ID:VYtVW2Zg0
ho
56MACオタ>u さん:2008/09/06(土) 20:18:39 ID:KVnsulHy0
>>54
Siggraphの論文そのものを読んだほうが100倍ためになると思うすけど。。。
ちなみにプレゼン資料のほうもココにおいてあるす。
http://s08.idav.ucdavis.edu/
57名称未設定:2008/09/13(土) 20:11:54 ID:UC26C+RH0
shu
58名称未設定:2008/09/20(土) 12:07:48 ID:XDJNTSsn0
一流大学卒の専門家が数人集まると高尚な議論へ発展して、
見る方としてはありがた くぁwせdrftgyふじこ。

613 :,,・´∀`・,,)っ :2008/09/20(土) 10:16:37 ID:ALOSlSrK
実験から考察して固定観念を切り崩していくのが科学だ。
実験すれば解る事実すら認めないのだから、そんな教育すら受けてないんだろうな。
616 :Socket774 :2008/09/20(土) 11:17:04 ID:zgYvllNz
団子はエンジニアだけどサイエンティストじゃないよなー
なんかさー、サイエンスに対するコンプレックスが駄々漏れで気持ち悪いだよねー
617 :Socket774 :2008/09/20(土) 11:51:32 ID:59KlAnFS
おれの指摘は完全に正しいのだが、君達が理解できていないだけのこと
59名称未設定:2008/09/20(土) 19:47:23 ID:M1fLWDhg0
団子は煽りすぎ。
他人とディスカッション出来ないタイプ。
60MACオタ>58 さん:2008/09/20(土) 21:51:23 ID:sxMJGBgR0
>>58
  --------------------
  一流大学卒の専門家が数人集まると高尚な議論へ発展して、
  --------------------
本来の技術分野の議論というのわ、ああいったモノでわ無いので誤解しないで欲しいす。

団子さんわ、「実験した」と称するなら阿呆でも再現できるように内容を書くべきだし、
キチガイ粘着のヒトわ「俺は知っている」でなく、何を知っているのか述べるべきなんすけど。。。

いまアーキテクチャスレッドで揉めているのわ、どちらのチンチンがデカいか?という話題でしか
無いす。
61名称未設定:2008/09/23(火) 01:47:24 ID:cTGfj3RS0
いや皮肉じゃないのかそれはw
62名称未設定:2008/10/01(水) 20:16:13 ID:nFmMPbi70
ho
63名称未設定:2008/10/05(日) 17:04:33 ID:aAZn0usH0
dngは、何でいつもx86の資産ばかりこだわるの?
64名称未設定:2008/10/06(月) 02:16:15 ID:5c6LklUD0
x86しか使ったことないからじゃね
65MACオタ>64 さん:2008/10/06(月) 02:39:50 ID:stVTHjWG0
>>64
以前仕事でItaniumを扱ったって自慢してたす。
CELL/B.Eについてわ、この辺。 http://tripper.kousaku.in/20070304.html
その上、彼わPowerPC Mac-miniのユーザーす。
66,,・´∀`・,,)っ-○◎●:2008/10/12(日) 13:28:13 ID:Om3rCJhu0
ようカスども
67,,・´∀`・,,)っ-○◎●:2008/10/12(日) 13:29:07 ID:Om3rCJhu0
検証も兼ねてEeePCをわざわざ自腹で買った俺様を舐めんな。
68,,・´∀`・,,)っ-○◎●:2008/10/12(日) 13:36:19 ID:Om3rCJhu0
>>45 つまらん揚げ足取りやってるな。
(フェンス君の言うストアデータの破棄を目的とした)ストアバッファリング機構は存在しない
って意味合いだよ。

帯域確保・低レイテンシ化確保のためのバッファリングの存在は俺自身が主張してるっつーの。
たとえばPrescottのL1がレイテンシの割に大して遅くなかったのだって
ライトバックバッファが間に存在したからだ。
って懐かしいネタだな
69,,・´∀`・,,)っ-○◎●:2008/10/12(日) 21:48:16 ID:Om3rCJhu0
ほら、誰か煽れよ
70,,・´∀`・,,)っ-○◎●:2008/10/13(月) 19:50:34 ID:JTqFA0Mr0
>>65についてだけど、こないだディスク交換したらDVDに傷が付いてて再インストールできなくて
以来Linuxマシンとして活用してるってのは参考までに。
71,,・´∀`・,,)っ-○◎●<ほら何か言え:2008/10/13(月) 19:51:16 ID:JTqFA0Mr0
 
72名称未設定:2008/10/14(火) 11:26:09 ID:ubBjcfrj0
ここはu様の個人スレなので。
73u:2008/10/14(火) 20:54:18 ID:jc15SCAm0
前スレに書いたPOWER7に関する情報も参考に。
http://pc11.2ch.net/test/read.cgi/jisaku/1219884494/950
  =====================
  開発グループが異なるとわ言え、POWER6で電力効率向上のために一旦あきらめたOoOEを
  再投入する 技術的裏付けわ謎す。冷却に関してわ水冷技術で先行しているために問題わ
  無さそうす。
  =====================

やっぱりOOO復活か。
漏れ的にはOOO=電力効率が悪いは半信半疑だった
(アーキではなく同時代の回路技術が原因な気がする)ので、きたきたって感じ。

ちなみにやっぱ漏れはもうここから引退するので、あと煮るなり焼くなりよろしく。
74u:2008/10/14(火) 21:01:07 ID:jc15SCAm0
一応ちょっと書いておくと、
Larrabeeで90W 10 coreだったと仮にすると、1コアあたりは超単純計算で9W。
Clarksfieldでは45Wで4 coreだったとすると1コアあたりは11W。
OOOのハイエンドプロセッサがパフォーマンス最優先で回路設計されていた時代はさておき、
in-orderは今復活して本当に電力効率で優れているといえるだろうか??
もちろんLarrabeeはP5-basedといわれているとはいえ512-bitのベクトル拡張もあるわけだが、
それにしても4 issue OOO + LNIでもそこまで電力大きくなる気がしない。
以前Part1か2でEPIの話があったが、Yonahとi486のEPIは殆どかわらないという論文もあった。
そんなところです。
75名称未設定:2008/10/14(火) 21:19:59 ID:t9fgm6IC0
おいおい
2ちゃんに現役も引退もない
76名称未設定:2008/10/14(火) 21:35:26 ID:jc15SCAm0
引退っても2chに全く書き込みしないということではない罠。
積極的なニュース貼りネタ貼りの活動はやめるけど、
たまに暇つぶしに書き込む&名無しによる活動は継続。
もちろん読むだけならネットにつなげる日は確実に、
これまで通り主要なCPU関連のスレは徘徊するのだった。
77,,・´∀`・,,)っ-○◎●:2008/10/18(土) 23:50:27 ID:6v7IJN9B0
> Larrabeeで90W 10 coreだったと仮にすると、1コアあたりは超単純計算で9W。

うーん、不正解。Larrabeeのコア数は8の倍数です。
いつぞのSIGGRAPHの10コアで云々は机上論の話。

で、製品は16コアで150WのTDP以内にに収まるだとか言われてるけど、GDDR3メモリとかも含めた
PCIeに刺さるボード全体での消費電力になるので、CPU単体と比べるのはいささかアンフェアかと

つーかClarksfieldって本当に出るのか怪しくなってきた感がある。
出ても大型ノート向けじゃないの?イスラエルチームも嫌いと言ってるくらいだし
たかだかDDR3に対応しただけで「Centrino 2」を立ち上げた時点で、Intel全体の意志として
Nehalemのモバイル版は見送るモノと思ってたのだが。
Penrynの消費電力の低さは魅力だしなぁ
78名称未設定:2008/10/19(日) 04:07:24 ID:P/3pgAzM0
団子さんは今日も鋭い分析で驚いた。
79名称未設定:2008/10/19(日) 12:59:03 ID:C1xtvS4W0
100万以上のトランジスタを費やしたPCUで、プロセッサ全体を監視しクロックや電源を制御。
コア単体での電源のON/OFFを可能にするPower Gateのために、大電流に耐える
7mm厚の電力配線層を追加で貼り付け、スイッチング専用のトランジスタを開発。

等々、かつてないほど省電力に気合が入っているわけだが。
http://pc.watch.impress.co.jp/docs/2008/0825/kaigai462.htm
http://journal.mycom.co.jp/articles/2008/09/03/idf11/003.html

とは言え、Auburndale(Havendale)投入がずいぶん先になってしまい、
ノートブック向けをClarksfiled(Lynnfiled)だけで展開するわけにもいかず、
45nm世代はPenryn系列の息が長そうな感はある。
80名称未設定:2008/10/19(日) 13:08:12 ID:P/3pgAzM0
団子さんが低消費電力と認めるPenrynも、そしておそらくSandyBridgeも4イシューのアウトオブオーダーなのだが。
団子さん的にはイスラエルのSandyBridgeはインオーダーとの予想ですね。
81名称未設定:2008/10/19(日) 14:20:43 ID:/3rKfTXs0
2009年Q1に2.93GHz追加のあとは2010年まで、Quad系拡充だけかね
82,,・´∀`・,,)っ-○◎●:2008/10/19(日) 14:22:02 ID:AQDPVDw20
>>80
イスラエルチームの作品の性能が高いのは、性能向上効果の高い部分を重点的に向上させて
処理をさっさと終わらせて待機状態になったほうが、結果的に省電力になるという観測に基づいてる。
デュアルコア・マルチコア化もその一環だし、Core 2ではSSEの演算性能が劇的に向上している。
必要なものなら消費電力が高くなっても受け入れる。
SandyBridgeは4 issueっていう読みは君と同じです。
5issue以上の線も考えたが別の理由であり得ないことに気づいた。

イスラエルチームが特に嫌いと言ったのはAuburndaleだね。
メモコン・GPU専用ダイとのMCMで、QPIによって接続する方式をとってるが
モノリシックでないと統合に伴う省電力化の恩恵がほとんどないからね。
その他、サーバ重視しすぎでどこそこモバイルに向いてない部分が多すぎるんだと。
83名称未設定:2008/10/19(日) 15:12:50 ID:P/3pgAzM0
Clarksfieldの45WはMCH分上乗せだから、
Penrynよりも目立って電力効率で劣っているわけではないでしょう。
SandyBridgeも同程度の電力を維持するのではないかと。
で、団子さん的にはSandyBridgeはインオーダー色濃厚なんですよね。
おれは全くアウトオブオーダーだと思うんですがね。
84,,・´∀`・,,)っ-○◎○:2008/10/19(日) 15:17:53 ID:AQDPVDw20
> で、団子さん的にはSandyBridgeはインオーダー色濃厚なんですよね。
なんで言ってもないことを勝手に想像するの?頭悪いの?
85,,・´∀`・,,)っ-○◎●:2008/10/19(日) 15:29:36 ID:AQDPVDw20
Core 2 QX9300 TDP 35W
PM45 TDP 7W

Clarksfield TDP 55W


Core 2 P9000番台 TDP=25W
GM45 TDP=11W

Auburndale TDP45W


同一プロセスでもこなれてくるとTDPは落ちるモンなんだけどね普通は。
それに見合う性能向上があるならトレードオフになるだろうけど
ノートはバッテリーの持ちが大事だからねぇ(QX積むようなレンジには必要なさそうだが)

だからオレゴンには期待するなと
86名称未設定:2008/10/19(日) 15:51:12 ID:P/3pgAzM0
↑もちろん性能向上分があるんだけどね
それからチップセットが電力増大傾向にある
87名称未設定:2008/10/19(日) 16:08:13 ID:P/3pgAzM0
>だからオレゴンには期待するなと
そうだLarrabeeには全然期待できないね
88,,・´∀`・,,)っ-○◎●:2008/10/19(日) 16:10:57 ID:AQDPVDw20
まあそうだな。
89,,・´∀`・,,)っ-○◎●:2008/10/19(日) 19:47:04 ID:AQDPVDw20
脱線するぜ

EeePCが54800円で売ってる店が、値段据え置きで16GBのUSBメモリをサービスしてくれます。
この店ではUSBメモリがタダでもらえると見なしてよいか?
90,,・´∀`・,,)っ-○◎●:2008/10/19(日) 19:48:43 ID:AQDPVDw20
俺は、それはセットだからお得価格だって言ってるんだけどね。

この板の重鎮的にはタダらしいんだよ。
91名称未設定:2008/10/20(月) 11:12:18 ID:99tCC+XJ0
USBメモリなんて要らんし即捨てる。最初から付いてこないに等しい
つまり\0ではなくてnullだ
92,,・´∀`・,,)っ:2008/10/20(月) 17:13:25 ID:q/HMxPLJO
それはつまり積和算命令においてアキュムレート値に0を指定して乗算とみなすということですね。あなたは賢い。
93,,・´∀`・,,)っ:2008/10/20(月) 19:30:16 ID:q/HMxPLJO
あ、ちなみにEeePCとUSBメモリの話はたとえ話ですよ。
94名称未設定:2008/10/23(木) 00:37:53 ID:nnufksPm0
半導体製造装置オークションに大量出品の匿名企業、正体はインテル社か(2008/10/22)
http://eetimes.jp/article/22478/


                   ,'⌒,ー、           _ ,,.. ,
                 〈∨⌒ /\__,,..  -‐ '' " _,,. ‐''´
          〈\   _,,r'" 〉 // //     . ‐''"
           ,ゝ `く/ /  〉 /  ∧_,. r ''"
- - - -_,,.. ‐''" _,.〉 / /  . {'⌒) ∠二二> -  - - - - - -
  _,.. ‐''"  _,,,.. -{(⌒)、  r'`ー''‐‐^‐'ヾ{} +
 '-‐ '' "  _,,. ‐''"`ー‐ヘj^‐'   ;;    ‐ -‐   _- ちょっくら入札しに行ってくる
 - ‐_+      ;'"  ,;'' ,''   ,;゙ ‐-  ー_- ‐
______,''___,;;"_;;__,,___________
///////////////////////
95,,・´∀`・,,)っ-●◎○:2008/10/24(金) 01:42:23 ID:S/rLQ15J0
Larrabeeはシュリンクを待たずにいきなり48コアなんて噂浮上
http://northwood.blog60.fc2.com/blog-entry-2380.html


これが本当なら32コアで300Wなんてアホみたいな噂は嘘だったことになるな
(300WはPCIeの上限)

もしくはnVIDIA/ATIの40nm GPUに対抗するために32nmを前倒ししてきたのか?
まあ、40nmって言ってもバルクじゃたかが知れてるが。
96名称未設定:2008/10/24(金) 15:18:25 ID:iJHIvs/D0
97名称未設定:2008/10/24(金) 19:56:24 ID:nPRTSrj+0
>>95
FUDzillaの元ソースをみてみろ。
It looks like the first version of Larrabee is supposed to be a
graphics chip with 48 cores, and not with 80 cores as most originally expected.
今まで80コアだと予想されていたが、48コアで残念だってw
電波ですね。いまだにPolarisと勘違いしてやがる。
98MACオタ>97 さん:2008/10/24(金) 21:00:51 ID:30ap5gPo0
>>97
それ以前に、未だに"FUD"zillaの腐れルーマーを信じるヒトが存在すること自体が驚きす(笑)
99名称未設定:2008/10/24(金) 21:03:28 ID:nPRTSrj+0
FUDzillaはね、元ソースはいいみたいなんだが、
ライターがものすごい馬鹿で勘違いが多いからどうしようもない。せっかくの情報が台無し。
2chの平凡な名無し以下だねぇ。
100MACオタ>99 さん:2008/10/24(金) 21:25:38 ID:30ap5gPo0
>>99
  ---------------
  FUDzillaはね、元ソースはいいみたいなんだが
  ---------------
独自ソースの記事わ捏造す(笑)
101名称未設定:2008/10/24(金) 21:31:59 ID:nPRTSrj+0
元ソースというかソースの業界脈。
FUDzillaのフィルタ能力がないからむちゃくちゃになって出てきてるだけ。
102,,・´∀`・,,)っ-○◎●:2008/10/25(土) 01:31:15 ID:fUrTbkVn0
>>97
それ気づいたけど別スレにも書いたことだから
http://pc11.2ch.net/test/read.cgi/jisaku/1217915128/247

北森の人も英語は弱いっぽいのであまりあてにしていない
103名称未設定:2008/10/25(土) 01:32:47 ID:OOrGsk9c0
つまり48コアなんてのは信用にあたいしないってことね。
団子は信じ切っているようだが。
104,,・´∀`・,,)っ-○◎●:2008/10/25(土) 01:39:00 ID:fUrTbkVn0
ああ、べつに確信も否定もする気はないね。
ただどっちにしろ32nmまではnVIDIAよりは不利になるって情報ならあった。
積和算のクロック数が4クロックだから加算のレイテンシは1クロックだなんて言う人間のいうことほど
信用できないものはないよ。
105名称未設定:2008/10/25(土) 01:40:59 ID:OOrGsk9c0
>いきなり48かよ!
>16-32コアで順当に攻めると思ってた俺
最初はちょっと信じちゃってただろw このノリ
106,,・´∀`・,,)っ-○◎●:2008/10/25(土) 01:49:30 ID:fUrTbkVn0
さあ、消費電力に言及してる資料あったしな。
それ以上にもそれ以下にもならないんじゃない?

32nmのWestmereが出るような時期に45nmプロセスでスタートと言われてる。
減価償却終わってるから、でかいダイで出しても問題ないってことだろうな
しかしCeleron作るのとどっちが儲かるんだろうな?
107名称未設定:2008/10/25(土) 03:23:11 ID:a4obVWfZ0
1stシリコンがない状態で誰もかれもが好き勝手言ってきたわけで、信用するとか以前の問題。
スケーラブルな設計なはずだし、市場動向を睨みつつ中の人が任意に決定するとしか言いようがない。
108名称未設定:2008/10/25(土) 12:18:42 ID:OOrGsk9c0
>>106
つまり団子さんは48コアの可能性濃厚とみているわけですね。
おれ的には予想より少ないコア数ででてみんな罵倒モードにはいるとみていますが。
109,,・´∀`・,,)っ-●◎○:2008/10/25(土) 15:02:12 ID:fUrTbkVn0
いいや、俺個人としては45nm版は32コアで、48コアが拝めるのは32nmじゃないかと思ってる。

メインストリーム製品コアの増加比率的に。
45nm で 4コア
32nm で 6コア
22nm で 8コア



もちろん、45nmで48コア、32nmで80コアでもほぼ比率どおりなんだけども。
48×1.5=72

ただ、製品のラインナップは多いに越したことは無いから
やれるならやればいいんじゃないの?
110名称未設定:2008/10/25(土) 17:41:28 ID:OOrGsk9c0
おれは素直に10〜16コアだと思うね。
16コアが限度。32コアはお花畑過ぎる。
1年後には罵倒モードの団子さんがみられますね。
111,,・´∀`・,,)っ-●◎○:2008/10/25(土) 21:59:22 ID:fUrTbkVn0
コア数だとかピークFLOPSは本質ではないな
端からGPUだとは思ってないし、CPUに統合されるまではただの露払い。

誤答宏茂の言うようにLarrabeeのSIMD命令が「将来のCPUで使われる拡張」
という位置づけが正しいとして

いつまで不自由させる気だ?ってのは気になるな
ビット単位のNOTで2オペレーションかかるとかさw
いい加減NANDなりNORなりサポートしようよ。
コンピュータの論理素子で一番単純なものを辿っていくとNANDかNORに
たどり着くことくらい素人でもわかるのに、なんでこの会社はMMXが出てから
10年も放置し続けてるのかね。汎用レジスタ側ではNOTやNEG命令使えるのに。

Cellが駄目なのは、既にOpcode空間に余裕が無いから。
倍精度を高速化したらあと何もやれることないだろ。
性能がおっつかなくなったら使い捨てる気丸出し。

MMX/SSEは、やれるのに放置してるのが気に入らない。
別にpcmpeqb + pxorでもいいんだよ。
ただSIMDユニットが1基しかないプロセッサではやらせないでくれ


どうだ、つまんねーだろ
112名称未設定:2008/10/25(土) 22:42:42 ID:OOrGsk9c0
団子さんはLarrabeeに期待しているのか期待していないのかよくわからないですね。
LarrabeeはLNIとメニーコア周辺のテストをIntelが早めにやりたいってだけってのは同意。
単純にGPUと比較してどうたらの記事は飽きた。
113名称未設定:2008/10/25(土) 22:45:16 ID:OOrGsk9c0
最近の誤答さんの記事は、
・GPUのGPGPU化とLarrabeeの方向性
・新しい低消費電力コアの秘密(インオーダーとポラックの法則)
の2ネタの無限ループだしな。
114名称未設定:2008/10/25(土) 23:14:35 ID:OOrGsk9c0
http://www.geocities.jp/andosprocinfo/wadai08/20081025.htm
>常識的に見て「一方的に離婚」と[アバター消し」のどっちが悪い行為なんでしょうかね。
>それに,こんなケースに税金使うのも勿体無いような気がします。
くだらない事件だとは思うが、アバター消しの方が悪いに決まってるだろっ。
IDとパスワード使って進入して、故意にデータ削除に近いことやってるんだからさあ。
115MACオタ:2008/10/25(土) 23:15:17 ID:/cZfg5+80
今までSIMDの幅が128-bit程度に留まっていた理由わ、ちゃんとアルす。
 ・ベクトル長を増やしても用途が広がらない
 ・タスクスイッチのオーバーヘッドが増える
汎用プロセッサにLRB (intelわLNIでわ無く、LarrabeeのISAをこう呼んでいるす)が採用されるかわ、
疑問す。まして単なるAVXのワイド版だとすれば、必要性すら皆無かも。。。
116名称未設定:2008/10/25(土) 23:22:02 ID:OOrGsk9c0
>汎用プロセッサにLRB (intelわLNIでわ無く、LarrabeeのISAをこう呼んでいるす)が採用されるかわ、
>疑問す。
まこたんわかってないね。確定ではないとはいえ、Intel CPUがどういう方向に進化しようという
流れなのか理解できてない。団子先生に説明してもらわないと。。。

> ・ベクトル長を増やしても用途が広がらない
> ・タスクスイッチのオーバーヘッドが増える
これは一般的すぎる。Intel特有のこだわりにはみえない。
117名称未設定:2008/10/25(土) 23:23:00 ID:OOrGsk9c0
>まして単なるAVXのワイド版だとすれば、必要性すら皆無かも。。。
こっちの方ね。わかってない。
118,,・´∀`・,,)っ-●◎○:2008/10/25(土) 23:46:56 ID:fUrTbkVn0
x86は論理レジスタ本数は少ないほうなんだけどね。

コア数が増えていくならコンテクストスイッチの頻度は相対的に減るから
そこにSIMD拡張に費やす余地が出てくる。

多コア化を推し進めるほどシングルコア性能を向上させ続けることができる
って面白い話だと思わんかね?
119,,・´∀`・,,)っ-●◎○:2008/10/25(土) 23:54:10 ID:fUrTbkVn0
つーかSIMDの幅を増やす場合、LSUで一度にストアできるビット数も増えることになるから
コンテクストスイッチの時間的に大きな問題になるとは思えんのだがな。

それとも何か?
Sandy BridgeのAVXがネイティブ256ビットではなくて128ビット×2って事実を認める気になったのかな?
Loadは2本だから安心しろよ。128ビット幅だけど。
120名称未設定:2008/11/06(木) 21:07:42 ID:oKRRJ3qZ0
ho
121名称未設定:2008/11/13(木) 21:39:21 ID:uYgQ1Hzm0
ze
122名称未設定:2008/11/20(木) 19:16:52 ID:O5PoN1Ej0
m
123名称未設定:2008/11/22(土) 03:20:45 ID:nyf5uIV/0
連休が近くなると,MACオタが元気になる気がするのですが,これはど
124名称未設定:2008/11/28(金) 22:30:43 ID:clGGZJre0
頭脳放談 第102回 「Core i7」の面を見れば……
http://www.atmarkit.co.jp/fsys/zunouhoudan/102zunou/corei7.html
125名称未設定:2008/11/28(金) 23:56:53 ID:c4mbtITH0
Massaさん、面白い話が書けなくなってきたなあ
残念
126名称未設定:2008/12/06(土) 14:14:01 ID:Vjs45hM70
ho
127名称未設定:2008/12/14(日) 21:21:03 ID:6aiL+7bg0
ze
128名称未設定:2008/12/22(月) 21:46:55 ID:xpR/Ra7nO
129名称未設定:2008/12/23(火) 12:27:54 ID:rOoYHhsJ0
もう落としていんじゃね?
130名称未設定:2008/12/28(日) 19:07:59 ID:pRD9mmbq0
ho
131MACオタ:2008/12/28(日) 20:14:28 ID:djpEikQ70
一応、2ちゃんねるの管理的にわ『保守わ荒らし』す。
http://www.media-k.co.jp/jiten/wiki.cgi?%A1%E3%A4%DB%A1%E4#i32
でも保守荒らしのヒトが、それで反省した例も無いすから彼らが飽きるまで放置するしか無いす(笑)
132名称未設定:2008/12/28(日) 21:28:54 ID:IA+OxsQu0
良いお年を
133名称未設定:2009/01/06(火) 01:39:02 ID:wgCWHbwp0
明毛尾目
134名称未設定:2009/01/13(火) 20:02:33 ID:jF9qZ7xe0
ho
135ころしやまん ◆snOWCRs4I2 :2009/01/13(火) 21:48:34 ID:gAF8aAmZ0

136,,・ ∀ ・,,)っ-○◎○:2009/01/20(火) 23:40:04 ID:wOuIW6B10
ここが噂のMACオタ先生が放置完全宣言決め込んだスレか。
むしろ過ごしやすく、快適になったとのではないかと期待してみる手素津。
137,,・´∀`・,,)っ-●◎○:2009/01/22(木) 02:50:50 ID:EcCWQxd/0
MACヲタのコピペはウザイのは同意。
読みたい奴に読ませたいならブログにでも書きやがれです。
所詮やってることはSPAMと同じ。
138,,・ ∀ ・,,)っ-○◎○:2009/01/25(日) 14:48:16 ID:bJndmWs60
最長寿Intelスレの表スレが落ちたままだな
まあ、このままなくなってくれても全然かまわんのだが
139名称未設定:2009/01/29(木) 22:03:06 ID:Z+u7UWQO0
ho
140名称未設定:2009/02/06(金) 00:17:29 ID:9M1rglFp0
眉なし団子が病気にかかったみたい
141,,・ ∀ ・,,)っ-○◎○:2009/02/06(金) 00:21:11 ID:uyuWahBF0
かなり苦しいですw
142,,・´∀`・,,)っ-●◎○:2009/02/11(水) 14:19:17 ID:tSOMH7TM0
いっぺん氏んでみる?
143,,・´∀`・,,)っ-●◎○:2009/02/11(水) 22:00:34 ID:tSOMH7TM0
>例えばx86 ISAわ、浮動小数点の積和演算命令を持たないすけど、この結果HPC分野でわLinpackでのピーク
>性能が劣るという理由で選択から外れたりすることがあるす。

144名称未設定:2009/02/16(月) 22:15:03 ID:5Z19wUSR0
ze
145名称未設定:2009/02/25(水) 00:41:29 ID:RAcNtJD20
m
146名称未設定:2009/02/25(水) 22:59:26 ID:VWV9mOc30
頭脳放談 第105回 不況のときこそ明日の技術へ投資せよ
http://www.atmarkit.co.jp/fsys/zunouhoudan/105zunou/sicrisis.html
147名称未設定:2009/03/07(土) 20:38:56 ID:SbDAuR7k0
ho
148名称未設定:2009/03/09(月) 20:18:15 ID:MMrppieI0
68. x86 プロセッサの将来 (2009/2/28)
http://jun.artcompsci.org/articles/future_sc/note069.html

死ぬ気で使えるようにするのか?諦めるのか?
http://www.ne.jp/asahi/comp/tarusan/main204.htm
149名称未設定:2009/03/14(土) 15:36:05 ID:uz5RZgqm0
(2009 3/8 間違いの指摘と訂正の追加 3/13)
150名称未設定:2009/03/21(土) 09:05:22 ID:WrLlCy9u0
ze
151名称未設定:2009/03/30(月) 21:28:48 ID:I/tR6wwZO
andoさん復活祈願
152名称未設定:2009/04/09(木) 02:20:23 ID:3pK7bnE+0
m
153名称未設定:2009/04/14(火) 13:13:55 ID:eBNB2p7K0
Intel、同社製MLC SSD用の性能改善ファームウェア
http://pc.watch.impress.co.jp/docs/news/20090414_125340.html
154 ◆ILoveinTcg :2009/04/15(水) 03:01:43 ID:Oz70AZbE0
テスト
155チラシの裏:2009/04/16(木) 03:07:50 ID:tG/4M6wd0
今更表スレに上がってた論文を読んだ....

DX9世代のゲームなら10コア@1GHzで十分実用的な感じ(7950GT〜X1950 XTX位?)だが.....

今のGPUだとどの位なのかがわからねーから意味ないな


まあ〜LarrabeeがGPUとして全く使い物にならないという悲惨な事態にはならなさげ
156チラシの裏2:2009/04/17(金) 02:32:49 ID:n0Oo2o+40
んでまあLarrabeeの性能をもちっとわかりやすく見積もりたいのだが

わかってるのは

http://en.wikipedia.org/wiki/Larrabee_(GPU)
>Graphs show how many 1 GHz Larrabee cores are required to maintain 60 FPS at 1600x1200 resolution in several popular games.
>Roughly 25 cores are required for Gears of War with no antialiasing, 25 cores for F.E.A.R with 4x antialiasing, and 10 cores for Half-Life 2: Episode 2 with 4x antialiasing.

ようするに

hogeというゲームを1600x1200 4xAAで遊ぶ場合
xxコア@1GHzで最低フレームレートが60になりますよ

ってこと


だがビデオカードのレビューでは大概最低フレームレートなんか測定してない
困った

仕方が無いからグラフに定規を当てて平均フレームレートを出してみた...
//高校の物理でやるあれ....

めんどいのでやるのはF.E.A.R.だけにしよう....

平均フレームレートは...114ぐらい....か?

この辺りと比較してみる....
http://pc.watch.impress.co.jp/docs/2008/0707/graph07.htm

Larrabee-25C@1GHzはGeforce 9800 GTX+を明確に上回るけどGeforce GTX 260と比較すると少し劣る?
157名称未設定:2009/04/17(金) 17:47:05 ID:Ar5MVeP50
Larrabeeは性能でなく,その表現力で競う物になるだろう。
158OOO-⊂(´∀`旦⊂☆諫碕:2009/04/17(金) 20:28:57 ID:/hlmiwyC0
最近の自作板の流れをみていると、反吐がでるよね。
LRBのリリース一年以上前の大本営ネタを拡大解釈して持ち上げ過ぎ。
未だにターゲットクロックやコア数の全貌もみえない。
IDFのウエハも試作研究チップレベルでごまかしてても全然おかしかないが。
例のスケーラビリティのグラフも未だにシミュレーションって下に注釈書いてあるんだだわ。
今までさんざんIntelに釣られてきたのに全く反省がないな。
ぼかして釣ってるだけのLarrabeeネタは有害だと思います。
GPGPUの対抗馬だって話題性とりたいだけだっての。
HPCならそこそこ使えるかもしれんが。
159OOO-⊂(´∀`旦⊂☆諫碕:2009/04/17(金) 20:32:09 ID:/hlmiwyC0
シリコンってだけならPolarisもとっくにウエハ展示されてた罠。
IDFのウエハ、対象配置のPolarisx2や、Becktonと縦横のダイ個数が同じなのも気になるわ。
160名称未設定:2009/04/17(金) 21:00:03 ID:owdxAf6k0
>未だにターゲットクロックやコア数の全貌もみえない。

Intelがダンマリ決め込んでいるのだから当たり前。

>IDFのウエハも試作研究チップレベルでごまかしてても全然おかしかないが。
IDFでウェハと量産開始時期が出る前はこんなこと言ってるのに。

668 名前:---⊂(´∀`旦⊂☆諫碕[sage] 投稿日:2009/03/27(金) 21:18:08 ID:N+VRP1rM
http://game.watch.impress.co.jp/docs/series/3dcg/20090325_79920.html
後藤じゃないけど、Larrabeeってまだリリース時期未定やってんの?
失敗作の予感がしてきた。
>期待されている、「GPUキラー」の異名を取るIntelのCPU/GPUハイブリッドプロセッサ
>「Larrabee」もDirectX 11に対応すると見られるが、こちらもリリース時期は不透明だ。
>なお、Larrabeeについては、GDC2009会期中に関連セッションについてレポートする予定なので、
>続報に期待していただきたい。

>例のスケーラビリティのグラフも未だにシミュレーションって下に注釈書いてあるんだだわ。
スライド使い回しなんて特に珍しくも何とも無い。

>シリコンってだけならPolarisもとっくにウエハ展示されてた罠。
x86ではない非商用のチップが何か?

>IDFのウエハ、対象配置のPolarisx2や、Becktonと縦横のダイ個数が同じなのも気になるわ。
病院逝け。
161OOO-⊂(´∀`旦⊂☆諫碕:2009/04/17(金) 21:06:30 ID:/hlmiwyC0
>ダンマリ決め込んでいるのだから当たり前。
Intelは性能を推測されると不味いからわざと性能が類推されるような情報は
全て隠蔽しているのだよ。コア数やクロックだけじゃなくてね。

>IDFでウェハと量産開始時期が出る前はこんなこと言ってるのに。
その書き込みがどうかしたか?
リリース時期に決定的な情報は未だに出てないぞ。
2009年末から2010年頭なんてとりあえず逃げ口煎ってみただけのレベルだ。
元は2008年〜2009頭とかそんなもんだったが。ルーマー初心者君よ。
GPUの世界で1年も遅れたら死んだも同然の糞チップですよ。

>シリコンってだけならPolarisもとっくにウエハ展示されてた罠。
>x86ではない非商用のチップが何か?
意味わかってねーのにレスつけんな。
試作研究レベルでもウエア起こすんだから、代わりにLRBの研究と称して
ウエアみせるくらいは普通にありうる。

>IDFのウエハ、対象配置のPolarisx2や、Becktonと縦横のダイ個数が同じなのも気になるわ。
>病院逝け
無知は消えろ(わらぃ
162名称未設定:2009/04/17(金) 21:18:20 ID:owdxAf6k0
>リリース時期に決定的な情報は未だに出てないぞ。
>2009年末から2010年頭なんてとりあえず逃げ口煎ってみただけのレベルだ。
期間に直せば3ヶ月程度。これ以上細かい粒度で時期を指定するとかそうそう無いから。

>元は2008年〜2009頭とかそんなもんだったが。ルーマー初心者君よ。
>GPUの世界で1年も遅れたら死んだも同然の糞チップですよ。
ルーマー上級者の方はLarrabeeのコア数に関する噂が、
16〜24, 24〜32, 48と(或いはもっと多様に)変化していることを知らないのですね。
2008年〜2009頭に予定していた仕様で登場すると思っているのですね。

>試作研究レベルでもウエア起こすんだから、代わりにLRBの研究と称して
>ウエアみせるくらいは普通にありうる。
ハイエンド向け製品のウェハだとCEOが明かしたばかり。
ルーマーばっかじゃなくてたまには財務の記事も読め。
163OOO-⊂(´∀`旦⊂☆諫碕:2009/04/17(金) 21:22:46 ID:/hlmiwyC0
まあ、おれは結果勝負だから別に1名無しとの議論の行く末なんてどうでもいいがね。
モノが出てみてから再び意見なり感想なりを書き込んでくれや。
Intel次世代CPUスレはPrescott以前の妄想モードに戻りつつあるかな。
164OOO-⊂(´∀`旦⊂☆諫碕:2009/04/17(金) 21:25:27 ID:/hlmiwyC0
とかいってるとモノがでてこないまま、プロジェクトがあぼ〜んしてみたり。
165名称未設定:2009/04/17(金) 23:54:29 ID:AKJLBmHI0
Larrabeeに最適化した(Pixomatic+)Quakeで
従来のx86CPU(C2Q、i7等)で走らせた時と比較してLarrabeeはこんなに速い!
というデモンストレーションを次のIDFでかまして巷の失笑を買う予定
166チラシの裏3 >>155-156:2009/04/18(土) 00:40:37 ID:biOfv1gm0
F.E.A.R.だけってのも味気ないのでやっぱりHalf Life 2 episode 2も定規で測ってみる....

平均フレームレートは78ぐらい....?

この辺りと比較してみる....
http://pc.watch.impress.co.jp/docs/2008/0910/graph11.gif

Larrabee-10C@1GHzはRadeon HD 4670とはいい勝負だけどGeforce 9600 GTとは競合できない?


//誰も居ないと思っていたらなんか伸びてて驚いた...
//
//有名な固定さんがきてたのかしら.....
167チラシの裏4:2009/04/18(土) 00:49:36 ID:biOfv1gm0
まとめてみる
//性能が高い順にソート


F.E.A.R.

Geforce GTX 260      715 GFlops
Radeon HD 4870       1200 GFlops
Larrebee-25C@1GHz  800 GFlops
↑明確な差異↓
Geforce 9800 GTX +   705 GFlops
Radeon HD 4850      1000 GFlops


Half Life 2 episode 2

Geforce 9600 GT     208 GFlops
↑明確な差異↓
Larrebee-10C@1GHz  320 GFlops
Radeon HD 4670       480 GFlops



GPUの性能が2年で3倍になると仮定した場合...

ハイエンド Larrebee-40C@2GHz  ミッドレンジ Larrebee-16C@2GHz

このぐらいで出せばx86 many-coreはGPUとしても普通に競争力を持てるはず.....
168名称未設定:2009/04/18(土) 01:10:42 ID:biOfv1gm0
x Larrebee
○ Larrabee
169チラシの裏5:2009/04/19(日) 01:55:39 ID:PYj8khDY0
更に今更の話を続ける...

どうやらLarrabeeのグラフィックスパイプラインは特定のAPIに依拠しないらしい....

DirectXでもOpenGLでも書けるが普通のC++で書けるようだ....

門外漢なのでDirectXやOpenGLじゃなくてC++だと具体的に何が嬉しいのかわからないが表現力が増すらしい....

物理演算やリアルタイムレイトレーシングを含む次世代のゲームエンジン....
つまり汎用プロセッシングと旧来的なグラフィックスプロセッシングとシームレスな開発環境....?


よくわからんことは横に置いて考える....とりあえずIntelツールは魅力的に見える

特にThreading Building Blocksによるスケーラビリティの確保はコードの資産価値を引き上げるだろう....
これとCtの出来はIntelの将来を左右すると思っている....個人的に


なんだかこの記事みたいな内容になってしまった...
http://pc.watch.impress.co.jp/docs/2008/1225/kaigai482.htm
170名称未設定:2009/04/19(日) 02:29:00 ID:6UwP81XE0
P54Cの表現力にご期待
171,,・´∀`・,,)っ-○○○:2009/04/21(火) 05:34:45 ID:K7yh5+Kd0
P54Cの現役時代には既に事務処理(整数演算)のPentium、
アート(浮動小数)のPowerPC(Mac)なんて言われてたがな。
垂直方向の演算密度の高さはCISCの【性能面での】アドバンテージですよ。

一方、浮動小数がふるわなかったのはそれこそスタックマシンベースのISAだったから、
これに尽きるのだが、Larrabeeでは512ビットのSIMDレジスタ32本と、インオーダ・2issueのコアとしては
パワーバランス崩壊級の厨性能を誇ります。

てか、これGPUだと思う?
GPUで多倍長演算とか多用するような分野は知らないよ。
これはまちがいなくGPUである以前にスパコン向けアクセラレータ。
トップ500寡占状態を完成させる野望のためにあるようなプロセッサ。
172名称未設定:2009/04/21(火) 06:26:47 ID:IEmHD7lr0
最初のLarrabeeはGDDRらしいじゃん。HPC向けが本命ならECCメモリ位使うだろ。
エミュレートかその辺で済ませようなんて気合入ってない証拠。

>てか、これGPUだと思う?
GPUではない。GPUを否定する何か。
173名称未設定:2009/04/21(火) 07:36:52 ID:aedcnRSx0
P54CはGPUだよ。
だから以降のP6、netburst、merom、nehalemもGPUだよ。
http://www.radgametools.com/jp/pixofeat.htm
174チラシの裏6:2009/04/21(火) 21:05:04 ID:45frk9qZ0
今更Nehalem再考....

Nehalemでは前代のPenrynに様々な改良が加えられているわけだが...

・フロムスクラッチで全面Static Circuit化

ってのの意味が実はよくわかっていなかった....
ふと正解に近そうな理由を思いついたのでメモ....

 その理由は、「微細化の恩恵を受けるため」.....?

実はIntelの場合Merom(65nm)からPenryn(45nm)への光学シュリンクではプロセサコア部の面積は30%程度しか減っていない....

既にCMOSでは、熱密度のために、線幅を30%減らせばチップ面積が50%減る時代は終わっている....?

Intelがこれを問題視しなかったとは思えない....
苦労して微細化しても経済的なダイサイズではコア数は1.5倍にしかならないなんて....

そんなわけで熱密度を抑えるために全面Static Circuit化という大工事をやったんじゃないかと...

Nehalem(45nm)からWestmere(32nm)への光学シュリンクでプロセサコア部の面積が50%減るならば、
SandyBridgeは8コアでも案外ダイサイズはBloomfieldと変わらないのではないか?

1D-TorusならXbarと違って面積を喰わない....

ちなみにPOWER6も高クロックでぶん回すために熱密度の低いStatic Circuitを採用してたり....

そういえばNehalemでプロセサコア部に配置されたL2$は8T-SRAMだった...
ttp://www.sijapan.com/content/0508vol2/industry/industry_0508_1.html
> 同じくIBMは、32nm以降に向けてSRAMセルの安定性を6T-SRAMと8T-SRAMで比較検証し、
>トランジスタ数が2個増えるが8T-SRAMの方が、安定性がよく微細化に有効であると発表した。(8A-2)
175チラシの裏7:2009/04/21(火) 21:07:11 ID:45frk9qZ0
これに伴って予想ダイサイズもかなり小さくなる....

Westmereの250sqmm前後 を 200sqmm前後に下方修正
SandyBridgeの300sqmm前後 を 250sqmm前後に下方修正


NehalemはPenryn比だとプロセサコアがかなり大きく成っている.... しかし機能拡張は大人しめ....

やはりStatic Circuit化とL2$(8T-SRAM)統合に起因....?

上述した二つに加え、QPI, IMC, ATA, Turbo Boost, モジュラー設計, Power Gate.......
Nehalemで施された拡張は後の世代で役に立ちそうなものばかり....

やはりそういうことか...?

何れにせよIntelはプロセッサの開発競争で大きくリードしているように見える.....

それほどにNehalemで貯えた資産は大きい....
176名称未設定:2009/04/21(火) 22:20:40 ID:VEr0K0S50
Nehalemが大きな仕事であることは間違いない
でも「Nehalemで貯えた資産」という言い方はちょっと…

・大昔からシリアルバスやCSIの研究してたっしょ
・IMCはTimnaで経験してるでしょ
・Turbo Boostは元Foxtonでしょ、ハイファのEDATも下敷き
177名称未設定:2009/04/22(水) 01:39:06 ID:fJKnxz5U0
8T-SRAMとStatic Circuitはそれを採用せざるを得ないほど
消費電力が大きかったのかっていう感じを受けるな。
Power Gateはプロセス面から見てもかなり頑張ってるな。
将来有望。
178OOO-⊂(´∀`旦⊂☆諫碕:2009/04/26(日) 13:56:47 ID:9jBPBAqE0
Merom(Core2)が大電力と爆熱化の時代にうまくフィットしたってのは
確かにあるのだが、いかんせんPCオタクの世界でIsraelは過大評価されすぎている。
>>176の言うとおり、CSIはTukwilaだしTurbo BoostはIsraelの技術だが、
TimnaのIMCと、Intelの主力製品であるXeon/旧Pentium系、ノートを一気に
IMC/CSI化する大仕事はIsraelの開発力では対応できたかあやしいぜ。

オレゴンのP6, NetBurst, Nehalem
イスラエル、MMX, Tillamook, Timna, PenM/Merom
を比較するとオレゴンの方が明らかに大仕事しているのだが。
NehalemやNetBurstの方が大声ではいえないが、
技術的に前進している部分がおおく、中身や将来性よりも出たときのベンチレビューのスコアで
評価の優劣がきまるPCオタク界には評価されにくかったともいえる。
179OOO-⊂(´∀`旦⊂☆諫碕:2009/04/26(日) 13:58:17 ID:9jBPBAqE0
TimnaごときのIMC化と比較されてもこまるってことだな。
TimnaはAtomがIMC化するのと同レベルの話だわ。
失敗してもあまり痛くないしね。NehalemのCSI/IMCは失敗が許されんよ。
180OOO-⊂(´∀`旦⊂☆諫碕:2009/04/26(日) 14:00:30 ID:9jBPBAqE0
ちなみにFoxtonとTurbo Boostは確かに一見似ているが異なる技術だね。
181OOO-⊂(´∀`旦⊂☆諫碕:2009/04/26(日) 14:10:12 ID:9jBPBAqE0
イスラエルの実力はSandy Bridgeでどれだけ新しい技術を投入できるかを
みないと何ともいえないな。
Meromまでは先行するオレゴンの製品にP4バスやらSSE2/3をはじめ、
仕様を合わせる感じの開発だったが、Sandy Bridgeは新しいものをつくらいないといけないんで。
AVX以外に前進はあるのだろうか?
特に電気的な話になると米国チームには全然及んでない気がするのだが。
まあオタ受けねらうなら電気よりもアーキですが。
182名称未設定:2009/04/26(日) 14:13:44 ID:78wxbtxr0
はいはい
Netburstは技術的に前進して将来性が有りまくりでしたよね
183OOO-⊂(´∀`旦⊂☆諫碕:2009/04/26(日) 14:15:28 ID:9jBPBAqE0
もちろん電力や発熱を除けばね。
あまりにもイスラエルマンセーで、オレゴンが糞だとおもっている
厨房が増えすぎたのでつい愚痴ってしまったわ。
184名称未設定:2009/04/26(日) 14:23:52 ID:78wxbtxr0
4年ほどCore2のターンだったからそういう厨房が増えるのはしょうがない
安いii5やi3が普及してくればまた変わってくるさ
185OOO-⊂(´∀`旦⊂☆諫碕:2009/04/26(日) 14:40:52 ID:9jBPBAqE0
オレゴンはイスラエルよりも大仕事をしている分、失敗したときの衝撃も大きい。
サランタクララ/HPのIA64チームもそうだし、こりゃ当たり前のこと。
それが消費者騙しで誇大妄想の拡張をやって自爆Intelをピンチに追い込んだ
オレゴンチーム、というゆがんだ解釈につながった。それだけだな。
その後、結局Tukwilaより先にQPIを実装させて登場したNehalemの出来を見ても
オレゴンがIntelの中核チームであることに間違いはない。
186名称未設定:2009/04/26(日) 14:59:26 ID:U2fyDKvj0
>>184
3年位じゃね?
187OOO-⊂(´∀`旦⊂☆諫碕:2009/04/26(日) 15:07:34 ID:9jBPBAqE0
Core 2からまだ3年たってないんだな。
NetBurstの爆熱フィーバーが遠い過去の出来事のようにおもえるわ。
とはいえ、世の中ではNetBurstマシンがまだまだ腐るほど現役で使われているのだが。

Meromの成功評価はMCMの助けがあったのも大きいな。
クアッド以上のコアはMP用以外用意していなかったので、
MCMが無ければ4コア以上はAMDに遅れをとっていたかもしれない。
逆にMCMがあったせいでBloomfieldをはじめとするネイティブ4コア製品が
技術的に頑張ったわりに、いまいちインパクトを与えられない状況になってしまったわけだが。
188名称未設定:2009/04/26(日) 15:13:39 ID:U2fyDKvj0
いまのIntelは手抜きフェイズだがAMDがMCM12コアにDDR3-4chという自爆テロに出たので来年は少しは本気になるだろ
Beckton-DPの投入を予測しておく
189名称未設定:2009/04/26(日) 16:15:49 ID:7sweYQHn0
HT/QPIやIMCだとMCMすると大変そう
ホップ数もややこしくなるし
AMDはG34で力業するみたいだがIntelもMCMやるかなあ
190名称未設定:2009/04/27(月) 02:20:09 ID:SPeq9uPe0
空冷限界のTDPは両社ともそう変わらないんだし、
コアの電力効率が劣ってるのに、競合他社よりコア多く積んだら
TDPの上限をかなり上げない限り、
電力と熱でクロック上昇を妨げられ、シングルスレッド性能が酷く残念な
ハイエンドCPUが出来上がってしまうのでは?、という危惧。

32nmでintelが躓けば(AMDは躓かないという前提)面白くなるのかね。
191名称未設定:2009/04/27(月) 02:29:18 ID:x7hZ3DEe0
どうせハイエンドサーバー向けでしか出ない
シングルスレッド性能は下がるしコストも上がるので
そこはNehalem-EX(Beckton)が固めてるだろうし
そもそもコスト競争になったらAMDに勝ち目が無いってのは大分前に指摘した通り

また、AMDは早晩脱落するとしても
IntelはAtomやLarrabeeで自身の将来を切り開いて行かねばならない
192名称未設定:2009/04/28(火) 01:41:57 ID:E1cfOhSB0
Windowsの売上高が減少した原因はネットブック――マイクロソフト幹部が認める
ttp://www.computerworld.jp/topics/netbook/144209.html
193誤答:2009/04/30(木) 01:57:25 ID:Ta7q+mG10
ttp://pc.watch.impress.co.jp/docs/column/kaigai/20090430_167815.html
>  Intelの8コアハイエンドCPU「Nehalem-EX(Beckton:ベックトン)」はFB-DIMMインターフェイスを
> オンマザーボードのバッファチップを介してDDR3 DIMMをサポートする。コスト面ではAMDに利がある。
194名称未設定:2009/05/02(土) 06:59:31 ID:ubub/qtZ0
「Nehalem」プロセッサの実力を徹底検証する
驚異的な性能を示す新型Xeonプロセッサの魅力に迫る
http://www.computerworld.jp/topics/srv/144829.html
195,,・´∀`・,,)っ-○○○:2009/05/04(月) 18:21:16 ID:8HMR4CZP0
>>188
そうも思えないがな。
Many-Core、じゃなくてMagny-Coursはラインナップの空白を埋めるためだろう。

AMDとしてはWestmere無双状態はサーバ市場だけは食い止めたい。
196,,・´∀`・,,)っ-○○○:2009/05/04(月) 18:39:03 ID:8HMR4CZP0
Nehalem 1ソケット4コアでHT使えばShanghai 2ソケット8コア分の性能なんて言われる事態だからな
更にWestmereで6コアになり計24スレッドになる。
スレッド数だけは追いつかないと駄目だろ。
197名称未設定:2009/05/05(火) 06:37:04 ID:qFAa82aS0
スレッド数上げるのも良いけど、コア積み過ぎてクロック上げられなくなるんだから
どっちにしろヤヴァいのであ?
198名称未設定:2009/05/05(火) 08:10:36 ID:sZYe1Gl90
Niagaraもそこそこ売れてるしサーバーはそれでもいいんじゃねー?
しかしそのNiagaraを上回るスループットでTurbo Boostまで備えたNehalemは完璧としか言い様がないな
199,,・´∀`・,,)っ-○○○:2009/05/05(火) 17:52:05 ID:EvzAltmX0
TDP縛りがあるからコア数を積んだぶんクロックが上げられないってのは正しいが
クロック&電圧を7割程度に抑えれば、理屈の上では消費電力は1/3程度になり
同じTDP枠で3倍のコアを載せることができるようになる。

スレッド数で稼ぐってのは戦略としては十分アリだよ。
4コアは高クロック化でラインナップを充実させればいい。
しかし、負けるのが解ってても出さなきゃいけないことはあるんだね。

Paxvilleを出したときのIntelがこんな感じだ。
200名称未設定:2009/05/05(火) 19:05:00 ID:poX4wJ0s0
300平方mmを切るNehalem-EPに、400平方mm近いIstanbulで戦わざるを得ないってこところが
AMDの苦しいところだろうな。
最悪Magny-Coursですら、Gulftownに対して大きく性能を上回れないってことになりかねないし。
201名称未設定:2009/05/05(火) 19:33:40 ID:T/MjLTGc0
>最悪Magny-Coursですら、Gulftownに対して大きく性能を上回れない
大きく上回るどころか同等なら儲けもん。
6コアで2.4GHzなら12コアは2.0GHz程度。
理論演算性能でも66%しか上がらない。

Istanbul 2.4GHzのSPECint_rate_base2006は184
ttp://finance.yahoo.com/news/AMD-Offers-Glimpse-of-the-bw-15002136.html
Nehalem-EP 2.93GHzのSPECint_rate_base2006は240
ttp://www.spec.org/cpu2006/results/res2009q1/cpu2006-20090313-06653.htm

Gulftownは32nmプロセスだがIstanbul同様クロックが下がって30%しか性能が向上しなかった(製造プロセスとしては90nm Prescott級の失敗)と仮定しても、
184 * 1.7 = 312.8 (多めに見積もったMagny-Coursの性能)
240 * 1.3 = 312 (極めて悲観的に見積もったWestmere-EPの性能)

FB-DIMM2@4chに24MBのL3キャッシュを備えるBecktonが相手だとお話にならないであろうことは火を見るより明らか。
202,,・´∀`・,,)っ-○○○:2009/05/05(火) 20:15:01 ID:EvzAltmX0
ところで自作板にいるMACオワタ(ペニス)君の劣化具合がかなり酷いんだが。
技術的な話題になるとボロが出まくるのは昔からなのか?
203名称未設定:2009/05/06(水) 00:42:34 ID:OUVy38h00
>>199
> クロック&電圧を7割程度に抑えれば
今時電圧はそんなに下げられないよ
下げるとリーク電流がえらいことになる
204,,・´∀`・,,)っ-○○○:2009/05/06(水) 00:44:42 ID:NKsKejrK0
じゃあ電圧を9割強、クロック6割くらいかな。
まあ、ひどいことになるな。
205名称未設定:2009/05/06(水) 01:07:06 ID:ytJd2eQd0
>まあ、ひどいことになるな。
ワロタ
笑える状況じゃないんだが、なぜかワロタ
206名称未設定:2009/05/06(水) 01:13:27 ID:Kjx6YeSY0
|695 :,,・´∀`・,,)っ-○○○:2009/05/06(水) 00:01:31 ID:YebxnnTm
|ゲーム屋風情が偉そうに


ああ、そうだな。
(大企業iの)ゲーム屋風情(部門)が偉そうにするのも気に障るよな。

http://software.intel.com/sites/billboard/index.php
http://software.intel.com/en-us/articles/michael-abrash-biography/
http://software.intel.com/en-us/articles/tom-forsyth-bio/
http://software.intel.com/en-us/articles/quake-wars-gets-ray-traced/
http://www.projectoffset.com/
207,,・´∀`・,,)っ-○○○:2009/05/06(水) 03:30:54 ID:NKsKejrK0
どこでIntelが出てくるんだ?ww
208名称未設定:2009/05/06(水) 03:34:28 ID:7ZIGg+XY0
Intel様にケンカを売る団子
209,,・´∀`・,,)っ-○○○:2009/05/06(水) 03:34:36 ID:NKsKejrK0
> 650 名前:Socket774[sage] 投稿日:2009/05/05(火) 02:07:09 ID:DxOnYt1N
> >>642
> WWSの内情について知らないのがはっきりした。良かった。
>
> 652 名前:Socket774[sage] 投稿日:2009/05/05(火) 02:19:37 ID:DxOnYt1N
> そうだね。GDC来ればよかったのにね。
>
> 694 名前:Socket774[sage] 投稿日:2009/05/05(火) 23:59:56 ID:DxOnYt1N
> ほんと超一級の揚げ足取りだな

こいつだろ

IntelにWWSなんて部門はないよ。ソニーのPS部門にはあるけど
210,,・´∀`・,,)っ-○○○:2009/05/06(水) 03:41:02 ID:NKsKejrK0
本人たちにしかわからないアナグラムを仕込んで応酬を繰り広げてるので
一介のMac使いにすぎないおまいらにやり取りの意味がわかるわけがねぇ
211名称未設定:2009/05/06(水) 06:53:20 ID:sEHrBwfw0
212名称未設定:2009/05/08(金) 03:01:42 ID:ONjcgzm+0
http://aceshardware.freeforums.org/itanium-aims-for-the-mainstream-t822.html
The real story of Tukwila is how it well it scales up in performance
at 8, 16, 32, and 64 sockets. A 4s Tukwila box may only be 2.5x-3x
better than a 4s Montvale box but a 64s Tukwila Superdome may
outperform the 64s Montvale Superdome by 4x-5x or more.


Itanium 9150M 1.66 GHz x16
1,354,086tpmC
http://www.tpc.org/tpcc/results/tpcc_result_detail.asp?id=108112401

Itanium 9150M 1.66 GHz x32
2,382,032tpmC
http://www.tpc.org/tpcc/results/tpcc_result_detail.asp?id=108120401

Itanium 9050 1.60 GHz x64
4,092,799tpmC
http://www.tpc.org/tpcc/results/tpcc_result_detail.asp?id=107022701

POWER6 5.0 GHz x32
6,085,166tpmC
http://www.tpc.org/tpcc/results/tpcc_result_detail.asp?id=108061001
213名称未設定:2009/05/08(金) 23:12:40 ID:b96YzYYX0
The Core 2 Quad Q8400: Intel's $183 Phenom II 940 Competitor
http://www.anandtech.com/cpuchipsets/intel/showdoc.aspx?i=3559&p=1

インテルとノベル、モバイル機器向けOS「Moblin」の推進で協力
http://japan.cnet.com/mobile/story/0,3800078151,20392798,00.htm
214名称未設定:2009/05/09(土) 13:15:05 ID:J0Xs5Dm50
x86でのIntegrated Memory ControllerはマジでIntelが元祖だったらしい・・・
ttp://www.cpu-world.com/CPUs/80386/
>80386SL - low-power microprocessor with power management features, with
>16-bit external data bus and 24-bit external address bus.
>The processor included ISA bus controller, memory controller and cache controller.
215名称未設定:2009/05/11(月) 01:26:58 ID:MzhiD89l0
216OOO-⊂(´∀`旦⊂☆諫碕:2009/05/13(水) 21:46:07 ID:fQy4e05I0
謎の新x86チップ、Xcore86。
妖しいの大好き。

713 :[Fn]+[名無しさん] [↑] :2009/05/13(水) 21:13:56 ID:CsL/jUtu
Gecko EduBookに乗ってるXcore86ってやつは、
ttp://xcore.weebly.com/technology.html
ttp://www.vortex86dx.com/
IntelやAMDに対抗するもんじゃないとは書いてあるが、
これって実際実力はどんなモンだろうね。
他に採用ノートが見つからないし。
217名称未設定:2009/05/13(水) 21:49:04 ID:fsZZzXwq0
218OOO-⊂(´∀`旦⊂☆諫碕:2009/05/13(水) 21:56:29 ID:fQy4e05I0
>>217
なんだmP6の系譜か。
219OOO-⊂(´∀`旦⊂☆諫碕:2009/05/13(水) 22:05:41 ID:fQy4e05I0
http://www.legitreviews.com/images/reviews/726/die_overlay.jpg
GTX280のダイを改めてみて思った。
テクスチャユニットの面積比が極端に小さいあいつは
RGPとしての性能は考えちゃいないんだと。
220OOO-⊂(´∀`旦⊂☆諫碕:2009/05/13(水) 22:18:27 ID:fQy4e05I0
通常、GPUの構成はレンダリングパイプの処理を滞りなく行うため、
一般的なゲームグラフィックスアプリでネックが発生しないようにリソースがバランス
されている。
従って、テクスチャユニットのスループットが明らかになれば
そのままRGPとしての性能をほぼ推し量ることができる。
Larrabeeは最近のIntelチップにしては、I/O類やキャッシュも目立たない。
本心はHPC向けの設計なのか、演算器異常特化でTflops級を何が何でも出したいだけだったのか。
いや、おれの予想が良い方向に見事にはずれることに期待していますがね。
221名称未設定:2009/05/15(金) 00:13:04 ID:8Hv+adcI0
69. GRAPE-DR の HPL 実効性能 (2009/5/9書きかけ)
70. 次世代スーパーコンピューター計画見直し (2009/5/14)
222名称未設定:2009/05/16(土) 09:51:16 ID:l8wOeGFa0
>>220
>通常、GPUの構成はレンダリングパイプの処理を滞りなく行うため、
>一般的なゲームグラフィックスアプリでネックが発生しないようにリソースがバランス
>されている。
実はこれはマヤカシだというのがLarrabee: A Many-Core x86 Architecture for Visual Computingで指摘されているわけだが
223OOO-⊂(´∀`旦⊂☆諫碕:2009/05/16(土) 14:17:12 ID:dC0nnAgF0
まやかしなんて書いてないだろ。
それとは別にLarrabeeは各レンダリングパイプ上の処理をソフトウエアとプログラム性の高いコアで
動的ロードバランシングしながら処理出来るのから、リソースのバランスから大部分
解放されているのが売り文句のようだが、テクスチャユニットは固定機能でその例外なんだよ。
つまり、GPUもLRBも固定で持っているテクスチャユニット分量の比較で
およその性能が推測できるのことは変わらない。
224OOO-⊂(´∀`旦⊂☆諫碕:2009/05/16(土) 14:30:26 ID:dC0nnAgF0
LRBは、従来のGPUのプロセッサコアよりも汎用性が高くて、
ソフトでもっと柔軟に動的使い分けができるんだけど、
ダイをみると、LRBのプロセッサコアの面積比が異常におおきく、
テクスチャユニットの面積が非常に小さい。
柔軟性があっても面積が小さくできなけりゃ結果は意味ないよね。
テクスチャユニットの面積比の小ささは、ダイの大部分を占めるプロセッサコア
の面積あたりのスループットがRGP的処理をしている時に大したことがない
ということの証明なんだよ。
この結果を好意的に解釈した結果が、理論flopsを重視したマーケチング向け製品か、
RGPとしての用途なんて最初から考えてないってことだ。
225名称未設定:2009/05/16(土) 15:17:12 ID:l8wOeGFa0
>まやかしなんて書いてないだろ。
セッション5の4
"Our conclusion is that application dependent resource balancing is not sufficient."

>ダイをみると、LRBのプロセッサコアの面積比が異常におおきく、
>テクスチャユニットの面積が非常に小さい。
ttp://i41.tinypic.com/2hcdzja.png
この写真を見て言っているのだろうが32KBしかキャッシュを持たないはずのテクスチャユニットに
プロセサコア(と分析されている)部分より面積が広いSRAMの様なパターンがあるんだぜ
あまり当てにならないと考える
セッション3の5読めばわかると思うがプロセサコアと物理的な距離をあけたくないだろうし
テクスチャユニットはプロセサコア(と分析されている)部分に含まれていると予想
ちなみにRadeonとかGeforceのレイアウトもそんな感じ
226OOO-⊂(´∀`旦⊂☆諫碕:2009/05/16(土) 15:26:40 ID:dC0nnAgF0
>Our conclusion is that application dependent resource balancing is not sufficient.
やっぱここか。これ旧来のGPUに対していってるんじゃないぜ。
検討中のLRBに対して言ってるんだが。で、不十分だから柔軟にロードバランスできるようにscatter/gatherやら
bit-scanを追加しているって流れだぞ。

>SRAMの様なパターンがあるんだぜ
その画像の分析がどこまであてになるかは確かにあやしいが、
おれにはSRAMの様なパターンには見えないね。
227OOO-⊂(´∀`旦⊂☆諫碕:2009/05/16(土) 15:31:30 ID:dC0nnAgF0
>セッション3の5読めばわかると思うがプロセサコアと物理的な距離をあけたくないだろうし
これソフトのブロック図だぞ(わらぃ ハードの物理的レイアウトとは何の関係もない。
ついでにブロック図ってのはハードにしろ接続が示してあるだけで、物理的な配置とは関係ないぜ。
関係ないからこそ図の意味がある。
228OOO-⊂(´∀`旦⊂☆諫碕:2009/05/16(土) 15:42:11 ID:dC0nnAgF0
>ちなみにRadeonとかGeforceのレイアウトもそんな感じ
>>219
http://img.hexus.net/v2/graphics_cards/ati/4850X/Die.png
229OOO-⊂(´∀`旦⊂☆諫碕:2009/05/16(土) 15:45:51 ID:dC0nnAgF0
ああ、なんだ図の方じゃないのか。
まあ、図1をみればテクスチャユニットがRingバス上にぶらさがってるのがわかるね。
230名称未設定:2009/05/16(土) 16:51:31 ID:l8wOeGFa0
>>Our conclusion is that application dependent resource balancing is not sufficient.
>やっぱここか。これ旧来のGPUに対していってるんじゃないぜ。
>検討中のLRBに対して言ってるんだが。で、不十分だから柔軟にロードバランスできるようにscatter/gatherやら
>bit-scanを追加しているって流れだぞ。
え?

>>ちなみにRadeonとかGeforceのレイアウトもそんな感じ
>>>219
>http://img.hexus.net/v2/graphics_cards/ati/4850X/Die.png
ああうん
これは間違っていたかも


>その画像の分析がどこまであてになるかは確かにあやしいが、
ところで、Larrabeeのテクスチャユニットの面積はどの程度が最適なのだろうか
RV770とGT200を見ているとあまり面積を割いてないRV770でも戦えているようだが
231名称未設定:2009/05/17(日) 11:19:40 ID:zVHpXr4Z0
AMD shrugs off Intel cross-licensing threat
ttp://news.cnet.com/8301-1001_3-10242421-92.html

もうほとんど忘れていた話だが期限は今日までだったらしい。
近日中に出るであろうIntelのプレスリリースに注目が集まる。
232名称未設定:2009/05/17(日) 12:10:53 ID:fSxqUSJD0
EU独禁法違反でそれどころじゃないお!
233名称未設定:2009/05/17(日) 12:31:27 ID:zVHpXr4Z0
インテルCEO、制裁金14億4,000万ドルに強く反論
ttp://www.computerworld.jp/topics/legal/145570.html
ttp://www.computerworld.com/action/article.do?command=viewArticleBasic&articleId=9133060
これか。

/.jのコメント。笑った。
ttp://slashdot.jp/articles/09/05/14/0456224.shtml
>なるほどこれがEUの景気対策ですか
234,,・´∀`・,,)っ-○○○:2009/05/18(月) 00:02:10 ID:sslgF7jt0
まあおちつけクソ共

スカラ版とベクトル版両方が用意されてるビットインターリーブやフィールド挿入なんかの演算は
基本的にアドレス・オフセット生成用だな
235名称未設定:2009/05/18(月) 00:25:05 ID:HtL6ETbHO
よう、クソ
236名称未設定:2009/05/18(月) 01:14:42 ID:z+Ltl92o0
EUのタカリ商売
237名称未設定:2009/05/18(月) 01:26:56 ID:tewePpJv0
日本にも言いたいがアメ企業が気に入らないなら国内企業にちゃんと梃入れしろ
京速とか制裁金とか対応が半端すぐる
238,,・´∀`・,,)っ-○○○:2009/05/18(月) 01:59:35 ID:nCvsfnBM0
京速って神戸だったよな


神戸大や阪大あたりもしばらく休校らしいね。
239名称未設定:2009/05/20(水) 06:31:22 ID:urVaIXEQ0
Nikon: EUV program alive and well
ttp://www.eetimes.com/news/latest/showArticle.jhtml;jsessionid=FC2ROOIRAWU5YQSNDLPCKH0CJUNN2JVN?articleID=217500676
EUVの導入は22nm以降、主流になるのは16nm以降

Intel's eight-core Nehalem-EX out next week
ttp://www.theinquirer.net/inquirer/news/1137401/intel-core-nehalem-ex
Istanbulに対抗してPaper Launchか?
IstanbulもPaper Launch臭いが

Intel previews Atom 'Pineview' chip, Linux OS
ttp://news.cnet.com/8301-13924_3-10244721-64.html

Intel "Medfield" Platform Targets Smartphone Market
ttp://www.dailytech.com/Intel+Medfield+Platform+Targets+Smartphone+Market/article15160.htm
240名称未設定:2009/05/20(水) 20:25:26 ID:Vw7FNX+z0
インテル、ネットブック向けLinux「Moblin 2.0」のベータ版を公開
http://www.computerworld.jp/topics/netbook/146289.html

インテル、次世代Atomプラットフォーム「Pine Trail」の概要を発表
http://www.computerworld.jp/topics/netbook/146229.html

【レポート】トランジスタ開発はIntelのハート - インテル及川氏が語るCPUのトレンド
http://journal.mycom.co.jp/articles/2009/05/19/esec2009_intel/index.html

遠ざかるスパコン世界一の座
http://www.itmedia.co.jp/enterprise/articles/0905/20/news009.html

一社製造体制で、より強化されたのかもしれない日本の次世代スパコン開発
http://hpc.livedoor.biz/archives/51440600.html

勝負の行方は性能ではなく価格で決まった。(Nano vs Atom330)
http://www.ne.jp/asahi/comp/tarusan/main207.htm
241名称未設定:2009/05/20(水) 21:51:03 ID:9VrFbvmR0
>>240
>【レポート】トランジスタ開発はIntelのハート - インテル及川氏が語るCPUのトレンド
>http://journal.mycom.co.jp/articles/2009/05/19/esec2009_intel/index.html
この記事にLarrabeeは16コア以上と書いてある。
45nmだと32コアでも600sqmmを超えそうなのでメインストリーム〜ローエンドは32nmだと思われ。
まるっきりXeonとXeonMPですな。


Intel and AMD begin server war dance
ttp://www.theregister.co.uk/2009/05/19/amd_intel_highend_server/
>>239のNehalem-EXが来週登場という記事はINQ記者の予想に過ぎないようだ。
Intelがプレスへ送ったメールからはハイエンドサーバーに関する何らかの発表を行うことしか読み取れないらしい。
The Registerはスケジュールが若干早めてTukwilaの発表をするのではないかと予想している。
また、自社のブレードにNehalem-EXを搭載するのは2010年の第1四半期になるという回答を富士通へのインタビューから得たらしい。
これを以ってNehalem-EXそのものか富士通の対応のどちらかが遅れているはずだと書いている。
何れにせよIntelが半年以上先の製品の発表を行うとは考え難いのでTukwilaの発表は順当な予想だと思う。
ただし、先日エンプラ部門のトップであるパット・ゲルシンガーが来日した時に
Nehalem-EXは早ければ夏頃登場と言っているので前倒しされた可能性もそれなりにある。
ttp://journal.mycom.co.jp/news/2009/04/07/012/index.html

まとめるとこんな感じ。
本命 Tukwilaのみ発表。
対抗 TukwilaとNehalem-EX両方発表。
大穴 Nehalem-EXのみ発表。
242名称未設定:2009/05/22(金) 22:07:42 ID:tJJhp+Cf0
Intel drags feet on Itanium quad-core (again)
ttp://www.theregister.co.uk/2009/05/21/intel_delays_tukwila_again/
>you would infer from Intel's terse invitation to the press that Tukwila was at least one of the topics it would discuss ahead of a product launch
てことで>>241も間違いだったようである。
この記事、何気にItaniumの売り上げと出荷数(推定)が載ってます。

インテル、次期「Itanium」の出荷時期を“またもや”延期
ttp://www.computerworld.jp/topics/mcore/146851.html
243名称未設定:2009/05/22(金) 22:36:31 ID:tJJhp+Cf0
244名称未設定:2009/05/24(日) 19:05:36 ID:i970n95q0
IntelからInvestor Meetingのプレゼン資料がダウンロードできる。
ttp://intelstudios.edgesuite.net/im/home.htm
一通り目を通したが、長いのでいくつか気になった点だけメモ。

Stacy Smithのプレゼン資料 27p
・45nmプロセスに対応したFabを32nmプロセスに対応するFabへ転換する際には設備の9割近くを流用できる
・32nmプロセスに対応したFabを22nmプロセスに対応するFabへ転換する際には設備の8割近くを流用できる
→多分、金額ベースの、例えば4BのFabが400Mで済むといったような、話ではない
245名称未設定:2009/05/24(日) 19:06:18 ID:i970n95q0
Dadi Perlmutter & Renee Jamesのプレゼン資料 11p
・Small Computingでもまだまだ性能が足りない

同 18p
・Westmere CoreはNehalem Coreに対して面積が半分になる
→8Core/L3-16MBでNehalem-EPと同じダイサイズ

同 20p
・高い性能と長いバッテリーの持続時間を実現できるLarrabeeはDiscrete Graphicsとしては最も優れたソリューション
→Larrabeeはモバイル版も投入される模様
 既存の製品同士で比較するとNehalemやAtom(Intel Architecture)の電力管理はGeforceやRadeonより圧倒的に強力
 Calpellaの時点でClarksfieldにGPUが無くてプラットフォームに穴が開いているので投入はかなり早いのではないか
 Clarksfield(or later) + Larrabee, Arrandale + GMA, Atom + GMA, Atom + PowerVR
 数年前はPentiumMとGMAのみだったモバイル製品に非常に幅が出てきた

同 23p
・Moorestownのアイドル時の消費電力は最も良いケースでMenlowの50分の1になる
→Menlowが500mW位だったと思うので10mW〜のレンジがMoorestownで達成できる?

同 27p
・Bonnellのデザインに従事したエンジニアは220人以下
・派生品のデザインに従事したエンジニアは150人以下

同 43p
・Windows 7はIntel Architectureに最適化されている

同 56p
・AtomとMoblin2.0によってSmall Computingの世界でも互換性が生まれる
→Small Computing = MIDs, CE, Embedded
246名称未設定:2009/05/24(日) 19:07:32 ID:i970n95q0
Paul Otelliniのプレゼン資料 6p
・32nmプロセスは45nmプロセスより速いペースで歩留りが上がっている

同 9p
・2011年にはEmbeddedで10B以上の売り上げを見込む

同 20p
・7Bの投資で4つのFabを32nmプロセス対応のFabに
→別のスライドでは32nmプロセスのFabコストを4Bと見積もっていたので設備の流用の効果がかなりある

同 21p
・22nmプロセスに対応出来るIDMはIntel, Samsung, ST Microのみ(IBM, Toshibaが脱落)
247名称未設定:2009/05/24(日) 20:11:27 ID:5dSFORsX0
>>244
昔は新規プロセスに合わせてバンバン工場建ててたけど
さすがのIntelもそれは無理になったのかね
248名称未設定:2009/05/24(日) 20:42:59 ID:i970n95q0
勿論そういうネガティブな言い方も出来るけれども
効率的な投資を行うことでこれからも微細化のペースを維持できる
ってのがIntelの主張したいことだと思いますた

ちなみにこの資料は後藤記事で度々引用されることになると思うので
時間があったら一度全てに目を通しておくとイイ感じかも知れない
249名称未設定:2009/05/30(土) 00:51:30 ID:+wjxzd2o0
インテル社、ビジュアル・コンピューティングの研究施設をドイツに開設
http://eetimes.jp/article/23044/

Intel says EU fine won't lead to dividend cut
http://www.eetimes.com/news/latest/showArticle.jhtml;jsessionid=C0YBHLD4PMADGQSNDLPCKH0CJUNN2JVN?articleID=217700488

Intel Ships Parallel Studio Development Toolkit
http://www.hpcwire.com/features/Intel-Ships-Parallel-Studio-Development-Toolkit-46401262.html

Intel Previews Intel Xeon 'Nehalem-EX' Processor
http://www.intel.com/pressroom/archive/releases/20090526comp.htm?iid=pr1_releasepri_20090526m
http://download.intel.com/pressroom/pdf/nehalem-ex.pdf

Worldwide Server Market Revenues Decline 25% in First Quarter as Market Contraction Accelerates, According to IDC
http://www.idc.com/getdoc.jsp;jsessionid=ZQXUN325QHFCQCQJAFDCFFAKBEAVAIWD?containerId=prUS21856409
250名称未設定:2009/05/30(土) 03:10:40 ID:+wjxzd2o0
Lynnfieldは素晴らしい

The Lynnfield Preview: Rumblings of Revenge
ttp://www.anandtech.com/cpuchipsets/showdoc.aspx?i=3570
251名称未設定:2009/06/02(火) 01:20:15 ID:s4JkS7pR0
次世代Atom「Moorestown」がCOMPUTEXでお披露目か
ttp://pc.watch.impress.co.jp/docs/column/kaigai/20090601_211977.html

スマートフォンの機能を統合する次々世代Atom「Medfield」
ttp://pc.watch.impress.co.jp/docs/column/kaigai/20090602_212014.html
252名称未設定:2009/06/02(火) 22:09:08 ID:/bbi5IsR0
AMDが6コアOpteronのIstanbulを正式発表
ttp://pc.watch.impress.co.jp/docs/column/kaigai/20090602_212130.html

AMD's Six-Core Opteron 2435
ttp://it.anandtech.com/IT/showdoc.aspx?i=3571
253名称未設定:2009/06/03(水) 21:26:33 ID:2FyuTKJL0
Intel’s Core i7-975 & 950: Preparing for Lynnfield
ttp://www.anandtech.com/cpuchipsets/showdoc.aspx?i=3574&p=1

Core i7の最高クロックを更新「Core i7-975 Extreme Edition」
ttp://pc.watch.impress.co.jp/docs/column/tawada/20090603_170331.html

【COMPUTEX 2009レポート】 CLEVO、モバイルクアッドコア「Clarksfield」搭載ノートを展示
ttp://pc.watch.impress.co.jp/docs/news/event/20090603_212241.html

【COMPUTEX 2009レポート】 ECS、壺型PCや統合型Atom搭載ベアボーンを展示
ttp://pc.watch.impress.co.jp/docs/news/event/20090603_212258.html

【COMPUTEX 2009レポート】 Intel基調講演 Intel 5シリーズチップセットや「Moblin 2」が動作するネットブックなどを公開
ttp://pc.watch.impress.co.jp/docs/news/event/20090603_212238.html

【COMPUTEX 2009レポート】 Intel Montevina Plusを正式発表
ttp://pc.watch.impress.co.jp/docs/news/event/20090603_212267.html
254名称未設定:2009/06/04(木) 22:10:42 ID:DHGOz+Fn0
Intel Larrabee samples said to perform like GeForce GTX 285
ttp://www.tcmagazine.com/comments.php?id=26976&catid=6
とは言えこの時期に出てくるサンプルはクロックが製品版と比べてかなり低かったりバグでIPCが低かったりするはずでして。。。

Intel VP deems Ion is overkill
ttp://www.theinquirer.net/inquirer/news/1184505/intel-vp-deems-ion-overkill
Mooly Eden

Intel's Maloney kicks off Computex keynotes
ttp://www.theinquirer.net/inquirer/news/1184502/intel-maloney-kicks-computex-keynotes
>Intel, said Maloney, will go on to deliver "Lynnfield" and "Clarksfield" processors in the second half of 2009
> and ship 32nm "Westmere" chips using a second-generation Hafnium-based high-k metal gate transistor design "soon after".
255OOO-⊂(´∀`旦⊂☆諫碕:2009/06/04(木) 23:41:49 ID:amuWwOox0
GTX285並の性能が本当にでるのならばLRBプロジェクトとしては十分成功なのだが、
あり得ない期待をしていた厨房共がこの先少しでも寒い情報が出るたびに
暴れ回ったりしないことを祈るわ。
256OOO-⊂(´∀`旦⊂☆諫碕:2009/06/04(木) 23:43:44 ID:amuWwOox0
685 :---⊂(´∀`旦⊂☆諫碕 [↓] :2009/03/31(火) 19:42:12 ID:l/vZRUst (2/7)
>>684
自作板って昔から現実派がたまにバランスを調整してやらないと、
御花畑派が無力な名無しを巻き込んで暴走したあげく、
現実のモノをみてからアンチに願えってさらに暴れ出すんだよ。
おれは議論よりも結果勝負をえらんだ。
257OOO-⊂(´∀`旦⊂☆諫碕:2009/06/04(木) 23:44:39 ID:amuWwOox0
699+1 :---⊂(´∀`旦⊂☆諫碕 [↓] :2009/04/04(土) 20:23:55 ID:WkDXM8VE (3/9)
誤答先生を含め微妙に軸がずれている勘違い君が多いようだが、
CPUメーカーがストリームコアの統合なり、命令セット拡張なりをすることによって
GPUが不要になるほどCPUの演算能力があがる。
それで、GPUが今やっていることが無駄になるかもしれないってだけのことだ。
多分、プログラマブルシェーダの大規模GPUは滅びるかもしれないけど、
完全に固定機能を廃して、ソフトだけになるまではいかないよ。
GPUの肩代わりのために並列演算能力をたかめているわけじゃなくて、
並列演算能力を高めた結果の応用の一つとして、
GPUの処理の多くがいらなくなるかもしれないってだけだ。
最初に影響をうけるのはハイエンドではなくて、むしろチップセットに統合されているようなローエンドの
GPU&MediaEncoder機能の方。


700+1 :---⊂(´∀`旦⊂☆諫碕 [↓] :2009/04/04(土) 20:27:14 ID:WkDXM8VE (4/9)
もちろんその固定機能の残りカスもCPUに統合してしまうのが都合が良いから、
結局のところ統合路線で、その後の高速化によって、汎用性の高さ、コスト、電力の観点から、
ニッチなハイエンドGPU市場が縮小していく。
258OOO-⊂(´∀`旦⊂☆諫碕:2009/06/04(木) 23:49:55 ID:amuWwOox0
まあ、LRBについてはこんなところだろ。
あとは、例のダイのテクスチャユニットの面積を同一プロセス換算で、
nVIDIA, AMDATIと比較してある程度性能見積もりして、>>254の話が信憑性あるかどおかはできそうだな。
LRBは面積が糞でかいのと、プロセッサコアがより汎用的だからテクスチャユニットの面積比が小さくなるのは
無理はない。現実の性能は製品がでるまではわからんから先走り議論はやりたくないね。
特にソフト周りの出来次第でじはらく数割の性能は当たり前に変動しそうだ。
259OOO-⊂(´∀`旦⊂☆諫碕:2009/06/05(金) 00:01:00 ID:j38oaozK0
ぶっちゃけ、IntelがまじめにSandyBridgeの後継とか
CPUへの統合を考えてるなら、LRBみたいな半分試作の処女作ディスクリート製品は
1/2〜1/3の性能でていればいいんじゃねくらいの勢い。
あとはIntel x86が昔からやっているように力業の高速化と統合化してりゃ勝てたり。
x86を古いと宣う対抗技術がことごとくx86の機能取り込みによって駆逐される歴史に
また一頁追加されるのか。

RISC <- P6
Itanium <- AMD64
GPGPU <- LNI
260OOO-⊂(´∀`旦⊂☆諫碕:2009/06/05(金) 00:06:09 ID:j38oaozK0
なーんて嘘。LRBみたいな釣りプロセッサが成功するわけなかた。
LRBのような製品はルーマーの質も低くなりがち。はっきりいって実ベンチが
でるまで性能情報は信用できん。
261名称未設定:2009/06/05(金) 00:10:54 ID:p/h2Dm2b0
LarrabeeがSoC化とかメニーコア化の先鞭というのは当スレの内外で散々語られてきたことなので過去ログ貼ったりして長々繰り返す必要はないです。はい。
それにこの手の議論の方がよっぽど先走っているというかマクロ化しすぎでアレな感じ。
262OOO-⊂(´∀`旦⊂☆諫碕:2009/06/05(金) 00:15:17 ID:j38oaozK0
そういわりれりゃそうだな。
LRBは実ベンチがでるまで性能わからんとかいいながら、
併行して一番先走りネタやってんのおれじゃんか(わらぃ
このスレでは自制しますよ。。。
263名称未設定:2009/06/05(金) 20:49:06 ID:6JYxVtV20
【COMPUTEX 2009レポート】 Intelデスクトップ編
ttp://pc.watch.impress.co.jp/docs/news/event/20090604_212402.html

Intel to Acquire Wind River Systems for Approximately $884 Million
ttp://www.intel.com/pressroom/archive/releases/20090604corp.htm?iid=pr1_releasepri_20090604r

組み込みOS大手のWind River社をIntel社が買収
ttp://eetimes.jp/article/23068/

Analysis: Intel eyes embedded apps with Wind River deal
ttp://www.eetimes.com/news/latest/showArticle.jhtml;jsessionid=OHZUVORS1JTDAQSNDLPCKH0CJUNN2JVN?articleID=217701869

【COMPUTEX 2009レポート】 Intelウルトラモビリティ基調講演 次期Atomプラットフォーム搭載のMIDを多数デモ
ttp://pc.watch.impress.co.jp/docs/news/event/20090605_212525.html

これがIntelの次世代Atom「Lincroft」の実チップだ
ttp://pc.watch.impress.co.jp/docs/column/kaigai/20090605_212608.html
264名称未設定:2009/06/11(木) 03:02:36 ID:OCYoeEqN0
Dirk Meyer talks up Atom-competitor
ttp://www.theinquirer.net/inquirer/news/1184676/dirk-meyer-talks-atom-competitor
読んだ感じだと5W以下のx86はこのままIntelの独占かねー。
2011-12辺りで両社のrevenueは笑える位開くと予測。

Hot Chips 21 has a stellar lineup
ttp://www.semiaccurate.com./2009/06/09/hot-chips-21-has-stellar-lineup/
Hot ChipsのAPが出てきた。この辺は普通にwktk。特に二次滝w
>* QuickPath: Bob Safranek (Intel)
>* Moorestown:The Innovation Platform for Next Generation MIDs (Intel)
>* Understanding the Intel Microarchitectures (Nehalem and Westmere): Transitioning into the Mainstream (Intel)
>* Sun's Next-Generation Multi-threaded Processor-Rainbow Falls (Sun)

Intel Atom N450規格首度曝光
整體平台功耗減半 Netbook將更纖薄
ttp://global.hkepc.com/3210
Pineviewで統合されるGPUはPowerVRだとか。デュアルコア版もあるよ、とか。他色々。
265名称未設定:2009/06/12(金) 21:30:50 ID:AGYsQvE80
Dell plans to buy something big
ttp://www.theinquirer.net/inquirer/news/1271190/dell-plans

次世代Atomは、ネットブック競争を戦い抜くためのIntelの矛
ttp://www.computerworld.jp/news/plf/150409.html

Web servers get 'leccy bill
SPECweb2009 fights the power
ttp://www.theregister.co.uk/2009/06/11/spec_web_power_test/
ttp://www.spec.org/web2009/results/web2009.html

Hot papers at 2009 VLSI Technology Symposium
ttp://www.eetimes.com/news/latest/showArticle.jhtml;jsessionid=2TLOJ0BZBIPSAQSNDLPCKH0CJUNN2JVN?articleID=217800771
Intelは2009 VLSIで16nmプロセスまでを視野に入れたゲート絶縁膜の形成について述べる。
従来のプロセスではチャネルとHigh-k絶縁膜の間に薄いSiOx(Low-k)の層があったために
EOTをある程度までしか低くすることが出来なかった
それをほぼ完全に排除することに成功したとかそんな話?
今後もムーアの法則を維持できるというアピールの意味が強いと思われる。
266名称未設定:2009/06/15(月) 22:53:23 ID:KsOAMBZq0
コスト削減と低消費電力を最優先にした次世代Atom“Pineview”の勝算
パフォーマンスは二の次でも需要はあるか
ttp://www.computerworld.jp/topics/netbook/150609.html

Webサーバの新ベンチマーク「SPECweb2009」、評価基準に消費電力を追加
エネルギー消費に対する関心の高まりを反映
ttp://www.computerworld.jp/topics/srv/150509.html
267名称未設定:2009/06/19(金) 00:51:50 ID:fa3+D4lD0
大原雄介の最新インターフェイス動向 Serial ATA 3.0編その1
ttp://pc.watch.impress.co.jp/docs/column/interface/20090616_294113.html

【VLSI 2009レポート】東芝、SSDの大幅なコスト削減を可能にするNANDフラッシュを試作
ttp://pc.watch.impress.co.jp/docs/news/event/20090617_294364.html

【VLSI 2009レポート】半導体チップの動作中に性能変化を把握する
ttp://pc.watch.impress.co.jp/docs/news/event/20090618_294587.html

NVIDIAが40nmプロセスのGPUを一気に3ファミリ投入
ttp://pc.watch.impress.co.jp/docs/column/kaigai/20090617_294281.html

Core i5が秒読みに入ったIntel CPUロードマップ
ttp://pc.watch.impress.co.jp/docs/column/kaigai/20090619_294653.html

Intel、プロセッサブランドをCoreファミリへ統合
ttp://pc.watch.impress.co.jp/docs/news/20090618_294634.html

関係者の表情が示すモバイルWiMAXの明るい未来
ttp://pc.watch.impress.co.jp/docs/column/mobile/20090618_294462.html
268名称未設定:2009/06/20(土) 21:46:35 ID:clL/B9RW0
269名称未設定:2009/07/01(水) 21:17:12 ID:IvcvOPN60
初志貫徹かニーズマッチか?(i7かi5か、楽しく悩む日々。)   
http://www.ne.jp/asahi/comp/tarusan/main209.htm
270名称未設定:2009/07/12(日) 00:57:22 ID:Kf3nS6QN0
ho
271名称未設定:2009/07/19(日) 00:09:27 ID:JLYP5xgj0
272OOO-⊂(´∀`旦⊂☆諫碕:2009/07/28(火) 20:08:12 ID:KYthl2Av0
消え行くLGA1366パッケージのCore i7
http://pc.watch.impress.co.jp/docs/column/kaigai/20090727_304653.html

誤答先生の誤答来たな。
Bloomfieldは、もともとXeon UPをデスクトップPCのハイエンドに転用しただけの製品だ。
今までBloomfieldが$200〜500のLynnfield圏のデスクトップ価格帯に投入されていたのは、
Lynnfieldが単純に遅れたために、仕方なく開発が先行していたサーバ用を中継ぎとして回したからにすぎず、
LynnfieldがでたらXEの価格帯以外は本来Xeon転用=XEであるBloomfieldが消えるのは自然なことで
別に驚くような事実でもない。

LGA1366がXeon専用として本来の役目を全うし続けるだけなのに、
ただLGA1366を否定論調でかかれても困る。
しかも、Gulftown以降QPIやメモリ種類とチャネル数がSandy Bridgeのサーバ用でも増えないことや、
LGA1155などがあることを考えるとむしろソケットとして長生きなのはLGA1366の方であることは
容易に想像できる。

LynnfieldとHavendaleが遅れたのはモジュラー設計の差別化が思ったよりも負担だったからで、
モジュラー設計を継続するSandy Bridgeでも最初の4CPU+1GPUコアよりも後の製品は
まだシリコンがないと言われている。
273OOO-⊂(´∀`旦⊂☆諫碕:2009/07/28(火) 20:09:24 ID:KYthl2Av0

Nehalemでは、やたらとソケットが乱立しているようだが、
元々Xeon MPとXeon DP/UP、デスクトップではそれぞれ違うソケットであり、
例えばCore 2/PenD系でもLGA775, 771, 604とモバイルを除いても3種類ある。
これはNehalemでも(おそらくSandy Bridgeでも)同じで、
LGA1156, 1366, 1567と3種類ある。

問題なのは1155だけだ。誤答先生の中では1155はSandy Bridge用されていて、
1155の以降予測をベースにSandy Bridgeの移行のシェア予想まで勝手に推測した記事
が前回かかれているが、1155はHavendaleの対策版ソケットでVRDの仕様が
VerUPした、しいていえばWestmere用ソケットであり、Sandy Bridge用ではないことを
付け加えておく。
(誤答先生が全体的にSandy Bridgeに期待してNehalemはハズレみたいな論調であるが、
誤解をベースに偏った予想をしているので注意して読んでほしい)
274OOO-⊂(´∀`旦⊂☆諫碕:2009/07/28(火) 20:16:21 ID:KYthl2Av0
まあようするに何が言いたいのかというと、
Lynnfield/Havendaleが遅れた(もしくはキャンセルされた)のが悪いんで、
LGA1366をNehalem初期型の失敗作であるかのような理解をしている人が
他板でも最近増えてきて誤報広めるなよといいたいだけだな。
275名称未設定:2009/07/29(水) 00:35:25 ID:LH1FbcF10
サーバー用途で某A社にあれだけ差をつけたアーキテクチャをハズレ呼ばわりとは…
そのハズレに負けちゃう連中はどうすればいいのさ
276名称未設定:2009/07/29(水) 00:49:48 ID:4Bbr85+y0
>>492
4-2-3-1の本田システムか。
本田さんはシュート力あるし、カラブロとのホットラインもバッチリだし、かなりwktkだな。
277OOO-⊂(´∀`旦⊂☆諫碕:2009/07/30(木) 19:46:34 ID:ec/NMCEm0
http://kishinkan.jugem.jp/?eid=2746
http://xtreview.com/addcomment-id-7780-view-intel-socket-H2-LGA-1155.html

LGA1155は、今年の2月にIntelが開発者向けのページで公開、販売していたもので、
その仕様によると、VRD11.1からVRD12にVerUPしたことにくわえて、
LGA1156と比べて電流値が少ない仕様になっている。
おれがLGA1155 = Sandy Bridge用ではないといっている理由は3つある。

(1)
メカニカルなソケットの評価部材を、2年も前から販売しているのは時期的におかしい。

(2)
Socket [P]enryn = mPGA478
Socket [B]loomfield = LGA1366
Socket [T]ejas = LGA775
Socket [G]ilo = mPGA989
IntelはSocketのコードネームには、最初のターゲットだったCPUのコードネームの頭文字をもってくるので
などのように従えば、Socket H1 / H2の[H]はHavendaleを指しているのだろう。

(3)
Nehalem/Westmere世代では、1156/1155が併存するというソースは今までにもちらほらと
でてきているが、LGA 1155 = Sandy Bridge用というようなソースは、
今のところ誤答記事と、誤答記事をまんま鵜呑みに紹介にしているサイトのみである。
278OOO-⊂(´∀`旦⊂☆諫碕:2009/07/30(木) 19:53:50 ID:ec/NMCEm0
単純にVRDのVerUpがあり(VRD12では今わかっているだけでサーバ用CPUなどにも変更がある模様)、
LGA1155が追加されるようだが、電流容量が抑えられていることや、
以前にも1156用のマザーでは1155CPUが使えるなどの上位互換の情報もでていることから、
単純に電源仕様を抑えて、プラットフォームコストを抑えるための、
廉価版仕様が1155というのが最も妥当な解釈に思えてきた。

Intelはマルチコアに移行してから特にNehalem以降で、
パフォーマンス/メインストリーム価格帯のCPUのダイサイズがこれまでより巨大化していて
比較的ダイの小さなClarkdaleでもMCMである。ボード側でプラットフォームコストを抑えた
仕様も新設したいのかもしれない。Sandy Bridgeでもこの前のルーマー記事を鵜呑みにするなら
225mm^2もダイサイズがあり、メインストリーム用としてはかなり苦しいサイズになっている
ので、都合がいい。
279OOO-⊂(´∀`旦⊂☆諫碕:2009/07/30(木) 19:59:52 ID:ec/NMCEm0
まあ、深読みしすぎは良くないけど、
LGA1155用のCPUなら、CPU自体を高くうったとしても、
マザーボード側のコストが低いので結果的にPC全体ではより廉価に
することが出来る。結果的に廉価版のグレードのCPUとして売れる。
つまりIntelがダイのでかい石を頑張って安く売らなくても
Intelの儲けを出来るだけ確保できるしくみというわけだ。
(無論最終目標はマザーボードベンダーのためではないところが味噌)
280名称未設定:2009/07/30(木) 20:06:16 ID:ZsHCgQAW0
チップセットの価格を上乗せして売るっぽい話は聞いた

従来の体系
CPUが$50, MCHが$30, ICHが$10の計$90

新体系
CPUが$80, ICHが$10の計$90

味噌はSoC型CPU(MCH統合)はCPUとMCHを別々に製造して売るよりコストが低いということ
これはムーアの法則の威力でもありCPUコアを単純に増やしてもウケない(とIntelが判断した)ということでもある
281OOO-⊂(´∀`旦⊂☆諫碕:2009/07/30(木) 20:07:48 ID:ec/NMCEm0
>>280
あれ新しいICH改めPCHは価格上乗せしてるんじゃなかったけ?
つまりここでもボッっている、とおれは認識してたが。
282名称未設定:2009/08/02(日) 04:47:51 ID:CSO5OsLr0
283名称未設定:2009/08/11(火) 05:54:52 ID:dJkoMT7B0
ho
284名称未設定:2009/08/19(水) 22:29:44 ID:s85m/ZDV0
ze
285名称未設定:2009/08/21(金) 00:13:54 ID:vFJF79T20
インテル、32nmプロセスの順調な立ち上がりをアピール
http://pc.watch.impress.co.jp/docs/news/20090821_309731.html
286名称未設定:2009/08/21(金) 06:01:32 ID:MySVE3Sa0
287名称未設定:2009/08/21(金) 21:58:17 ID:29Nm8+Ay0
>>286
やっぱHaswellからが濃厚か。2年前の妄想どおりできたって感じやね。

756 :u:2007/10/14(日) 15:14:50 ID:Vcf5EqG/
>>755
じゃ、x86ベースでSSEが512bitに拡張されるとでも妄想してみるテスト。

漏れは10ヶ月前にx86ベースで512bit書いてたよ〜。
自慢してみるテスツ(ソースあっただけだが)。
ネットに久々につないだのでLarrabeeの論文みるのはこれからだが、
Tera Tera Teraの資料は当時としては結果的には結構当たってる方かと。
上海IDFの資料ではHPC用途も書いてあるし、Larrabeeは派生の計画もあるかと。

LarrabeeとSandy Bridgeは同じring busを採用してる。
Sandy BridgeのAVXをLarrabeeよりも先にIDFで出したときは
不自然だった。まだ、Nehalemのアーキの詳細をだしたところだったのに
何故Sandy BridgeのAVXがこのタイミングで??

Nehalem/TukwilaはCSIの導入、
Sandy Bridge/Poulsonはchip内ring busの導入
と来て、深読みするとLarrabeeの512bit SIMDが
同じOregonのHaswellアーキの命令のテストで、同じring busだから
Larrabee + Sandy Bridge = Haswell
っていう展開がありかなあと。
で、AVXの方が先に公開しないとHaswellで512bitなLarrabeeと順番が
入れ替わって見劣りするからかと思ってみたり。
妄想だけど。
288名称未設定:2009/08/21(金) 22:19:45 ID:29Nm8+Ay0
2年前じゃないや、1年前だ。
289名称未設定:2009/08/22(土) 00:05:56 ID:1DcMiGI10
「11nmプロセスまでは自社だけで実現できる」。
インテル,製造開発部門のロードマップを披露。
筑波本社のラボも一部公開に
http://www.4gamer.net/games/043/G004345/20090821001/
290名称未設定:2009/08/22(土) 02:30:15 ID:zKW0R84t0
2018年辺りにはIII-Vがものになるだろう。まだまだいけるな。
291名称未設定:2009/08/22(土) 02:32:06 ID:LZbIW79K0
↑ムリw
292名称未設定:2009/08/23(日) 02:37:28 ID:WA5wUPbz0
293名無しさん@そうだ選挙に行こう:2009/08/30(日) 05:12:14 ID:o5UBAe320
ttp://www.pcworld.com/article/170629/intel_to_focus_on_next_generation_of_chips.html
"This will probably be the last IDF till Larrabee launches," McCarron said.

最近の話題 2009年8月29日
ttp://www.geocities.jp/andosprocinfo/wadai09/20090829.htm
294名称未設定:2009/09/07(月) 18:06:36 ID:qb/koWiSO
【レポート】Hot Chips 21 - モバイルプラットフォーム向けチップ技術の動向を読み解く
http://journal.mycom.co.jp/articles/2009/09/07/hot_chips21_client/index.html
295OOO-⊂(´∀`旦⊂☆諫碕:2009/09/15(火) 23:02:41 ID:TzDSxMKU0
245 :[Fn]+[名無しさん] [↓] :2009/09/15(火) 12:49:08 ID:S/Bfp91A
イスラエル組の完全勝利

Intelアーキテクチャ部門(IAG)の上級副社長にDadi Perlmutter氏が就任
http://japan.cnet.com/news/biz/story/0,2000056020,20399998,00.htm

-----------
Lynnfieldは個人的な想像よりも完成度が高かったけど、
Larrabeeがやばかったらどうしようかと不安になる人事ですね。
296OOO-⊂(´∀`旦⊂☆諫碕:2009/09/15(火) 23:07:38 ID:TzDSxMKU0
今回、PCクライアントで、従来モバイルとサーバの流用の交互なアーキテクチャチェンジだったのが
市場規模が主力といえる程に大きくなったモバイルよりのチップで
イスラエルだけでなくオレゴンも開発していくのではないかと期待。
オレゴンの優れた開発力がモバイル〜デスクトップにより生かされるのではないかと考えると期待できるな。
297OOO-⊂(´∀`旦⊂☆諫碕:2009/09/15(火) 23:10:37 ID:TzDSxMKU0
日本語になってないな。
これからは、モバイル中心に設計した方が、スムーズにデスクトップ、ひいてはサーバへの転用がききやすい。
はっきりいって現時点ですでにそうだった。まさかSandy Bridgeの後継でサーバ用に設計した3チップ流用なんて想像できないしな。
298名称未設定:2009/09/17(木) 17:06:04 ID:cAbT1BN3O
Intelのゲルシンガー氏辞任に思うこと
http://pc.watch.impress.co.jp/docs/column/hot/20090917_316184.html
299名称未設定:2009/09/21(月) 21:59:45 ID:9fovQ+mc0
真の勝利宣言はモトローラ組がインテルを乗っ取った時じゃないか
300名称未設定:2009/09/23(水) 12:44:50 ID:2VKkKhHx0
機能追加や性能アップをする分、同じ32nmではトランジスタが増えてさらに高コストになるはずだが、
Nehalem 4コアが32nmにならかなった分、その差で45nmの4コアより低コスト低消費電力になるんだろうか

もしNehalem 32nm 4コアが出てたら、Sandy Bridge 4コアじゃ同じプロセスだからコスト増えちゃうからな
301名称未設定:2009/09/23(水) 12:47:46 ID:2VKkKhHx0
分かりづらい言い方になってスマン

実際、YonahからMeromになったときは消費電力もコストも上がった
MPC74xxからみれば、どちらも3-4倍の消費電力なのでPowerBook筐体での廃熱の辛さでは誤差みたいなもんだがw

Meromはワット辺りの性能向上でみればかなりのものだけど、
Sandy Bridgeのノート向けはTDP45W/55W維持で性能アップ、とかやって欲しくないね
302名称未設定:2009/09/23(水) 12:55:18 ID:SLtWhjxf0
SandyBridgeはGPU部分さえなければ、32nm版Lynnfieldよりダイサイズが小さい可能性あるよ。
ダイ写真見ると、コア間通信がクロスバーからリングバスなったから、
その分ダイサイズ節約できているようだし。
303名称未設定:2009/09/23(水) 13:06:02 ID:2VKkKhHx0
>>302
なるほど、そういうことか
たしかに、Nehalemにプラスするだけ、ってわけじゃないもんな
アーキテクチャってあまり詳しくないんだけど、リングバスってRadeon HD 4000から廃止になったんじゃなかったっけ?
トランジスタ食うから
304名称未設定:2009/09/23(水) 14:29:54 ID:G+b7FxvJ0
Fritz Kruger氏が言うところのそれもあるけど、ここ2~3年で
Radeonのパフォーマンス÷ダイサイズが良くなってきたのは、
デザインツールの変更が大きいのではないかと勝手に踏んでる。
305名称未設定:2009/09/23(水) 14:40:43 ID:SLtWhjxf0
>>309
intelは最近リングバスを採用しているのが増えているよ。
Larrabeeもそうだけど、Nehalem-EXのL3でも、ローカルの3MBと他のコアのL3を
リングバスで接続しているし。
Radeonでは効率が悪かったとしても、intelにとって効率が悪いとは限らないんじゃないかな。
306309:2009/09/23(水) 14:52:01 ID:uICLz0om0
ちょと、待っ
307名称未設定:2009/09/23(水) 14:56:10 ID:SLtWhjxf0
あ、アンカー間違えている。
>>303のつもりが、なぜに309にorz
308名称未設定:2009/09/23(水) 23:39:53 ID:q2228yZQ0
【IDF 2009レポート】ポール・オッテリーニ社長兼CEO基調講演
22nmプロセスルールウェハと、実働するSandy Bridgeを初公開
http://pc.watch.impress.co.jp/docs/news/event/20090923_317302.html
309OOO-⊂(´∀`旦⊂☆諫碕:2009/09/24(木) 21:57:03 ID:poMMhYda0
>>302
つか、それを加味してもSandy Bridgeはコアが小さい気がする。
まともに写真から測ってないからSRAM面積からの目測だけど。
あと、クロスバーよりもリングバスの方が性能でるとはおもえんね。
特にSandy Bridgeの場合、L3もリングだからワーストケースでは
レイテンシがかなりわるくなると見られる。
L1も含めてキャッシュレイテンシに関しては全体的に不遇の予感。
まあ、Sandy Bridgeでかけることはおれもたくさんあるのだが、まだ秘密だ。
310OOO-⊂(´∀`旦⊂☆諫碕:2009/09/24(木) 22:02:08 ID:poMMhYda0
Nehalem, Sandy Bridge, Haswellの3つは
同じラインの延長線上にある兄弟みたいなものかも。
個人的には今回の組織改編でHaswellがSNB+LRBみたいな
構成にならないことをむしろいのってます(わらぃ
正直、ポール・オッテリーニ以前のIntelがよかった。
春男先生も昔に書いていたが、IntelがどんどんIntelらしくなくなってる気がするぜ。
311OOO-⊂(´∀`旦⊂☆諫碕:2009/09/24(木) 22:07:28 ID:poMMhYda0
最近のCPUは電力制御・管理技術に依存して最終的な性能が大きく左右されるから、
事前予想は以前よりもはるかに困難になった。
実行ユニット類の増加もあるだろうが、それよりもSandy Bridgeは電力を抑えた結果で
性能(マルチスレッド/SIMD)を稼ごうという方面の進化を選択しているように見える。
なにしろとりあえず電力さえおさえればコアのスループットは全く拡張しなくても
クロックで性能あがるからね。ある意味そうだとしたらものすごく現実的。
個人的願望では汎用スカラ&シングルスレッドに力いれてほしいんだけど、
どおやらそれはないさそうだぜ。
312OOO-⊂(´∀`旦⊂☆諫碕:2009/09/24(木) 22:21:20 ID:poMMhYda0
あと、Lynnfieldの32nmバージョンは半年以上前の情報で存在しないことが明らかになっているが、
たぶん実際にはHavendaleと同時かそれよりも前にキャンセルされたんじゃないかと。
Havendaleはロードマップに堂々と載ってたから騒ぎになったが、
Lynnfieldの32nm版は存在を公表もしてなかったから、ひっそり消えられたのかもね。
Lynnfield/Havendaleの遅れと、Sandy Bridgeがいままでのところかなり順調なことからいくと、
32nmにシュリンクして、Sandy Bridgeまでつなぐメリットは殆どなかったのだろう。
個人的には、LynnfieldもClarksfieldも思ったより完成度が高くて好印象なんだが、
2年でアーキテクチャ切り替えだと、半年でも遅れたらかなり痛いからなあ。
↓Clarksfieldベンチ
http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=3647&p=1
313OOO-⊂(´∀`旦⊂☆諫碕:2009/09/24(木) 22:42:43 ID:poMMhYda0
http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=3645
>The demo was nothing more than proof of functionality, but Sean Maloney did officially
> confirm that Larrabee's architecture would eventually be integrated into a desktop
> CPU at some point in the future.
>The CPU is called Haswell and will be built using 22nm transistors. It's about 3 years away.
なんか、今回のIDFで統合が公式に認められちゃったみたいだな。
まあまだ変更の可能性はあるけど。いずれにしろdiscreteのRGPとしてのLarrabeeに期待している人は
ご苦労さんとしかいいようがない。最初はしらんが、やはりハイエンドGPUねらいのプロジェクトじゃない。
314名称未設定:2009/09/24(木) 22:51:12 ID:2O/J6wuk0
・I/Oパッド周りで一定のダイのエッジ長を確保しないといけない
・微細化を続けなきゃいけない

ふつーに微細化を続けると空白部分が出来てしまう
例:http://pc.watch.impress.co.jp/img/pcw/docs/310/373/kaigai-06.jpg

→ じゃあ空き地に、これまでCPUの近くにあった何かをブチ込んで行きましょ


なんかつまんねSoCムーブメント
315名称未設定:2009/09/25(金) 21:28:09 ID:Ia7GjA+V0
>>312
デスクトップ版も定格から上がるから同じだけど、ノートの2GHzでも4コアのまま2.26GHzまで上がるんだよね
これがそのまま32nmになってくれたら、定格2.26GHzが出せるんだろうけどな
316名称未設定:2009/09/25(金) 21:29:38 ID:Ia7GjA+V0
紛らわしくてスマン、ターボブーストで4コア時2.26GHzまで上がる、という意味です。
2コアで3.06GHz、1コアで3.2GHz
1コア動作はOS XでもWindowsでもほぼ無さそうだけど、2コアならうまい

デスクトップも4コアのまま、133MHzずつ上がるようになってる
317OOO-⊂(´∀`旦⊂☆諫碕:2009/09/25(金) 22:49:59 ID:gYgZTphd0
ターボブーストはOS透過なんでしょ。
ちなみにIntelのデータシートではターボブーストは基板設計完全透過がウリのようだぜ。
マザーボードの基板設計者からターボブーストの存在は全くみえないし、考えなくてもいいことになってる。
もちろん間接的に電源周りの設計に影響はあるだろうけど。
318名称未設定:2009/09/26(土) 00:01:07 ID:GYy20nyO0
今後シングルスレッドのスピード向上はターボブーストにかなり依存しそうだし
どんどん磨いてくるでしょうね
319名称未設定:2009/09/26(土) 10:23:24 ID:2OzYZX0E0
でもTurboBoostの最高クロックでナンバリングするのは止めて欲しい
紛らわしすぎる
320OOO-⊂(´∀`旦⊂☆諫碕:2009/09/27(日) 01:16:38 ID:WkYek+C10
IDF関連のニュース、資料おおざっぱにだが見た。
つーか、Sandy Bridgeこの時期に実働デモって絶対前倒ししてくるだろこれ。
いつもなら来年6〜7月くらいにだせるペースだ。
Nehalem/Westmere関係の製品がでそろってないから購入意欲を減退させないように
ひかえてるだけでClarkdaleかGulftownがでた当たりで前倒しスケジュールだすんじゃないかと。
今2011年っていわれてるけど、すくなくとも来年中に登場するに10000ペリカ賭けてもいいね。
321OOO-⊂(´∀`旦⊂☆諫碕:2009/09/27(日) 01:24:39 ID:WkYek+C10
というのを何ヶ月か前からおもっていたが今改めて書いてみたり。
コストメリットでは2コア版のSandy BridgeがでるまではClarkdaleに分があるから、
上位SandyBridge 4コア, 下位Clarkdaleでしばらくはつなぐんだろうな。
322名称未設定:2009/09/27(日) 02:16:59 ID:G4+ZHiHE0
AMDがしんじゃうからあえて延ばすんじゃないの
323名称未設定:2009/09/28(月) 09:15:20 ID:xlZIFoaD0
http://pc.watch.impress.co.jp/docs/2007/0919/idf01.htm
Nehalemのときも投入一年くらい前に動作デモしてるし
324OOO-⊂(´∀`旦⊂☆諫碕:2009/09/28(月) 23:18:51 ID:fj44U9V00
>>323
http://www.theinquirer.net/inquirer/news/1034123/intels-merom-misses-tape-out-by-a-month
この記事によるとMeromのときは2005年6月テープアウトで、12ヶ月でWoodcrestリリースまでいってるけど、
NehalemはA0シリコンの最初のデモから14ヶ月もかかってたんだね。
これはかなり遅い方です。QPI&IMCの大がかりなシステムアーキテクチャ変更があったからかね。
325名称未設定:2009/09/29(火) 02:24:38 ID:JYI+HcMi0
もうさ,空きスペースは冷却用の水でも入れとけって感じで
326OOO-⊂(´∀`旦⊂☆諫碕:2009/09/29(火) 21:50:47 ID:EC0KZRzc0
■後藤弘茂のWeekly海外ニュース■
Intelの次世代CPU「Sandy Bridge」の正体
http://pc.watch.impress.co.jp/docs/column/kaigai/20090929_318033.html
327OOO-⊂(´∀`旦⊂☆諫碕:2009/09/29(火) 22:14:27 ID:EC0KZRzc0
後藤記事をみて、まあ予想どおりな展開だな>Sandy Bridge。
つーか、後藤先生より自分のほうが現時点では断然書けるな、書かないけど(わらぃ
328OOO-⊂(´∀`旦⊂☆諫碕:2009/09/29(火) 23:29:15 ID:EC0KZRzc0
統合化が現実に広く認識されるようになってきたようだが、
なんか若干、統合化の意味やメリットが勘違いされているな。
統合化は、過去のコアの拡張の方法やマルチコアとかの高速化方面の拡張でネタがつきたからやってるというのは
当たっているが、必要悪なんだから仕方がない。
たしかに、今までのCPUの進化のペース(年率約+50%)に慣れてしまった人には
批判もしたくなる気持ちもわかるが、性能向上の鈍化はCPUの将来に絶望を感じつつも受け入れざるを得ないものだ。
シュリンクであいたスペースを埋めるというのも全くはずれないし、
コストメリットもあるが、そもそも性能向上の足かせになっている要素で最もでかいのが電力だから
統合した方が電力削減できて、間接的に性能向上のマージンを確保できるってのがでかい。
Sandy BridgeでもTBがCPU-GPU間にまで拡張されるのが明らか。
メニーコアと周辺部品の統合は本来対立するものだが、なにやら同じモノのように
最近はうまくごまかされている感があるね。
もっとも現在までの話では、Haswellは無謀にも同じリングバス上にストリームコアを
多数集積して頑張るつもりにみえるから、メニーコアもまだあきらめたわけではないようだが。
また、統合化も主記憶まですすむと性能面でも全く異なる意味をもつんだが、
それまでの過渡期と思ってあまり期待せずに期待するという手もある。
329OOO-⊂(´∀`旦⊂☆諫碕:2009/09/30(水) 00:10:25 ID:J8ZSa7k90
IntelのEden氏に聞くSandy Bridgeの姿
http://pc.watch.impress.co.jp/docs/column/kaigai/20090930_318199.html

Eden氏。この人の発言はいつも面白いなあ。すげー現実派。
330名称未設定:2009/10/01(木) 21:01:00 ID:HQtghgjz0
いまさらながら先週のIDF記事より

> Moorestownは元々は2009年の末にリリースされる予定だった
> 製品だが、予定よりも遅れており、初日に行なわれたポール・
> オッテリーニ社長兼CEOの基調講演の中で、2010年の半ばに
> スケジュールが変更されたことがさりげなく明らかにされた。

('A`)
331名称未設定:2009/10/02(金) 20:05:20 ID:Mmpx0Jn/0
PPCコア統合してくれ
332名称未設定:2009/10/03(土) 01:09:33 ID:AXzQMdZm0
>>331
CoreやPhenomやAtomでは大騒ぎしてるけど、PPCはもちろん、CPUで統合されてる製品は別に珍しくない
x86は特異なんだよな

インテルとAMDで争ってる信者同士を見ると、ね…
ブービー賞のファンがビリを笑うとか、ブービー賞のファンが「世界初!」とか自慢げに話してるのは自作板とかでよくみる
333名称未設定:2009/10/03(土) 01:18:07 ID:J919hvp90
さすがにもうよく見ないだろ。
数年前からタイムスリップしてきたのか。
334OOO-⊂(´∀`旦⊂☆諫碕:2009/10/03(土) 01:29:19 ID:irtqZmH10
MoorestownやPPCにおける組み込み分野での統合化と
Intel Core, Phenom, POWER等のハイエンドチップが統合化をするのとは
(少なくとも現時点では)よくわからない人は別物とお考えください。
そこが区別できていないようでは最近のCPU事情は半分も理解できんので。
335名称未設定:2009/10/05(月) 22:25:01 ID:taZUFkiJ0
SuperMicro shows 4 and 7 GPU boards
ttp://www.semiaccurate.com./2009/10/04/supermicro-shows-4-and-7-gpu-boards/
LRB向けに作らせてたんだろうか

8月の世界半導体売上高、前月比で5%増――回復基調を維持
ネットブックが市場を牽引
ttp://www.computerworld.jp/topics/mp/163909.html
336名称未設定:2009/10/10(土) 20:56:26 ID:6fu55yKf0
>>332-333
ところがどっこい、今でもこの有様

352 :Socket774 [sage] :2009/10/09(金) 20:06:09 ID:uqVW6qtj
AMDはCPU+GPUやらないのかね
357 :Socket774:2009/10/09(金) 22:22:56 ID:sIbUQAlq
>>352
Intelのパクリで1年後ぐらいに出るんじゃないの?
359 :Socket774:2009/10/09(金) 23:56:00 ID:O5LAnWm4
>357
GPUとCPUの統合はAMDのFusion構想のが発表先だが。
337名称未設定:2009/10/10(土) 23:21:34 ID:CZknqYi50
例のAMDのトレンド、テンプレに入れておいた方が良いの?
338名称未設定:2009/10/10(土) 23:33:08 ID:xruqybeg0
イラネ
339名称未設定:2009/10/17(土) 09:22:54 ID:iSkDRKZu0
341 名前:Socket774[] 投稿日:2009/10/17(土) 07:33:31 ID:WOYbKCgb
Innovation@Intel
ttp://www.intel.com/pressroom/innovation/innovation.htm#101609a
ttp://techresearch.intel.com/UserFiles/en-us/File/terascale/Mayo_IEEE_VIS2009_FINAL.PDF

342 名前:Socket774[sage] 投稿日:2009/10/17(土) 07:51:06 ID:5sBlP9Av
64coreとな

343 名前:Socket774[sage] 投稿日:2009/10/17(土) 08:58:08 ID:b1GwOcaa
>>341
・まだシミュレーターでの見積もり ただしcycle accurateなので大嘘ではないかも
・転送がボトルネック。両側で圧縮展開すればはやい、と主張
・そもそもLarrabee向きアルゴリズムの提案とセット。
 HPCでの頻出するよく知られた課題のテストは避けている?

345 名前:Socket774[sage] 投稿日:2009/10/17(土) 09:10:32 ID:duVcaP5F
ほぼCONCLUSIONSだけ読んだ
・Larrabeeのパフォーマンスは高精度のシミュレーターによるもの。
・動作クロックは1GHzで16, 32, 64コアでシミュレーションしている。
・16コア@1GHzのLarrabeeでGTX 280より平均1.5倍速く、シングルコアのHarpertownの10倍速い。
・32コアと64コアではCPU-Larrabee間でのデータ転送がボトルネックになる。
 もし、このデータ転送のコストが0ならば32コアでは(CPUの)24倍速くなり、64コアでは42倍速くなる。
・しかしこのボトルネックを放置すると32コアでも64コアでも11倍しか速くならない。
・この問題を解決するためにデータセットを可逆圧縮するSIMDと親和性の高いアルゴリズムを実装した。
 これによってデータを三分の一以下に圧縮できる。また、解凍のオーバーヘッドも30パーセント未満である。
・データセットの圧縮によって転送に要する時間を平均して20-30パーセントに削減した。
・それによって、32コアでは19倍性能が向上、64コアでは31倍性能が向上するという実験結果が得られた。

346 名前:Socket774[sage] 投稿日:2009/10/17(土) 09:15:39 ID:duVcaP5F
>16コア@1GHzのLarrabeeでGTX 280より平均1.5倍速く〜
ちょっと正確じゃなかった。正しくはこう。
16コア@1GHzのLarrabeeは理論演算性能がGTX 280の半分だが、それでもGTX 280より平均1.5倍速く〜
340名称未設定:2009/10/17(土) 12:40:43 ID:xOb4j0sQ0 BE:83624832-PLT(12022)

x86初のGPU統合プロセッサってCyrix MediaGXか?
Intelだと、完成までしてたがRDRAMがアレなことになって
出荷に至らなかったTimnaになるんだろうが

341OOO-⊂(´∀`旦⊂☆諫碕:2009/10/17(土) 13:15:48 ID:dXGbEjSJ0
>>339
この後に及んでボリュームリンダリングのシミュレーション比較かよ。
Discrete GPU詠うならまずはゲームのラスタグラフィックで勝負しろ(わらぃ
342OOO-⊂(´∀`旦⊂☆諫碕:2009/10/17(土) 13:17:04 ID:dXGbEjSJ0
レンダリングねw
343OOO-⊂(´∀`旦⊂☆諫碕:2009/10/17(土) 14:10:04 ID:dXGbEjSJ0
683 :---⊂(´∀`旦⊂☆諫碕 :2009/03/31(火) 19:28:37 ID:l/vZRUst
Cell(笑)
Larrabee(笑)
GPGPU(笑)
3大釣りプロセッサ。これらを持ち上げている記事は要注意だ。
344名称未設定:2009/10/17(土) 14:11:27 ID:7jpzBZ5T0
汎用と専用のいいとこ取りできる魔法はないってことだよね
345OOO-⊂(´∀`旦⊂☆諫碕:2009/10/17(土) 14:16:54 ID:dXGbEjSJ0
3大釣りプロセッサの中ではGPGPUが技術な方向性が一番まともです。
ただ、今後LRBどうこうに関わらず、Discrete GPU市場は落ち込んでいく可能性が高い。
そのような中でHPC向けの拡張を行うとますますRGPとしての競争力をうしなうし、
HPC系の専用プロセッサは90年代以降、それだけでは投資・回収のサイクルを維持できるジャンルではないことが
証明されている(最近ではClearSpeedなんてのもあったがすぐ消えた)。
346OOO-⊂(´∀`旦⊂☆諫碕:2009/10/17(土) 14:19:14 ID:dXGbEjSJ0
消えたなんていったら怒られるか。
347名称未設定:2009/10/17(土) 14:49:56 ID:p9YOWB8y0
なぜこんな時期に性能を晒さないといけないんだ?
シミュレーターがあるなら登場時期とその時に競合する製品の予想スペックから逆算してコア数なりメモリ帯域なり決めているだろうに
この糞コテはそんなこともわからんのか
348OOO-⊂(´∀`旦⊂☆諫碕:2009/10/17(土) 14:58:03 ID:dXGbEjSJ0
なぜこんな時期に性能を晒さないといけないんだ?

http://pc.watch.impress.co.jp/docs/news/20091016_322120.html
こういう釣り記事が事前にあったからおれは書いているわけだが。
>また、同社が開発コードネーム“Larrabee”(ララビー)で開発を進めている
>ディスクリートGPUについて触れ、日本時間の17日に、
>Larrabeeの性能データを初めて公開することを明らかにした。

こういう釣り記事が事前にあったわけだが。
あと、"シミュレーター"と聞いただけで、現実のプロセッサと何から何まで一致する魔法のツール
みたいな認識はやめよう。
349名称未設定:2009/10/17(土) 15:01:29 ID:uS+3FzvZ0
>>347
6ヶ月前の円盤は何だったん?

758 :Socket774:2009/04/10(金) 17:28:09 ID:9R26seby
ttp://www.hardware.fr/articles/757-4/idf-printemps-2009-pekin.html
LRBウェハ公開。
ウェハのダイサイズは600平方mm級の巨大さ。
45nmなら48コア? 32nmなら64コア?
350名称未設定:2009/10/17(土) 15:02:27 ID:p9YOWB8y0
>>348
馬鹿ニワカ乙としか言い様が無いな
シミュレーターの精度が勝敗を決める世界なのに
記事もちゃんと読んでないし。。。。。
> なお、同氏よればIntelが米国のメイヨー病院と共同で開発した
>メディカル用のアプリケーションを利用したLarrabeeの性能データを、
>日本時間の17日の朝に公開することを明らかにした。

>>349
お前の論旨が不明確
351名称未設定:2009/10/17(土) 15:06:22 ID:uS+3FzvZ0
352名称未設定:2009/10/17(土) 15:08:33 ID:p9YOWB8y0
>>351
それが?
353名称未設定:2009/10/17(土) 15:10:37 ID:otMV1LSv0
動作するシリコンを使わせてもらえないラトナーが不遇すぎる
354OOO-⊂(´∀`旦⊂☆諫碕:2009/10/17(土) 15:15:20 ID:dXGbEjSJ0
シミュレータの精度が勝敗を決める世界って、
論文中のシミュレータの内容や精度をお前はいつ評価したのかとw
まあLRB厨は継続的に予想の実績をだしてから反論してほしいわ。
LRB厨の意見は都合の悪い部分がことごとく好意的な妄想で補完されすぎ。
355名称未設定:2009/10/17(土) 15:18:41 ID:kf8p5ik50
誰が見ても論旨が不明確なのは>>347
356名称未設定:2009/10/17(土) 15:23:30 ID:p9YOWB8y0
>>354
ふう、、、何を今更。。。
Intelの常勝の歴史 ≒ シミュレーターの精度だろ
ほとんどのケースでIntelは競合製品を僅かに上回る性能で暴利を貪り続けて来たわけなんだがw
こんな基礎的な認識すら一致してないんじゃなー
357名称未設定:2009/10/17(土) 15:36:54 ID:bpqPYLI80
ここ10年でみて「僅かに上回る」状態ってあったっけ?
大まかに均衡・負け・完勝って流れだと思うが (注:営業成績的には常勝)
358名称未設定:2009/10/17(土) 16:00:36 ID:bpqPYLI80
>>304
ツールの変更でそんなに良くなるもんか?

「CADツールの大幅改良により効率の良いレイアウトが作成できるようになった」とされるプロセッサの一例
http://journal.mycom.co.jp/news/2003/02/21/30.html
http://pc.watch.impress.co.jp/docs/2003/0220/kaigai01.htm
359名称未設定:2009/10/17(土) 16:17:03 ID:83YBDSSC0
作為的だなぁw
良くなりはしても悪くなる事は無いんじゃない?
デザインツールでリークは防げないと思うけどねw
360,,・´∀`・,,)っ-○○○:2009/10/17(土) 17:07:16 ID:xOb4j0sQ0
Intelアーキのシミュレータで遊んでるけど精度の高さびっくりするわ
ああ、一つ言っておくがIntelはVTune作ってる会社だぜ

その論文がGTX285じゃなくて280と比較してるのは仕込みの開始時期がそのへんってことだから
まあ実機じゃないのは勘弁してやってほしい
361,,・´∀`・,,)っ-○○○:2009/10/17(土) 17:16:54 ID:xOb4j0sQ0
つか、諌崎はLarrabee開発の意図がいまだにわからんのか。
IntelがXeonで獲得してきたHPCにおける市場を維持するため競合チップを排除するための
最終決戦兵器であって、GPUとしての性能は二の次。

既存のゲームに対する性能要求などない。
VRAM-チップ間の無駄なデータトラフィックを削減し最適化することで
かろうじてGPUとしてもまともな性能になるかなって感じ。

Radeonがシェアを伸ばしてるのは、ゲーム性能を求めてるユーザーは未だ多くいて
GPGPU性能など求めていないと言うことだ。
Fermiの設計に関しては、LarrabeeとRadeonを同時に相手にしてどっちにも及ばない
中途半端なもの作ってしまったな。NVIDIAの戦略ミスとしか思えない
362名称未設定:2009/10/17(土) 17:50:59 ID:83YBDSSC0
でも最終的な舵の方向はintelと同じ方向なんだし
過渡的な製品もあるのは仕方のない事なんじゃないの?
363,,・´∀`・,,)っ-○○○:2009/10/17(土) 18:12:53 ID:xOb4j0sQ0
NVIDIAはCUDAの市場価値を過当評価してるとしか思えん。
ちなみにCUDAユーザー人口は世界6万人(NVIDIA調べ)
364OOO-⊂(´∀`旦⊂☆諫碕:2009/10/18(日) 02:39:59 ID:x9npZpn30
LRBは全く順調に、
CPUの良し悪しや技術動向を予測することの難しさをLRB厨に知らしめてくれそうだな。
Intelの意図するところでは無いだろうけど。
365,,・´∀`・,,)っ-○○○:2009/10/18(日) 02:46:45 ID:ynoD0Hzq0
んオレには期待以上だ
Fermiが残念仕様なので特にそう見えるのかも
366OOO-⊂(´∀`旦⊂☆諫碕:2009/10/18(日) 03:11:52 ID:x9npZpn30
Fermi関係やたらさわがれてるけど、
GTX280→Fermiって最近のGPU進歩の中では、
革新的なものはないし、正直物量以外あまりかわってない印象なんだが、
いかにGTX280までのGPUが国内で理解されていないか浮き彫りになったね。
おれもGPUはあまり興味がないから普段ならどうでもいいんだが酷すぎる。
367OOO-⊂(´∀`旦⊂☆諫碕:2009/10/18(日) 03:13:20 ID:x9npZpn30
というかFermiなんでそんな騒ぎなの?
逆にGPU厨に教えてもらいたい。
倍精度ユニット増えるのも予想の範囲だし、なんかしたのか?
368OOO-⊂(´∀`旦⊂☆諫碕:2009/10/18(日) 03:17:52 ID:x9npZpn30
>IntelがXeonで獲得してきたHPCにおける市場を維持するため競合チップを排除するための
>最終決戦兵器であって、GPUとしての性能は二の次。
HPCなんて元々負け組プロセッサの世界、Xeonだけで十分なんだよ。
LRBが開発された意図はおれの過去の書き込みを読めばわかるね。
HPCは元々PC/サーバ市場で大もうけしているIntelにとっては重要なマーケットじゃありません。
LRBもGPGPUも別のマーケットをバックグラウンドとして持っているから
HPC用途として開発サイクルを維持できるというのが大前提。
369OOO-⊂(´∀`旦⊂☆諫碕:2009/10/18(日) 03:27:03 ID:x9npZpn30
GT200から倍精度ユニットが増えたわけじゃないのか。
あとテクスチャ関係もフラットになってるんだね。
まあどのみち今までのGPU進歩の流れからみても今更騒ぐような変化じゃないと思うが。
370,,・´∀`・,,)っ-○○○:2009/10/18(日) 13:36:03 ID:ynoD0Hzq0
HPCは成長市場だぞ

あと、クラウド(笑)に対応した高密度ブレードサーバ
こっちはどっちかというとAtomのメニーコア投入が急がれる。
371,,・´∀`・,,)っ-○○○:2009/10/18(日) 13:39:20 ID:ynoD0Hzq0
成長著しいHPC市場、2010年には143億ドル
2006年11月20日 06:04PM
http://sourceforge.jp/magazine/06/11/20/098246

2007年Q3のHPCサーバー市場は30億ドル規模,2011年には5倍に拡大
http://itpro.nikkeibp.co.jp/article/Research/20071204/288674/


まあインテグレータでないIntelにとっては取り分はタカがしれてるが
372OOO-⊂(´∀`旦⊂☆諫碕:2009/10/18(日) 15:08:24 ID:x9npZpn30
HPCが成長市場なのはもちろん知っているが、問題はプロセッサ屋からみた市場としてどうかだからな。
373OOO-⊂(´∀`旦⊂☆諫碕:2009/10/18(日) 15:13:24 ID:x9npZpn30
専用プロセッサ殆どなくなって、
安価な汎用プロセッサのクラスタが低価格化とHPCの普及を後押ししているのがでかい。
スーパーコンピュータはアーキテクチャとしては終わったジャンルで結局実態は今やサーバやPCなんだよ。
汎用プロセッサのSIMDを拡張し、流用するという方向ならば賛同できるが、
HPC向けの専用プロセッサは時代の流れに逆行している過去のボリ返しにすぎない。
374名称未設定:2009/10/18(日) 15:20:43 ID:rQ2rnlqQ0
男子がよく罹りやすいのが
HPC至上主義という病
375名称未設定:2009/10/18(日) 16:40:16 ID:bPPm8EN+0
Haswellかその辺りでLRB組み込む前の、実験じゃないの?Larrabeeって。
376,,・´∀`・,,)っ-○○○:2009/10/18(日) 18:02:16 ID:ynoD0Hzq0
実験と言うか、ディスクリート版をカットダウンしたものそのものが載るって言ってね?

Windows 7/Server 2008 R2のVirtual Serverとか、LinuxのXenとかで
ハードウェア仮想化支援技術と組み合わせたハイパーバイザ上に乗っける形で
ゲストのLarrabeeコアの管理用OSを動かすから、その世代になるとCeleronも含め
全部VTに対応してくる。

さて、MacOSだが、Larrabeeコアを動かすのに必要にならね?
377,,・´∀`・,,)っ-○○○:2009/10/18(日) 18:03:31 ID:ynoD0Hzq0
MacOS自身にハイパーバイザ機能が。
378名称未設定:2009/10/19(月) 00:05:00 ID:bGqNhypb0
1TBのメモリが利用可能−メインフレーム並みの信頼性を持つ「Nehalem-EX」
http://enterprise.watch.impress.co.jp/docs/series/virtual/20091019_321274.html
379,,・´∀`・,,)っ-○○○:2009/10/19(月) 00:47:16 ID:oMh6evTi0
Magny-Coursってこいつの対抗なんだよな


大丈夫かAMDは
380名称未設定:2009/10/19(月) 04:18:34 ID:rWGerDEy0
Magny-CoursとNehalem-EXでは価格も位置づけも違うと思います。
Magny-Coursは2ソケットがメインになると思われるので、
今までの8000番台よりは安くなるのではないでしょうか。
Nehalem-EXはスライドに2ソケットの例もありますが、
4ソケット以上で信頼性を必要とするところがメインになるのでは。
要するにAMDはNehalem-EXに対抗できるものがないし、する気もない。
381名称未設定:2009/10/19(月) 07:37:25 ID:9omDrcN40
AMDもそうだけどItaniumの将来も心配されます。
正直もういらなくね?
382OOO-⊂(´∀`旦⊂☆諫碕:2009/10/20(火) 20:51:41 ID:RJanAian0
Itaniumまだ心配できる奴いたんだ。
おれも5,6年位前までなら心配してたが今は心配してないぜ。
383OOO-⊂(´∀`旦⊂☆諫碕:2009/10/20(火) 20:54:44 ID:RJanAian0
5,6年前まではいかないか。
Montecitoあたりでもう心配の必要もないなと。
384名称未設定:2009/10/22(木) 02:47:16 ID:/+lGNwVP0
>>380
Magny-CoursはNehalem-EX同様コストが高すぎてスイートスポットにはもって来れないから無理。
2S用のプラットフォームが2種類ある時点で察してやれ。
コア当たりの性能が1.5倍以上違う時点で勝負にならないってこった。
385,,・´∀`・,,)っ-○○○:2009/10/22(木) 08:18:32 ID:R/hKP3f40
HT-Xの牙城を崩させるわけにもいかんから、AMDの経営戦略上出さないよりはマシ
386名称未設定:2009/10/22(木) 13:09:36 ID:B7ZXdSfp0
>>384
そうですかね。
Opteron 2425 HEが523ドルなので、
2つで1000ドルを少し上回るくらいですよね。
単純に2倍にはならないにしても高すぎるというほどにはならないと思いますけど。
それに12コアでも2.1GHzくらいではWestmere-EPに対して優位にならないので、
それほど高くはできないと思います。
387名称未設定:2009/10/22(木) 16:16:12 ID:oo36fMed0
なんかおかしいなと思っていたら
>【お詫びと訂正】初出時、次世代Itaniumとソケット互換がある旨、
>記載しておりましたが、事実と異なりました。お詫びして訂正します。
388,,・´∀`・,,)っ-○○○:2009/10/22(木) 22:36:06 ID:R/hKP3f40
フカシ記事多すぎるぞ山本
389290:2009/10/25(日) 05:43:13 ID:IDi8LjfM0
>>291
Intelが2017年にIII-Vだってさwww
表スレに書いてあった
390,,・´∀`・,,)っ-○○○:2009/10/25(日) 12:42:11 ID:M0/5hHwu0
ここ彼処の裏スレだったのか
391名称未設定:2009/10/29(木) 11:07:54 ID:iFYsovRy0



岡田外務大臣キタ━━━━━━(゚∀゚)━━━━━━ !!!!!
h‍ttp‍:‍/‍/‍q‍b5.2‍ch.net/t‍est/rea‍d.cgi‍/sak‍u2ch/1256‍630318/1



早く記念カキコしないと埋まっちゃうwww
392名称未設定:2009/11/01(日) 18:29:30 ID:1YT33BKcO
HPC界隈のblog・日記ざっと見てきたけど軒並み例の論文(>>339)はスルー。
みんな興味なくしちゃったのかな。
393名称未設定:2009/11/01(日) 19:40:59 ID:yMUg45BW0
CELLの時も論文全部追ってたのはゲハ民ぐらいだったけどな
394,,・´∀`・,,)っ-○○○:2009/11/01(日) 20:17:24 ID:ApiZUIQu0
Larrabee関連特許文書でも読めばいいと思うよ

積和算・プレディケート周り
 http://www.freepatentsonline.com/20090171994.pdf
Gather/Svatter周り
 http://www.freepatentsonline.com/20090172364.pdf

なにげに実装ネタバレしてる
395,,・´∀`・,,)っ-○○○:2009/11/03(火) 15:05:40 ID:IQCKSZs+0
命令セットが完全公開されててユーザーが触れる資料が色々出てたCellとは違って
Larrabeeは秘密主義だからな。

目に見えるって意味ではAVXのほうが面白いかもね
396名称未設定:2009/11/04(水) 23:47:21 ID:g1YOxLco0
New microarchitectureと言われるMedfieldはLarrabeeコアがベースになると予想している
コアそのものが流用されなくてもLRBniがenableされてGPUとCPUが兼用になる可能性が高いと予測
397,,・´∀`・,,)っ-○○○:2009/11/04(水) 23:59:56 ID:r9SGJsla0
ないない
ちなみにその次の世代くらいでAVXが使えるようになる模様
398名称未設定:2009/11/05(木) 00:07:32 ID:2QyothRw0
399,,・´∀`・,,)っ-○○○:2009/11/05(木) 00:14:00 ID:JQjZeHoq0
というかね、Atomの市場進出のストラテジーは、ARMと同じく「コントローラ」に徹すること。
アクセラレータである必要はない。
ネットブックなんてSoCビジネスが本格的に立ち上がるまでの繋ぎなんです。

何の為にわざわざTSMCの製造ラインまるまるAtom用に買い上げたと思うよ
400名称未設定:2009/11/05(木) 00:57:24 ID:JtuV1Db/0
単なる製造委託でもIntelがやるとラインの買い上げになるのか
401,,・´∀`・,,)っ-○○○:2009/11/05(木) 01:53:41 ID:JQjZeHoq0
そりゃTSMC最先端の40nm Fabの一つがまるまるAtom製造用だし。
402名称未設定:2009/11/05(木) 02:12:37 ID:TpAftpO50
TSMC Fab14 40nmで作るAtomって何よ?
LangwellはTSMC 65nmのはず

IntelのSoC向けプロセスロードマップはあるし 45nm→32nm→22nm
http://pc.watch.impress.co.jp/img/pcw/docs/212/014/kaigai7.jpg
http://pc.watch.impress.co.jp/img/pcw/docs/212/014/kaigai8.jpg
403,,・´∀`・,,)っ-○○○:2009/11/05(木) 02:15:42 ID:JQjZeHoq0
Intelが自社Fabで作るSoCはそのロードマップの通りだろ。
ARMがそうであるのように、Atomをコントローラとして使いたい他の企業にも解放する。
だからロードマップなんて無い。顧客が付き次第。
404名称未設定:2009/11/05(木) 06:43:52 ID:JtuV1Db/0
>>401
いや、だからFab丸ごとAtom用なんてどこから出てきたんだ?
そんなにキャパ埋められるわけないだろ
405,,・´∀`・,,)っ-○○○:2009/11/05(木) 09:46:46 ID:JQjZeHoq0
ネタ元が被害妄想のNVIDIA儲だったかもね
生産キャパを殺いでFermiの量産を阻止するつもりだとか云々
相手にするだけ無駄か
406名称未設定:2009/11/05(木) 20:34:49 ID:+pcBtANq0
ギャグでやってんのこれ?
まったく笑えない

399 :,,・´∀`・,,)っ-○○○:2009/11/05(木) 00:14:00 ID:JQjZeHoq0
何の為にわざわざTSMCの製造ラインまるまるAtom用に買い上げたと思うよ

403 :,,・´∀`・,,)っ-○○○ [sage] :2009/11/05(木) 02:15:42 ID:JQjZeHoq0
ARMがそうであるのように、Atomをコントローラとして使いたい他の企業にも解放する。

405 :,,・´∀`・,,)っ-○○○:2009/11/05(木) 09:46:46 ID:JQjZeHoq0
ネタ元が被害妄想のNVIDIA儲だったかもね
407,,・´∀`・,,)っ-○○○:2009/11/05(木) 22:52:25 ID:JQjZeHoq0
だんごあげるから許せ
408290:2009/11/10(火) 08:49:13 ID:c8iHgPi90
TSMCは32nmでも梃子摺っている
ttp://www.semiaccurate.com./2009/11/09/tsmc-slips-their-32nm-process/
性能
Intel 32nm>TSMC 28nm>TSMC32nm
密度
Intel 32nm>TSMC 28nm>TSMC32nm
投入時期
Intel 32nm>TSMC 32nm>TSMC28nm
409名称未設定:2009/11/10(火) 08:50:50 ID:c8iHgPi90
何か残ってたわ
410名称未設定:2009/11/10(火) 09:13:52 ID:P8aJS9x00
TSMCは28nmをフルノードにするって言ってるからな
逆に言えば32nmは期待するなってことだ
411名称未設定:2009/11/12(木) 23:32:57 ID:ml7u56XC0
インテル、新型SSDを近日投入――HDD並みの容量を持つ企業向け製品も
ttp://www.computerworld.jp/topics/storage/167389.html

インテル、2.3/2.5/3.5GHz帯対応のWiMAXモジュール「Kilmer Peak」を製造開始
ttp://www.computerworld.jp/topics/uw/167111.html

インテル、vProテクノロジーの堅調な導入実績をアピール
ttp://www.computerworld.jp/topics/mp/167349.html
412OOO-⊂(´∀`旦⊂☆諫碕:2009/11/13(金) 22:40:08 ID:hK88L6Cj0
■後藤弘茂のWeekly海外ニュース■
AMDが次期アーキテクチャ「Bulldozer」と「Bobcat」の概要を明らかに
http://pc.watch.impress.co.jp/docs/column/kaigai/20091112_328392.html

AMDネタはすっかりスルーモードだが、けっこう面白い情報がでてきたな。
Bulldozerはアーキテクチャからみてどう見てもサーバ向け。
今更感はあるが開発開始当時スループットコンピューティング志向の流れをみたAMDなりの回答でしょう。
実際のところPC向けではBarcelona系がしばらくCPUコアとしてつづきそうで、その後継とはならなそうだね。
Sandy Bridge等と市場が競合するのは計画通りいったとしてLlano系になりそうです。
両社はやはり結局のところ近い方向性を進んでいるようにみえる。
413,,・´∀`・,,)っ-○○○:2009/11/14(土) 01:19:00 ID:Ep6Chbf+0
LlanoはAVXサポートしないのかね
414OOO-⊂(´∀`旦⊂☆諫碕:2009/11/15(日) 14:29:41 ID:UyxcQfZa0
もしLlanoでAVXサポートとしていたら、
今から宣伝して困る理由はないだろうから無いに俺的には1票だな。

あとBulldozerのInteger Coreは後藤やDresdenboyのように
ALU(+AGU)+ld+stが鉄板予想。性能予想のグラフをみてもそうだが
コアあたりの性能はおちるし、スループット志向のサーバ向け製品であって、
とてもK10系コアの全面置き換えにはならない。

Bobcatはダイサイズ半分でもセオリーどおりいけば70%位の性能は維持できるから、
あとはプロセスが進んだ分と電力マージンが出来たのをクロックに20%-30%ふれられれば2issue OOOでも
高電力版は現行品の90%くらいの性能はでてもおかしくない。
415OOO-⊂(´∀`旦⊂☆諫碕:2009/11/15(日) 14:30:50 ID:UyxcQfZa0
まちがえた2 ALUだ。
ALU(AGU)+ALU(AGU)+ld+st
416,,・´∀`・,,)っ-○○○:2009/11/15(日) 18:20:25 ID:p8griTW90
いやそれはおかしい。
AGUはアドレスを解決してLoad/Storeユニットを動かすためのものだ
Load/Storeのみで独立したリザベーションパイプを持つのだとしたら
AGUはLoad/Store側が持つことになるだろ。
417OOO-⊂(´∀`旦⊂☆諫碕:2009/11/15(日) 21:45:05 ID:UyxcQfZa0
整数ユニットにLSUをぶら下げるのってAlphaの伝統なんだよな。
Bobcatみるなり、その伝統やめるのかもね。
ALU+ALU+ld(AGU)+st(AGU)
かな。
AGUとld/stをわざと分ける方式もある。IntelのSTAユニットもそう。
早めに実効アドレスを生成してStoreバッファに書き込みしていくだけをやると
依存性解析に使える。
418OOO-⊂(´∀`旦⊂☆諫碕:2009/11/15(日) 22:17:44 ID:UyxcQfZa0
BulldozerにおけるClusterd-Architectureとは、構造的にはおおざっぱに言えば、
整数部がCMP風味、FP部がFGMT風味のアプローチであり、普通のマルチコアよりもリソースを節約したものだ。
でも、この事実は大して重要じゃなかた。
実は意外や意外、Clustered-Architectureの目指していた目標は、IntelでいうところのTurbo Boostなのだ。
419名称未設定:2009/11/15(日) 23:21:55 ID:qId6j8vh0
FP演算はINTに比べて消費電力が大きいから実行ユニットの稼動状況をリアルタイムで計測して
ワークロードがINT中心の場合はその程度に応じてクロックを上げるというのがTukwilaのFoxtonだが

クラスタなんちゃらでFPの演算リソースをINTに対して少なく配すればターゲットクロックは高くできる(ヘッドルームを確保)


って話? >>418
420OOO-⊂(´∀`旦⊂☆諫碕:2009/11/15(日) 23:23:32 ID:UyxcQfZa0
IntelのTBはコアが多数同時稼働している状況では低クロックで回るようになっている。
TBは、シングルスレッド性能とスループット性能のバランスの問題に対して柔軟な橋渡しを実現し、
マルチコアCPUの汎用性を高める技術でもある。

AMDは同じバランスの問題を全くソリッドな方法で対処しようとしたんだろ。
プロセッサの設計には4,5年かかるので、開発開始からリリースまでに世の認識が変わっていることはよくある。
マルチコアへの機運が高まっていた当時、TBはない。
421,,・´∀`・,,)っ-○○○:2009/11/15(日) 23:30:06 ID:p8griTW90
いや、結果的には最大2倍のスループットを得ることができるFPUへのデータ供給のためだよ。
8DP/16SPを捌くためには同数のDPをロードするのがAMDの美学のようで。
かといって1つのL1キャッシュの帯域を2倍、ロードユニットを4本にするのは現実的ではない。
整数パイプごとに32byte/clkの帯域、2WayのLoadなら十分に供給できる。
2スレッド使う必要があるが、逆にFP演算のレイテンシを隠蔽するにはスレッド数を増やした方が有効だろう。
まあ、こういうアプローチはHPC以外にも使い道はあるんだけど。

IntelのSandy Bridgeは32byte Load + 16byte Storeで、ロードユニットは2本に増えただけでしかない。
YMMレジスタでレジスタ空間が倍に増えること、ブロードキャストを有効に活用することで
実効ロード帯域をセーブする方式でGEMMやFFTは賄えると判断したようだ。

結果としてSandy Bridgeの1コアとBulldozerの1モジュール(2整数コア+浮動小数ユニット)は
同じ程度の実装面積になりそうだが、なかなか面白そうじゃないか。
422OOO-⊂(´∀`旦⊂☆諫碕:2009/11/15(日) 23:47:34 ID:UyxcQfZa0
団子先生はやたら細部に関心があるようだが、単に結果を重視しない議論をしたいならともかく、
プロセッサの動向予測という目的の中では、おれの経験からいってもそんなのは殆ど無駄としかいいようがない。
FP演算やHPC用途をやたら注目しているようだが、
基本的に汎用プロセッサでFPやSIMDってオマケ。
整数を大胆に犠牲にしてアーキテクチャを練ることはない。
確かに最近のサーバ用CPUではFP/SIMDを強化する路線が流行ってきているものの、
BulldozerのIntegerはスループットを重視しただけ。
サーバ市場メインのCPUでFPを複数同時に走らす想定は無駄だし、
FP共有化で8DP/16SP重視ってのは悪かないだろ。
423,,・´∀`・,,)っ-○○○:2009/11/15(日) 23:51:49 ID:p8griTW90
マトリクス演算はHPCでなくとも割と汎用性あるんだけどな。
4x4程度なら回転とかでゲームでもよく使うし
424OOO-⊂(´∀`旦⊂☆諫碕:2009/11/15(日) 23:54:38 ID:UyxcQfZa0
アフィン変換でそ。
3Dゲーがなければ、FPもPC市場でこうまでメジャーにならなかっただろうな。
FPは本当はマイノリティなんだ。
425,,・´∀`・,,)っ-○○○:2009/11/16(月) 00:09:17 ID:hDiD8W7T0
AMDみたいな形式だと1コアHTよりは理屈上性能は出せるが2コアよりは低性能なアプローチ
426名称未設定:2009/11/16(月) 10:54:52 ID:Bsa8n4vG0
トランジスタあたりの消費電力削減が行き詰ってダイあたりの性能に移行するか
将来はダイの大きさで勝負することになるの?
427OOO-⊂(´∀`旦⊂☆諫碕:2009/11/16(月) 20:23:22 ID:itr1dYjW0
http://arstechnica.com/hardware/news/2009/11/amd-bobcat-bulldozer.ars
>As you can see in the diagram above, there are two integer schedulers, each of which feeds four pipelines:
> two integer pipes and two memory pipes (load and store).
> Right now, AMD is referring to each integer scheduler and the pipelines associated with it as a "core,"
>making each Bulldozer module "dual-core."

arsにBulldozerの整数コアのユニット構成が既に
>two integer pipes and two memory pipes (load and store)
って書いてあるのだが、これはAMDから聞いたのか、それともarsの中の人の妄想なのだろうか?
428OOO-⊂(´∀`旦⊂☆諫碕:2009/11/16(月) 20:45:53 ID:itr1dYjW0
まあ長文なんて書いていてばかばかしくなるところであるが、
一応もう一度同じことを書いておこう。

マルチコアの初期からの問題として、コアを増やしていくのにはNiagaraのように小規模なコアを多数集積して
スループットを重視して設計した方がよいのか、それとも旧来からある大規模コアを集積して
シングルスレッド性能を極力維持していった行った方がよいのか、という方向性の見定めがあった。

大規模コアを多数集積し、同時にコアを稼働させた場合は、電力の上限から低クロック動作を余儀なくされる。
したがって、TBのような動的な性能/電力制御を想定していない場合、初めから低いクロックでの動作を見込まなければならず、
そんなことなら初めから全コアが電力で稼働しても電力の上限に到達しない小規模のコアを集積した方がトータルスループットがよいということになる。

このような大規模コアを小規模コアをただ並べていくというアプローチの無駄に正攻法でハード的に対処しようとしたら、
マルチコアで冗長なリソースは共有・統合化し、スループットを稼ぐ上で都合がよいリソースは多重化して、
小規模コアと大規模コアの間に存在する、スループット性能とシングルスレッド性能のトレードオフの関係をちょうど良いところで折半し、
一定の電力の範囲でベストなパフォーマンスを提供するというアプローチにいたるわけで、
それがクラスタードアーキテクチャである。

Bobcatでも今日のメインストリームの90%の性能といわれているとおり、2-issue OOO相当のコアでも
そこまで極端にシングルスレッド性能が落ちるわけではない。
Bulldozerの場合、フロントエンドはワイドだから、2-issue OOOの整数実行コアでも3-issueに近い性能が出てもおかしくない。
特にOOOプロセッサの場合それくらいフロントエンドの帯域は重要だ。
429OOO-⊂(´∀`旦⊂☆諫碕:2009/11/16(月) 21:02:11 ID:itr1dYjW0
わかりにくいことに、
問題なのはここ最近のIntel系のマルチコアが地味にもかなり大きな革新を果たしていることなのです。

Turbo Boostは、同時に導入されたPower Gatingの効果もあって、
シングルスレッド動作時には、単一コアを全力でまわしながらも他のコアの電力はまるで無視できるところまで降下するし、
スループット志向のプログラムでは複数コアをより低クロックでまわすことで一定の電力の範囲を守りながら常時ベストなパフォーマンスを
発揮するように動作する。

既にLynnfieldやClarksfieldの時点でTB時と全コア稼働時のクロックの格差は歴然たるものになっているし、
最近話題のSandy Bridgeでのグラフィックスの統合化や、Haswellであるかもしれないストリームコアの統合化
などの展望もTBによってシングルスレッド性能に保険がかけられているところで説得力を増しているわけだ。

これらの議論はここ一年余りで登場した新しい話題で、Bulldozerのアーキテクチャには殆ど影響を与えていない。
またここ数年で国内のCPU関連の情報の速報性や議論の早さは著しく進歩している。
Core 2のリリースくらいのときはこのスレが国内最速だったくらいショボいものだったからな。
したがって、Intelの構想の噂に慣らされて、自分たちが無意識のうちに進んだ認識をもっている実感のないPCオタの目には
クラスタードアーキテクチャは、HTともCMPともつかない中途半端で不可解なアーキテクチャにみえるのである。
本当はむしろTurbo Boostでクロック調整できるからコア増やしてもいいだろってアプローチの方が
Intelの壮大な独自路線なのかもしれないのにね。
430OOO-⊂(´∀`旦⊂☆諫碕:2009/11/16(月) 21:05:44 ID:itr1dYjW0
まあといっても既にIBMのPower 7は動的クロック制御で10%位は調整かかることがわかっているのだが。
最近はハイエンドプロセッサを作っている会社もへったからなにがユニークなのか判断がつきにくくなってしまったな。
431,,・´∀`・,,)っ-○○○:2009/11/16(月) 23:52:11 ID:hDiD8W7T0
> two memory pipes (load and store)

やっぱし1モジュール内のFPUが利用できるロード・ストア帯域は合計64byte/clkなわけだな
432,,・´∀`・,,)っ-○○○:2009/11/17(火) 00:18:10 ID:in64F/m50
やっぱ4ALU / Int.Coreらしいよ
433名称未設定:2009/11/17(火) 01:14:46 ID:m2gsTluy0
デコーダの帯域足りるのかな
Trace Cacheっぽいのがあるんだっけか

Power Gatingの導入は是非とも実現してもらいたいけどIntelの
特殊プロセスっぷりを見ると分社化したAMDにとっては厳しいかなあ
434,,・´∀`・,,)っ-○○○:2009/11/17(火) 02:17:06 ID:in64F/m50
>デコーダの帯域足りるのかな

命令フェッチ帯域なら十分でしょ。32byte/clkあれば。

デコードは4命令/clkだけどはなから全部動かす気はないでしょ。
片方のスレッドがストールしたらもう片方が全力で使える程度に余剰性能が必要なんでしょ。

Nehalemの命令帯域は16byte/clkと、4issueにしては致命的に足りてなさ過ぎるんだが
実際のワークロードでは命令供給以上にメモリがネックなんでしょ。
435OOO-⊂(´∀`旦⊂☆諫碕:2009/11/17(火) 19:48:24 ID:xvZTyT3r0
>>432
元ソースみたがたぶんガセだろうね。
というか4 ALU + 4 ALUという構成だったとしたら
それこそBulldozerは期待できないのだろうに。
Barcelonaで散々遅延したあげく、大電力で性能がでなかったのから
何も感じなかったのだろうか。
436OOO-⊂(´∀`旦⊂☆諫碕:2009/11/17(火) 19:49:43 ID:xvZTyT3r0
ちなみに万が一無謀にも4-issueだったら、Alphaライクに
ALU +ALU/AGU + ALU + ALU/AGU
で2 Loadだとみた。
437OOO-⊂(´∀`旦⊂☆諫碕:2009/11/17(火) 19:51:33 ID:xvZTyT3r0
個人的には2-issue OOOっていうバランスは既にBobcatでは確定しているわけだが、
2011年時点の電力性能比的にはけっこうおいしいゾーンだとおもっているのだが。
438OOO-⊂(´∀`旦⊂☆諫碕:2009/11/17(火) 20:21:32 ID:xvZTyT3r0
http://www.ospn.jp/osc2009-shimane/amd.pdf
ここのスライドの14 pageにInterlagos 16 coreまでのパフォーマンス予測が書いてある。
これによれば整数スループット性能は
Istanbul 6 coreが約17で
Interlagos 16 coreが約33であり
Istanbul vs Interlagosでは2倍弱であることがわかる。
(Magny CoursはMCMに押し込んだだけの設計のため、単純にクロックが低いとみえる。)

IstanbulとInterlagosが便宜上ほぼ同クロックであると想定して考えると、整数理論演算能力としては、
Istanbul = 3 ALU x 6 core = 18 ALU
Interlagos 2 ALU説 = ( 2 ALU x 16 core ) = 32 ALU
Interlagos 4 ALU説 = ( 4 ALU x 16 core ) = 64 ALU

であり、2 ALU説ではInterlagosはIstanbulの2倍弱であるからALUの稼働率比としては、IstanbulとInterlagosでほぼ同レベルで、
わずかにInterlagosがよいという程度。
しかし、4 ALU説ではIstanbul比でで50〜60%程度のALUの稼働率であり、せっかくクラスタ化してフロントエンドを共有しても
従来よりも遊んでいる場合が多く、非効率であるという解釈になってしまう。
また、AMDのいう+50%の投資で、+80%のスループットという発言ともかけ離れていて整合性がとれない。
439OOO-⊂(´∀`旦⊂☆諫碕:2009/11/17(火) 21:01:18 ID:xvZTyT3r0
>>431
BulldozerのFPUは、L1を介さずに、L2と直接データのやりとりをするという説を唱える人もいますよ。
つまりブロック図では隠された独自ユニットからアクセスしているのかもしれないのだ。
BulldozerのFPクラスタのターゲットプログラムがよりメモリインテンシヴならばそっちの方がよいかもしれない。
積和に力をいれているならありそう。
440,,・´∀`・,,)っ-○○○:2009/11/18(水) 01:22:50 ID:GoxzWJsL0
ないない

排他キャッシュだと死ぬる。
それともInclusiveにするのか?
441名称未設定:2009/11/18(水) 18:52:34 ID:EopSiN2r0
信頼度低めの日本語訳
ttp://www.heise.de/newsticker/meldung/SC09-Intel-demonstriert-Larrabee-mit-ueber-1-Teraflops-862305.html
SC09でシングルカードのLarrabeeがSGEMMで1TFoverというデモが行われた。現行最速のTesla C1060は320GF。
1TFのデモは試作品のOCによって行われた。(多分2006年の80コアと同じ手法)
OCしない場合は理論性能712GFでSGEMMは417GF?

堅固な情報統制の行われていたLarrabeeだが、「遅延は無かった(by ラトナー)」。
GPGPUはCPUとのデータのやり取りがボトルネック。
IntelはQPIでCPUとLarrabeeを直結しメモリ空間を共有(M-Y-O)するモデルを出す。

Nehalem-EX 'も' 2010年前半に出す。HPC向けに6コアの高クロック版を出す。
442OOO-⊂(´∀`旦⊂☆諫碕:2009/11/18(水) 20:52:42 ID:Jlv2m8O/0
>>440
基本的にはおれもそんなに信じているわけじゃないが、
Bobcatをみてもそうだが、BulldozerやBobcatは従来のK7以降のAMD x86の伝統を踏襲しない可能性も高いだろ。
443,,・´∀`・,,)っ-○○○:2009/11/18(水) 22:10:05 ID:GoxzWJsL0
実はInclusiveでも面倒なことに変わりない

同じキャッシュラインを整数パイプと浮動小数パイプで読み書きやってたとしてみ?
キャッシュラインのinvalidateしまくって性能でない。
444,,・´∀`・,,)っ-○○○:2009/11/18(水) 22:18:12 ID:GoxzWJsL0
もしやるとしてnon-temporal load/store専用だな。
write-allocateな命令をダイレクトにL2にストアやろうってのはいろいろ不都合が生じる。
L1キャッシュが破綻する。
445OOO-⊂(´∀`旦⊂☆諫碕:2009/11/18(水) 22:36:02 ID:Jlv2m8O/0
団子先生の脳内シミュの正当性はともかく、FPはL2から直接読むアーキテクチャが実際めずらしくもないけどね。
446OOO-⊂(´∀`旦⊂☆諫碕:2009/11/18(水) 22:40:43 ID:Jlv2m8O/0
これ以上の議論はアーキテクチャを語るスレッドや技術談義を楽しむという目的のスレッドではないので、
自作板にたくさんある同種の談義スレでやってほしいな。
議論のための議論になってしまって、真実に近づいている感じしないもん。
447OOO-⊂(´∀`旦⊂☆諫碕:2009/11/18(水) 22:45:10 ID:Jlv2m8O/0
>>445
という書き込みをどっかで最近みたとおもったら例によって安藤氏のサイトだったか。
まあ、あのブロック図をみてL2に直接つながっていると判断するのは飛躍しすぎであるが。
448,,・´∀`・,,)っ-○○○:2009/11/18(水) 22:46:07 ID:GoxzWJsL0
>>445
x86じゃないだろそれ。

スカラでストアしたデータをSIMDデータとして読み出したりその逆をやったりってコードはアホみたいにある。
軒並み性能的に死ぬる
449OOO-⊂(´∀`旦⊂☆諫碕:2009/11/18(水) 22:51:29 ID:Jlv2m8O/0
まあおれも実際問題L2ダイレクト説はあまり賛同してないからいいんだが。
それはそうと、個人的にはBobcatが実はいちばん自作的には流行しそうだと思っているのだが、
自作板では評価イマイチなんだね。
450名称未設定:2009/11/18(水) 23:03:48 ID:EopSiN2r0
そらそうだ
Atomに勝てそうな気配がねえもん
451OOO-⊂(´∀`旦⊂☆諫碕:2009/11/18(水) 23:07:52 ID:Jlv2m8O/0
AtomはMIDやらスマートフォンやらがあくまでもIntelの眼中だから
コアを拡張して性能をあげようという話は少なくとも現段階のロードマップではでていない。
コスト面でULV Core、性能面でAtomに勝るなら、PC市場ではIntelの手薄なところに上手くはまると思う。
32nm, 2-issue OOOがそこそこのクロックでまわれば大抵のPCの用途には事足りるしな。
つーか、一番Bulldozerが微妙だろ今回のは。
452名称未設定:2009/11/18(水) 23:27:06 ID:EopSiN2r0
この辺から割かれるリソース(やる気)の少なさを感じている。今でもIntelは派生品へきっちりリソースつぎ込んで設計してるし。
ttp://pc.watch.impress.co.jp/docs/column/kaigai/20091112_328392.html
> BobcatもBulldozerと同じく2011年に登場する予定だ。
>最初の製品はOntarioでノートPC向けとなる。
>また、Bobcatはカスタム回路を使わずに、再利用しやすいように高レベル言語で書かれている。
>そのため、バリエーションが多数登場することが予想される。

つーか、もともとBobcat自体2009年だかに登場する予定だったのがBulldozerが遅れて、そっちにリソースを回す形で遅延しているわけで。。。
AMDの中でもプライオリティも垣間見える。

んで、かなり悲観的に見積もっても2011年にはIntelは最低限の地歩を固めている(AtomのR&DをAtom自身の売り上げから捻出することが出来る)だろ。
AMDはそういう手ごわい先行者を追撃する体制に無いと考える。
453名称未設定:2009/11/18(水) 23:27:54 ID:EopSiN2r0
×AMDの中でも
○AMDの中での
454名称未設定:2009/11/25(水) 20:08:38 ID:66MSSZ3u0
まあ無能の意見は狂ってるからね。
自分が駄目なのまで国のせいにしたがるし。

有能・無能に国境はない。
有能な人間は大体どこの国でも通用するし、有能であればあるほど国は関係ない。
無能は母国で他人の足を引っ張りながら暮らすのだけで精一杯なんだよ。
最近になって元々無能だった人間たちが、いままでの暮らしを維持できるか不安になってきて
ウダウダいってるだけ。

無能にはどのみち国を改善する能力など最初からないのだから
いつ改善するかもわからない国に文句をたれている暇があるのなら、
自分の現状を自力で打開する策を自分自身で考えていた方が全くお利口さんじゃないか。
有能な人間はそれが自然に最初っからできているから違うんだよ。
自分の飯は他人など信用せずに自分で調達する。それができないやつには死に近づいていく。
有史以前から当たり前の現実をなぜウダウダいって承伏しないんだ?
455OOO-⊂(´∀`旦⊂☆諫碕:2009/11/27(金) 00:12:45 ID:pIO1ytjl0
Sandy Bridgeのサーバ版がおれ的にけっこう予想外だった件について。
ゆくゆくは統合すると思ってたけど、2チップでいきなりくるとはね。まあいいけど。
456OOO-⊂(´∀`旦⊂☆諫碕:2009/11/27(金) 00:15:14 ID:pIO1ytjl0
なんかNehalemからLGA136x版のSNBへ移行狙ったほうが世下げに思えてきたな。
あと、後藤先生の記事のAMDの中の人の話がこっちは想像通り過ぎてワラタ。
457OOO-⊂(´∀`旦⊂☆諫碕:2009/11/27(金) 00:48:25 ID:pIO1ytjl0
Sandy Bridgeのサーバ版が2チップであることが発覚してSoC化路線色がさらに濃厚な印象になった。
>>328に書いたとおり、統合化による電力削減の効果はTB等の効果範囲も広がることも相乗して、
絶対性能の獲得につながっていくからサーバでもSoC色が徐々に強くなっていくことは不思議ではないし、
はやめに統合しといたほうが良いという判断もあったのかもしれない。
458OOO-⊂(´∀`旦⊂☆諫碕:2009/11/27(金) 00:49:51 ID:pIO1ytjl0
話はかわってコストの話はわざと書かないでいたわけだが今のうちにちょっとかいときます。
コスト面については、全般AMDのやつは現状よりも攻勢かけやすくなるかも。
Intelは今のところ単体の状態のコアを極力いじらないでリングでつなぐだけの方向で一貫している。
マルチコアの派生品展開に必要な開発期間を徹底的に短縮する方針に見える。
これまでのところ汎用コアだけじゃなくLRBやGMAのようなコアも殆ど単体の状態から
マルチコアのためにつっこんだ最適化はしてないという一貫っぷり。
このアプローチだと冗長部分があるから製造コスト面で不利になるが、
古くから機能の無効化に積極的なIntelは、派生品に対して製造時点での冗長部分をつぶすことには消極的だった。
このIntelのやり方は、うまく開発期間をおさえられれば結果的には新しいCPUが速く手に入ることになり、
結果的に性能を高くを維持できるから、同時代でより高速なCPUをリリースできることと同義になる。
また例えば非対称で大量にLNIコアを集積したやつがこけてもすぐに保険プランの派生品で巻き返せるため、リスクがそもそも少ない。
AMDのクラスタアーキでは製造面でのコストは抑えられるが開発期間/開発コストが逆に大きくなる。
電力では今のところLynnfield時点でIntelのTBの完成度ばおれとしても予想以上。
まあ総じて言うとIntelうまくいきすぎなんだよな。
AMDもTBライクなものは導入する予定はあるようだが、クロックなり、命令あたりの電力コストなりを動的に調整して
乗り切ろうってのはIntelのが一番性格が強くでているのは間違い無いと思う。
459,,・´∀`・,,)っ-○○○:2009/11/27(金) 02:42:01 ID:kakEWK6S0
>>458
>>458
Intelがまたネタプロセッサの発表するってさ。

461 名前:Socket774[sage] 投稿日:2009/11/27(金) 00:51:52 ID:D7mBF9pc
http://www.isscc.org/isscc/2010/ISSCCAP2010.pdf
ISSCC2010のプログラムがあった。
intelの発表は色々あるようだけど、48個のIA32コアと4chのDDR3をメッシュでつなげたものを
45nmで作ったチップの発表が予定されている。
しばらくはコア間接続はリングバスになりそうだけど、さらに多数のコアを載せるときは
メッシュの方が有力と考えているのだろうか。



日本が京速やるだのやらないだの揉めてるときに製品化予定もないプロセッサ開発してみたりとか
そういうことにポンと投資できる余裕が、世界最強の半導体メーカーを支えてるんだぜ
国産スパコン復権なんて永久にあり得ないと悟ったよ
460,,・´∀`・,,)っ-○○○:2009/11/27(金) 03:06:07 ID:kakEWK6S0
それと、Bulldozerは50%の面積増で80%のスループット向上をうたってるが
それって結局面積効率は1.2倍程度なわけで、HTより優位な技術というわけではない。
461OOO-⊂(´∀`旦⊂☆諫碕:2009/11/27(金) 03:15:56 ID:pIO1ytjl0
以前後藤スレでもにおわせたが、まじめな話、IntelがCtの土台にのせようとしている
並列志向のアーキテクチャは複数ある。Intelの論文なり資料をみるなりそう考えといた
方がベター。だから実はLRBはその候補の中の一つにすぎないんだよな。
しかしまだおれたちにはこの議論は早すぎる。頭に入れておくだけでいい。

SoC無線スパコンマダー??
462名称未設定:2009/11/27(金) 10:57:13 ID:Io+tY/4/0
面積効率だけを語るならデュアルコアなんかお粗末な技術になってしまう
CBMTの利点はHTより絶対的な性能が上がる点でしょう
HTは性能落ちる場合だってあるし
463OOO-⊂(´∀`旦⊂☆諫碕:2009/11/27(金) 19:38:56 ID:2Ui1ib200
まあその一見SMTと比較したくなるであろう人たちのために
おれは書いてるわけだが、わかってくれてなくて残念。
SMTってのはCMPともともとあまり競合する技術ではないし、
クラスタドアーキはAMDもいってるとおり最適化したデュアルコアであって
マルチコアのこれからに対するAMDの回答なんだよ。
SMTはぶっちゃけほとんど関係ない。
電力や面積を最適化することがこれからのマルチコア同士の対決の中で優位性を得ることにつながるわけで、
すぐにPCのイメージで、HTはリソースがというやつは最近のCPU事情が全くわかってないです。
>まず我々は、CPUアーキテクチャにスループット時代が来ると予測した。
>そして、その時代に向けて、最もパワー効率が高く、最も密度の高いスループットエンジンを開発することにした。
AMDもあっさりといってくれたよ。
464OOO-⊂(´∀`旦⊂☆諫碕:2009/11/27(金) 19:52:19 ID:2Ui1ib200
>それも、シングルスレッドパフォーマンスについて妥協せずに。
>そのために、CPUのワークロードを研究し、各ワークロードがシステムの中でどのように振る舞うかを研究した

シングルスレッド性能に対する妥協ってのはNiagaraのよう単に電力を抑えたい、
沢山コアを並べられるようにしたいっていう縮小路線の妥協であって、
SMTなどと比較して整数のリソースの共有がどうこうの話じゃない。
後藤のこの部分の解説は全く的を得ていない。
AMDの人は単に整数は使用頻度が高く、FPは少ないといっているだけだろうに。それがなんでHTになるのだ?
スループットや電力という言葉が重要なんだよ。
465OOO-⊂(´∀`旦⊂☆諫碕:2009/11/27(金) 19:55:35 ID:2Ui1ib200
NiagaraはFPはいらんとばかりにあっさりて捨て去り、電力効率を増すためにコアを極力コンパクトにした。
AMDのは妥協は最小限にしようとしている。AMDがいいたいのはそういう話。PCオタの大好きなHTは関係ない。
466OOO-⊂(´∀`旦⊂☆諫碕:2009/11/27(金) 21:25:46 ID:2Ui1ib200
http://pc.watch.impress.co.jp/docs/column/kaigai/20091127_331818.html
Arrandaleからパッケージターボやるのか。Nehalem予想外に色々やってくれるな。
467,,・´∀`・,,)っ-○○○:2009/11/28(土) 01:39:58 ID:J1/fezTO0
BulldozerってNehalemのLSD同等の仕組み使って小さいループに限ってだけ
キャッシュされたμOPsを再利用されて2スレッド合計で最大8命令同時発行できる仕組みらしい。
これって別に実効性能が上がる技術じゃないよな。

ちなみにNehalemは別に同時命令発行数を上げるためにLSD採用してるわけじゃないからな。
468,,・´∀`・,,)っ-○○○:2009/11/28(土) 01:49:47 ID:J1/fezTO0
>>462
Bulldozer 8スレッドはCoreMAの4コア8スレッドよりはスループットが出るかもしれないが
Core MAの本物の8コアよりは弱いと思うんだ。

面積効率語るにはそういうレベルで見ないといけない。
469,,・´∀`・,,)っ-○○○:2009/11/28(土) 02:01:38 ID:J1/fezTO0
本当はBulldozerも浮動小数重視だがSandy BridgeのFP性能が化け物と判明して
GPGPUがあるから整数だけで十分と強がる戦略に出ただけだと思うのです。
(Radeon向けのGPGPU開発環境はあまりにお粗末すぎるが)

LAMPサーバとかなら確かに浮動小数は要らんが、あくまでPCとして多コア必要な香具師って
動画処理、ゲームにせよ、浮動小数性能はいくらあっても足りないくらい欲しいと思うんだが・・・・
470OOO-⊂(´∀`旦⊂☆諫碕:2009/11/28(土) 22:44:15 ID:l/yEkxTt0
まあ後藤先生の記事だけ読むとさもFPを犠牲にしたかのような印象をうけるが、
FPを共有化してリソース集中ってのは別に性能稼ぐ手段としても悪くない罠。
実際にAMD公開している性能予想のグラフでInterlagos FP相対的に悪くないしね。
SIMD倍化の効果がでかいけど。
471,,・´∀`・,,)っ-○○○:2009/11/29(日) 15:01:47 ID:WWPxkK630
いや、後藤さんの図(AMD資料のデッドコピー)はあからさまにユニット数が減ったように見えるんだが。
FMISCとか何処行ったの?って感じ。
3ユニットあったものが2ユニットになってたら浮動小数性能落ちるって思うじゃない?
472,,・´∀`・,,)っ-○○○:2009/11/29(日) 15:04:32 ID:WWPxkK630
中の人が不正確だって言ってる図をそのまんま見てどうこうとか
473OOO-⊂(´∀`旦⊂☆諫碕:2009/11/29(日) 18:28:53 ID:Xk0knOdJ0
あれは簡略化された図だし、FMACしかないとか実際あり得ないからな。
単に新しいFMACを説明で強調したかっただけだろ。
グラフで示されているとおり、FP捨てたというわけじゃない。
FP演算ばかり延々実行しているようなワークロードは実際サーバでは超レアなわけで、
FPクラスタ部はどちらのスレッドからもハードウエアマルチスレッディングで切り替えて
実行できるようであるし、全く同じ時間にFP演算がかち合いつづける想定はあまり意味無いってことだな。

それよりこの特徴的なINT/FPの構成のアーキに最適化したコンパイラを作ってくれる
ベンダーはあるのだろうか?普通にCore 2系に最適化しただけじゃ実力でなさそうだな。
474,,・´∀`・,,)っ-○○○:2009/11/29(日) 22:37:02 ID:WWPxkK630
それはそれでSandy Bridgeで256bitのFADD+FMULとBulldozerの128bitのFMAC*2
どっちが良いかっていうと判断しかねる

まあBulldozerの設計段階で256bitという選択肢は無かったわけだろうが

475OOO-⊂(´∀`旦⊂☆諫碕:2009/12/05(土) 14:38:48 ID:PWoPvAcf0
今日からここは3年前を懐かしんでいくスレになりました。
476名称未設定:2009/12/05(土) 14:41:26 ID:QyROQi480
No Thank You
477名称未設定:2009/12/05(土) 15:26:05 ID:3dYt2kZj0
⊂(´∀`旦⊂氏の予測精度の高さに感服いたしますた!
478,,・´∀`・,,)っ-○○○:2009/12/05(土) 15:42:21 ID:E+7NrUPd0
>>475は俺の嫁
479,,・´∀`・,,)っ-○○○:2009/12/05(土) 15:48:08 ID:E+7NrUPd0
それはそうと、どうもBulldozerのFMISCは1本ぽいな
AMDのXOPの仕様書にIntel AVXでポシャったvpermil2ps/vpermil2pdの記述が追加
もっとも、もともとpermps/permpdの形で入ってたモノの読み替えだけどね。

こいつを活用する場合、転置行列積を求めてから転置行列を作る形になる
4x4行列積の場合、16回のSIMD積和算に対して8回のPermuteで済む。

vbroadcast*→vmul*→vadd* のIntelとは対称的だね。
480OOO-⊂(´∀`旦⊂☆μ:2009/12/05(土) 22:52:25 ID:PWoPvAcf0
プロセッサは電力(Power)だぜ!
481∃∃∃∃⊂(・∀・,,☆u:2009/12/05(土) 23:17:36 ID:PWoPvAcf0
なんとLarrabeeeは失敗作だったぜ!

612 :,,・ ∀ ・,,)っ-○◎○ [↓] :2008/10/25(土) 18:01:54 ID:L+S6Bhz8 (2/2)
Larrabeeは失敗作ですっ!!

624 :,,・ ∀ ・,,)っ-○◎○ [↓] :2008/10/27(月) 20:53:06 ID:Awv+woA0
>>613
できあがっていないものを、
これまでの情報から判断して失敗といっているのだ。
きみのような低能くんの予想とおなじじげんで語らないで欲しい。
おれは団子だぞ。

734 :,,・ ∀ ・,,)っ-○◎○ [↓] :2008/11/05(水) 23:28:06 ID:9Sl/DSog (8/8)
てーか、よくそこまで期待できるよな。
SIGGRAPHの論文がでた時点で、
「あ、これだめだね」
ってのがLarrabee追いかけてきたものの正直な感想だろう。
その後も期待できる話題はないな。
将来の統合話は別として。
482名称未設定:2009/12/05(土) 23:22:48 ID:PWoPvAcf0
#解説#
Havendaleのキャンセル予想に続き、LRBを失敗作であるとぐうぜん当ててしまった彼は
能力が超(スーパー)化してかつてのスレ主のように変身してしまったのだった…(・∀・)
483∃∃∃∃⊂(・∀・,,☆u:2009/12/05(土) 23:25:41 ID:PWoPvAcf0
という冗談はさておき
Haswellの運命がどうなるか楽しみになってきたな。
個人的には一度キャンセルしてSoC化の方向を期待しているわけであるが。
484∃∃∃∃⊂(・∀・,,☆u:2009/12/05(土) 23:49:46 ID:PWoPvAcf0
Part1 >>702-
http://itl.jisakuita.net/intel_ups_info/1121683774.html#R702

Keiferは32nmプロセスで、4coreを1ノードで32core集積って話で、
今思えばIntel版のBulldozerみたいな計画だったな。
Part1は1世代のシュリンクでコア面積が半分になるという間違った推測をして
Westmereの派生品であるとかぬかしているが、Mini Core系。
Keiferは整数重視だったんだろうけど。
485∃∃∃∃⊂(・∀・,,☆u:2009/12/05(土) 23:51:30 ID:PWoPvAcf0
>このサイズだとXeon MP/IPFクラスのハイエンド特化チップならsingle dieもありえなくもないな最近のトレンドだと。
>リングで中途半端なmcm構成もやだし、ことMany Coreに関しては冗長構成でコアを積極的に殺す方針でつくれば歩留まりも大分改善されるわけだし。
>意外とsingle dieでいけるかもしれない説浮上。

Becktonが8coreどまりなところからして、32nmでWestmere 32 core集積なんて
今の常識から考えて到底無理だぞ(わらぃ
486,,・´∀`・,,)っ-○○○:2009/12/05(土) 23:56:13 ID:E+7NrUPd0
Keiferは普通にBonnelみたいなLPIAだと思ってたよ
487∃∃∃∃⊂(・∀・,,☆u:2009/12/05(土) 23:57:09 ID:PWoPvAcf0
Part1 >>647-
http://itl.jisakuita.net/intel_ups_info/1121683774.html#R702


647 名前:名称未設定 :2006/06/25(日) 22:41:27 ID:wVCZoCKm0
intelerはコレどう思う?


ゲテモノテクノロジがきましたよ
>"Reverse(Anti)-Hyper-Threading"技術って、
>X2の2個のコアを結合し6IPC(3IPCx2個分)のシングルコアをエミュレートする技術とのこと(CONROEは4IPC)。

329 名前:Socket774[sage] 投稿日:2006/06/24(土) 23:36:08 ID:GbdsoFH3
http://nueda.main.jp/blog/archives/002203.html
パフォーマンス次第でAM2化けるなこれ。
939で出来れば神なのにw

336 名前:Socket774[sage] 投稿日:2006/06/25(日) 00:38:21 ID:W3KCOSqT
Intelも同じことやるそうですw
ケンツで4コアを1CPUにw

98 名前:Socket774[sage] 投稿日:2006/06/25(日) 00:33:05 ID:Utko172H
なんか似たようなのが…
CMT (Core Multiplexing Technology)
http://www.xtremesystems.org/forums/showthread.php?t=104178
488∃∃∃∃⊂(・∀・,,☆u:2009/12/05(土) 23:58:26 ID:PWoPvAcf0
ttp://itl.jisakuita.net/intel_ups_info/1121683774.html#R647

今思えば
上田新聞をみるなり、"Reverse HT"ってクラスタドアーキ初期構想が
変形して腐れルーマー化したまのだったんじゃね?
489,,・´∀`・,,)っ-○○○:2009/12/05(土) 23:59:17 ID:E+7NrUPd0
シングルスレッド性能を4issue以上に引き上げるためのアプローチではなかったものの
やっぱりCPUの最先端技術には何らかの伏線はあるんだな
490∃∃∃∃⊂(・∀・,,☆u:2009/12/05(土) 23:59:30 ID:PWoPvAcf0
652 名前:名称未設定 :2006/06/25(日) 23:00:43 ID:B3WpK4hv0
>>651
だから、マルチスレッドに分解する技術ではなかた。
部分的に2コア分のリソースを1コアに回すだけ。
それも現行コアでは難しいと思うけどな。

663 名前:inteler :2006/07/01(土) 12:53:35 ID:EoOwVEaJ0
特に速度向上主眼ではない理由でマルチスレッドを用いる状況はたくさんあるわけで、
そのようなアプリでは、複数コアが有効になった場合、逆に性能が低下してしまうケースもでるわけ。
(あるスレッドがぬるい処理しかしていなくて殆ど遊んでいたりする場合など)

OSはCPUに対して全知全能なわけはないので、
アプリ側の要求で、動的にいらないコアを殺して性能を維持したいCore Multiplexingのような技術が有効なってくるわけ。

片方のコアに複数分のコアのリソースを回すというのは、ハード設計の問題があるので、
現行製品ではこのような機能のための投資は殆どしてないだろうから難しい。
"Core"の場合、shared L2とL1-to-L1のリンクは生かされそう。
(しかし、これらの機能はいちいちいらんコアを殺さなくてもSingle Threadになれば勝手に働いてくれるわけだが)

今後の展開でも、実行ユニット、スケジューラのリソース使い回しははっきりいって不可能だと思われる。
頑張ってもFetch, Decodeなどのフロントエンドが限度かと。それでも帯域増やしながら遅延を一定に押さえるのは
容易ではないのでタダで速くはなりません。

電力・発熱の都合から考えて、いらんコアを殺してオーバークロックというFoxton系の展開は今後考えられる。
つーか、リソース回すより、オーバークロックで性能稼いだ方が、安上がりで効果も大きいんじゃないかと。
491,,・´∀`・,,)っ-○○○:2009/12/06(日) 00:00:16 ID:E+7NrUPd0
Inteler鋭いな
492∃∃∃∃⊂(・∀・,,☆u:2009/12/06(日) 00:01:26 ID:S8MnQmbp0
部分的に2コア分のリソースを1コアに回すだけ。

>今後の展開でも、実行ユニット、スケジューラのリソース使い回しははっきりいって不可能だと思われる。
>頑張ってもFetch, Decodeなどのフロントエンドが限度かと。それでも帯域増やしながら遅延を一定に押さえるのは
> 容易ではないのでタダで速くはなりません。

実際にBulldozerは頑張ってFetch, Decode統合したからうける。
493,,・´∀`・,,)っ-○○○:2009/12/06(日) 00:02:09 ID:BIG5ygr20
> L1-to-L1のリンク
そーいやこんなの噂あったけど未だに実用化されてないよな
Bulldozerで入るのかしら?
494∃∃∃∃⊂(・∀・,,☆u:2009/12/06(日) 00:04:11 ID:S8MnQmbp0
Core Multiplexingの特許はそのままTurbo Boostにつながっているから面白い。

だとすると、いらないコアを殺してオーバークロックまでは現在のところ実現してるけど、
シングルスレッド時に使うコアを動的に切り替えていって、
温度上昇を抑えるって展開は今後ありえぞうだな。そう特許にかいてあったわけで。
動的切り替えで温度抑えられれば、更なるオーバークロックにもつながる。
495∃∃∃∃⊂(・∀・,,☆u:2009/12/06(日) 00:06:11 ID:S8MnQmbp0
L1 to L1のリンクは結果からいうとガセ情報だったんだろ。今はそういう認識。
Core 2関連の噂も当時は精度わるかったからね。20B-24Bのフェッチ帯域ってのも結局ガセだった。
496,,・´∀`・,,)っ-○○○:2009/12/06(日) 00:08:59 ID:BIG5ygr20
うむ、AVX世代でもフェッチ帯域の縛りあるのは正直きつい
497∃∃∃∃⊂(・∀・,,☆u:2009/12/06(日) 00:11:00 ID:S8MnQmbp0
これがTurbo Boostだったわけね。

784 名前:名称未設定 :2006/07/30(日) 16:10:59 ID:htVIKc7F0
HotSpot対策という表現が適切かどうかはおいておくとして、
Core 2では、>>750に示されているように、一定の温度に達すると簡単にスロットリングが
働いてパフォーマンスが落ちてしまうので、発熱を分散させるのはパフォーマンスを維持する上でも有効なわけ。
また、静音化にも効果があるかと。
当然、>>783もいってる通り常に2coreがフル稼働しているわけじゃないから、>>779のような制御が意味を持ってくるわけ。
特許にもかいてあるけど、各コアの発熱がmax値以上に達するとやはり最終手段としてはスロットリングが働く。

desktopより発熱の制約が厳しいMeromではもっと有効かも。
将来のプロセッサではさらに既定どおりのクロック速度で常に動作している状況はどんどん減って、
マルチスレッド以前にクロックからパフォーマンスを推測するのは難しくなってくるんだろな。
498∃∃∃∃⊂(・∀・,,☆u:2009/12/06(日) 00:12:59 ID:S8MnQmbp0
そうそうcore hopping == Turbo Boost
だったんだ。Israelの特許。

>core hopping = 各コアの消費電力や熱をモニタして、クールなコアにプロセスを割り当てるようにしたり、
>>>668のように、熱くなったらコアをスワップしたり、クールなコアは昇圧でクロックあげたりなどの
>制御をハードウエアベースで行い活性化率を分散化。OSから単一コアにみえるって話はなしかな。
499∃∃∃∃⊂(・∀・,,☆u:2009/12/06(日) 00:14:07 ID:S8MnQmbp0
いや、やっぱそうでもないか。
ハードウエアベースにスレッドの動的コア割り当てってのは未だに実現できてないな。
Hypercore(笑)は似てるが。
500,,・´∀`・,,)っ-○○○:2009/12/06(日) 00:17:51 ID:BIG5ygr20
Hypercoreってイスラエル企業だね。Intelの傀儡企業というわけでもなさそうだけど。
501∃∃∃∃⊂(・∀・,,☆u:2009/12/06(日) 00:18:13 ID:S8MnQmbp0
>"Reverse(Anti)-Hyper-Threading"技術って、
>X2の2個のコアを結合し6IPC(3IPCx2個分)のシングルコアをエミュレートする技術とのこと(CONROEは4IPC)。
この初期構想どおりならBulldozerは、3 issueだったんだろうね。
今漏れは断然2issue説であるが。
502,,・´∀`・,,)っ-○○○:2009/12/06(日) 00:21:17 ID:BIG5ygr20
4+4でもいけるんじゃないの?
大原さんの予想と被るけど
503∃∃∃∃⊂(・∀・,,☆u:2009/12/06(日) 00:23:45 ID:S8MnQmbp0
無理だろう。というかその話は書ききったのでボリ返しはなしだな。
ボリ返し始めたのは漏れだが。
504,,・´∀`・,,)っ-○○○:2009/12/06(日) 00:26:32 ID:BIG5ygr20
Barcelonaのダイレイアウト見るに整数パイプラインはそんなに面積食ってない。
むしろL1データキャッシュとLSUが大丈夫かと


505,,・´∀`・,,)っ-○○○:2009/12/06(日) 00:39:48 ID:BIG5ygr20
ところで俺のIDがBIG5だ
506名称未設定:2009/12/06(日) 01:33:39 ID:paDtyVj20
東工大の松岡先生情報
http://twitter.com/ProfMatsuoka/status/5643167774
>2年以上前にChuck Mooreから(もちろんNDAで)説明を受けたものとは
>大まかには変化していない。重要なことの一つはCore/Nealemと
>同等に4-issueなことだ。

そもそもSandy Bridge世代では8コアが出るようなのに,
整数演算ユニット8コアのBulldozerが4*(ALU+AGU)
を採用しづらいほどサイズが大きくなるとは思えない.

Bulldozerはホットスポットになるデコーダの数が半分になるから,
高クロックにできるのかなと思っていたけど,そんなことはないのか.
507名称未設定:2009/12/07(月) 02:09:33 ID:oLx/lgG10
イスラエルの特許のコアの動的制御で
Hyperthreadingも制御できないかな?
HTonだと実行性能が落ちる処理がある以上
そういう傾向くらいはintelも承知してるだろうし
HTがあるとまずい処理をしてるコアのHTは切っちゃう的な
508,,・´∀`・,,)っ-○○○:2009/12/07(月) 23:54:03 ID:DYByEWQO0
おい俺の分身でてこいや
509|ω・`):2009/12/08(火) 09:07:50 ID:DFBgeHWn0
Core/Nealemと同等に4-issue = 律儀に 4ALU+4AGU とかにすんのはもうやめました
ってことじゃないの?
510,,・´∀`・,,)っ-○○○:2009/12/09(水) 20:07:19 ID:OuPLqOl50
諫碕はガソリンかぶって火の中に飛び込むようなまねが好きなんだな
誤答スレに連レスとかwww

まあGPUはともかく、HPCでなら、45nmのあの仕様のまま出してもLarrabeeは
十分なパワーはあると思うけどね。GPUとしてのバランスとりに失敗しただけで。

というより、Sandy Bridge 6コアで倍精度実効100GFLOPS狙える時代が
間近なのに、ろくにローカルメモリも積んでないGPUで行列積の性能を
競うことがどこまで通じるかという問題もある。

1TFLOPSを自称してたTesla 1060がSGEMMで300GFLOPS, DGEMMで70GFLOPS程度だぜ。
そりゃFermiでは多少あがるだろうが、あのユニット構成、いまだにLU分解とか
最適化されてないだろ。
SFUを乗算ユニットとして使えなくなったことで自動的にGEMMでは使い物に
ならない分の理論性能が落ちたので、自動的に実効性能比は1.5倍程度あがる(笑)
計算にはなるだろうが。
511∃∃∃∃⊂(・∀・,,☆u:2009/12/09(水) 20:18:35 ID:4o1T9QKx0
まあLRBがキャンセルされた理由の一番は性能ってのは正解だろうな。
ベクトル特化のコアをリング1本でたくさんつないで、単体商品で売るみたいなのは未来永劫見られないでしょう。

というかLRBキャンセルは、変に注目していたGPU厨やHPC厨にとっては大きな話題なのかもしれないけど、
ぶっちゃけ、あまり重要なニュースじゃないんだよ。
もともと試作段階にあるよなものを、メニィコアの順調さを少しでも早くアピールしたいがために、
無理に製品化を公言して事前に情報公開していただけで、
話がおおきくなっているが、もともとIntelの本気度としてもItanicと比較できるような代物じゃないんで。
議論するだけ時間の無駄だね。
512∃∃∃∃⊂(・∀・,,☆u:2009/12/09(水) 20:27:29 ID:4o1T9QKx0
完全な妄想であるが、

Intel内部には、メニィコアよりも
例えばSoC化を推し進めて主記憶を統合したりしなければ
中期的に実用的な性能向上はほぼ不可能だと感じているエンジニアはたくさんいると思う。

しかしメニィコアが全て失敗すれば性能向上のペースが低下して、
マイクロプロセッサの価値が低下していき、Intelは今の利益体勢を維持できなくなる。
だから簡単に舵をきれないんだろうと。おれはそう思っている。
多分あと数年はメニィコアをあきらめずに研究しつづける。
無理だとわかったら急激に舵をとって逆方向に進むだろう。
Intelのメニィコア/テラスケールプロジェクトは数打ちゃあたる状態で進んできていて、
いままでにキャンセルされた計画は他にもわかっているだけで複数ある。
513∃∃∃∃⊂(・∀・,,☆u:2009/12/09(水) 20:31:06 ID:4o1T9QKx0
IDFの資料をみればわかるが、コアの数が増えたら
リング以外のインターコネクトを導入するという話は前からあって、
まあ今のところリングの可能性が高いのはSNB〜Haswellまででそのあとはどうなるかわからん。
Nehalem〜Haswellが前に同じ延長線上にある兄弟といったのは、とりあえずメニィコアの前段階として
最終的にあまり最適化していないコアをとりあえず非対称で柔軟に接続してスケールするというのが
目標の世代のように見受けられるからである。
514∃∃∃∃⊂(・∀・,,☆u:2009/12/09(水) 20:35:36 ID:4o1T9QKx0
そういう意味でHaswellはかなり微妙なポジションにいるわけです。
キャンセルされて別のものに入れ替わるか、
このまま非対称でストリームコアなりを集積してリリースされるか、時期的に微妙。
515∃∃∃∃⊂(・∀・,,☆u:2009/12/09(水) 20:53:46 ID:4o1T9QKx0
メニィコアをものにできるかできないかの境界と闘っているなかで必死に順調さをアピールしたいIntel。
メニィコアの試作品をソフト開発者に提供してできるだけメニィコアを生かしてくれるソフトも作って欲しい。
Intelがメニィコアをマンセーして宣伝しまくっているのは、
Intelが現代のマイクロプロセッサの性能向上の壁と闘っている厳しい現実の裏返しなのである。
消費者としてもそれを察して情報を受け止めるべきで、現実的な予想はIntelが対外的にアピールする理想の方向性とは
話が異なっておかしくはないんだ。
516名称未設定:2009/12/09(水) 21:13:34 ID:iP9dIDZf0
団子嫁マジで後藤スレ住民の相手しててワロスwww
517∃∃∃∃⊂(・∀・,,☆u:2009/12/09(水) 21:19:33 ID:4o1T9QKx0
まあ最初に書こうとおもっていたことと話がずれてしまったが、
Intelは他にもメニィコアのプロジェクトをもっていて
LRBもその中の一つで、メニィコア第一弾としてとりあえず製品化を公言して、
それなりの情報を明かしてしまったプロジェクトなわけ。

技術的に失敗したプロジェクトは他にもあるし、LRBもその一つにずきないのであまり技術についどうこうはどうでもいいんだ。
ただ、完成度の低いものを事前に製品化を公言して、それなりの詳細を公開してしまった情報戦略が大きな失敗だったわけで
まあゲルもいなくなったことだし今後はどうなるやら。もっとひっそりとメニィコアを進める可能性もあるだろう。
しかしながらいきなりLRBキャンセルのイメージ低下をやわらげるために、
こりずに48コアの配布のめどが経ったところでキャンセル発表だったからな。
次は同じ大風呂敷は広げないでひっそりやって欲しいモノだが。
518∃∃∃∃⊂(・∀・,,☆u:2009/12/09(水) 21:41:25 ID:4o1T9QKx0
Part1 >>692
http://itl.jisakuita.net/intel_ups_info/1121683774.html#R692

Tejasの設計チーム@テキサス州オースティンが
次世代Xscaleに左遷されたニュース。
この次世代XscaleがまさかXscaleの後継とはいえx86のBonnellだったとはねぇ。
もとはMotorolaの低消費電力チップの開発チームだったメンバーのようだが。

692 名前:inteler :2006/07/09(日) 11:59:26 ID:euVMFGdC0
----
454 名前:Socket774[sage] 投稿日:2006/07/09(日) 05:42:10 ID:tZypqzus
>>419
ttp://www.eetimes.com/news/latest/showArticle.jhtml;jsessionid=W4YJQATP0HKDMQSNDLRCKHSCJUNN2JVN?articleID=188703330&pgno=3
>The Tejas design team, led by Brad Beavers, site director for Intel in Austin,
>was put to work on the ultramobile-PC processor.
>Intel's work force in Austin has increased from 500 to 800,
>including design teams working on the next-generation Xscale, an Intel Austin engineer said.

Tejasの中の人はXscaleに左遷されたらしいよw
----

表スレの書き込みを読んで重大なことに気づいた。
519∃∃∃∃⊂(・∀・,,☆u:2009/12/09(水) 21:44:13 ID:4o1T9QKx0
あ、なんか当時記事読み間違えているようだな。
普通にx86 UMPCのプロセッサ開発する。
Xscaleの開発チームも一緒になるみたいな内容じゃないか。
520∃∃∃∃⊂(・∀・,,☆u:2009/12/09(水) 21:47:08 ID:4o1T9QKx0
ちなみに"UMPC"という言葉を初めて取り上げたのは日本のサイトでこの書込が最高速と思われる。
この時は全くといっていいほど注目されておりませんでした。

322 名前:inteler :2006/02/07(火) 20:43:15 ID:6yKKLJCo0
>>321
Q3

Intel's Ultra Mobile PC on track for Q1 release
http://www.tgdaily.com/2006/02/06/intel_umpc/

UMPC(Ultra Mobile PC)について。
詳しくはソース参照。

ざっさみたかんじ、
IntelがハンドトップなPCを今四半期中に予定。Q2あたりから数が出る。

当初は0.5Wの消費電力の新しいカテゴリのプロセッサを搭載する予定だったようだが、
少なくとも最初のバージョンは90nm ULV Dothanで出る。

ちなみにこのソースによると新マイクロアーキのCPUは9月。
521名称未設定:2009/12/09(水) 22:12:25 ID:Dr7V1f8I0
XScaleやってたチームもAtom開発に加わっていたのか。
522∃∃∃∃⊂(・∀・,,☆u:2009/12/09(水) 22:27:10 ID:4o1T9QKx0
次世代Xscaleやってるってだけで一緒にAtom開発したってわけじゃないのか。
523名称未設定:2009/12/10(木) 01:41:38 ID:jmMKh6Q50
>>517
他の失敗したMany-CoreとLarrabeeを同列に据えようとするのはちと違和感があるな
製品化が公言されてただけじゃなく、x86を拡張していく方向性が入ってる時点で他のMany-Coreとは重みが違うでしょ

他のプロジェクトはコアの並べ方に関してのリサーチって感じがする
そのコアがたまたまx86なだけで、x86である必然性があんまない

それとも団子に毒されすぎか?w
524,,・´∀`・,,)っ-○○○:2009/12/10(木) 03:40:36 ID:/M5QA7t50
結局みんなPentium*のコード資産使いたいんですよ
525名称未設定:2009/12/10(木) 09:48:31 ID:sa8rBxOy0
混載用のコア開発が本来の目的なんだから
ディスクリートがいくら後退しようとintel的には問題ないのでは?
ゲーム開発会社にはお金と一緒に渡しておくべきだと思うけどw
526∃∃∃∃⊂(・∀・,,☆u:2009/12/10(木) 18:47:25 ID:THg85MlJ0
やっぱ事後解釈の議論はだだ滑りだな。
未来の話は、その後の経過をみることで理論に実証性をいれられるけど、
過ぎた話をこうだろうといってもなにが正しかったのか証明するのが難しい。
というわけでおれは未来の話専業に徹することにした。
527∃∃∃∃⊂(・∀・,,☆u:2009/12/10(木) 18:49:07 ID:THg85MlJ0
もちろん過去スレの話題がどの程度正しかったのかはできればやっておきたいところだ。
528OOO-⊂(・∀・,,☆u:2009/12/10(木) 18:57:03 ID:THg85MlJ0
CPU関連のニュースやルーマーに右往左往していると、
まあこれだけ情報が流通する時代において熱心に情報をあつめているつもりでも、
わずか数年の時間に対していかに真実を歴史として記憶していくことが難しいかがわかるな。
積極的に未来を予想して、セオリーどおりに進んだかどうかの結果をフィードバックすることで、
歴史に対してある程度の実証性の概念を取り入れられる。
これでより真実に近づくことがおれの一つの目標である出来るのだ。
まあ歴史学者にはわるいが、どんな天才であっても
人類には100年前の真実をまとも知ることは不可能だと実感してしまう。
歴史は嘘ばかりなのだろう。
529OOO-⊂(・∀・,,☆u:2009/12/10(木) 20:27:03 ID:THg85MlJ0
それにしても後藤先生むかつくな(わらぃ

おれがLRBが失敗した理由は
リアルタイム性の高い処理が1ターゲットであるのに、ワークロードを分析もろくにないまま
殆どソフトに丸投げ(=ゲーム中での得意・不得意な処理の差が大きくなる。
ゲームは60fps以上を常にキープしないといけないのでサーバのトランザクションなどと異なり下限の性能がきわめて重要。
LRBにとってベストに近いデータの論文発表なんて参考にならない)したあげく、
1本のリングで10以上のコアを扱うのは遅延が安定しないから無謀だし、テクスチャで帯域も喰われて
下限の性能がでない。非対称にするにも用途の全く異なるコアはバスを分離すべき。
というのを書こうとしたら似たようなことを先にかかれた。
まあ>>328でも用途的にリングが無謀であるとをキャンセルされるよりも先かいていた
おれの勝利なわけだが。
530OOO-⊂(・∀・,,☆u:2009/12/10(木) 20:30:21 ID:THg85MlJ0
GMAの統合とLRB統合の最も大きな違いは、
LRBコアは汎用コア同じリングに対してフラットに集積することが予想されたのにたいし、
GMAはストリーム処理に関してGMA内部でデータのやりとりを殆ど完結できることにある。
個人的にはIntelの論文をみてもGMAとLRBコアはむしろ共存してまじった製品があってもおかしくはないと思っていた。
531OOO-⊂(・∀・,,☆u:2009/12/10(木) 20:36:44 ID:THg85MlJ0
GPGPUはあくまでもソフト化可能な部分を段階的にそぎ落として汎用化しているところがLRBと異なる。
普通はワークロードを分析して、必要なところにリソースをさいていらないところをカットするが、
LRBの場合、汎用CPUへの容易な統合化のスタンスがもろに現れていて、
ただリングでつないだだけで、とりあえず先にハードのアーキテクチャを用意した。

その後で、こうしたらこのアーキはうまくつかえるぞぉ、みたいなソフト系の論文があとからでてくるという
まあ失敗度の高い展開だったわけで。こういうところは某○ELLに似ていたな。
532OOO-⊂(・∀・,,☆u:2009/12/10(木) 20:38:22 ID:THg85MlJ0
まずワークロード、ターゲットソフトの研究・分析からはじまらないとな。
多分次のメニィコアも期待できない。リングはやめるかもしれないけど、それだけでは
抜本的な改善にはならないだろうな。
533OOO-⊂(・∀・,,☆u:2009/12/10(木) 21:03:05 ID:THg85MlJ0
こうしてあらためて考えてみると
汎用コアのSIMDをそのまま拡張するか、
専用コアを統合するにしても専用コア内のバスで極力データの流れを完結させる、
というSoC的アプローチの方が、

Fabric, Ring, Mech等で汎用コアもろとも、フラットにコアを多数集積という
メニィコア的アプローチよりも現実的で有効なアプローチのように思えて、
今Intelのやっていることが無駄におもえて仕方がない。
電力の話をふくめてなぜメニィコアがだめなのかということをおさらいすると
10-20長文レスの長編になってしまうし、めんどうなので書かないが。
534OOO-⊂(・∀・,,☆u:2009/12/10(木) 21:04:20 ID:THg85MlJ0
mesh
535OOO-⊂(・∀・,,☆u:2009/12/10(木) 21:10:16 ID:THg85MlJ0
インターコネクトの問題は2番だね。
メニィコアが駄目な1番の理由はやはり電力。
本当は電力がよいからコアを増やしたつもりなんだけども。
やっぱCPUは電力だぜ、ってことだ。
536名称未設定:2009/12/11(金) 11:00:23 ID:MUr77cKd0
> まずワークロード、ターゲットソフトの研究・分析からはじまらないとな。

してたろ。実際のゲームタイトルでどこの処理が高負荷か、など。
それであの命令セットに収まったんだろ。

問題はその命令セットを実現するためのマイクロアーキテクチャの設計であって
どっちかというとハードとソフトの両面から、スイートスポットがどこか
探りを入れる必要がある。

512ビットのSIMDなんてIntelとしても初の試み。
今でこそ現行Core MAの礎として代々受け継がれているPentium Proにしても
PC用として最初から高い評価が得られたわけではない。
まったく新規のプロセッサが一発OKなんてありえないこと。
537名称未設定:2009/12/12(土) 08:02:46 ID:ngGqOhUt0
HPC市場という明確な目標があればワークロードの研究分析は容易いだろうけど、
Intelの主戦場であるコンシューマで並列コンピューティングと言ったらやっぱ
グラフィックスしかないからなあ、現状では。
RTRTとかRMSとかいつになったらやるの?って感じだし。
それでメインターゲットを決められずどっちつかずになって迷走したと。

Intelの主戦場はHPCではなくコンシューマであって、そこで製品を高く売り続けるため
には何らかの新しい価値を提案しなけりゃいけない。
ところがその価値を提案出来ないまま、メニーコアを売ろうとしちゃったのが今回の
Larrabeeキャンセルに繋がったってことじゃなかろうか。
ハードとソフト、卵と鶏の関係とも言えるけど。

そう考えるとすでに足場があるGPUの方が新価値は提案しやすい位置にいるのかも。
538名称未設定:2009/12/12(土) 11:01:33 ID:89Hacmni0
http://pc.watch.impress.co.jp/docs/2003/0901/kaigai015.htm
[Q] その段階のCellコンピューティングで、エンタテインメントは何が実現できるのか。
[久夛良木氏]  処理能力は、エンタテインメントを考えるだけでも極端な要望がある。
エンタテインメントを越えた、感性の域までいったら千倍になっても足りない。
キアヌ・リーブスが映画「マトリックス」の中で、そこ(マトリックスの仮想世界)にいる
と感じる、本物かどうか見分けがつかない(と感じる)、いつかは、あそこまでゆくはず。
ともかく、(Cellコンピューティングの)伸びは無限だから。(Cellが)ネットワークに繋がれば
繋がるほど数が増える。人類はとんでもないものを手にするんじゃないかと思っているほど。

http://journal.mycom.co.jp/articles/2009/12/10/sc09_algore/
IntelのCTOであるJustin Rattner氏はHPC(High Performance Computing)のマーケット
の伸びは小さく、大きく伸びるためにはキラーアプリケーションが必要である述べ、
その可能性として「3D Web」を挙げた。3D Webは連続的にシミュレーションを行い、
その結果を3Dアニメーションで表示し、あたかもその中に浸るような経験を与え、
その中で他の人とも協調して動けるような環境であるという。

( ゚д゚)

(゚д゚ )

( ゚д゚)・・・



( ゚д゚ )
539名称未設定:2009/12/12(土) 17:36:10 ID:EdMDAEnt0
VRML2.0対応ブラウザ Cosmo Playerを発表
Netscape Navigator 2.01以降にプラグイン
http://www.sgi.co.jp/newsroom/press_releases/1996/May/CosmoPlayer.html
540,,・´∀`・,,)っ-○○○:2009/12/12(土) 22:19:57 ID:ZuadSBSX0
VRMLっていつの間にか消えてたよな。

そういえばHTML5ってどうよ?
541名称未設定:2009/12/12(土) 22:37:50 ID:DdsqfCXW0
ラトナーはそろそろ退場だな
542,,・´∀`・,,)っ-○○○:2009/12/12(土) 22:40:17 ID:ZuadSBSX0
パルパティーン皇帝に似てるよね
543OOO-⊂(・∀・,,☆u:2009/12/13(日) 01:27:25 ID:WQrIL6ry0
まあここは他人に反論するよりも、
自分の予想の精度を鍛錬するためのスレなので、おれの書き込みの内容に構わず
自分の予想を記録として独立して書き込み欲しいモノだ。
おれはあくまで自分の予想の記録として書いているのでレスは結構ですので。
結果でものをいいましょう。賛同できない人は表スレで。
544OOO-⊂(・∀・,,☆u:2009/12/13(日) 14:02:14 ID:WQrIL6ry0
Intel内にはCtの土台にGMAアーキも乗せる計画があるだろう。
LRBもキャンセルされたことだし来年あたりにもっと具体的な計画があきらかにされるだろう。
なんとなくそういう予感がする。
今度はGMAは糞だからどうのの相手しなきゃいけなくなるかと思うといやだなあ。
545,,・´∀`・,,)っ-○○○:2009/12/13(日) 14:45:06 ID:XQl4FFJy0
ないないwww
Westmereでようやく12Wayの積和ユニットだぜ。CPU 1コアのほうが速い。
Sandy Bridge世代だとCPUの空きさえあればシェーダ処理をCPUに投げた方が速かろう
(L3キャッシュをCPUとGMAで共有してる理由はこれじゃないかと思う)
546OOO-⊂(・∀・,,☆u:2009/12/13(日) 14:50:55 ID:WQrIL6ry0
また団子先生と対立する予想にいたってしまったようだな。
CPU1コアの方がはやいとかよりもIntelの方向性の問題だろ。
547OOO-⊂(・∀・,,☆u:2009/12/13(日) 14:52:38 ID:WQrIL6ry0
Bonnellの後継アーキはOOO実行を採用するだろう。
548OOO-⊂(・∀・,,☆u:2009/12/13(日) 14:53:43 ID:WQrIL6ry0
とりあえず結論だけ先にかいとけば後藤先生等に唐突に出し抜かれる
ことはないので安心。おれって頭いいなー。
549,,・´∀`・,,)っ-○○○:2009/12/13(日) 18:52:06 ID:XQl4FFJy0
> Bonnellの後継アーキはOOO実行を採用するだろう。
血迷ったか

今のネットブックのポジションはCore MAベースのCULVでAtomの上位レンジは置き換えるだろうが
Atomはあのままシュリンクを続けると思うがな。
OoOは電力効率面で弱い。

どうせBobcatとの対抗とかいうんだろ?
あれに大した優位性は無い。

550OOO-⊂(・∀・,,☆u:2009/12/13(日) 21:39:34 ID:WQrIL6ry0
次世代AtomじゃなくてBonnellアーキ自体の後継の話をしているんだが。かなり先の話だ。
551名称未設定:2009/12/13(日) 23:44:42 ID:V0tuNtWm0
人工頭脳ではなく,人はそこに,シリコンの神を生み出そうとしたんだよ
552,,・´∀`・,,)っ-○○○:2009/12/14(月) 01:05:06 ID:CbnVM1uG0
サラコナー・クロニクルズでジョン役がIntelの話をしてたな
553名称未設定:2009/12/16(水) 00:16:45 ID:UV0jyaYj0
整数パフォーマンスを犠牲にする? AMDの「Bulldozer」
ttp://pc.watch.impress.co.jp/docs/column/kaigai/20091216_335956.html

FPショボいシングルすっどれショボいて完全にNiagaraだな
554名称未設定:2009/12/16(水) 01:12:52 ID:F04lni+p0
シングルコア当りの浮動小数点演算性能はプレスコ5GHz相当に
留めておいて,整数演算性能をひたすら引き上げていく方がこの
先あっているような気がしないでもない
555名称未設定:2009/12/16(水) 13:44:07 ID:shBuhR1o0
>プレスコ5GHz
何でそのあとcedermillが出てるのに何時までもプレスコプレスコ言うのかね…
556名称未設定:2009/12/16(水) 16:12:32 ID:CrL5rxoN0
アム厨だから
557名称未設定:2009/12/17(木) 03:58:47 ID:H+wtN4nt0
スケジューラやデコーダ等、高速トランジスタが求められる部分の肥大化を抑制し、リーク電流を削減。
それにより余ったTDP枠をクロック向上に振り向けシングルスレッド性能を確保という算段?

シングルコア比でスループットは80%向上と言ってるんだから現行の9割くらいの性能は確保出来るんだろうか。
K8程度のシングルスレッド性能があれば特に問題にもならん気もする。
558名称未設定:2009/12/17(木) 04:22:57 ID:rKIMFlFm0
その高クロック化には電気食いな回路が必要な罠
559名称未設定:2009/12/17(木) 04:45:19 ID:H+wtN4nt0
32nmSOIは45nmSOI比で50%まで速くできるらしい
トランジスタの性能向上分でクロック向上のヘッドルームは生まれるんじゃなかろうか
560名称未設定:2009/12/17(木) 04:48:46 ID:BEtigqMo0
はいはい
561名称未設定:2009/12/18(金) 00:09:19 ID:OLbC1nG5O
4GHz突破はいつかなあ
562OOO-⊂(・∀・,,☆u:2009/12/18(金) 19:27:35 ID:2/yBjFMZ0
さすが後藤先生(わらぃ
何事もなかったかのように一転して整数重視から整数犠牲に論調変更してきたね。

Bulldozerはint/fpの性能バランスは総合的にみてこれまでの流れからあまり変わってない。
従来よりも一応fpの方が重視されてるという感じだが、
IntelのSNBはもっとfp/SIMD重視なので実際のものがでる頃の比較話では今の感覚とは異なる。
ただ単に2コアでFP共有というだけで性能ががたおちになるとかいうやつはプロセッサというものがわかってない。

intでスループット重視なのはサーバにはむいている。
intについても2 issue OOOでフロントエンドが広ければ
そこまで性能はおちない。もちろんIntelや既存のK10などにくらべたらおちるがね。

>うまく行けば、Bulldozerが2011年からの長期に渡ってのAMDのアーキテクチャの基本になるだろう。
しかしこの結論には賛同できないな。
ロードマップ上では一応ハイエンドPC向けにもBulldozer系ということになっているが、
現実問題としてPC用途ではBulldozerはPC向けSandy Bridgeなどとはまともにやり合うのは難しいし、
K10のリプレースと考えるのは危険すぎる。
蓋を開けてみればAMDは当分K10の派生・拡張をPC向けでは主力として使っていくことになると思われる。
まあ>>412で最初に書いたとおりだね。
それからfpはGPUを統合するからどうのという話は現段階では言い訳的蛇足だよ。
実際FPUの代わりにGPU型のコアを統合するとして全力でもFPUが完全にいらなくなるまでは数世代もかかる話で、
自作板でも話題のようだが、Bulldozerすら今までよく理解できないでいるような連中が今からどうこう語って予想できる話じゃない。
563OOO-⊂(・∀・,,☆u:2009/12/18(金) 19:29:39 ID:2/yBjFMZ0
さすがに予想のスレだと2ちゃんねるの流儀に反して
コテが推奨
されるね。というわけで予想を書く人わコテを出来るだけ名乗って欲しいす。
564OOO-⊂(・∀・,,☆u:2009/12/18(金) 19:34:48 ID:2/yBjFMZ0
Intel、2010年1月7日に新CPUを発表
http://itpro.nikkeibp.co.jp/article/NEWS/20091218/342246/

Intelの新作でるんだね。
どんなクピュになるのか楽しみだわ。
565OOO-⊂(・∀・,,☆u:2009/12/18(金) 19:45:09 ID:2/yBjFMZ0
妄想であるが、個人的には整数コアも最小限のFPUだけは用意しておいて、たまにある浮動小数点演算に対処。
これぞというFPまくりの処理になったらFPUクラスタのコアを電源ONして実行とかだったらかっこよかったのになあ。
でもFPUのクラスタはよほどFPよりの処理でない限り電圧とクロックを下げておくとかくらいは普通に出来そうである。
FPUに電力常にくわれてるの無駄だからな。そう考えると発展されれば結構おいしい構造かもしれん。
あとよくいわれてるいるとおりデコード済みのキャッシュないしバッファは構造的に必須だろう。
566,,・´∀`・,,)っ-○○○:2009/12/19(土) 00:06:22 ID:Vehkdehy0
Westmereか
567名称未設定:2009/12/21(月) 23:40:13 ID:zFINOD1r0
Pineview/Atom N450のダイ写真
http://ascii.jp/elem/000/000/484/484568/p_n450die_o_.jpg
568,,・´∀`・,,)っ-○○○:2009/12/24(木) 04:36:06 ID:dqF7/nOX0
モザイクでもかかってるのか?
569名称未設定:2009/12/28(月) 11:37:11 ID:h26t4FwT0
570名称未設定:2010/01/09(土) 16:29:11 ID:jmVWXJ+90
571名称未設定:2010/01/19(火) 19:39:04 ID:PN077uEr0
ho
572名称未設定:2010/01/26(火) 19:47:03 ID:H7Wjv3Ge0
ze
573名称未設定:2010/02/09(火) 00:10:06 ID:oArgawsG0
n
574名称未設定:2010/02/13(土) 21:12:17 ID:C2gXLoSz0
ta
575名称未設定:2010/02/20(土) 04:25:11 ID:Z+8SjM9a0
すげー今更なコードネームのネタだけどCedarviewってCedarmillに似てるな
何か関係あるのかね
576名称未設定:2010/02/27(土) 15:45:21 ID:jiJXPmeJ0
ho
577名称未設定:2010/03/01(月) 01:57:35 ID:jxyPWreL0
ttp://pc.watch.impress.co.jp/docs/column/kaigai/20100301_351592.html
> ただし、このLlanoのダイ写真は、完全なものではない可能性が高い。

多分ここ読んでニヨニヨ(・∀・)してしまった人多数w
578名称未設定:2010/03/08(月) 22:40:30 ID:dlb1Woa+0
ze
579OOO-⊂(・∀・,,☆u:2010/03/11(木) 18:44:38 ID:0YhVyy+V0
コンピュータサイエンス史上最大の課題「並列処理による性能向上
〜情報処理学会創立50周年記念全国大会の招待講演
http://www.publickey.jp/blog/10/50.html
580OOO-⊂(・∀・,,☆u:2010/03/11(木) 19:05:24 ID:0YhVyy+V0
おおむね同意できるが、マルチコアの並列化の問題は、
個人的には言語よりさらに下位レベルの大きな問題だと思うがな。
雑多なシステム/アプリで、ノイマン型コンピュータが長らく続けてきた、
プログラマのアドリヴ思考によるプログラミングの文化を捨て去るところまでいかないと解決しないのかも。
十分数学的に検討され理論化された並列化アルゴリズムの部品を専門家が開発し、
一般のプログラマは極力その並列な部品だけを糊付けしてソフトウエアを作成する、
もちろん逐次でしか処理できないものは高速化できない問題として認知させた上であきらめる。
最低そこまでいかないと言語、コンパイラの小手先な研究ではゴールはこないだろう。
HPCは理論、アルゴリズムが明確で、ある程度それができているから並列化が一定の成功を収めているわけで。
まあそこまでできるならノイマン型にこだわる理由ももうないな。
581名称未設定:2010/03/11(木) 20:19:51 ID:GwSHDvbO0
理想論だな
582OOO-⊂(・∀・,,☆u:2010/03/11(木) 20:22:42 ID:0YhVyy+V0
まあ単なる個人的な妄想案のひとつだからな。
583OOO-⊂(・∀・,,☆u:2010/03/11(木) 20:34:15 ID:0YhVyy+V0
マルチプロセッサって大雑把にみて複数のノイマン型コンピュータが
メモリを介して通信しながら各自の処理をしているだけなので、
システム全体としてみればすでにノイマン型の枠組みから外れているともいえよう。
ゆえにあからさまに単一のノイマン型ハードべったりなC言語やそれ系の文法構造では扱いにくいといえる。
というか最近のスクリプト言語にとろ何にしろ実用的なプログラミング言語は
新しいプログラミングのパラダイムをうたっていて、いくら皮をかぶせていても、
所詮ノイマン型で効率よく処理できる範疇の文法構造しかもってないだよな。
584OOO-⊂(・∀・,,☆u:2010/03/11(木) 20:46:26 ID:0YhVyy+V0
>QPIの電圧振幅は、サーバー向けCPUの500mVに対して、
>クライアントCPUのClarkdale/Arrandaleでは150mVで、振幅のスケーラビリティは約3倍になるという。
振幅のスケーラビリティ!!

Sandy Bridge世代ではQPIは1.1になります。
(最上位のWestmere-EXは完全置き換えではない可能性あり。)
http://ch.bechtle.com/_rsc/content/download//bechtledirecthp200911_schaffner.pdf;jsessionid=DF2334E07DF177ECD1DD61EA7C76152B
585OOO-⊂(・∀・,,☆u:2010/03/11(木) 20:56:06 ID:0YhVyy+V0
ttp://lalsie.ist.hokudai.ac.jp/publication/dlcenter.php?fn=paper/ap_2009_amemiya.pdf
>その後、このメモリスタを実現したという発表がHP 社の
>研究グループから出された[3-5]。正確に言うと, 同グルー
>プが以前から開発を進めてきた cross-point switch とい
>うデバイスがメモリスタに相当する、という発表である。

>しかし、このデバイスは既存のReRAM(抵抗変化型の不揮
>発メモリ素子)や電気化学的積分素子と同じようなヒステ
>リシス抵抗素子であり、メモリスタというには問題がある。
>磁束-電荷の物理現象が根底にないので、これをメモリスタ
>と呼ぶことはできない。
586OOO-⊂(・∀・,,☆u:2010/03/11(木) 21:01:47 ID:0YhVyy+V0
あら、タイコエレクトロニクス社のサイトに
Intel/AMDのソケットロードマップがあったのだが、
いまぐぐったらでなくなったな。

サーバはSandy Bridge世代で
Socket [R]omley (2011pin)
Socket Bの後継としてSocket B1/B2(1356pin)
がある。まあ既報だけど。
その後サーバのSocketはマイクロコンタクトソケットへと進む。
ttp://www.asjp.co.jp/ja/topics/ele2005.07.pdf
587OOO-⊂(・∀・,,☆u:2010/03/11(木) 21:25:37 ID:0YhVyy+V0
ノートは
rPGA989,rPGA988Aの後継として、
2011年に
rPGA988B
さらに2012年前後で
rPGA988C
2013年に
rPGA II
となっています。

デスクトップはLGA1155以降、詳細定かではないが、まあ統合化の代償として
モバイル並みの変化は今から覚悟しといてもいいかもな。
588名称未設定:2010/03/13(土) 03:59:49 ID:2124ySIU0
人間超えれば解決しそうだ
589OOO-⊂(・∀・,,☆u:2010/03/16(火) 19:26:22 ID:RswqaCWb0
やっぱLRBやめたんかねぇ…?

698 :Socket774 [↓] :2010/03/16(火) 11:02:25 ID:pImm+kO9
Haswellのシュリンク版のRockwellのIGPにさえもLarrabeeが載らないのだとすると・・・

Haswell has a sucessor
http://www.semiaccurate.com/2010/03/15/haswell-has-sucessor/
590OOO-⊂(・∀・,,☆u:2010/03/16(火) 19:27:33 ID:RswqaCWb0
>>588
世の中には人間やめました級の頭の持ち主がたくさんいるだろうから、
彼らに期待するしかないという路線だな。
591OOO-⊂(・∀・,,☆u:2010/03/16(火) 19:45:58 ID:RswqaCWb0
果たしてクラウドコンピューティング(笑)は、
コンシューマ市場で得た売上げによって開発されたCPU/GPUをはじめとするハードウエア、
製造プロセスを一切つかわないで高性能なクラウドサーバを一から開発したと過程した場合、
ビジネスサイクルを維持できるのだろうか?
それができなければクラウドがクライアントハードを抹殺することは原理的に不可能だ。
実際にはコンピュータはより小型、低価格、分散化の方向へ進歩しています。
592名称未設定:2010/03/16(火) 23:15:40 ID:9XsxKj000
Westmere-EP発表と同時にベンチマークもいくつか出てきた
ttp://www.intel.com/pressroom/archive/releases/2010/20100316comp_sm.htm
まあ大体予想通り(当たり前か
593名称未設定:2010/03/22(月) 12:13:32 ID:9FBVdyWn0
ho
594OOO-⊂(・∀・,,☆u:2010/03/27(土) 17:09:57 ID:5hrh/s/s0
NVIDIA’s GeForce GTX 480 and GTX 470: 6 Months Late, Was It Worth the Wait?
http://www.anandtech.com/printarticle.aspx?i=3783

Fermiきたね!
特に言うこともないが、今後のGPUがどこへむかってどううなっていくか楽しみ。
595OOO-⊂(・∀・,,☆u:2010/03/27(土) 17:18:41 ID:5hrh/s/s0
GeForceって重力加速度(G forces)とジオメトリをかけたのかな?
というのをいまさら思いついた。
596OOO-⊂(・∀・,,☆u:2010/03/31(水) 19:14:07 ID:FsLm+5Y70
597OOO-⊂(・∀・,,☆u:2010/03/31(水) 19:17:50 ID:FsLm+5Y70
Nehalem-EX vs. AMD 12-Core-Opteron 6100
Intel Xeon X7560 - Neue 8-Core-CPU im Test
http://www.tecchannel.de/server/prozessoren/2026908/test_review_benchmarks_intel_xeon_7500_octa_core/

以下 RWTの掲示板よりコピペ
First up SAP 2-tier.
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
IBM System x3850 X5, 4 Processors / 32 Cores / 64 Threads, Intel Xeon Processor X7560, 2.26 Ghz, 64 KB L1 cache and 256 KB L2 cache per core, 24 MB L3 cache per processor
= 57120 SAPS
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
Fujitsu PRIMEQUEST 1800E, 8 Processors / 64 Cores / 128 Threads, Intel Xeon Processor X7560, 2.26 Ghz, 64 KB L1 cache and 256 KB L2 cache per core, 24 MB L3 cache per processor
= 87550 SAPS
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
Compared to:
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
Fujitsu PRIMERGY BX922 S2, 2 Processors / 12 Cores / 24 Threads, Intel Xeon Processor X5680, 3.33 Ghz, 64 KB L1 cache and 256 KB L2 cache per core, 12 MB L3 cache per processor
= 26800 SAPS
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
IBM Power System 750, 4 Processors / 32 Cores / 128 Threads, POWER7, 3.55 Ghz, 32 KB(I) + 32 KB(D) L1 cache and 256 KB L2 cache per core, 4 MB L3 cache per core
= 85220 SAPS
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
Dell PowerEdge M905, 4 Processors / 24 Cores / 24 Threads, Six-Core AMD Opteron Processor 8431, 2.4 Ghz, 128 KB L1 cache and 512 KB L2 cache per core, 6 MB L3 cache per processor
= 19730 SAPS
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

SAPS per core:
Xeon 7560 ~1785(4s)1367(8s) (scaling doesn't look too hot?)
Xeon 5680 ~2233
Power7 ~2663
Opteron ~822
598OOO-⊂(・∀・,,☆u:2010/03/31(水) 19:33:17 ID:FsLm+5Y70
この結果だけでいうと、4S→8Sでのスケールがいまいちということのようだね。
それにしても8コアでも高クロックでまわってるPower 7の出来がひかるな。

Nehalem-EXのおさらい
http://www.hotchips.org/archives/hc21/2_mon/HC21.24.100.ServerSystemsI-Epub/HC21.24.122-Kottapalli-Intel-NHM-EX.pdf
599OOO-⊂(・∀・,,☆u:2010/03/31(水) 20:20:56 ID:FsLm+5Y70
くぴゅフェチ向け動画

New POWER7 workload optimizing systems
http://www.youtube.com/watch?v=CmXfZmplxUA

IBM launches eight-core Power7 processor, servers
http://www.youtube.com/watch?v=lAKIdKi0Zpw
600,,・´∀`・,,)っ-○○○:2010/03/31(水) 20:33:28 ID:i3mJceSX0
>>598
> それにしても8コアでも高クロックでまわってるPower 7の出来がひかるな。

TDP枠が同じ130WならPOWER7だって高クロックで回るわけがないよ
601OOO-⊂(・∀・,,☆u:2010/03/31(水) 20:41:37 ID:FsLm+5Y70
200WだとNehalemが3.5GHzでまわるとかありえないな。
602OOO-⊂(・∀・,,☆u:2010/03/31(水) 20:59:01 ID:FsLm+5Y70
ワールドワイドのサーバシェア、IBMが首位、HP、Dellが続く。サーバの96%がx86サーバ
http://www.publickey1.jp/blog/10/ibmhpdell96x86.html

>サーバの種類としては売上げの55%、出荷台数の96%がx86サーバであり、
>x86サーバは過去5年、継続的にシェアを上昇させ続けているとのこと。

う〜ん、シェア96%で売上高の55%なんだよなx86サーバって。
IntelがIA64にマジだったのもうなずける数字だ。
まあ、逆にいえばRISCシステムが無駄に高すぎなわけで
プロセッサの売上高の比でいえばまた数字が違うわけであるが。
603OOO-⊂(・∀・,,☆u:2010/03/31(水) 21:10:03 ID:FsLm+5Y70
http://www.ospn.jp/osc2010-kobe/pdf/OSC2010Kobe_HP.pdf
TOP500ってHPがシェア1位だったのか。
604名称未設定:2010/03/31(水) 21:45:30 ID:vqk/j4hd0
>>597
参考になったthx
605,,・´∀`・,,)っ-○○○:2010/03/31(水) 21:54:47 ID:i3mJceSX0
>>601
まあそうだが
そもそもPOWERはクロックあたりの整数演算性能がCoreファミリよりずっと低いので
対等な比較ではないだろう

L3もeDRAMだしな
606名称未設定:2010/03/31(水) 22:21:32 ID:3A+KXygZ0
>>598
うにしすが専用のチプセト使った鯖出すだろうからそれまで待てば?
607,,・´∀`・,,)っ-○○○:2010/04/01(木) 20:39:13 ID:e/JBYppB0
608名称未設定:2010/04/01(木) 21:05:01 ID:AndNcD/20
>>607
こういうの見るとAMD Zoneって確信犯で信者だましてるんだろうな。
ひどい話だ。
609OOO-⊂(・∀・,,☆u:2010/04/01(木) 21:09:26 ID:AndNcD/20
実は最近あばれているえるえるの正体は、
おれだったのである。
610OOO-⊂(・∀・,,☆u:2010/04/01(木) 21:20:00 ID:AndNcD/20
というかおれもエイプリルフールの大ネタ仕込んで楽しみしてきたのに
>>607でさきこされてすぐばれるから公開できなかったという事実。
611名称未設定:2010/04/06(火) 21:43:32 ID:exI81skj0
ho
612名称未設定:2010/04/07(水) 14:40:48 ID:bRIelQPF0
POWER7高杉だろ
POWERMac復活は夢のまた夢か
613,,・´∀`・,,)っ-○○○:2010/04/07(水) 19:51:51 ID:LLVLYsL20
Appleがコンシューマ向けハイエンドPPCのコストメリット・スケールメリットを支える側にいないから当然だな
614名称未設定:2010/04/09(金) 21:55:26 ID:oSoFsai50
>>538
Σ(´Д`; )

インテルのテクノロジー・リーダー、“3Dインターネット”の未来を語る
「5年後には誰もがオンライン3Dコンテンツを楽しめるようになる」
http://www.computerworld.jp/news/trd/178869.html
615名称未設定:2010/04/10(土) 23:06:42 ID:LrzdKpKB0
今回の後藤記事おもろいな
Intel結構焦ってるかもな
616名称未設定:2010/04/16(金) 18:30:29 ID:rtBDaLIZ0
617,,・´∀`・,,)っ-○○○:2010/04/17(土) 16:09:14 ID:NVjGvv+E0
> Sandy Bridgeの性能は新TBの実力とcache周辺のlatencyに大きく依存しているため、予想が難しい。
> memory/cache accessがprocessorの性能向上の足かせになっている昨今、個人的には、L1Dのlatencyが
> 3 cyclesか悪くてNehalemと同等の4 cyclesであれば、load portの増えたSNBはIPC面でそれなりに
> 期待できると思いますが、現在のところ5 cycles以上の説が有力ですね。

ロードユニットが増えた分だけロードを先行実行できるチャンスが増えるので、
大体のレイテンシの増加はカバーできるのではないかと予想。

一方ロードにdependency chainがある場合、たとえばある値をロードして更にその値をアドレスのオフセット値として
評価してロードするようなケースだと、レイテンシが増加した分だけ性能は低下する。
まあ、ただこのへんのパイプラインに空きが出来るのはHTある程度は緩和される。

> 上のlink先にあるSandy Bridgeの公式block図では、Allocate/Rename/Retireのところに、Zeroing Idioms(ゼロ化慣用句)というのが

これ前からあるけどな
XOR*だけだったのがSUB*とかPCMPGT*にも適用されるようになっただけ
618OOO-⊂(・∀・,,☆u:2010/04/17(土) 19:43:39 ID:zrwbqXB10
Sandy BirdgeはAVXやLd/St強化があるのに、
Westmereと比較してなぜコア面積があまり大きくなっていないか
あぶない超解釈のテスツ。

1.Nehlalem比でパイプラインが短くなった説
Nehalemはデータパスはallスタティック回路にローテク回帰しているくらいな上に
Sandy Bridgeでは32nmプロセス準拠になってさらにトランジスタのSW速度は改善しているくらいなので、
スタティック回路だけでは飽き足らず、パイプラインピッチを荒くしても電力減らしてクロックかせげるじゃんということ
でパイプラインのステージ数を減らした。そのおかげでコアが全体的にコンパクトになった。

2.Oregon設計のNehalemと、Israel設計のSNBとで論理合成、配置配線ツールなどが異なる説
実は開発環境の問題だった。

3.AVX対応もあることだし、uopを更なる消費電力化のために大幅に再定義して見直した説
uopのエンコードは制御ロジックの最小化にも影響する。
SNBは頑張ってuopの定義をAVX対応などのついでに超最適化した。

4.温度センサを減らした説
温度センサをみる頻度は減ったので、Nehalemよりも減らした。
そもそも温度センサ如きがダイ面積を食っていたのかは謎である。

5.Israelチームが最適化を頑張った説
Nehalemは急いで設計したものなのでそもそも最適化が甘かった。
一方SNBはじっくりやれる時間があった。単なる時間と人の問題。
619OOO-⊂(・∀・,,☆u:2010/04/17(土) 19:46:51 ID:zrwbqXB10
それにしても今回のIDFはインパクトなかったな。
そもそも資料がおとせないもんな。
https://intel.wingateweb.com/bj10/scheduler/catalog/catalog.jsp
イソテルはIDFの資料を一般に公開する気ないのだろうか。萎える展開だね。
620名称未設定:2010/04/17(土) 19:54:57 ID:RLtF1pfp0
十分でかくなってる気がする
621OOO-⊂(・∀・,,☆u:2010/04/17(土) 19:56:38 ID:zrwbqXB10
Yonah→Merom, Penryn→Nehalem
の実績からいくとやけにコンパクトだよ。
622OOO-⊂(・∀・,,☆u:2010/04/17(土) 20:17:31 ID:zrwbqXB10
>>617
ある程度カバーできているのかもしれないけど、
HaswellでL0D実装説がおれの中で最近人気。
623,,・´∀`・,,)っ-○○○:2010/04/17(土) 20:32:35 ID:NVjGvv+E0
>>618

5.に1票。
Pentium III→Pentium Mでもだいぶ小さくなってるからな
そもそもPenryn→Nehalemで大きくなりすぎたんだよ。
トランジスタ密度を引き上げる技術はイスラエルの方が優れてるんだろうよ。



> HaswellでL0D
L0キャッシュというべきものなら大昔に「Store to Load Forwarding Buffer」の形で実装されてないか?
同じアドレスにストア後すぐにロードするようなケースで実効レイテンシが大幅短縮される。
624OOO-⊂(・∀・,,☆u:2010/04/17(土) 20:39:20 ID:zrwbqXB10
>>623
Store Bufferだけでは足りない部分にさらにL0をはさめるんだよ。
L1はさらにレイテンシが悪化していく可能性あるしな。
ストアフォフォワーディングの強化とかMemory Disambiguationとか、Israelは
キャッシュ、メモリアクセス周りはかなり問題視していて力を入れる方向性なのかもね。
625名称未設定:2010/04/17(土) 20:43:35 ID:RLtF1pfp0
>>623
>トランジスタ密度を引き上げる技術はイスラエルの方が優れてる
っPrescott
626OOO-⊂(・∀・,,☆u:2010/04/17(土) 20:45:45 ID:zrwbqXB10
サーバでスループット(マルチスレッド)性能が重視される理由は単純な話、
サーバは共用のコンピュータなので、同時利用者数に強く依存して複数のタスクを実行するからだろう。
これはPC/WS向けのマルチスレッドアプリやHPCなどでマルチコア、マルチプロセッサが役に立つのとは異なる事情だ。
サーバだろうがデスクトップPCだろうがシングルスレッド性能がのびてくれないと
結局のところ新しいサービスが可能になっていくという発展は残念ながら難しい。

したがって、サーバプロセッサの高速化トレンドで、シングルスレッド性能を伸ばさずに
スループット志向に注力していった場合、既存のサービスをベースに同時利用者数(クライアント数)が増える一方になり、
結果、サーバの統合集約化/ローコス化という使われ方になってしまう。

あるネットワーク上でのサーバとクライアントハードウエアのコスト比を考えれは、
サーバ > クライアント → サーバ < クライアント → サーバ << クライアント
と変遷していくのがTSSの時代から引き継いだ運命なのだろう。
もちろんネットワーク上で共有せざるを得ない部分は存在するからサーバがまったくなくなることはないが、
サーバはスループットがあがればよいから、多コア化がサーバ志向を加速するという見方は疑わしいだろう。
今後コスト構造的にみてサーバはどんどんネットワーク上ではどんどん小さくなっていく方向だろう。
627,,・´∀`・,,)っ-○○○:2010/04/17(土) 20:46:51 ID:NVjGvv+E0
逆の発想はないのか
むしろバッファが深くなってるからレイテンシが増えてると
628OOO-⊂(・∀・,,☆u:2010/04/17(土) 20:51:37 ID:zrwbqXB10
Store Bufferはストアフォワーディングのためだけにあるのではないし、
検索は余裕で1サイクルきってる設計でないとメモリオーダリングの性能全般に問題がでるだろう。
629OOO-⊂(・∀・,,☆u:2010/04/17(土) 21:54:19 ID:zrwbqXB10
まあALUの追加に比べるとLoadユニットの追加はインパクトが小さく見える人が多いんだろうな。
STAユニットの追加で実行アドレス計算、エイリアス解析が早く捌けるようになったり、
Loadユニットの増加でLoad命令を早く捌けるようになったりの価値を理解している人はコードオタ以外では
あまり多くないのは無理も無いだろう。
630名称未設定:2010/04/17(土) 22:10:05 ID:wILUVDCK0
Loop Stream Detector改良されてL1 5cyclesでもOK
・・・ということにしておこう
631,,・´∀`・,,)っ-○○○:2010/04/17(土) 23:34:10 ID:NVjGvv+E0
LSD関係ねえだろそこは
632名称未設定:2010/04/18(日) 00:24:37 ID:ax+pEsnc0
NetBurstでは12K語分のキャッシュだったから、これに比べれば遥かに小さい
とはいえ、うまくLoop構造に入ると全く同じ動作をする事になる。見方を変えれば、
これこそがL1命令キャッシュであり、Photo05に出てくる32KB Instruction Cache
というのはL2命令キャッシュとも捉えられる訳だ。Stream Loop Detectorは、
プログラムの非Loop構造部分の実行中は単にFIFOとして動作することになるから、
これはキャッシュそのものと見るのが正しいと筆者は考える。
633,,・´∀`・,,)っ-○○○:2010/04/18(日) 09:40:19 ID:/03Pvdnl0
レイテンシ5なのはData Cacheのほうだぞ
634,,・´∀`・,,)っ-○○○:2010/04/18(日) 09:58:42 ID:/03Pvdnl0
ちなみにアレは要するにループしてるコードシーケンスを検出してリオーダバッファ上のμOPsをリタイヤせずに
再利用する技術で、新設されたのはあくまでその名の通り「検出器」。
決して専用のキャッシュを新設したわけではない。
635名称未設定:2010/04/20(火) 21:13:21 ID:Qj2i6b3W0
【レポート】IDF Beijing 2010 - Sandy Bridge/Light Peak/Tunnel Creekをまとめる - 大原雄介のIDFお留守番レポート
http://journal.mycom.co.jp/articles/2010/04/20/idf02/menu.html
636OOO-⊂(・∀・,,☆u:2010/04/22(木) 19:21:38 ID:eBx/FkKH0
Sandy Bridge rumors
http://www.semiaccurate.com/2010/04/21/sandy-bridge-rumors/
Nehalemと比較すると
L1Iの連想度が4way→8wayに増えた
L3の連想度は16way→12way(4MB→3MB)に減った
637OOO-⊂(・∀・,,☆u:2010/04/22(木) 19:26:28 ID:eBx/FkKH0
>>630
L1Dの話なのでLSDは今の話には関係ないです。
>>634
LSDはデコーダとRSの間にある。ROBは関係ない。というかROBには命令のアドレスはいっても命令は入らない。
638OOO-⊂(・∀・,,☆u:2010/04/22(木) 19:30:24 ID:eBx/FkKH0
いやステージ的にいうとDecodeとRenameの中間か。ROBは関係ないけど。
639OOO-⊂(・∀・,,☆u:2010/04/22(木) 19:31:47 ID:eBx/FkKH0
というわけでいちおうLSDの働くバッファは、極小サイズuopキャッシュのように働くだろ。
640,,・´∀`・,,)っ-○○○:2010/04/22(木) 21:02:46 ID:nO+O7nf10
連想型構成だったのを忘れてた


641OOO-⊂(・∀・,,☆u:2010/04/22(木) 22:18:50 ID:eBx/FkKH0
L1Iは、
Core 2 - 8 way
Nehalem - 4 way
Sandy Bridge - 8 way
らしいので戻ったようだね。
642名称未設定:2010/04/28(水) 01:08:27 ID://Rer9DH0
PCI Express Gen3とDDR3-1600をサポートするSandy Bridge
ttp://pc.watch.impress.co.jp/docs/column/kaigai/20100428_364200.html

ソケットとかダイのバリエーション増やしてもコストが爆発しなくなったみたいだな
643OOO-⊂(・∀・,,☆u:2010/04/28(水) 19:27:30 ID:wr2eoBUu0
バリエーションはモジュラー化とリング化でやりやすくなった
(というかそれがSNBの最大の成果ともいえる)と思うけど、
コストはまだ苦しいと思うよ。>>281でも書いたとおりPCHでも2重にぼってるしね。
4コアでエントリーレベルまで可能になるのはやはり22nmからだと思う。
644OOO-⊂(・∀・,,☆u:2010/04/28(水) 19:33:59 ID:wr2eoBUu0
> Ivy Bridge-EX-Aは、おそらくQPIを3リンク備え、4ソケット構成でも全てのCPUに1ホップで
>アクセスできるようになると推定される。当然、 CPUソケットはSocket R(LGA2011)と異なるものとなる。
>メモリ回りも異なる可能性が高いが、4チャネル以上となるとメモリブリッジチップを使うことになる
Ivy Bridge-EX-Aは>>616的にみてもLGA1567継続か、それに近いピン数だろうね。
ハイエンドはSMI経由でないと容量と帯域の両立が難しいだろう。
(Socket RはDDR3 4ch分のI/Fが直接入る構成だからどうしてもピン数が多くなってしまう。)
645OOO-⊂(・∀・,,☆u:2010/04/28(水) 19:42:40 ID:wr2eoBUu0
>>635
大原先生の記事よむまで気がつかなかったけど、
LS PortからBufferまでは256bx2/clock分のスループットがある可能性あるんだな。
ややお花畑だけど、256bのストアフォワーディングが可能だったりとかすれば内部的にはCore2比4倍の256bx2級
で回ることを想定している可能性があるな。SandyでなくてもIvy以降で強化という可能性もある。
646OOO-⊂(・∀・,,☆u:2010/04/28(水) 19:44:54 ID:wr2eoBUu0
まあでも出来てもL1Dに書き込まれるまでの間だから瞬間的な話かなあ。
647OOO-⊂(・∀・,,☆u:2010/04/28(水) 19:58:01 ID:wr2eoBUu0
>>645->>646は内容が微妙なので脳内削除よろしく。

ARM Cortex-A8 vs Atom等のベンチマーク発見
http://www.brightsideofnews.com/news/2010/4/7/the-coming-war-arm-versus-x86.aspx?pageid=0
648OOO-⊂(・∀・,,☆u:2010/04/28(水) 20:00:21 ID:wr2eoBUu0
649,,・´∀`・,,)っ-○○○:2010/04/28(水) 20:28:52 ID:eFV2QoW40
>>645
ないない。
ちなみに連続した256ビットのデータのロードは2サイクル分かかる。

・128b Load Data (+ AGU)×2
・128b Store Data ×1
の合計48byte/clk

256bのロード・ストアも、AGUは1サイクルで解決できる。したがって、たとえば
たとえば256b Loadと128b Storeのアドレス解決を各Load Portで交互に行うこともできるのだ。
いずれにしても48byte/clk(上り32下り16)の帯域をフルに使うには


> 恐らく当初はAVXのLoad/Storeのスループットが低くてもそれほど問題ではなく、
> むしろSSEのスループットを底上げする事を重視したのと、ここでAVXにあわせて
> 96Bytes/cycleの帯域を設けるのは実装上不可能だった事の両方が理由ではないか、
> と想像される。

行列積やN-Bodyみたいな同じ値をブロードキャストして反復する問題だとこれで十分なんだけどね。
256ビットSIMDだと論理レジスタが半分に減る、みたいなしょっぱいアーキテクチャとは違って
YMM上位を使うことでレジスタ空間も倍になるので結果的にロード・ストア帯域もセーブできる。
650OOO-⊂(・∀・,,☆u:2010/04/28(水) 20:32:58 ID:wr2eoBUu0
相変わらず細部の話になると異様なはりきりっぷりですね。
しかし、わかってかいているのかもしれないけど>>645->>646はL1Dからのloadについて書いたものでは無いぜ。
まあもう脳内削除されているので無効であるが。
651OOO-⊂(・∀・,,☆u:2010/04/28(水) 20:48:33 ID:wr2eoBUu0
Intelのブロック図は幅が対応bit数をあらわしているので、
Store Dataは128bだけど、
Load Portは256bが2つあるように書かれている。
もちろんL1Dは32Bのロード帯域しかないからL1Dに帯域が制約されるから持続は無理だけど
ユニット的には512b分のリソースがあるととれる。というのから>>645はかいたんだよ。
この部分も既にシミュレータで解析済みというなら文句は無いけどね。
652,,・´∀`・,,)っ-○○○:2010/04/28(水) 21:32:39 ID:eFV2QoW40
>>651
もちろんあのシミュで解析済み。
256bit Load命令は2サイクルかかるけど2つのLoad Portで交互に発行すれば
1サイクルあたり1回になるわけだ。

あと、256b Loadのレイテンシが128bのそれより大きい理由も説明できるね。
653,,・´∀`・,,)っ-○○○:2010/04/28(水) 21:38:51 ID:eFV2QoW40
あ、Destination Bus(?)は256ビット化されてると思われる。
654OOO-⊂(・∀・,,☆u:2010/05/01(土) 00:42:37 ID:G4KGRk6/0
団子先生はSNBにおけるNehalemからの既存アプリの実効IPCアップは
何%くらいだと見積もっているのでしょうか?
655,,・´∀`・,,)っ-○○○:2010/05/01(土) 07:43:12 ID:r+xUw7tB0
正規表現マッチング(NFA)とかほとんど分岐予測とキャッシュのレイテンシ依存だからなあ

シミュによると従来SSEですら大して性能あがらない。
ただしLoadネックのコードに関しては(Loadユニットが増えた分)劇的に性能向上する可能性がある。
(ちなみにLoadネックだとどのみちAVXで性能向上の余地殆どないんだよね)

非SSEでも有効そうなところではsub+jccとかdec+jccでもMacro Ops Fusionが使えるようになったことくらいか。
どっちにしろ微妙すぎ。
656,,・´∀`・,,)っ-○○○:2010/05/01(土) 07:45:08 ID:r+xUw7tB0
あえて言う。非SIMD用途で<10%
657名称未設定:2010/05/01(土) 12:04:13 ID:dFZm4cxB0
そんなにアップしないだろ。
5%でも十分にすごいと思うが。
658OOO-⊂(・∀・,,☆u:2010/05/01(土) 12:29:03 ID:G4KGRk6/0
なんだおれと同じくらいだな。Core 2も本来ただALU増やしただけではあんなに
はやくならなかった。OOOのld/st周辺は理解されてないし過小評価だろう。
5%以下は無いと思うよ。おれは強気で10%前後にしとく。
659OOO-⊂(・∀・,,☆u:2010/05/01(土) 12:44:59 ID:G4KGRk6/0
SNBで性能あがらなかったらIsrael的にはOregonがNehalemで想定外に頑張りすぎちゃったってことだろうな。
アグレッシブクロックゲーティングはWillametteが最初だし、
Penrynでの新省電力も回路実装はサンタクララに丸投げ。TBもOregonの実装が先行。
回路技術は米国中心で、低電力化の技術は実際のところアーキテクチャよりも
回路やデバイスに依存している度合いが高いので、世間での評価とは裏腹に
むしろ省電力技術は米国チーム中心で今後は語ることになる可能性すらある。
根っこにある理屈が同じなので、高速な回路で一流のアイデアをだせる設計チームが
電流抑えることを考えたら突然三流になるということは実際のところ無いだろう。
設計人からみれば目標値がかわるだけ。
660名称未設定:2010/05/01(土) 12:53:23 ID:WiYAGZ1W0
同プロセスでTDP25%減&IPC10%アップ
そんな都合よくいくのかいな
661OOO-⊂(・∀・,,☆u:2010/05/01(土) 12:54:42 ID:G4KGRk6/0
Pentium 4のときはまだまだCPUの性能はあがっていくと、
Intelの上層部を含めて信じていたようで、まあPentium 4みたいな高クロック路線が
設計サイドだけでなくIntel全体の方針みたいなものだったからな。
Intelがまだ電力や発熱が重要だということを本気で受け入れ切れていなかったのだろう。
でも今はIsrealチームの評価があがってしまったとはいえ、
Oregonも低消費電力必須の方針下にあるのでどうなるかわからないね。
でもLRBのぐだぐたがあるからHaswellはあまりコアを拡張して無い上期待できないかもしれない。

以上、GWの妄想でした。
662OOO-⊂(・∀・,,☆u:2010/05/01(土) 12:55:40 ID:G4KGRk6/0
>>660
そんな情報あったか?
Lynnfieldと同性能で25%TDPダウンとかだった気がする。
663名称未設定:2010/05/01(土) 13:14:49 ID:WiYAGZ1W0
664名称未設定:2010/05/01(土) 13:24:50 ID:+qceu7oV0
FUD貼んな
665,,・´∀`・,,)っ-○○○:2010/05/01(土) 17:22:05 ID:r+xUw7tB0
<10%ってのはHT込みでの予想
3つのALUに対してLoadユニットが少なくてネックってのはスカラでも同じだしな
666,,・´∀`・,,)っ-○○○:2010/05/02(日) 23:55:49 ID:5hQw4TI00
こっちに転載しておくか


Bulldozer will be Version 1 and other info
http://citavia.blog.de/2010/04/30/bulldozer-will-be-version-1-and-other-info-8484302/


721 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2010/05/02(日) 20:10:58 ID:rgIg+qs9
> - Improve fetch bandwidth by reducing code size.
> This is accomplished by:
> Replacing "packed double (PD)" and "packed integer (DQ)" forms of some
> SSEx/AVX instructions with "packed single (PS)" forms, where the "PS" form
> of the instruction is 1 byte shorter than the "PD" or "DQ" form.
> This applies to
> - use movaps instead of movapd/movdqa.
> - use movups instead of movupd/movdqu.
> - use xorps/andps/orpd instead of xorpd/andpd/orpd.

未だにこんなチューン必要なのかよ
何のための32B/clkの命令フェッチだよwww

ちなみにこれIntelプロセッサでは性能低下するコードの組み方の典型。
ああ、競合が遅くなるからある意味「最適化」なのか。
667名称未設定:2010/05/03(月) 00:38:42 ID:rBEWYQP10
movaps、movups、xorps/andps/orpd
どれがダメなの?
素人にわかるように解説ぷりーz
668名称未設定:2010/05/03(月) 00:44:45 ID:4tskhm5H0
いままでどおり
AMDのCPUはFPパイプで、整数SIMDとFPを区別しないとうことしかわからない
(IntelのCPUの場合、データタイプと命令を同じにしないとペナルティを受ける)

コードサイズが小さいほうがキャッシュのヒット率が上がるので
命令フェッチ帯域にかかわらず、有効な最適化だと思われる
669,,・´∀`・,,)っ-○○○:2010/05/03(月) 02:26:29 ID:QSiraSJF0
実際問題Intelのプロセッサでもこんなことやって速くなったのはAtomくらいだが
実際に命令フェッチ帯域がかなり狭いから5%程度の性能向上は得られたことがある。

コードサイズの最適化言うならもっと他にやることがあるぜ。
64ビットモードでREXプリフィクスが付く命令を減らすとか、あるいはAVXだと
vaddps xmm10, xmm7, xmm8→vaddps xmm10, xmm8, xmm7
とかね。前者だと5バイトだが後者は4バイト。

GCCはまだまだこの手の最適化弱いから手動でやらんといかん。
670名称未設定:2010/05/03(月) 04:23:00 ID:/j1Kz81m0
速くならんIntelの方が悪い
671名称未設定:2010/05/03(月) 05:30:52 ID:XR1sEdTh0
カエレ(・∀・)
672名称未設定:2010/05/06(木) 17:17:28 ID:JJd8lpPp0
Moorestownキタ━━━━(゚∀゚)━━━━ !!!!!
ttp://pc.watch.impress.co.jp/docs/news/20100506_365603.html
> 米Intelは4日、スマートフォン向けのIntelアーキテクチャSoC(System-on-Chip)「Atom Z6xx」シリーズを発表、同日付けで出荷開始した。
>
> これまで「Lincroft」のコードネームで呼ばれてきたプロセッサ。High-k 45nm LP SoCプロセスを採用。
>キャッシュ容量はL1データが24KB、L1命令が32KB、L2が512KB。
>クロックはハンドヘルド/スマートフォン向けが最大1.5GHz、タブレット向けが最大1.9GHz。
>
> また、CPUに、フルHDでのH.264/WMV/VC1によるデコードや、720pでのH.264によるエンコード機能や、
>OpenGL 2.1に対応する2D/3D機能などに対応したビデオコア「GMA 600」、
>32bitシングルチャネルLPDDR-200(最大1GB)/DDR2-400(最大2GB)に対応したメモリコントローラを内蔵する。
>
> 機能面では、Hyper-Threadingテクノロジのほか、短時間だけ動的にプロセッサの性能を持ち上げるBurst Performanceテクノロジ、
>OSがオン状態(S0)でもCPUコアやSoCをオフにするSmart Idleテクノロジなどの新機能を搭載する。
>
> チップセットはコードネーム「Langwell」こと「Platform Controller Hub MP20」。オーディオやUSB機能のほか、暗号化機能も搭載する。
>また、「Mixed Signal IC (MSCI)」と呼ばれる、バッテリの充電や、オーディオ、タッチスクリーンなど各種アナログ/デジタル周りを統制するチップを伴う。
>
> プラットフォーム全体の消費電力は、従来品と比べ、アイドル時の消費電力が1/50以下、ブラウジングやビデオ再生時の消費電力が1/2〜1/3になり、
>待ち受けは10日間以上、音楽再生時で最大2日、ブラウジングやビデオ再生時で4〜5時間バッテリ駆動できるという。
>
> 従来のAtom Z5xxシリーズ(コードネームSilverthorne)の多くが小型のx86 PCに採用されたのと異なり、Atom Z6xxシリーズは組み込み向けとなり、
>対応OSもAndroid、Moblin、MeeGoといったLinux系となる。ただし、これとは別にWindows PC向けの「Oak Trail」というプラットフォームも計画されている。
673名称未設定:2010/05/06(木) 19:39:30 ID:sA0dgkcx0
全文引用はしなくていい
674名称未設定:2010/05/06(木) 22:36:18 ID:zXoOTmobP
えっ、、、ultra-low-power statesで100mW? (Snapdragonは10mW未満)
実装面積もヤバそう・・・Atom Z6xx+MP20+MSCI+どこぞやのベースバンドチップ(or Evans Peak)。

http://pc.watch.impress.co.jp/docs/column/kaigai/20090601_211977.html
>「Moorestownでは、システムを構成する全てを含めたプラットフォーム
>として1/50の20mWのアイドル時電力となっている」(Chandrasekher氏)。

ウソツキ ('A`)
675,,・´∀`・,,)っ-○○○:2010/05/07(金) 07:19:20 ID:gZ0L5lu/0
> これまで「Lincroft」のコードネームで呼ばれてきたプロセッサ。High-k 45nm LP SoCプロセスを採用。
>キャッシュ容量はL1データが24KB、L1命令が32KB、L2が512KB。
>クロックはハンドヘルド/スマートフォン向けが最大1.5GHz、タブレット向けが最大1.9GHz。

L1Dが24KBとな?
そういえばAtomのL1Dの容量って気にしたことなかったな(8T-SRAMだったのは覚えてるが)
676OOO-⊂(・∀・,,☆u:2010/05/07(金) 22:18:33 ID:sdIxt4vx0
Atom勝ったなこりゃ。
677OOO-⊂(・∀・,,☆u:2010/05/07(金) 22:19:32 ID:sdIxt4vx0
電力性能比で最近はやりのCortex-A8系SoCこえてるんじゃねぇか?
誰か検証して。
Intel Unveils Moorestown and the Atom Z600, The Fastest Smartphone Platform?
http://www.anandtech.com/print/3696

Moorestown Battery Life (Figures by Intel)
Total Phone Power Consumption
Idle 21 - 23 mW
Audio Playback 120 mW
1080p Video Playback 1.1W+
Web Browsing (WiFi) 1.1W
2G Phone Call 550 mW
3G Phone Call 1.2W
1.5 GHz SKU for smartphones
1.9 GHz SKU for tablets
678OOO-⊂(・∀・,,☆u:2010/05/07(金) 22:21:13 ID:sdIxt4vx0
ARMあまりくわしくないけど、
ARMの最大の弱点は所詮RTLレベルのIPコアにすぎないってことを
最近まで見逃してたわ。Medfieldまでいけばかなりの差で勝てると思うよ。
679OOO-⊂(・∀・,,☆u:2010/05/07(金) 22:22:48 ID:sdIxt4vx0
Levelレベルになってしまったな。
>>639
uopキャッシュというのはuopのキャッシュだ。
トレースキャッシュはuopをキャッシュしているだけでなくコードの実行パスもキャッシュ
するため、制御が複雑。uopは変換済みの命令をキャッシュしているだけなので制御が単純で
電力効率的にもウマーである。
uop cacheとL1I cacheをならといて
uop cacheミス時にはL1Iをそのまま読んでデコード、
ヒット時はuopキャッシュから読んでデコードはしないという実装もありうる。
680OOO-⊂(・∀・,,☆u:2010/05/07(金) 22:28:13 ID:sdIxt4vx0
まあベンダーとしてはAtomを採用するとIntelのプラン、スケジュールに振り回されることになるから
なかなか今の携帯メーカーが舵をきるのは難しいのが現実だろうけど。
Atom系のスマートフォンは別ジャンルというか最終的にはAtomが勝つ場合、
やっぱPCとの互換性を重視した製品が普及するのではなかろうか。
>>675
L1Dは前から24KBだぜ。命令変換もしてるぜ。
681名称未設定:2010/05/07(金) 22:40:20 ID:0bImzWQ00
ARMの最大の弱点は所詮RTLレベルのIPコアにすぎないってことを
最近まで見逃してたわ。

おいwwwwwwww
Silverthorneが出る前から団子はじめとする淫厨(ARM派いわく)が主張してただろwww
682OOO-⊂(・∀・,,☆u:2010/05/07(金) 22:44:26 ID:sdIxt4vx0
以上、おれはしばらく2chを休業することにしたので乙。
683名称未設定:2010/05/07(金) 23:00:52 ID:mC3k9eWQ0
k-tai.impressやmycomに100mWと書いてあったけど、
オフィシャルリリース読んだら100_hじゃなくて100μhのようだ。
つまり0.0001W? ホントだとしたら凄い。
684OOO-⊂(・∀・,,☆u:2010/05/07(金) 23:05:32 ID:sdIxt4vx0
>100 uW deep sleep power
>21 mW idle power
>300-400mW active power for video playback
685OOO-⊂(・∀・,,☆u:2010/05/07(金) 23:09:15 ID:sdIxt4vx0
Israelはなんだかんだいって論理〜アーキ設計の改良が多いな。
電力ではこれらは脇役。アナログ色の強い部分で技術者の層が薄いのだろうか。
686OOO-⊂(・∀・,,☆u:2010/05/07(金) 23:12:24 ID:sdIxt4vx0
Atomの設計が大電力でキャンセルされたTe○asと同じ設計チームという事実が笑える。
687,,・´∀`・,,)っ-○○○:2010/05/08(土) 05:52:57 ID:1IRkakSI0
Atomの強みは生のLinuxやWindowsがそのまま動くことだろ。PCのハード・ソフトインフラがそのまま使える。
ARMは最先端プロセスで実装したIPデモしてもそっからSoC作ってシステム開発して、だから実際の製品が出るのは2〜3年後だからな。

同じシャープでもD4はAtom Zシリーズ発表からまもなくして出たが、後発のNetWalkerは未だに90nmで800MHzのCortex A8だ。
688名称未設定:2010/05/08(土) 06:20:58 ID:CTea2poH0
ググッた範囲で
Snapdragon 1GHz      最大500mW
Snapdragon(新型) 1.3GHz  待機時10mW以下
Tegra   一般的な利用50mW 動画再生150mW
Tegra 2   音楽再生30mW以下 動画再生500mW
*動画再生時の電力がTegra2より低い初代Tegraの数値は疑わしい。

一般的な携帯電話の1.3〜2倍程度のバッテリ容量にもかかわらず
Snapdragon端末のバッテリ持ちは悪い
http://review.kakaku.com/review/K0000082257/
http://review.kakaku.com/review/K0000035612/
http://review.kakaku.com/review/K0000035598/

Z600が>>677だとすると、iPad並巨大バッテリ端末に成らざる得ない?
689名称未設定:2010/05/08(土) 06:26:50 ID:qjHU8RLE0
そこでバッテリを大きくするか切れやすくするかはガワ作る側が判断するだろーからにんともかんとも
690,,・´∀`・,,)っ-○○○:2010/05/08(土) 07:26:48 ID:1IRkakSI0
主犯は液晶パネルじゃね?
スマートフォンサイズとネットブックサイズじゃ消費電力だいぶ違うだろうよ
691名称未設定:2010/05/08(土) 07:49:12 ID:niuDmG410
Z600は4型液晶スマフォには過剰な気がするねぇ
692名称未設定:2010/05/08(土) 07:58:17 ID:qjHU8RLE0
ぶっちゃげバッテリより入力デバイスどうするかの方が気になる
ここまできたらPCとかわらんし
693名称未設定:2010/05/08(土) 07:59:19 ID:qjHU8RLE0
sageてしまったageage
694えるえる:2010/05/08(土) 21:58:55 ID:e2RuTGKK0
>>692
そこでディスプレイコンピューティングですよ。

1. 普段は携帯電話のような使い方をする。みんながそれを持ち歩いている未来。

2. 街中の様々な箇所や、職場の卓上にディスプレイとキーボード/マウスだけが
くっついただけのような共用入出力プラットフォームを設置。インターフェースはディスプレイを含めて
無線のユニバーサルなものになっている。

3. 共用入出力プラットフォームの近くに携帯機器をおくと無線で自動的につながり、
ディスプレイとキーボード/マウスが認識されてそちらに入出力の制御がうつる。
携帯機器はPCの本体のような役割に即座に切り替わる。

ネタだがクラウドよりは可能性があると思うぞ。
695名称未設定:2010/05/11(火) 22:24:04 ID:glb1gcqj0
そもそも組込系のプロセッサの詳細なんてどこも公開してないし,
公正な比較自体不可能じゃん。
696名称未設定:2010/05/12(水) 00:24:26 ID:ub3MBS6O0
いずれにせよUniPhier 4MBB+&SH-Mobile G4が
ワットパフォーマンス最強であることに変わりはない
697名称未設定:2010/05/26(水) 02:51:11 ID:lPo5TLVD0
ho
698名称未設定:2010/05/27(木) 01:39:25 ID:YhCm224N0
米Intel、ディスクリートGPU市場への参入はないことを再確認
http://journal.mycom.co.jp/news/2010/05/26/117/index.html

4年前・・・
|838 :2006/09/03(日) 01:58:34 ID:MD28wGH60
|Intel puts beef into designing discrete graphics chip
http://www.theinquirer.net/default.aspx?article=33720

|IntelがdiscreteなGPUに真面目に取り組んでいるらしい。

|434 :2007/02/11(日) 02:29:30 ID:7KPzS4wf0
http://www.theinquirer.net/default.aspx?article=32776

|解雇者のほうが多いIntelのコードネーム、事実上3つのうち2つが死にます。
|興味深いのはそれらの存在そのものではなく、それらがmini-coreであることです。

|彼らの名前はKevet、Keifer、Larrabee(Larabee?Laraby?Larraby?)です。
|彼らは皆、確かに在ります、いえ在りました。Intelのmini-core計画の一環として。
|KevetとKeiferは解雇されましたがLarrabeeにはゴーサインが出ました。
699名称未設定:2010/05/27(木) 07:39:18 ID:M1WLhPFf0
Larrabee 2がキャンセルされてLarrabee 3がLarrabee 2に改名されたって話ね
ttp://www.semiaccurate.com/2010/05/17/larrabee-3-now-larrabee-2/
700名称未設定:2010/05/27(木) 08:34:04 ID:ZiiX71BD0
それ先週のデマ痔庵
701えるえる:2010/05/31(月) 20:33:21 ID:7HkSl+nd0
702えるえる:2010/05/31(月) 20:39:24 ID:7HkSl+nd0
半導体IPライセンスで普及したARMアーキテクチャ
http://www.gbrc.jp/journal/amr/free/dlranklog.cgi?dl=AMR5-5-4.pdf

ARMが携帯で普及した理由は結局運なのか、
それともIPビジネスモデルの成功と見てよいのだろうか。
おれの脳内では組み込みではARM以上の電力性能比のプロセッサは
もっとあったはずだが、低消費電力だけが普及の鍵でないことは確か。
703えるえる:2010/05/31(月) 21:10:24 ID:7HkSl+nd0
本当に電力性能比を追求するならアーキ〜RTL設計以下の領域でも
電力を最適化をしなければならない。
(本家)ARMは所詮RTLなIPコアにすぎないので、
最終的な消費電力は結局のところベンダー側の設計や製造プロセスの力量にも依存している。

この点、IntelのAtomは完全独自設計で、製造プロセスもAtom SoC用に最適化されているので、
マイクロアーキ〜プロセスにいたるまで一貫して電力性能比にフォーカスしている点にアドバンテージがある。
というわけで技術的にAtomがARMを電力性能比で上回るのは別に驚きではない。
(何でもかんでもISAが優劣を決定するかのような発言をする連中は、RISC論争が残した負の遺産だと思う。)
http://ednjapan.rbi-j.com/issue/2009/12/49/5693

一方で、電力性能比で仮にAtomがARMに大きく勝ったとして、
即Atomが普及が決定するかといわれると、これもコンピュータの歴史を顧みればわかるとおり、
そう単純にいくようなものではない。
704えるえる:2010/05/31(月) 21:15:50 ID:7HkSl+nd0
http://pc.watch.impress.co.jp/img/pcw/docs/367/786/html/11.jpg.html
ちなみにこの絵をみればわかるとおり、
32nmで残念ながら
Bonnell → Saltwell
にマイクロアーキテクチャが変更される予定になっている。
個人的にはもう少しこのまま拡張しないで低電力化を追求してほしいかったんだけどな。
705,,・´∀`・,,)っ-○○○:2010/06/01(火) 02:08:50 ID:oYz7PYiz0
Sandy BridgeのLoad Unitの実装
http://microboy.seesaa.net/article/148783139.html

>>704
ま、より電力効率が改善する改良なら大歓迎だが・・・
706,,・´∀`・,,)っ-○○○:2010/06/01(火) 02:14:45 ID:oYz7PYiz0
>>702
そりゃそうだろ
独自命令セットアーキテクチャでコンパイラをはじめとしたソフトインフラを維持するのは
どこのメーカーも負担が大きい。
707名称未設定:2010/06/03(木) 23:16:19 ID:ZpNJ2ECp0
>>688-692
3.8インチ液晶で来たよ。インテルは本気だよ。

Moorestown搭載スマートフォンをインテルが披露
http://ascii.jp/elem/000/000/526/526838/
708名称未設定:2010/06/03(木) 23:21:10 ID:ss1mAvp60
この板で言うのもなんだがやっぱWindowsが使いたいよなあ
709名称未設定:2010/06/03(木) 23:39:44 ID:L58ABFRQ0
えっ、Windows?
VAIO Tyep Pの8型ワイドでさえキツキツ画面で嫌気がさすのに3.8型じゃ・・
710名称未設定:2010/06/04(金) 00:28:40 ID:h1aopu8m0
いや流石にポン載せは嫌だがwww
711えるえる:2010/06/07(月) 19:58:41 ID:updlZpfe0
GPUとCPUが決定的に異なる点として、
処理対象にリアルタイム性が求めらているかどうかってことがある。
このことが買い手の戦略に決定的な違いをもたらす。

CPUの場合、例えばPC上でよく動かすプログラムといえば、
OSのサービスだったりやオフィスやらブラウザの処理だったりするわけだが、
その大部分がリアルタイム性を求められておらず、速ければ速いほど価値の高いものになっている。

しかし、GPU=ラスタグラフィックプロセッサのターゲットはゲームなので
最高画質の設定で60fpsが出れば、それ以上の処理能力は意味がなくなる。
それどころか一般に高性能GPUは電力や価格が高くなるので、
予算に制約のない買い手にとっては自分のやるゲームの画質で60fpsがでる最低限のGPUを
常に装着しているのが構成上のベストということになってしまう。

実際、PCでゲームを比較的やる層で、なおかつ予算は十分あっても
わざわざローエンドやミドルのカードを好んで買っている人は多いだろう。
ハイエンドGPUの購入者はゲーマーである以前に単なるモノ好きが多い。
(このような リアルタイム性 == 過剰性能の否定 は、GPU以外のリアルタイム処理な分野でも成り立っている。)
712えるえる:2010/06/07(月) 20:00:40 ID:updlZpfe0
>>705
相変わらずこのスレのモロパクネタの多いサイトだな。まあおれ的にはパクリ自体は別にいいけどさ。
713名称未設定:2010/06/07(月) 20:10:06 ID:aInL02c80
新参か。
このスレの住人がやってるblogだよ。
714えるえる:2010/06/07(月) 20:10:35 ID:updlZpfe0
にもかかわらずPC世界でGPUがもてはやされる理由として

・米国でのFPSが、PC文化の中で異常な地位であること
・3Dゲーも過去の2Dゲーと同じく、十分な技術レベルの達成 → 芸術・表現面の模索
の段階に達しているが、消費者の認識がまだ追いついてない

の2点が大きいだろう。
715,,・´∀`・,,)っ-○○○:2010/06/08(火) 02:38:53 ID:fD+35dOm0
>>714
お前さんのBlogだと思ってたよ

おいらは>>652あたりの話はソースは出してない。
716名称未設定:2010/06/08(火) 04:04:25 ID:c1Uplqh40
Intelerのブログだろ
717えるえる:2010/06/09(水) 21:50:31 ID:wtNaD3f/0
独断と偏見に満ちすぎたPCの技術革新TOP100
ttp://labaq.com/archives/50853196.html

TOP10にDoom, Quake, Voodoo
という糞なランキング。
718名称未設定:2010/06/27(日) 12:58:30 ID:+CMu174E0
ho
719名称未設定:2010/07/24(土) 01:06:18 ID:965BV2Xx0
Intelのプロセス開発担当者に聞いた,15nm世代以降のCMOS技術
http://techon.nikkeibp.co.jp/article/NEWS/20100712/184141/

Nvidia: Intel Has No Particular Advantages in Heterogeneous Multi-Core Technologies.
http://www.xbitlabs.com/news/other/display/20100722132431_Nvidia_Intel_Has_No_Particular_Advantages_in_Heterogeneous_Multi_Core_Technologies.html
720名称未設定:2010/08/02(月) 20:28:04 ID:le5RTAMdP
>世代毎の改善は大体 1.6 倍なので、22nm になると Intel は 650 MF/W 程度、AMD は 800MF/W 程度ということになります。
>この辺まできてやっと 65nm の PowerXCell と同等であり、大体3世代、4倍の効率差がある、ということになります。
世代ごとの改善1.6倍とのことだが、その通りだとしてそれは最近の話ではないか。
過去のマイクロプロセッサは電力よりも性能を重視した設計をしていたが、
最近は改善されてその成果が顕著にでているととれる。

このままもし1.6倍ペースが維持できるならそれは驚異的なことであり、
並列演算にフォーカスした専用プロセッサが、1.6倍以下の改善であればx86にいずれ抜かされるということになる。
現在は昔と異なり専用プロセッサも汎用マイクロプロセッサも同種の素子、プロセスを使用して設計されているのに、
専用プロセッサの方が改善幅がよいという具体的証拠が示されいない。
はっきりいってPowerXCellのような並列志向のアーキテクチャに対しても、
X86が4倍しか差がでないところまで電力が最適化されていることがむしろ驚き。
この記事は全体的に誤っているでしょう。もっと長い時間のスケールで、過去のHPC用プロセッサと汎用プロセッサと、
電力改善の比率とこれからの展望を比較すべきです。
721名称未設定:2010/08/02(月) 20:29:02 ID:le5RTAMdP
>その結果はGPUの方が平均で2.5倍,最大で14.9倍速いという結論です。確かに100倍速いというのは正しくないということを示したのですが,
>平均2.5倍でも十分速いので,一般の受け止め方はやっぱりGPGPUの方がのかとなってしまい,
>これはIntel のオウンゴールではないかという見方が一般的です。
この結果がオウンゴールと解釈するやつが一般というのなら、
過去を顧みないor都合のよいことしか受け入れられない人が一般化したのだな、としかいいようがない。
GPUのようなアーキテクチャが汎用CPUに対して、Intelの論文が本当にフェアで2.5倍しか差がないというならば、
それは驚きであり、HPC向けとしては敗北のボーダーラインを余裕でわっているのではないかと考えるのがふつうだろうに。
専用は10倍〜数十倍程度はアドバンテージがある。これは珍しいことではないし、むしろそこから話が始まる。
1,2割の性能差でブーブーいえる実益度外視のオタク世界からみれば2.5倍は大差という印象なのかもしれないが、
その差でこれからビジネス的にも流行るゾと思ったら負け組コース。

#最近の国内HPCネタはホラ臭のする話が多い予感。影響力のある人がもしわかってやってるのならば重罪。
#真に受けるやつも多いし勘弁してほしい。
722OOO-⊂(・∀・,,☆u:2010/08/22(日) 00:35:08 ID:nW3BuggLP
Intel Core i7 Q 720
http://browse.geekbench.ca/geekbench2/view/274637

Intel Corporation SandyBridge Platform - 1.60 GHz(クロック不明)
http://browse.geekbench.ca/geekbench2/view/273184

More Sandy Bridge performance numbers
http://citavia.blog.de/2010/08/05/more-sandy-bridge-performance-numbers-9128712/

SNB Core-i7-920 Difference
Integer 6224 5059 23.0
Floating Point 7193 5805 23.9
Memory 3217 3456 -6.9
Stream 3388 3275 3.5
Total 5678 4821 17.8
723OOO-⊂(・∀・,,☆u:2010/08/22(日) 00:54:24 ID:nW3BuggLP
■Integer Performance - Multithread
Sandy_Bridge Nehalem_i7-920 (%) Benchmark
-------------------------------------------------
8037 6905 16.4 Blowfish
9739 7245 34.4 Text Compress
11673 8281 41.0 Text Decompress
8966 7174 25.0 Image Compress
9147 6912 32.3 Image Decompress
14826 10899 36.0 Lua
-------------------------------------------------
10177 7792 30.6 GEOMEAN()

■Integer Performance - Singlethread
-------------------------------------------------
Sandy_Bridge Nehalem_i7-920 (%) Benchmark
1206 1442 -16.4 Blowfish
2022 1958 3.3 Text Compress
2197 2133 3.0 Text Decompress
1801 2035 -11.5 Image Compress
1757 2025 -13.2 Image Decompress
3325 3704 -10.2 Lua
-------------------------------------------------
1958 2124 -7.8 GEOMEAN()
724OOO-⊂(・∀・,,☆u:2010/08/22(日) 00:56:09 ID:nW3BuggLP
■Floating Point Performance - Multithread
-------------------------------------------------
Sandy_Bridge Nehalem_i7-920 (%) Benchmark
11728 8598 36.4 Mandelbrot
6720 5317 26.4 Dot Product
24322 17037 42.8 Dot Product
9404 6079 54.7 LU Decomposition
15814 10070 57.0 Primality Test
3581 4040 -11.4 Sharpen Image
13443 13663 -1.6 Blur Image
-------------------------------------------------
10462 8264 26.6 GEOMEAN()

■Floating Point Performance - Singlethread
Sandy_Bridge Nehalem_i7-920 (%) Benchmark
-------------------------------------------------
1591 1923 -17.3 Mandelbrot
902 992 -9.1 Dot Product
3585 4197 -14.6 Dot Product
2538 1526 66.3 LU Decomposition
4273 4015 6.4 Primality Test
562 840 -33.1 Sharpen Image
2246 2975 -24.5 Blur Image
--------------------------------------------------
1836 1988 -7.6 GEOMEAN()
725OOO-⊂(・∀・,,☆u:2010/08/22(日) 00:57:26 ID:nW3BuggLP
ちなみにこのベンチ結果からは殆どなにもわからないな。
726名称未設定:2010/08/22(日) 01:01:57 ID:Ce0WYfA20
シングルスレッドが異様に落ちてるのはSNBではTBが効いてない?
727OOO-⊂(・∀・,,☆u:2010/08/22(日) 01:02:19 ID:nW3BuggLP
http://plusd.itmedia.co.jp/pcuser/articles/1006/08/news089.html

>CINEBENCH R10では、CPUに“Sandy Bridge”を組み込み、GPUにMobility Radeon HD 5000番台(56xxか?)を搭載したシステムと、
>Core i7-920XMとGeForce GTX280Mを組み込んだとされるシステムを並べて比較したが、
>Sandy Bridgeのシステム情報には、動作クロックとして「2.20GHz」と表示されていた。
>ただし、このクロックはデモのために設定されていて製品版のクロックとは異なる可能性も高い。
>ちなみに、ライブデモで行われたCINEBENCH R10の結果は、“Sandy Bridge”搭載システムが「19843」、
>Core i7-920(推定2.00GHz動作)搭載システムが「11961」だった。

ちなみにこのデモであるが、Cinebenchが最新のR11.5でないところからして、
R10をAVXに最適化したIntel内部の評価用ver.という解釈が妥当ではなかろうか。
728OOO-⊂(・∀・,,☆u:2010/08/22(日) 01:05:06 ID:nW3BuggLP
>>726
Sandy Bridge側のクロックが不明なので絶対性能やクロックあたり性能の比較になってない。
マルチスレッド時には高スコアになっているので、マルチスレッドが得意ということはいえる。
729OOO-⊂(・∀・,,☆u:2010/08/22(日) 01:14:06 ID:nW3BuggLP
あ、ちがうちがう。
というかこのベンチのサイトで検索すると同じCPUでも結果がマチマチすぎて比較になってないね。
こりゃつかえねぇな。はるんじゃなかった。
730名称未設定:2010/08/26(木) 11:42:54 ID:VFD3TXL60
AMD 3DNow!終了のお知らせ
http://blogs.amd.com/developer/2010/08/18/3dnow-deprecated/


長かったなぁ
731名称未設定:2010/08/26(木) 12:03:57 ID:VFD3TXL60
>>720
牧野さんのとこのだね。ちゃんとAVXによる性能向上の可能性にも触れてるよ

> あ、でも、 AVX というものがあるので、 Intel に関してはチップの電力をあ まりあげないで浮動小数点性能が倍になる可能性はあります。
> そうすると 32 nm で 700-800MF/W、22 nm では 1.2GF/W 程度になります。2012 年には 22nm にな るでしょうから、なかなか厳しいものはあります。

結局はMF/WってSIMD演算性能だけあげてれば改善するから、
SIMD特化型のアクセラレータってそんなに優位性が無くなっていく


> GPGPU は Fermi がなかなか難しい状態になっているので今後が不透明ですが、 明らかなのはこのままでは x86 に比べてよいところがない、
> ということです。 84 では、Fermi を使うことで Xeon だけに比べて 1.6 倍程度は 電力効率が上がっているのでは?と書いたのですが、
> そんな大きな効果はなく て実際の向上は 14% しかなかったわけです。これは、松岡さんがどこかで指摘 していたように、行列サイズが
> 妙に小さいために実行効率が低いことが原因の 一部ではあり、あと 2-3 割は上がる余地があると思います。
> しかしこれは半導 体技術1世代分にもならないわけで、現状の Fermi や、そこから技術を外挿し たものには将来性はない、ということになるでしょう。

まあ、この辺は納得。
732,,・´∀`・,,)っ-○○○:2010/08/29(日) 02:53:40 ID:Urxmzf5n0
さて、Sandy BridgeのESのベンチも出たことだし・・・
俺の予想どんぴしゃじゃないか>>656
733OOO-⊂(・∀・,,☆u:2010/08/29(日) 09:18:31 ID:MTTiKgI5P
非SIMDのまとまったベンチなんてあったか?
というか結論いそぎすぎ。まだ結論だすのには不十分。

Cache周辺の容量や帯域、レイテンシなどの仕様、
実行ユニットなどの仕様も変わっているので、
まあ実力は非SIMDに関してもコンパイラが最適化されてからだな。
いつものようにSPECとかで最適化されたやつ登録してくるからな。
734OOO-⊂(・∀・,,☆u:2010/08/29(日) 10:02:04 ID:MTTiKgI5P
>>703
ARMも最上位のA9になると本命はハードマクロである程度最適化されたやつみたいだね。
typ.2GHzで1.9Wって微妙だと思うけどね。
# Advanced SIMD NEON? unit (Optional)
# Floating Point Unit (Optional)
って書いてあるしな。

http://www.arm.com/products/processors/cortex-a/index.php
http://www.arm.com/products/processors/cortex-a/cortex-a9.php
735,,・´∀`・,,)っ-○○○:2010/08/29(日) 10:18:55 ID:Urxmzf5n0
ようはAVXを使わずにどこまで性能があがるかってことなんで
SSEを含めた既存コードが1割性能上がれば十分だろう

いろいろ細かい部分もあるが、Sandy Bridgeの性能向上の一番のキモはLoad Unitの倍増なんで、
これはSSE, スカラ関係なくコードを書き換えることなく自動的に恩恵を受けられる。

> まあ実力は非SIMDに関してもコンパイラが最適化されてからだな。

その最適化スイッチって-mavxとか/QxAVXとか以外にあるってことですか?w

実際問題、AVXを使う以外でコンパイラでやれる最適化テクニックなんて殆ど無いよ。
昔のPentium 4/Pentium M世代だと、QxW, QxB, QxN, QxPとか複数の最適化スイッチが存在したけど
今はなくなってる。
MSのコンパイラにあったG5, G6, G7なんて廃止されて久しい。

Intelコンパイラもスカラコードに関する部分はCore MAベースで、あとは命令セットのサポートだけ
ベースのマイクロアーキテクチャが同じだからな。

Atom以外にアーキ固有の最適化スイッチなんて存在しないよ。
http://www.sofken.com/Documentation/compiler_c/main_cls/copts/common_options/option_x_lcase.htm

いっぺんIntelコンパイラで/QaxSSE2 /QaxSSE3 /QaxSSSE3 /QaxSSE4.1 /QaxSSS4.2 /QxAVXとかでコード生成やってみるといいよ。
スカラ部分のコード分けなんてやらないからw

IntelコンパイラもGCCもSandy Bridge用最適化は -march=core2 -mavx で十分と言ってる状況
これを仮に-march=opteronにしても1〜2%も変わらんよ。

今となってはコードの並べ方変えることでやれる事なんて殆ど何も無い。
それがアウトオブオーダ実行だから。
736OOO-⊂(・∀・,,☆u:2010/08/29(日) 10:21:38 ID:MTTiKgI5P
Coremark(EEMBCベンチマーク)
http://www.coremark.org/benchmark/index.php

Nvidia Tegra2 (dual-core ARM Cortex-A9) 1GHz
5866.39

Intel Atom N280 1.68 GHz
5353.79

Atom+HT 1.68GHz
ARM-A9+DualCore 1GHz
で同じくらい。というかコア性能は互角くらいかな。

>>667をみるなり、SoC全体で1.1WというMoorestownの世代で既に
電力性能比でARMにアドバンテージはない可能性が高い。
737OOO-⊂(・∀・,,☆u:2010/08/29(日) 10:24:53 ID:MTTiKgI5P
まあおれはコードオタじゃないしIntelコンパイラ事情なんて追いかけてないから知らんが、
最適化スイッチ以外でコンパイラの改良はないとか、
団子先生の話は時折強引になるのはよくわかっているから聞き流している。
738OOO-⊂(・∀・,,☆u:2010/08/29(日) 10:31:55 ID:MTTiKgI5P
というわけで現実は、
- IPビジネスモデルでうっていくのがARM
- 電力と性能の最適化でアドバンテージをうっていくのが新規参入のIntel SoC
という戦い方になるのではないかと。

感覚な性能はアバウトなところで
Coretex-A8 … Deschutes-Katmaiクラス
Coretex-A9 … Willamette、Bonnellクラス

性能でPCハイエンドの約8年遅れ
アーキテクチャで約10〜15年遅れ
で、製造プロセスはあまり変わらないのでそこまでコア性能差がでてないというイメージ。
739OOO-⊂(・∀・,,☆u:2010/08/29(日) 10:35:25 ID:MTTiKgI5P
o Coretex
x Cortex
740OOO-⊂(・∀・,,☆u:2010/08/29(日) 10:38:04 ID:MTTiKgI5P
まあAnandのベンチだけでもおよそのことはわかったし、
ほぼ予想通りということもわかったね。

それにしても発売までまだまだあるのにSandy Bridgeのベンチ解禁早すぎる。
もうテープアウトから1年以上経過しているからな。
もういいから、早くIntelだせよと。
741OOO-⊂(・∀・,,☆u:2010/08/29(日) 10:39:31 ID:MTTiKgI5P
Haswellは今のところ冗長マルチスレッドとネットワーク専用プロセッサの統合が個人的に今のところ有力か。
例によってサーバ色の強い改良が多そうだな。
742名称未設定:2010/08/29(日) 10:40:25 ID:viTFkRsHP
http://ednjapan.cancom-j.com/issue/2010/6/69/6784/2
CoreMarkって8bitや16bitの処理もやってるから、
ARMのベンチ結果良いのってThumbで8bitや16bitの数字稼いでるんじゃないの?
743,,・´∀`・,,)っ-○○○:2010/08/29(日) 11:17:42 ID:Urxmzf5n0
ロードユニットが増えることでの性能の恩恵ってのは
ロード命令の比率が増えるところ、だけではなく、ミスアラインメントなデータに対するロードを行っても
性能低下が少ないこと。
これはAMDの中の人も説明していた。
744OOO-⊂(・∀・,,☆u:2010/08/29(日) 17:40:11 ID:MTTiKgI5P
IGPのスコアがArrandale比でやたらのびているようだが、
L3の効果がいかほどか気になるな。
GPU統合はもともとGPUに興味なかった層には語るに余計なものがくっついてきてきつい(わらぃ
745名称未設定:2010/08/29(日) 18:02:56 ID:MTTiKgI5P
>>714
つまり、ゲーム中でのラスタグラフィックスの質を改善するには今や
シェーダプログラマをたくさん雇って所詮ラスタグラフィックにかぶせるシェーダプログラムをバリバリ使い倒すよりも、
グラフィック屋やセンスのよい演出屋をたくさん雇ったりして、質の高いモデルに従来どおり高画質のテクスチャをバリバリは
っていったほうがずっと視覚効果が高いわけで。実際のゲーム製作の工数的にもグラフィックや演出の調整がかなりの比重になっている。
2DゲームもGPU性能があまり重要でなくなってからグラフィッカーなどの質がゲームのビジュアル面の品質を左右するのが
顕著になったがそれと同じ様な流れである。

もともとプログラマブルシェーダなんていうのはGPUが大規模になって差別化やバグつぶしが困難になってきた
GPUメーカーやMSの開発の都合からきたものにすぎないかもしれないのに、GPUがグラフィックの質を向上すべく汎用化をおこなって
ついにCPUの地位をおびやかすところまできたみたいな文脈で語られてることがはじめから半分胡散臭い話ではあった。

nVIDIAとしても例えばレイトレーシング専用チップなどを早いうちに研究しといてくれれば、
HPCという狭い世界を頼みの綱にしなくても多少延命できたかもしれないのに残念だ。
レイトレーシング技術が一般消費者にも浸透すれば、オタク界隈で3D美少女モデラーたちが続々と登場して、
次世代のオタクコンテンツとしてゲームないしゲーム以外のメディアに進出して浸透するシナリオがつながったのに
日本としても残念なことだ(わらぃ
746名称未設定:2010/08/29(日) 19:58:29 ID:hYIILOih0
俺もGPU付けるならCPUコア増やせなんて感じちゃう
自作erって馬鹿で悲しい生き物だよね
747名称未設定:2010/08/29(日) 20:01:20 ID:hYIILOih0
しかし2005年にIntelが提唱していたMany-Coreにどんどん近づいてるというのは感じる
LRBがキャンセルされなかったらマイクロカーネルも既に実現していたはずで
748,,・´∀`・,,)っ-○○○:2010/08/31(火) 00:02:15 ID:CFkt7Rae0
ノートPC用のCPUを選別して出す為にデスクトップやローエンドサーバにも展開するわけで

内蔵GPU使う事なんて強制されてないだろ
749名称未設定:2010/08/31(火) 09:51:46 ID:G+KH+kzj0
やっぱりアポーは10万円台のPOWER7Mac発売とかやってくれないと面白味ないよな
750OOO-⊂(・∀・,,☆u:2010/08/31(火) 20:19:55 ID:qxLqmzCnP
コスト的に無理。
Appleが大口注文してればPOWERの価格も量産効果でダウンするはするだろうが、
それでもあの豪華仕様はPCレベルの製品には無理なので機能をダウンして切り売りすることになる。
結局PPCみたいなのができるだけ。
751OOO-⊂(・∀・,,☆u:2010/08/31(火) 20:28:23 ID:qxLqmzCnP
個人的にはMany-Coreにはぜんぜん近づいていっているように思わないけどなあ。
GPUでいうコアとかスレッドってのはCPUのと定義が異なるし、
GPUをメニィコアとかいうのは単なる営業文句だからな。

>>38に書いてあるとおり、マルチコアはプロセス1世代で1.4倍のコアしか集積できない
面積と電力の両方で効率の悪い技術だよ。それで速くなるのは一部のアプリだけ。
2006年11月にQuad-Coreが登場したが、4年弱たっているのにいまだに4コアは一般に浸透してない。
このまま順調にコア数ふやしていっても8コアなんて当分普及しないぜ。
752MACオタ>OOO-⊂(・∀・,,☆u さん:2010/09/01(水) 17:53:59 ID:Jr3ElFqy0
>>750
  ---------------
  コスト的に無理。
  ---------------
IBMのサーバー製品は正に『IBM価格』というヤツなので、コストで値段が決まっている訳じゃありません。
試しにかつて存在したPPC970搭載のIBM製サーバーの価格を調べてみると…
http://www-07.ibm.com/businesscenter/sg/pdf/IBM_Express_Portfolio.pdf (p.3参照)
  ===============
  IBM System p5 185 Express
  Price starting from $6,099
  ===============
一方、POWER7搭載サーバーの最廉価版 Power 710 Express の米国価格はこちら。
http://www-03.ibm.com/systems/power/hardware/710/browse_aix.html
  ===============
  8231-E2B1
  POWER7 / 3.0 GHz 4-core
  $6,385.00 IBM Web price*
  ===============
あまり変わらないという(笑)

実際のところ、POWER7のローエンド版は外部L3チップが不要になったことに加えて、プラスチック
製でピン数も少ないパッケージになっています。ブレードやローエンドサーバーで x86 製品との
価格競争力を考慮して開発されていますから、Power Mac G5レベルのハイエンドデスクトップ/
ワークステーションにはそのまま流用できますし、上の価格比較からも判るようにシステム価格も
Power Mac G5 程度で済みそうです。
753MACオタ@訂正:2010/09/01(水) 18:36:10 ID:Jr3ElFqy0
上で引用したIBMのG5サーバーの価格は米ドルじゃなくて、シンガポールドルでした…
で、当時の記事よりちょっと訂正。およそ $4,000 とのこと。
http://www.osnews.com/story/13678/
  --------------------
  A 2-way 2.5GHz system with 2GB of RAM and two SCSI drives
  will set you back $4000 [EUR 3360] without any OS licenses.
  --------------------
ちなみにこの製品、後々YDL の Terra Soft Solutions が OEM で販売しています。この時の価格はなんと $1,895 也。
http://lwn.net/Articles/285538/
  --------------------
  The YDL PowerStation is available for just $1895 and will ship
  by the close of June, 2008.
  --------------------
Power 710 も普通のベンダが販売すれば 30-50万円程度の製品になりそう… ということで。

これより安くするには Power Mac のようにデスクトップ製品として設計しなおす必要があるのでしょう。
754名称未設定:2010/09/02(木) 09:57:19 ID:ZoXk0IcZ0
MACオタアホか
言ってるのは専用設計することなくその半額で売れということだ。
755MACオタ>754 さん:2010/09/02(木) 21:07:57 ID:bXSyxYHZ0
>>754
  -------------------
  専用設計することなくその半額で売れということだ。
  -------------------
専用設計の Power Mac G5 は同じクラスで30-40万円の製品なのですが?乞食のヒトですか(笑)
http://www.apple.com/jp/news/2005/oct/20powermac.html
  ========================
  Power Mac G5 Dual 299,800円 (本体価格 285,524円)
   - デュアルコア2.3 GHz PowerPC G5プロセッサ
  Power Mac G5 Quad 399,800円 (本体価格 380,762円)
   - デュアルコア2.5 GHz PowerPC G5プロセッサ
  ========================
756名称未設定:2010/09/03(金) 02:49:31 ID:ugKmVNlu0
インタビュー:ニコン社長
http://jp.reuters.com/article/topNews/idJPJAPAN-17068220100902
> 競合するオランダのASMLが次世代技術の「EUV」を使った最新型の
> 半導体露光装置の開発にいち早く着手して12年に量産機を出荷する
> 見通しになっているが、木村社長は「顧客がEUVを本格的な量産機として
> 使うのは2010年代の最後の方になるだろう」とし、それまでは「液浸」型の
> 技術革新を続けることでASMLのEUV技術に対抗していく方針を示した。
757名称未設定:2010/09/03(金) 03:02:50 ID:827AzcaM0
2009年に実用化とか言ってたのが懐かしいなwww
758,,・´∀`・,,)っ-○○○:2010/09/03(金) 23:55:55 ID:a4BVoU7i0
450mmウェハからなのかな?
759名称未設定:2010/09/04(土) 00:45:55 ID:GecsTqw80
ようやっとEUVか
193nm ArFが長かったな
760名称未設定:2010/09/04(土) 12:42:07 ID:fbqRKqmH0
http://eetimes.jp/content/3932

2015年くらいには何とかなるかな
761OOO-⊂(・∀・,,☆u:2010/09/04(土) 18:32:42 ID:PWto0yVqP
気持ちポジティヴ目で
BullのIPCがSNB比で0.6前後という数字だった。
762,,・´∀`・,,)っ-○○○:2010/09/04(土) 19:03:40 ID:AXtKnU6k0
それじゃAMDは勝てんだろ。
ダイフォト見る限りだとBulldozer 8コアはSandy Bridge 4コアよりは大きくなりそうだし(6コアと同程度?)

結局はシングルスレッド性能を上げるのにIPCを上げるかクロックをあげるか、だと思うのだが。
IPCをx倍にするにはおおよそトランジスタはxの2乗倍必要になり、消費電力はそれに比例して増える。
クロックをx倍にするには、xの2乗より更に多くの電力が必要になる

Turbo Boostのようにパワーゲーティングで1〜2コアに電力供給を集中して
クロックを一時的に上げるアプローチは、まあありだと思うが
全コアの定格クロックを上げるアプローチはなかなかうまくいかないと思われる。
763OOO-⊂(・∀・,,☆u:2010/09/04(土) 19:55:34 ID:PWto0yVqP
AMDも実力を認識してるだろうな。Ivy-Bridge-EXとかのゾーンは狙ってないだろうね。
低価格帯のサーバや、デタセンで大量買いしてくれる顧客を当てにしているのではないかと。
Bulldozerといえばスループットなのだがスループット性能でも大規模コア相手に苦戦すると思う。
所詮スループット重視のアーキテクチャなんてそんなもん。
デスクトップは主力にはならないと思うよ。
個人的にはBulldozerのようなアーキテクチャがPCに進出してくれるおかけで
やっぱマルチコアやスループットは投資に見合うだけの性能でないんだな、
という認識が広まって業界の流れが変わってくれないかという点でむしろかなり期待している。

Sandy BridgeはTurbo Boostの存在を前提にアーキテクチャを練った世代という感じがするが、
昔もいったがBulldozerはアーキテクチャ構想段階ではTB考えてなかっただろうね。
だからああいうソリッドなアプローチになったんだろう。
この手の電力/クロック制御技術ではThuban、LlanoでステップアップしながらIntelになるだけ追いつかせようというかんじ。
764名称未設定:2010/09/04(土) 20:09:07 ID:Ujkes8tIP
もともとIntelはFoxtonでアプリごとに消費電力が違うことに着目して、
TDP範囲内で最高性能を出すことを目指していたんだから、
コア単位の制御に取りかかったばかりのAMDとは年期が違って当然なんじゃないの?
765名称未設定:2010/09/04(土) 21:57:56 ID:0padwxkf0
果たしてBulldozerはIntelからAtomサーバーを引きずり出すことができるのか
766,,・´∀`・,,)っ-○○○:2010/09/04(土) 22:41:08 ID:AXtKnU6k0
>>763
ぶっちゃけた話、Sandy BridgeとBulldozer(Orochi)は同じモジュール(コア)数で比較した場合
動作クロック的にはそんなに変わらんのではないかと思うんだが。

結局はx86の複雑さの最たる部分であるデコーダに動作限界が縛られるしな。
この点に関しては、おなじ4ウェイでComplex Decoder×4のOrochiのほうがむしろ不利かと。
(CoreMAの場合、命令列がLSDに収まる場合はデコーダを止めることができる)

>>765
Atomマルチコアは面白いな
元々メニーコア向けに設計してた石を携帯機器向けにカットダウンした物らしいし、
Nehalem-EXの技術応用すればすぐにでもできる気がする
767OOO-⊂(・∀・,,☆u:2010/09/11(土) 21:45:21 ID:UL7M3C3vP
768OOO-⊂(・∀・,,☆u:2010/09/11(土) 22:06:45 ID:UL7M3C3vP
>>764
Foxton以外にも非対称マルチコア向けにEPIスロットリングなんて研究もあったな。
性能/電力、シングルスレッド/スループットの動的なスケーリングというのは
Intelの好き物なんだろうな。

http://itl.jisakuita.net/intel_ups_info/1159817811.html#R148
http://itl.jisakuita.net/intel_ups_info/1121683774.html#R232
http://download.intel.com/jp/developer/jpdoc/epi-throttling-1005_j.pdf
http://download.intel.com/jp/developer/jpdoc/power_efficiency-0206_j.pdf
769OOO-⊂(・∀・,,☆u:2010/09/11(土) 23:32:46 ID:UL7M3C3vP
>>766
TDPを抜きにして、同じコア数での比較というのにはあまり意味がないでしょ。
TDPに対してコア数をどれだけ(定格的な動作で)押し込めるかが、Bulldozerの狙い。
便宜上、NehalemとのIPC比はジャンルによらず0.65でTBなし前提での比較。これはテキトーに決めた数字です。
(Intelの定格クロックは現在、全コア稼動時を基準に設定されていると見られる。)

- MPサーバ (TDPに対してコア数が多く、制約が厳しい。)
Nehalem-EX, 130W, 8コア, 2.26GHz, TB 2.66GHz
2.26GHz / 0.65 = 3.47GHz
→ Bulldozerは130Wで8コアが3.5GHz程度で回ってくれればコアあたりの性能でも通用。
クラスタードなので面積などでメリットがある。

- メインストリームデスクトップ (TDPに対してコア数が少ない。TBの恩恵がほとんどなくなる。)
Clarkdale-620, 73W, 2コア, 3.60GHz, TB 3.86GHz
3.33GHz / 0.65 = 5.54GHz
→ Bulldozerはコアあたり性能で勝つには2コアを5.6GHzもの世界最高スピードで回さなければならない。
無理があるので価格メリットや、より多くのコアを集積するなどの対応。

というわけで、TDP vs Core数がBulldozerの優劣を決める鍵なんだよ(本来は)。

通常、単純な理論で
- コア設計の拡張に対する性能向上に対して、電力は2乗くらいで増える (←コアを本気で電力に最適化してなかった時代前提の話だが)
- 電圧一定でクロックアップに対して、電力は1乗で増える
- 更なるクロック向上ののため昇圧込みでクロックを無理にあげると、電力は3乗で増える
ので、電力に気を使ったアーキテクチャでも、電圧をあげてまで無理に性能をあげるとたちまち電力と発熱が爆発してしまう。
したがって、小規模コアなら性能低下以上に電力を下げることは容易だが、
小規模コアであっても昇圧しての性能アップしたら、3乗で爆発するからやばい。

プロセス/デバイスの適正値な電圧で使うことを前提なら、Bullのような規模を抑えたコアならTDPが厳しくでもそれなりに回るから有利。
しかし、大コアがよいか小コアがよいかは、どんな使い方をしても電力性能比で小コアが有利というわけでもない。
770名称未設定:2010/09/12(日) 01:22:02 ID:AxuRPBvE0
スタティックな電力が無視できない現在の半導体では、もはやそういう単純なモデルは意味が無いかと。
771OOO-⊂(・∀・,,☆u:2010/09/16(木) 20:11:42 ID:+L9A3ktCP
>>769
やべぇ、Bull予想大幅にミスってるかも。
http://www.realworldtech.com/page.cfm?ArticleID=RWT082610181333
RWTの解説みたら2 ALUではあるものの、各整数コア 4issueのアーキテクチャで、
OOO関連のBufferやQueueも従来より贅沢だね。まじならIPCも侮れないかもしれない。
772OOO-⊂(・∀・,,☆u:2010/09/16(木) 20:13:05 ID:+L9A3ktCP
>>770
それはわかっているが大筋で結論が変わらない程度から書いた。
773名称未設定:2010/09/17(金) 01:15:36 ID:Kg0iP0E10
>>771
LlanoでもROBのentryが72から84に増えるらしいけど素人目には
どれほど効果があるのかよくわからんな

Bulldozerの構成が明らかになった当初は将来的に整数コアでSMTも
アリかと思ってたけど、整数コアをきっちり回す方向性っぽいな
SMTのためにフロントエンドを拡張するとかは却って効率悪くなりそうな予感
ALUが増えれば良いのかも知れんが
774名称未設定:2010/09/17(金) 17:42:54 ID:WPcpC8Mn0
なぜSandy Bridgeはそんなにパフォーマンスが高いのか
ttp://pc.watch.impress.co.jp/docs/column/kaigai/20100917_394622.html
775OOO-⊂(・∀・,,☆u:2010/09/17(金) 18:58:33 ID:+yqJbz12P
実はさりげなく>>679がSNBの予想ネタだったんだぜ。おれ相変わらずすげー。
776OOO-⊂(・∀・,,☆u:2010/09/17(金) 19:05:41 ID:+yqJbz12P
でもuopキャッシュよりもLoad Unitの方が既存コードの高速化にも効いてると思うんだが。
キャッシュのレイテンシ増加で大分相殺されてるだろうけど。
あと、uopキャッシュはサイズの割に効率悪い。そのうちHansのダイ分析でてくるだろうけど、
意外なサイズに混乱するだろうな。
777名称未設定:2010/09/17(金) 19:29:05 ID:mlGFuKuVP
使えるトランジスタが増えて、多少効率悪くてもデコーダー休めた方が
省電力だからμopキャッシュ復活ってこと?
778名称未設定:2010/09/17(金) 22:09:17 ID:Yvdqo1IX0
>>776
ちうか4コア+GPU版のダイサイズが225平方mmでコア1個が20平方mmって1年前にリークしてたよな
当時からAVXを追加しただけにしてはコアが大きすぎるって話題になってた
ちなみにその時リークした情報で動作クロックが最大で3.8GHzになるってのも当たってるんだよな
この情報リークしたやつ消されたんじゃねーかwwwwww
779名称未設定:2010/09/17(金) 23:54:22 ID:mlGFuKuVP
http://www.heise.de/ct/artikel/Prozessorgefluester-796627.html
当たってたというのだと、この記事には1500μopsのトレースキャッシュってネタがあったな。
当時はこれと、ソース不明の英語のWikipediaのSandyBridgeの項目くらいしか
トレースキャッシュ搭載に触れてなかったので、
本当だろうかって半信半疑だったのに。
780名称未設定:2010/09/18(土) 00:11:04 ID:yhV/62WkP
まあ元ネタはIntelの特許だけどね。
781OOO-⊂(・∀・,,☆u:2010/09/18(土) 00:13:13 ID:yhV/62WkP
予想というのは冗談で40%くらいのつもりで書いた。
782名称未設定:2010/09/18(土) 00:14:36 ID:9+7ERCe90
すげーなおまいら
783名称未設定:2010/09/18(土) 14:57:59 ID:Sr5UEBIM0
シングルスレッド性能を妥協しないと言い続けてきたパールムッターさん。
有限実行ってやつか。
784名称未設定:2010/09/18(土) 20:30:43 ID:Vu0+qBbc0
有限実行わろた
Intelのコストに見合う範囲でしか頑張らない傾向は他社より顕著だからなwww
785名称未設定:2010/09/20(月) 03:25:11 ID:O8uqpYK+0
SNBの充実が明らかになったことで楽しみになってきたのがMedfield
こっちも気合入れて拡張してきそうな予感がする
Bonnellのまま32nmに行くとコアが小さくなりすぎる品
786名称未設定:2010/09/20(月) 13:51:58 ID:Ka6SJsCP0
Langwell相当が合体するからBonnellコアをむやみにでかくする余裕なんてないよ
787名称未設定:2010/09/21(火) 00:43:59 ID:wfQu39bY0
Bonnellコアが変更されるのは22nmのSaltwellプラットフォームから by fudzilla
788名称未設定:2010/09/21(火) 01:40:07 ID:l20FHvGy0
Saltwellは32nmのコアの名前だが...?
789名称未設定:2010/09/21(火) 01:50:20 ID:TCk32FD2P
>>787
それ北森誤訳じゃん。Fudzillaは今回は間違ってないよ。
790OOO-⊂(・∀・,,☆u:2010/09/21(火) 18:52:38 ID:tRKQOonEP
791OOO-⊂(・∀・,,☆u:2010/09/21(火) 19:15:44 ID:tRKQOonEP
Atomは1年ずらしのデスクトップ/モバイルと異なり、
プロセスの世代とマイクロアーキテクチャが一対一。

最近は元記事あまり見なくなったが、国内ニュースサイトそろって誤訳みたいだな。
元記事は32nmがSaltwellで、コアいじくった。
更にSaltwellの後継のコアの22nm Atomが2013年くらいで順調。
みたいな内容。
792名称未設定:2010/09/21(火) 20:13:04 ID:Kg75FcQY0
てかAtomが32nmでアーキ変わるってのは1年前にはパールムッターが言ってる >>244
793787:2010/09/22(水) 00:27:45 ID:YgX900ra0
元記事読まず転載しちゃってごめんなさい><
794OOO-⊂(・∀・,,☆u:2010/09/23(木) 21:11:15 ID:VTtnLfr+P
SPECint2006
Intel Xeon X5677 3467MHz Base 40.1 Peak 43.5
http://www.spec.org/cpu2006/results/res2010q3/cpu2006-20100706-12329.html
IBM POWER7 4140MHz Base 29.3 Peak 44.0
http://www.spec.org/cpu2006/results/res2010q2/cpu2006-20100426-10753.html

SPECfp2006
Intel Xeon X5677 3467MHz Base 45.5 Peak 48.9
http://www.spec.org/cpu2006/results/res2010q3/cpu2006-20100702-12044.html
POWER7 3860MHz Base 44.5 Peak 71.5
http://www.spec.org/cpu2006/results/res2010q2/cpu2006-20100426-10752.html

今までBaseのスコアしかみてなかったから気がつかなかったけど、
PeakはPOWER7が最高スコアのようだな。特にfpがダントツでやべぇ。
eDRAM恐るべし。
795OOO-⊂(・∀・,,☆u:2010/09/23(木) 21:40:31 ID:VTtnLfr+P
・GPGPU
GPGPUは現在nVIDIAが中心の展開とみられているが、しつこいようだが、
コンシューマでのDiscrete GPUの売上が縮小してくると、
HPCだけで採算をとらなければならなくなるため、GPGPUの先行きはかなり怪しい。
もともとハイエンドGPUはローエンドまでカットダウンで展開することで生涯で開発費を回収していたため、
ミドル以下で既に失敗しているFermiのコンシューマ市場での有様をみてもわかるとおり、
ビジネスモデル的に苦しい立ち位置だと思う。
LRB(Kights Series)についても同様のことが言える。こちらはIntelの主力製品ではないから、
会社が傾くことはないと思うが、GPUとして使えないということになるとやはり、GPGPU共々、採算性がない。
HPC市場のみの売上では、2, 3世代でプロセッサは蒸発する。

一方、AMDのFusionやSandy BridgeのようなGPU統合アプローチは
CPUソケットの多いシステムでは自動的にGPUが増えることになり、GPGPUとしては
ハイエンドGPU志向よりもむしろ成功する可能性もある。こちらはコンシューマのメインストリームPC市場で
売れることはほぼ間違いないので、採算性がとれないということはほぼ有り得ない不死身の体を持つ。
796OOO-⊂(・∀・,,☆u:2010/09/23(木) 21:42:02 ID:VTtnLfr+P
・GPU+CPU
Sandy BridgeではGPUがオンダイで統合された。AMDもGPU統合製品を着々と準備している。

AMDの場合はDiscrete GPUがあるため、これまでと同様ハイエンドからミドルにおとし、
後からCPUに統合するという形で対応することができるため、リスクは小さい。

それに対し、IntelのGMAはDiscrete市場をもっていないため、はじめから新規アーキテクチャを
CPUに統合する計画で進むことになり、GPU側がこけるとCPU側が道連れになる可能性もあり、リスクは大きい。

Intelの強みとしてはCPUのシェアが8割あるため、今後の展開では、Intel GPUが評価の基準になり、
ハイエンドゲームをのぞいて、Intel GPUコアに最適化されてくるゲームが増える可能性がある。
AMDやnVIDIAはこの点において現代の評価とは裏腹に、不具合という形で数の不利を被る展開も予想される。
統合型GPUの戦いは従来とは異なり、厳しいコストと熱的な制約下での競争になるため、
Discrete GPUとは分けて展開を考える必要があると見ている。

今後はCPUとGPUの統合度は更に増して行くかもしれないが、
- CPU側の並列度を上げていくアプローチ
- GPU側のプログラマビリティを上げていくアプローチ
の2つの方向性のどちらに傾くか注目。

個人的にはCPUの並列度を上げていって、GPUは固定機能回帰が好みだが。
まあIDFを見る限りhalf floatとかいってるから、CPUがよりGPU的な処理をする展開を狙っている
のかもしれない。
797OOO-⊂(・∀・,,☆u:2010/09/25(土) 11:35:27 ID:BQT0FDxzP
>>771の記事だが、DK氏の妄想っぽい。
コアあたり4-issueの明確な根拠は持ってないようなので、おれ的には予想に修正なし。
しかし、Bulldozerのシングルスレッド性能の見積りがRWTの掲示板も含めて、世界的に
甘すぎる。これは実測データがでてから大騒ぎの予感。
798,,・´∀`・,,)っ[売り切れ]:2010/09/26(日) 10:49:42 ID:ucQwjAvSO
ロードとレジスタ間演算に分解して2ALU+2AGUで計4issueだけどね。
「CRISC」回帰というか、まあ有効性はわからんな。

同じ3issueのP6ベースでもPen3とPenM程度にはシングルスレッド性能に差があったし。
799名称未設定:2010/09/27(月) 18:43:01 ID:3FtM0Kda0
Intel's Sandy Bridge Microarchitecture
http://www.realworldtech.com/page.cfm?ArticleID=RWT091810191937&p=10

参考文献が皆無なんだけど、これも妄想なのかな?
800OOO-⊂(・∀・,,☆u:2010/09/27(月) 20:41:50 ID:btzetW5f0
パッとみたけど誤り多いね。DK氏の知識は認めているが、いくらなんでも調子に乗りすぎではなかろうか。
LSDの入力とかそんなな帯域ねぇし、IDFスライド誤読してる。
Microcode ROMの入力の書き方も以前から矢印がおかしい。
801OOO-⊂(・∀・,,☆u:2010/09/27(月) 21:00:30 ID:btzetW5f0
そういやそもそもSNBにLSDはあるのだろうか。
uopキャッシュのおかげで殆ど要らなくなったと思うのだが。
802OOO-⊂(・∀・,,☆u:2010/09/27(月) 21:10:06 ID:btzetW5f0
All the uops from the traditional front-end and the uop cache are ultimately merged into the 32 uop Loop Stream Buffer.
The Loop Stream Buffer can still act as a cache for small loops like in Nehalem, and actually can bypass both
the instruction cache and uop cache. The Loop Stream Buffer also smoothes out uop delivery to the back-end.
Since uop cache hits can provide far more uops than the back-end can receive (18 vs. 4),
this decoupling can hide the pipeline bubbles introduced by taken branches and effectively ‘stitch across taken branches’.

おれは信じないぞー。
803OOO-⊂(・∀・,,☆u:2010/09/27(月) 21:22:51 ID:btzetW5f0
RWTも書いてるけど、Sandy Bridgeってある意味NetBurst回帰なんだよな。
まあ回帰というより、PenM/Core2でP6回帰したあとで、
P6系コアの古い部分を一新した結果、NetBurstの特徴と似てきた。
804名称未設定:2010/09/27(月) 22:29:01 ID:N1ahscyP0
>>802
その18という数値は特許からだろうけど、
・1ラインに6uopsまで
・タグが一致するラインの検出は少なくとも3ラインまで同時に可能
とあるが、実際のキャッシュラインへのアクセスが3ライン同時に可能とは書いてないな。
というかキャッシュ読み出しの帯域よりもタグの一致検出の帯域の方が広いから
match queueにuop読み出し待ちのアドレスが溜まっている限り
ミスヒットでI$フェッチャ/デコーダを動かすレイテンシを隠蔽できて
バックエンドへの命令供給は維持されるると書いてある。
805OOO-⊂(・∀・,,☆u:2010/09/27(月) 22:47:37 ID:btzetW5f0
そもそもIDFのスライドで
デコーダとuopキャッシュの出力がマルチプレクサ介しているように書かれているのに
なんでRWTは並列に書くんだろうね。
806名称未設定:2010/09/27(月) 22:58:01 ID:N1ahscyP0
ultimately mergedってそういう事なのかw
807OOO-⊂(・∀・,,☆u:2010/09/27(月) 23:03:03 ID:btzetW5f0
脱線してきたな。
ここはアーキテクチャを語る目的のスレではなかた。

Sandy Bridgeの意義はあくまで、
(1) リングバスによる派生品や将来へのスケーラビリティ
(2) (1)と関連しているが、GPUのオンダイ統合
(3) 256bit SIMD対応+Load Portの増設
(4)以下、その他の最近明らかになった細かい話
なので、あしからず。
808,,・´∀`・,,)っ[売り切れ]:2010/09/28(火) 06:46:48 ID:ur96O5hNO
あまり説明はされてないが、uopsキャッシュは多バイト命令利用時の命令フェッチ帯域不足もある程度解決できる。

現状の16B/cycleの帯域のままでは将来のFMAを実装しても有効活用できないことを予見してたけど
Intelは解決策を用意してきたわけだわな。

1500uopsもあればある程度はループアンロールしても納まる。
809,,・´∀`・,,)っ[売り切れ]:2010/10/01(金) 14:59:17 ID:u3NM9wAMO
>>801
殆どてか全くいらんだろ。
LSDは連続した命令列の反復にしか使えない。

トレースキャッシュは頻繁にcallされる小規模な関数(もしくはプロシージャ)なんかも格納できる
810OOO-⊂(・∀・,,☆u:2010/10/01(金) 21:13:30 ID:6OYRlSWf0
http://journal.mycom.co.jp/articles/2010/09/30/nvidia_gpu/002.html
>--科学技術計算用GPUに投資するのはペイするのか?
>Dally:それはビジネスクエスチョンだが、先に述べたように、
>すべてがヘテロジニアスコンピューティングになっていくと考えている。
>科学技術計算専用のGPUを開発するのでは開発投資を回収できないが、
>グラフィックスの需要にアドオンの形なら問題ない。
安藤氏マンセー。直球で聞きやがった。
nVIDIAもコンシューマの売上なしではペイしないと認識しているようだね。
811OOO-⊂(・∀・,,☆u:2010/10/01(金) 21:16:38 ID:6OYRlSWf0
nVIDIAがARMを持ち上げる理由は明白だな。
というか今までnVIDIAの売上を支えてきたハイエンド志向のPCユーザやPCゲーマーを
否定するようなコメントを発してくるあたり、かなり追い詰められてると思うが。
最近のGPGPU HPC推進者の発言には恐れいります。
812名称未設定:2010/10/02(土) 00:25:22 ID:DBEcP3tV0
NV追い詰められてるな
813名称未設定:2010/10/02(土) 00:30:52 ID:+LhhEOzK0
だからこそ期待している
814,,・´∀`・,,)っ[売り切れ]:2010/10/02(土) 07:24:55 ID:/FCzXwhVO
>>811
Intelは本気でHPC特化のGPUもといディスクリートコプロセッサカードを作っており
NVIDIAもGPUとしてのコストバランスを追求する以上はHPCでは不利になる。

計画修正後のLarrabee計画の頼どころはHPCとハイエンドゲームの性能要求のギャップ。
GPUとしての性能に振る必要がなくなったMICと、オンコアのコプロセッサとして倍々で性能向上を目指すAVXの2路線。
815,,・´∀`・,,)っ[売り切れ]:2010/10/02(土) 10:57:02 ID:/FCzXwhVO
てか教授のx86嫌いは元々でしょ

ARMが省電力うんぬんも誇大広告気味なんだけどな。

データ転送に電力食うのはCPUも同じ。
たとえばCortexA9のハイエンドですらAtomのように64bit DDR*対応した実装は皆無。
だからメモリ帯域があまり必要のないベンチでしかAtomと勝負しないんだよね。
あと、キャッシュ馬鹿みたいに積んだサンプルチップ使ったりとか。
816OOO-⊂(・∀・,,☆u:2010/10/04(月) 19:30:51 ID:CNhB6Y5S0
>>802
記事修正されたね。まだ間違い多いけど。
817,,・´∀`・,,)っ[売り切れ]:2010/10/08(金) 07:32:05 ID:15N8aOw/O
今回の後藤記事

NVIDIAはもう完全に強がりの世界だな。
別にARMはほかの組み込みRISCと比べて電力効率いいわけじゃないし。

結局はx86のような強力で柔軟なメモリアドレッシングモードを持つ可変長CISC ISAの美点を再認識するだけになりそうな。
818,,・´∀`・,,)っ[売り切れ]:2010/10/08(金) 07:46:23 ID:15N8aOw/O
まあ仮にウン十ワット消費するARM作ったとしても
さすがにx86のほうが性能効率がいいだろう。
819名称未設定:2010/10/12(火) 17:21:26 ID:UnY3q/nd0
次世代スレにキチガイ団子がいるのだが
あれは本物か?それとも成りすましか?
820名称未設定:2010/10/12(火) 18:16:27 ID:XA1dVxiB0
RISCなんて、クロックがガンガン上がるという幻想を抱いていた時代の産物
821,,・´∀`・,,)っ[売り切れ]:2010/10/13(水) 14:04:15 ID:hPw9KiHMO
>>819
売り切れてないやつは偽物
822名称未設定:2010/10/13(水) 18:51:51 ID:hPw9KiHMO
Cortex-A15だけど、3decodeの8issueってなんのこっちゃ
性能が倍になる根拠も不明だし。
まさかx86みたいにメモリアドレッシングモードでも追加するのか?w
823名称未設定:2010/10/13(水) 19:37:01 ID:qkZd4h+u0
vaporwareです
824MACオタ>団子 さん:2010/10/13(水) 21:40:57 ID:XHDG4YSU0
>>821
ここ半年ほどの次世代スレッドの腐れっぷりは団子さんが「もっさり」スレに突撃して、キチガイのヒトを引きずり出してしまった所為では?
多少は責任を感じて欲しいモノです。
825名称未設定:2010/10/14(木) 07:11:49 ID:/+hy9TLA0
キチガイの存在に責任を感じる必要なんてないと思うけどな。
826名称未設定:2010/10/14(木) 07:38:16 ID:mEvL3xnB0
てか824が基地外なんじゃね?相手して欲しくてこっちに来たとかw
827,,・´∀`・,,)っ[売り切れ]:2010/10/14(木) 11:38:55 ID:BG7o1quSO
さてCortex-A15がA9の倍の性能を達成できる理由を真剣に考えようか。
828名称未設定:2010/10/14(木) 15:11:40 ID:suUfNffM0
あそこで豚とかホモとか言ってる基地外の方が余程害悪だと思うのだが
スレの連中も構わない所を見ると相当ヤバい奴なんだろうな
829MACオタ>828 さん:2010/10/14(木) 20:36:20 ID:gsxsaOzn0
>>828
  -----------------
  あそこで豚とかホモとか言ってる基地外
  -----------------
ソレが、もっさりスレッドに隔離されていたキチガイのヒトです。
隔離先では適当に相手をするヒト達がいて、あまり他スレに出てこない状態だったのですが、団子さんが突撃したばかりに…
830名称未設定:2010/10/14(木) 21:30:03 ID:eiVffp1u0
>>827
Intelが製造する
831,,・´∀`・,,)っ[売り切れ]:2010/10/14(木) 23:08:45 ID:BG7o1quSO
A9の1.4倍程度のクロックを実現したとしても、あと1.4倍IPCをあげないと2倍には届かない。
832名称未設定:2010/10/14(木) 23:37:41 ID:/+hy9TLA0
A9比1.5倍のIPCを達成するって話がどこかになかったっけ?
だとしたら予定通りじゃないの?
833名称未設定:2010/10/15(金) 11:08:28 ID:oQDXxb5/0
むしろそろばん復権の時代が近づきつつある
834,,・´∀`・,,)っ[売り切れ]:2010/10/15(金) 17:55:02 ID:9Gg50vncO
>>832
だからそのIPC向上のからくりがイミフ

たとえば128ビットNEON/VFPが2サイクルから1サイクルになるとか?
そんなんで向上するのは一部だけだよね。
835名称未設定:2010/11/03(水) 15:48:08 ID:es+d9W490
ho
836名称未設定:2010/11/10(水) 17:30:18 ID:dzJ6dMfv0
PC向けでもBulldozerがK10を置き換えちゃいますね
837名称未設定:2010/11/10(水) 21:31:55 ID:1XXvJmcV0
196 名前:水先案名無い人[sage] 投稿日:2010/11/10(水) 12:41:26 ID:Jm8WaIBv0
95 名前:名無しさん@お腹いっぱい。:2010/10/16(土) 04:40:44
自分で開けたドアに顔(左半分)を派手にぶつけた。
痛えー!!ボーッとしてたからだなぁ〜。も〜ぅ!と思いながら何故かドアを閉め、
また開けてまた同じ処をぶつけた。
後ろで見ていた同僚に「おまじないか何かですか?」と言われた。

んなマジナイは無い。

197 名前:水先案名無い人[sage] 投稿日:2010/11/10(水) 17:23:44 ID:91S8VEqS0
マジ無い
838名称未設定:2010/11/11(木) 05:25:26 ID:uQgtZG5D0
http://blogs.amd.com/work/2010/11/09/server-highlights-from-financial-analyst-day/
Turbo CORE -
We have disclosed that we would include AMD Turbo CORE technology
in the past, so this should not be a surprise to anyone. But what is
news is the uplift ? up to 500MHz with all cores fully utilized. Today’s
implementations of boost technology can push up the clock speed of
a couple of cores when the others are idle, but with our new version of
Turbo CORE you’ll see full core boost, meaning an extra 500MHz
across all 16 threads for most workloads.

全コア稼働時でも最大で500MHzブースト出来るとする。
Intelの場合、全コアブーストするときはだいたい定格クロックの1割増し。
この仮定を当てはめるとBulldozerは定格クロック5GHz。
全コアブーストで定格の1.5割増しとした場合は3.33GHz。

さてこの考え方は合っているだろうか…
839名称未設定:2010/11/11(木) 20:50:14 ID:KWv6bj0VP
全コア稼動時もブーストしてるってのは、
単にAMD定格クロックの定義の問題だろ。
Intelの場合は全コア稼動時=定格の定義の諸元
だから。
840名称未設定:2010/11/12(金) 19:55:14 ID:Kh/qKkJf0
確かに
でもわざと定格クロックを低めに設定することは現状を考えても無いんじゃないの?
マーケティング的にもクロック高い方が絶対良いわけだし
841OOO-⊂(・∀・,,☆u:2010/11/13(土) 15:47:35 ID:4NlXVPv1P
まあ、2issue in-order → 3issue OOO なら普通な予感だな。キャッシュも大幅に増えてるし。
あとはプロセスだな。
ARM Cortex-A15―does this processor IP core need a new category…Superstar IP?
http://eda360insider.wordpress.com/2010/11/10/arm-cortex-a15%E2%80%94does-this-processor-ip-core-need-a-new-category%E2%80%A6superstar-ip/?goback=.gde_30219_member_34714657
842OOO-⊂(・∀・,,☆u:2010/11/13(土) 16:02:38 ID:4NlXVPv1P
あ、すまんA9からOOOだったわ。
Decode / Rename / Dispatchに7ステージも使ってるから、P6よりも低遅延設計か??
キャッシュのレイテンシはどうなんだろう…。
843OOO-⊂(・∀・,,☆u:2010/11/17(水) 20:04:19 ID:mWwOozrpP
4.8 A 32nm 3.1 Billion Transistor 12-Wide-Issue Itanium? Processor for Mission-Critical Servers, Intel
http://isscc.org/doc/2011/isscc2011.advanceprogramflyerfinal.pdf

Poulson 12-issue キタ----------!!
こう言うのまってたんだよ、おれは。

依存チェイン実行アーキかな。
844OOO-⊂(・∀・,,☆u:2010/11/17(水) 20:50:04 ID:mWwOozrpP
4.6 40-Entry Unified Out-of-Order Scheduler and Integer Execution Unit for the AMD Bulldozer x86-64 Core, AMD
14.3 An 8MB Level-3 Cache in 32nm SOI with Column-Select Aliasing, AMD
845名称未設定:2010/11/18(木) 00:50:37 ID:zYpORpjD0
>>843
ウヒョー!!
とりあえず1年以内の遅延ですむなら許す
キャンセルはダメよん
846名称未設定:2010/11/18(木) 17:16:59 ID:XgNFzZmu0
Intel全体で見るとやる気ないけど開発部隊にはやる気があるようだな
847OOO-⊂(・∀・,,☆u:2010/11/18(木) 18:17:07 ID:BFZb8/ovP
21464とRockみたいに発表したけど、
もうかってないし終わりました、みたいにならなきゃいいけどな。
848OOO-⊂(・∀・,,☆u:2010/11/18(木) 18:31:30 ID:BFZb8/ovP
12-issueは一般的な整数プログラムが本質的に内在する並列性の限界をこえてるはずなので、
マルチスレッドか少なくとも従来SIMDが効くような特殊なアルゴリズムをみこしての拡張だろう。
もちろんシングルスレッドにかんしても従来以上に力をいれられているだろうが。
OOOを使わないけどOOO的な効果が得られる技術が導入される予感。
849OOO-⊂(・∀・,,☆u:2010/11/18(木) 18:33:37 ID:BFZb8/ovP
もちろんFPはSPECベンチでも数十命令は並列度があるはずだったので
(そもそもFP用途で専用プロセッサが存在できる理由でもある)、
この限りではない。
850名称未設定:2010/11/22(月) 21:00:52 ID:oAbWWNic0
Bulldozer
1 module
 3.5GHz+
 0.8-1.3V
 213M transistors
 30.9mm2

Llano
1 core
 35M transistors

1 core + 1MB L2 + Power-Gate Ring
 3GHz+
 0.8-1.3V
 
851名称未設定:2010/11/22(月) 21:04:27 ID:oAbWWNic0
ミスすまん

http://isscc.org/doc/2011/isscc2011.advanceprogrambooklet_abstracts.pdf

Bulldozer
1 module
 3.5GHz+
 0.8-1.3V
 213M transistors
 30.9mm2
L3
 [email protected]

比較対象
Llano
1 core
 35M transistors
 9.69mm2
1 core + 1MB L2 + Power-Gate Ring
 3GHz+
 0.8-1.3V
 110M transistors
 17.7mm2

確かに面積は普通の2コアに比べれば小さいが思ったほどでもないような
852名称未設定:2010/11/23(火) 01:08:10 ID:VBcGkBUB0
あんま小さくないとのことだが、ポラックの法則を考えれば
IPCにもちょっとは期待できるということにならないか?
単純に当てはめるとK10比で93%になるぞ
853名称未設定:2010/11/23(火) 01:51:16 ID:e6e3ST/g0
とっくに破綻した経験則持ち出されても
854,,・´∀`・,,)っ-○○○:2010/11/23(火) 16:17:59 ID:dVdQWVg90
ARM、64ビット・プロセッサ・コアを近く発表へ
http://www.computerworld.jp/topics/move/189915.html

結局A15のアドレス拡張はベンダーからのウケが悪かったのかな?
855名称未設定:2010/11/23(火) 16:48:24 ID:V0GZrBuT0
まあ逆にいえばそれなりに需要あるってことだろ。
結構売れると思う。
856OOO-⊂(・∀・,,☆u:2010/11/23(火) 21:35:20 ID:nWnkG7y1P
Sandy BridgeはSIMDがちょっと速いくらいだな。まあ拡張考えればそうだろうなな。
というか10%とかないな。おれはもう生きいく自信をなくしたので首釣ってくる…。

329 :Socket774 [↓] :2010/11/23(火) 04:12:31 ID:7hVwa3vr
ttp://www.inpai.com.cn/doc/hard/138458.htm
SandyBridge Core i7 2600K preview(中国語)
857,,・´∀`・,,)っ-○○○:2010/11/23(火) 21:57:11 ID:dVdQWVg90
IPC据え置きでもクロック上がれば十分といえるけどな。
2コアでのWestmereとの比較が欲しい。

858名称未設定:2010/11/24(水) 01:29:01 ID:hMcL8A340
>>851
bullのL1は96KBでLlanoの128KBより減っているので、パイプライントランジスタ数に限ると、数字以上に多いかもな。
859657:2010/11/24(水) 20:02:09 ID:qUqfNEwY0
>>856
まあまあ、もちつけ。
電力効率は良さそうなんで普通に期待汁!
860OOO-⊂(・∀・,,☆u:2010/11/24(水) 21:42:23 ID:digwo+48P
日本のコンピュータ関係の国家プロジェクトは
採用賞10億円で、一般からも方向性公募するようにしてほしい。
そしたらプロ含みでみんな必死に考えるぜ。
10億で方向性よくなるなら安いもんだろ。
861OOO-⊂(・∀・,,☆u:2010/11/24(水) 21:55:33 ID:digwo+48P
この手の意思決定は、既に人生あがりみたいなすごくエライ人達が
ちんたら会議したって絶対良い方向に決まりません。
もっと自由な発想の個人技一発でやった方がいい。
862,,・´∀`・,,)っ-○○○:2010/11/24(水) 22:58:38 ID:0Dybfnl00
文部科学省と経済産業省の縦割りが無駄だな。
大規模な競争的研究費つけて民間と大学で共同開発させたほうがいい。
863名称未設定:2010/11/24(水) 23:12:47 ID:G3nbEGdc0
にちゃんでいうところの老害ってあながち間違いではないよな
864名称未設定:2010/11/25(木) 03:52:28 ID:8hPhKGFS0
行政縦割りが無駄なのと
もう国単位で争うこと&維持自体が無駄なのはどうしたらいいの?
良い方向のグローバリゼイションを発揮しやすい分野だと思うのだけどなぁ、CERNみたいに

そうなると一国の民間と大学規模じゃ済まなくなるはずだけど
人類性悪説に基づくとそういうプロジェクト自体がうまくいきませんか?
ただ自分が生きているうちに人類の先が見たいだけなんだよ…
865名称未設定:2010/11/25(木) 04:26:50 ID:b9SbVeJV0
人類とか言ってる時点でお花畑
866名称未設定:2010/11/27(土) 10:47:16 ID:Gg5Jhsgx0
尖閣諸島を切っ掛けに日米VS中国・北朝鮮戦争
http://toki.2ch.net/test/read.cgi/occult/1284709704/
    ロシア中国VS日米連合    
http://toki.2ch.net/test/read.cgi/occult/1285158552/
【日月】ロシア軍が日本を攻撃してくる!【大本】
http://toki.2ch.net/test/read.cgi/occult/1290585658/
【大峠入口】 日月神示準備専用 【肯定派専用】
http://toki.2ch.net/test/read.cgi/occult/1289575866/
867OOO-⊂(・∀・,,☆u:2010/12/02(木) 20:02:12 ID:HQX0/URQP
Romleyの後継のBricklandがIvy Bridge-EXのプラットフォームのコードネームらしい。

Ivy Bridge server code names leak
http://semiaccurate.com/2010/12/01/ivy-bridge-server-code-names-leak/
868名称未設定:2010/12/23(木) 00:16:14 ID:ydavJBN60
ho
869名称未設定:2010/12/30(木) 12:15:46 ID:X7P5BexmP
Ivy Bridgeでダイスタック化メモリをオンパッケージで統合へ。
CPU+GPUは熱いので別ダイ。
http://semiaccurate.com/2010/12/29/intel-puts-gpu-memory-ivy-bridge/
870名称未設定:2010/12/30(木) 14:28:59 ID:h2Ss7I7J0
本来はSNBでやる予定だったんだがHSWまでスリップしなかっただけでも上出来か
871OOO-⊂(・∀・,,☆u:2010/12/31(金) 11:59:28 ID:DcnNsfkqP
>>769
http://isca2010.inria.fr/media/slides/Azizi-ISCA2010-EnergyEfficientProcessors-FinalDistributable.pdf

めちゃくちゃ良い資料キター!!
dMarginalCost / dVoltageScale == dMarginalCost / dArchCircuitScale
がプロセス毎の最適点なので、アーキテクチャ・回路設計はそこを狙え。
in-order厨憤死だな。
やっぱOOOがいつも電力性能比悪いはマルチコア推進派のデマだということがはっきりしたきたわ。
872OOO-⊂(・∀・,,☆u:2010/12/31(金) 12:05:54 ID:DcnNsfkqP
最新のCore i7が既にin-order以前の設計と同等クラスの電力性能比なのは言うまでもない。
勘違い君が後を絶たないが、同一規模でアーキテクチャ設計が電力に影響する度合いは回路設計に比べるとずっと小さいしな。
コアを小さくして多数コアでスループットを稼ごうっていうアプローチは疑わしい。
LRBも電力性能比が最新の汎用コアと比べてとりわけよい訳ではない。
メニィコアはマイクロプロセッサ史が始まって以来の迷走として将来振り返ることになるかもしれない。
873OOO-⊂(・∀・,,☆u:2010/12/31(金) 13:11:57 ID:DcnNsfkqP
>>871
あ、改めて見たらなんか違うがまあいいや。
874名称未設定:2010/12/31(金) 14:12:08 ID:7jUsZ8L90
2-issue OoO、つまりBulldozer,Bobcatが最強というわけですね
875OOO-⊂(・∀・,,☆u:2010/12/31(金) 14:19:41 ID:DcnNsfkqP
>>437
にも書いたとおり、単体コアで2-issue OOOは電力性能比的に美味しいというのはマジだと思う。
876名称未設定:2010/12/31(金) 19:34:04 ID:V2/Snvda0
電力性能比"だけ"じゃダメってintelの偉い人だったか、ハイファの偉い人だったかが言ってた気がするが
たしか、同時評価にパフォーマンスレンジがどの程度かも重要的な発言だったような
877MACオタ:2011/01/01(土) 05:58:05 ID:ltZyH+9s0
新年おめでとうございます。

>>871 さん
消費電力調整のためにサイクルあたりの dispatch/issue 命令数を増減するのは商用プロセッサでも IBM POWER5/POWER6 あたりの世代から行われていますから、特に新味は無いのでは?
Power-Gating が一般化したことにより、実効的にユニット数を動的に増減することも可能になっています。

興味深いのは、このようなプロセッサ内の実行ユニットの動的有効・無効化の延長として、in-order/OoO の切替までやる価値があるかどうかということかもしれません。
878名称未設定:2011/01/01(土) 06:39:01 ID:Dd3NicD40
Power-GatingではなくClock-Gatingの間違いでは
879MACオタ>878 さん:2011/01/01(土) 07:09:15 ID:ltZyH+9s0
>>878
既にコア単位のPower-Gatingは一般的と言って良い技術かと。
ご指摘のように、現世代のプロセッサでは実行ユニット単位では Clock-Gating しか行われていない筈ですが、実現可能な範疇に入っているのではないでしょうか?
880名称未設定:2011/01/01(土) 09:16:28 ID:Dd3NicD40
スイッチon/off時の電力増大と復帰時間と言ったトレードオフを考えると
実現可能ではあっても現実的にはなってないような気がする
881MACオタ>880 さん:2011/01/01(土) 11:05:53 ID:ltZyH+9s0
>>880
 ---------------
 スイッチon/off時の電力増大
 ---------------
こちらは何かソース/資料はありましたっけ?

切替時間について、コア全体をOFFする場合には内部情報を書き出す必要があるために時間を要しますが、実行パイプラインの情報をフラッシュする時間は、分岐ミスと同程度にしかなりません。また、ON/OFFを行う単位が小さくなるほど、電気的な影響も小さくなっていきます。

一つの極限としてのリコンフィガラブル・プロセッサが実用化されている以上、『現実的ではない』ということは無いのでは?
882名称未設定:2011/01/01(土) 12:28:25 ID:Dd3NicD40
こんなのとか
http://www.hal.ipc.i.u-tokyo.ac.jp/~matutani/papers/matsutani_sacsis2010.pptx
http://www.ulp.jst.go.jp/topics/pdf/101126_PDF/H18-4_nakamura.pdf

現実的でないってのはALUみたいな高頻度で使用するところに関しての話
こういうところだと復帰は1cycleくらいで出来ないと性能にも影響出るでしょ
883MACオタ>882 さん:2011/01/01(土) 13:10:47 ID:ltZyH+9s0
>>882
面白い資料ありがとうございました。
ただ、前者の資料での power-gating による電力的なオーバーヘッドの評価は、モード遷移に伴う特有の電力消費があるといった話では無く、細粒度 power-gating 用に新たに追加したトランジスタの消費電力を考慮していることの様です。
結果的にはルーターの様な高度なリアルタイム性が必要な分野ですら適用可能であるということは、リアルタイム性の低い汎用プロセッサ用途では更に効果が高いと考えて良さそうです。
後者の資料に至ってはMIPSアーキテクチャに適用して、有効な結果が得られていると結論しています。
 ------------------
 こういうところだと復帰は1cycleくらいで出来ないと性能にも影響出るでしょ
 ------------------
これは細粒度 power-gating を動作モードのどこの階層に置くか次第ではないでしょうか?パワーマネジメント機能の応用も広がってきており、コア単位での ON/OFF 機能を製品のアップグレードに利用している IBM のサーバー製品の様な使い方すらあるのですから。
884名称未設定:2011/01/03(月) 21:07:08 ID:T4Thyrd/P
>>871は動的なスケーリングの話じゃないんだが。
885名称未設定:2011/01/03(月) 21:37:57 ID:T4Thyrd/P
The Sandy Bridge Review: Intel Core i7-2600K, i5-2500K and Core i3-2100 Tested
http://www.anandtech.com/show/4083/the-sandy-bridge-review-intel-core-i5-2600k-i5-2500k-and-core-i3-2100-tested
886名称未設定:2011/01/04(火) 00:49:17 ID:diWsZEVoP
887名称未設定:2011/01/04(火) 02:11:09 ID:ZTL2vVFx0
>>883
アーキテクチャ的には良くてもレイアウト的にはあまりやりたくない気がする
deep nwellとか使って分離しなきゃいかんし
888名称未設定:2011/01/06(木) 20:25:50 ID:eR0hxCMY0
sandybridgeレイテンシー&スループット

http://instlatx64.fw.hu/
889名称未設定:2011/01/06(木) 20:58:32 ID:QhqdeZe90
レイテンシは乗算中心に悪くなってるのが多い?
スループットは良くなってるのが多い? load, zeroing idioms, その他
除算は全体的に遅くなってる
890,,・´∀`・,,)っ-○○○:2011/01/07(金) 00:13:33 ID:EvLfdELP0
クロック上げるためにパイプラインを深くせざるを得なかったんだろうねえ。
SSE4.1の命令がほとんどスループット1なのには感動。
891,,・´∀`・,,)っ-○○○:2011/01/15(土) 14:50:20 ID:0ItXKs9q0
とりあえず足回りの帯域が同等なら電力効率はAtom≒ARMという説を唱えてみる。

> 256 :,,・´∀`・,,)<一番良い -○○○ を頼む [↓] :2011/01/13(木) 05:57:04 ID:tXE0aH+g
> 現状最強のARMがこれ。
> http://jp.advfn.com/news__45120396.html
>
> ようはIntelからMarvellにわたったXScaleの末裔ですが。
> Atom 1.6GHzで1コアあたり4000MIPS程度なので、10W以下で16600 DMIPSって数字はそんなに凄くは無いです。
> デュアルコアのCore i5 430UM程度の数字だし、Quad-Core Atomを作ったとしてもこの程度は軽く達成できる気がしますですよ。




892名称未設定:2011/01/16(日) 10:17:37 ID:z9LBX0TU0
マッキントッシュのユーザーで、Sandybridgeは、
何テラフップロスーくらい出るの?
やっぱ、PS3の1.8よりは上だと思うの?
893名称未設定:2011/01/31(月) 23:40:10 ID:RoWnrbeyi
ho
894名称未設定:2011/02/05(土) 18:03:55 ID:Pfx5eIaBI
ando氏
> 想像ですが,電源配線かSATA信号線か

今回のバグは、
・PLL Voltageが高すぎた
・PLLを制御するトランジスタのゲート酸化膜が薄すぎた
のであって、VccやRx/Txは無関係のはずだが・・・
895名称未設定:2011/02/24(木) 14:05:27.83 ID:hDuf7t760
結局Poulsonはダイの写真とレイアウト公開したくらいか
フロントエンドの変更が一切触れられなくてワロス
ISSCCはこんなコマーシャルペーパーやらせるなよ
896名称未設定:2011/02/26(土) 02:33:04.76 ID:siWR2r8M0
new MBPに載ってる10.6.6はAVX対応済みだワッショイ
897名称未設定:2011/03/29(火) 17:04:40.29 ID:f83/Zr7S0
898名称未設定:2011/04/17(日) 04:17:47.34 ID:399AmIUM0
899名称未設定:2011/05/02(月) 15:35:56.15 ID:ZnTpz2530
900名称未設定:2011/05/14(土) 15:13:25.47 ID:FJZhhxnr0
901名称未設定:2011/06/02(木) 21:12:21.75 ID:APtDNt2U0
902名称未設定:2011/06/17(金) 06:11:52.02 ID:pJK48oNS0
903名称未設定:2011/06/18(土) 11:32:50.18 ID:rYkNudwc0
904名称未設定:2011/07/05(火) 21:55:14.12 ID:7YM65+PU0
905名称未設定:2011/07/23(土) 23:29:19.53 ID:aLyEY5LP0
906名称未設定:2011/08/11(木) 22:44:34.96 ID:++COJ9hp0
907名称未設定:2011/08/31(水) 23:45:18.47 ID:8kMh7RLf0
908名称未設定:2011/09/23(金) 20:53:47.99 ID:2IxR/zaR0
909名称未設定