Intel Larrabee 4コア

1 ：Socket774：2009/07/29(水) 01:42:19 ID:wjKRGa6L

Intel Larrabee 1コア
http://pc11.2ch.net/test/read.cgi/jisaku/1217915128/
Intel Larrabee 2コア
http://pc11.2ch.net/test/read.cgi/jisaku/1238152183/
Intel Larrabee 3コア
http://pc11.2ch.net/test/read.cgi/jisaku/1245944113/

Larrabeeはやくくてくれーーーーーーーーっっ！！

2 ：Socket774：2009/07/29(水) 06:21:13 ID:IxOdZ7gg

しらんがな

3 ：Socket774：2009/07/30(木) 05:07:18 ID:P3uQTmXv

糞スレ上げ

4 ：Socket774：2009/07/30(木) 15:09:26 ID:7axByCOW

糞スレじゃねーよ。
で、情報まだ？

5 ：Socket774：2009/07/30(木) 15:40:54 ID:goqnzu7r

なんで糞スレじゃないってわかるの？

6 ：Socket774：2009/07/30(木) 23:55:19 ID:uL6jWk38

7 ：Socket774：2009/07/31(金) 13:44:10 ID:a4Ui7vT4

楽しみだけど、前スレが11レスで落ちたからみんな待ってないのかなｗ

8 ：Socket774：2009/08/01(土) 00:52:46 ID:icLUd671

さぁふるえるがいい

9 ：Socket774：2009/08/02(日) 19:21:12 ID:WC0lIxM1

やぁみんな！期待に応えて増えたよ！！

(´・ω・`)(´・ω・`)(´・ω・`)(´・ω・`)(´・ω・`)(´・ω・`)(´・ω・`)(´・ω・`)

(´・ω・`)なんて増殖するとか思ったの？

(´・ω・`)＝３

10 ：Socket774：2009/08/03(月) 22:12:58 ID:RvC5CoNw

(´・ω・`)くさいスレだねぇ

11 ：Socket774：2009/08/04(火) 16:43:51 ID:CjHHLmBz

(´･ω･`)クサッ！このスレﾆｵｳﾖｰ

12 ：Socket774：2009/08/05(水) 18:56:40 ID:wuH6f42X

(´・ω・`)ショボンヌ帝国in自作PCと聞いて飛んできました

13 ：Socket774：2009/08/06(木) 02:56:52 ID:p7+4GVSB

(´・ω・`)自演乙

(´・ω・`)＝３

14 ：Socket774：2009/08/06(木) 12:03:01 ID:/IQwbrLZ

ｶﾜｲｿ( ´・ω・)ｽ

15 ：Socket774：2009/08/07(金) 13:45:34 ID:EZ6PkUOd

(´・ω・`)はじめまして

(´・ω・`)っ●　つまらないウンコですがどうぞ

16 ：Socket774：2009/08/07(金) 17:09:19 ID:EZ6PkUOd

(´・ω・`)…

(´・ω・`)一時間以内にガッされなかったら神になれる

17 ：Socket774：2009/08/07(金) 17:31:23 ID:3b52XyaW

　　　　　　　ミ　＿＿＿＿
　　　　　　　ミ/＼　　　　＼
　　　　　 /　　＼＿＿＿＼
　　　　　　/　　　　/　　　　　/　ｶﾞｯ
　 ∧＿∧/　　　　/　　人　/
　(´・ω・`)＼　　/　　<　 >＿∧∩
　（　　　つノ .＼/＿＿_Ｖ　｀Д´)/
　　　　　　　　　　　　　　　　　　/>>16

18 ：Socket774：2009/08/07(金) 17:47:35 ID:I4VhoorW

(´・ω・`)ぬるぽ！！！

19 ：Socket774：2009/08/07(金) 23:26:45 ID:I4VhoorW

(´・ω・`)ぬるぽ

20 ：Socket774：2009/08/07(金) 23:27:28 ID:I4VhoorW

(´・ω・`)オラオラ！ぬるぽ！！！ぬるぽぬるぽぬるぬるるるぬるぽぬるぽっぽーー！！

21 ：Socket774：2009/08/08(土) 16:52:45 ID:ZvHxXlD+

(´・ω・`)ぬるぽ

22 ：Socket774：2009/08/08(土) 20:57:29 ID:ZvHxXlD+

(´・ω・`)まだまだぬるぽ

23 ：Socket774：2009/08/08(土) 21:46:32 ID:ZvHxXlD+

(´・ω・`)ウェーハッハッハ！ガッしてみやがれクソども！

(´・ω・`)ぬるっぽ～♪

24 ：Socket774：2009/08/09(日) 03:45:28 ID:i6swSJDZ

(´・ω・`)ぬる～♪ぬるるるっぽっぽ～♪

25 ：Socket774：2009/08/09(日) 12:25:38 ID:i6swSJDZ

(´・ω・`)本当にガッされないねぇ

(´・ω・`)俺しかいない予感！

(´・ω・`)ぬるぽ！！

26 ：Socket774：2009/08/09(日) 20:39:59 ID:nWWj98yb

(´･ω･`)ぬるぽ

27 ：Socket774：2009/08/09(日) 20:44:22 ID:lOoQGexw

(´･ω･｀)？

28 ：Socket774：2009/08/09(日) 21:00:34 ID:E26ztVih

(　´･ω･｀)ここはどこだい？

29 ：Socket774：2009/08/10(月) 00:37:31 ID:Yi7VUnFs

(´・ω・`)ようこそぶりゃんぬスレへ

30 ：Socket774：2009/08/10(月) 14:02:49 ID:jq0/yY6d

(´･ω･｀)ｳﾝﾁ

31 ：Socket774：2009/08/10(月) 15:20:39 ID:Yr6rwJUL

(´･ω･｀)ｱｳｰ

32 ：Socket774：2009/08/10(月) 18:38:16 ID:H/5/+15o

(´･ω･｀)っL

33 ：Socket774：2009/08/11(火) 08:02:05 ID:dXCnHG73

(´･ω･｀)
　つLと

34 ：Socket774：2009/08/11(火) 13:07:56 ID:KmWnCyDG

(´・ω・`)私がLです

35 ：Socket774：2009/08/12(水) 01:56:38 ID:rkkDHriU

(´・ω・`)私が変なオジサンです

36 ：Socket774：2009/08/12(水) 03:43:37 ID:EevvA2p4

(´・ω・`)じゃあ俺は変なガンダムだ

37 ：Socket774：2009/08/13(木) 16:23:11 ID:20mnFBnp

(´･ω･｀)いえ…私は…変なゼロです…

38 ：Socket774：2009/08/14(金) 03:32:41 ID:l65pgJNU

(´･ω･｀)俺はフルチンだ

39 ：Socket774：2009/08/14(金) 11:59:26 ID:NrZTY11I

(´･ω･｀)それはそれは・・・

40 ：Socket774：2009/08/15(土) 12:55:38 ID:pZ4KKrl8

　　　　　　　　　　　　　　　　　　　 ,===,====、
　　　　　　　　　　　　　　　　　　 _.||＿__|_____||_
..　　　　　　　　　　　　　　　　／　　／||＿＿＿|^ l　　　　
..　　　　　　　　　　　　　(*‘ω‘ *)／／||　　　|口| |ω‘ *)　　ぽおおおお
.　　　　　　　　　　　　　.／(^(^ .／／||...||　　　|口| |ｃ　）　　　　
...　　　　　　　　／　　　／／　 ||...||　　　|口| ||し
.......　　　　　　　(*‘ω‘ *) ／／....　　||...||　　　|口| ||
　　　　　　　　／(^(^　／／　....　　.||...||　　　|口| ||
　"" 　　　:::''　|／　　|／　''　"　　:::　　⌒　 :: ⌒⌒⌒ ::　""　　`
　::　,,　:::::　,,　;￣￣￣　　"､　:::: "　,, ,　:::　　 "　::　"　::::　　"

41 ：Socket774：2009/08/15(土) 15:00:08 ID:EpTdQWUe

(´･ω･｀)そろそろまぜろよ

42 ：Socket774：2009/08/17(月) 21:34:45 ID:5/ZxUtle

　　　　　　ちんぽっぽ
　　　 ∧　∧　　　　　　　　　　ぼいーーんっ！
　(>=◎‘ω‘ *) 　　(´⌒(´⌒;;
　 /_./ 〉 ⊂_ノ｀　　(´⌒(´≡≡≡(´⌒;;;≡≡≡⌒;;
　〈/ ）/__ノ,ﾐ　≡≡≡(´⌒;;;≡≡≡
　（_/^´　　(´⌒(´⌒;;

43 ：Socket774：2009/08/18(火) 05:27:20 ID:9J0pgkBl

結局プログラム組むのがGPGPUより糞大変で
GPUが進んでるGPGPUの動きに合わせるしかなさそうだな
PS4とかに使えばいいんじゃね

44 ：Socket774：2009/08/18(火) 05:40:57 ID:RoY7i9uV

オマエバカナノ

45 ：Socket774：2009/08/18(火) 17:16:45 ID:K+gXN2wP

ヨクワカラナイケドオレハバカダヨ

46 ：Socket774：2009/08/19(水) 14:15:16 ID:1Njqmjmn

(´・ω・`)うるせーハゲ

47 ：Socket774：2009/08/19(水) 20:33:22 ID:e72U57hf

>>44
普通のCPU同然みたいに使えるとか思ってんの？

48 ：Socket774：2009/08/19(水) 21:06:40 ID:8CIehTnA

少なくとも、あと2世代先のGPUよりは

49 ：Socket774：2009/08/21(金) 00:13:32 ID:MSawTMCn

ttp://blog.livedoor.jp/amd646464/archives/51377855.html
で、いつ出るの？

50 ：Socket774：2009/08/21(金) 00:27:37 ID:Sokjx14I

アンチの工作うざい
順調だっつってんだろ

http://www.intel.co.jp/jp/intel/pr/press/jointhp.htm
このPentiumベースの最初のメニーコアアーキテクチャプロセッサ
「Larrabee(TM)」は、インテルによって設計、製造、販売される予定で、
量産出荷は2009年になる見込みです。

http://www.intel.co.jp/jp/intel/pr/press98/980601.htm
インテルコーポレーション（本社：米国カリフォルニア州サンタクララ）
は、本日、「Larrabee(TM) プロセッサ」の生産スケジュールの変更を
顧客に連絡したと発表しました。連絡された最新の生産スケジュール
によると、同プロセッサのサンプル出荷は2009年に、また、当初
2009年に予定されていた量産出荷は、2010年半ばに予定されています。

http://techon.nikkeibp.co.jp/article/NEWS/20080118/145725/
米Intel社は，「Larrabee(ララビ)」を搭載した実機を使った
3次元グラフィックスデモを初公開した。2009年9月22日から
米国サンフランシスコで開催中の「IDF Fall 2009」の基調講演で，
社長兼CEOのPaul Otellini氏自らが，デモを披露した。
Larrabeeは，すでに特定メーカ向けのサンプル出荷が始まっている。

51 ：Socket774：2009/08/21(金) 07:58:29 ID:UZyhN9oP

http://northwood.blog60.fc2.com/blog-entry-3071.html

◇“Larrabee”は第3世代なのか？
Larrabee is Intel’s third attempt（Fudzilla）
http://www.fudzilla.com/content/view/15098/34/

Silicon Valley内の情報によると、現在Intelが言う“Larrabee”は3世代目になるという。
最初の2世代は大きく熱かった。なので、Intelの考えていたものとは合致せず、失敗となった。そして第3世代は2010年の中盤にお披露目される。
噂では“Larrabee 3”はやはり大きく手厚いが、性能面では現行世代のGeForce GTX 295やRadeon HD 4870X2を超えられるという。
ただし、NVIDIAもAMD-ATiもGPUのリフレッシュを計画しており、“Larrabee 3”ローンチ時点ではIntelはNVIDIAやAMD-ATiに追いつくことは出来そうにない。

＞最初の2世代は大きく熱かった。なので、Intelの考えていたものとは合致せず、失敗となった。
＞最初の2世代は大きく熱かった。なので、Intelの考えていたものとは合致せず、失敗となった。
＞最初の2世代は大きく熱かった。なので、Intelの考えていたものとは合致せず、失敗となった。

＞Larrabee 3”ローンチ時点ではIntelはNVIDIAやAMD-ATiに追いつくことは出来そうにない。
＞Larrabee 3”ローンチ時点ではIntelはNVIDIAやAMD-ATiに追いつくことは出来そうにない。
＞Larrabee 3”ローンチ時点ではIntelはNVIDIAやAMD-ATiに追いつくことは出来そうにない。

プゲラｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗ

52 ：Socket774：2009/08/21(金) 08:24:43 ID:A+3vQr1W

どんなに画期的なんかと期待してたんだが
他社のGPUとたいして変わらないのか。

53 ：Socket774：2009/08/21(金) 10:36:25 ID:6IFyWUVy

大分前から微妙臭がしてたけどな…
個人的にはLarrabeeまでGMAで頑張るって方が終わってる

54 ：Socket774：2009/08/21(金) 12:08:21 ID:lkUHBnsP

そこでnVidia買収ですよ。

55 ：Socket774：2009/08/21(金) 13:28:19 ID:lGEIWCyq

性能がよくないだけで残念な空気になるとは。
Larrabeeはプログラミング用のおもちゃとして使うものだと思ってた。

56 ：Socket774：2009/08/23(日) 21:18:04 ID:oTF6+N0T

バン　　　　　　　バンバンバン゛ンバンバン
バン（∩‘ω‘ *)　　バンバンバンバン゛ン
　＿/_ミつ/￣￣￣/
　　　＼/＿＿＿/￣

57 ：Socket774：2009/08/24(月) 23:16:48 ID:chzU3t7k

　　　　／　　　　　／|
　　　 |￣￣￣￣ |　 |
　　　 |[]:: 　　　 |　 |
　　　 |──── |　 |
　　　 |[]:: 　　　 |　 |　
　　　 |＿＿＿＿_|　 |
ｶﾞﾗｯ　 |＿＿＿＿_|　　| 　　過疎かね？
.　彡／(・ω・　）／|　 |　　
　　　|￣￣￣￣|　 |／　　　　
　　　|＿＿＿＿|／

58 ：Socket774：2009/08/26(水) 04:06:51 ID:YbgQRfFD

ハードウェア固定機能を搭載したGPUに勝てるのか？
ソフトウェアによる柔軟性は性能とのトレードオフ
単体CPUとしてみれはタダのPentiumだし
GPUとしてみても、固定機能をソフトウェアで実装してやらないと
動かないメンドクサイ存在

Cellのように「プログラミングが難しくてアプリケーションが作れません！」
となる確率極大

オープンソースの「メニーコアCPU用GPUエミュレーションライブラリ」を出さないと無理

59 ：Socket774：2009/08/26(水) 05:47:45 ID:hvajBTj+

CPUとGPUの構造が単純化して性能向上に繋がったらいいんだけど

60 ：Socket774：2009/08/26(水) 06:23:04 ID:UwMnfQUD

DX10の時点でDX9以前の固定機能は盲腸
texture unitは残るだろうけどね

61 ：Socket774：2009/08/26(水) 11:33:26 ID:oOWcshg0

LinuxでのOpenGL, OpenCLあたりに関して言えば、Larrabeeが出るころには
Gallum3DのLarrabee Driverを作れば対応出来るようになっているはず。

62 ：Socket774：2009/08/26(水) 13:21:23 ID:bZGUlnFW

で結局、実用性はあるんか？
乗り換えるメリットねーならいらんし

どーなのよ

63 ：Socket774：2009/08/26(水) 15:35:52 ID:9kbihJiO

LarrabeeのマルチスレッドプログラミングってPOSIXのpthreadみたいにできるのかな？
できればプログラムの移植が楽になるんだが…

64 ：Socket774：2009/08/28(金) 08:41:37 ID:QgSoP0Kz

金でゴリ押しの普及させようとしても、Cellみたいにローカルな感じになるんだろうな
ずっと続けるためにはLarrabee2とか出さないといけないし
並列コンピューティングのシェアがCUDAに奪われたから作ったんだろうけど、Larrabeeにするメリットが無い
ソフト開発の流れを、いかにLarrabee向けにするかだよな
出荷されても対応ソフトも無くて、ローエンドなGPUとして使うしかないんだろ？

65 ：Socket774：2009/09/03(木) 18:04:05 ID:oFeoXptx

http://www.4gamer.net/games/032/G003263/20090903008/
マイクロソフトが担当する技術セッションではお馴染みの「顔」である。
ご存じの方も多いと思うが，川西氏が得意とするのはグラフィックス。

そのため，このセッションも「裏のタイトルは，『Larrabee』（ララビー，開発コードネーム）の準備をしよう，

次世代の準備をしようというノリ」にしようかと考えていたそうだ。

66 ：Socket774：2009/09/03(木) 18:51:29 ID:mg594UxK

その写真のｵｶﾏ野郎が団子ってわけか

67 ：Socket774：2009/09/03(木) 19:03:28 ID:IdWZrO4K

まぁDX9で十分だもんな
Crytecもすでに次世代手法に移ってるけど
現行法は限界だから美しいグラフィックを求めるというならららｂ、いや次世代しか選択肢はないよな

そこまでグラフィッククオリティ求めてねーよというならDX9で十分
もっと美しいグラフィックでゲームしたいっていうなら

68 ：Socket774：2009/09/03(木) 19:03:37 ID:oFeoXptx

MS(DX)がどう進もうとしてるかは明らかやね

>Microsoftの日本法人であるマイクロソフトでプラットフォームエバンジェリストを務める川西裕幸氏だ。
>マイクロソフトが担当する技術セッションではお馴染みの「顔」である。
>ご存じの方も多いと思うが，川西氏が得意とするのはグラフィックス。

http://blogs.msdn.com/hiroyuk/default.aspx
川西裕幸のブログ
Windows Graphics & Presentaiton Technologies for Developers

69 ：Socket774：2009/09/03(木) 20:56:38 ID:UinmzS0l

Nehalem EXのL3は24MBフラットじゃなくて3MBづつでリングバスで
繋がってるんだとさ。キャッシュをリングバスでってのはLarrabeeで
ぶっつけ本番じゃないんだな。

Larrabeeでも
＞複数のリング区間に別のデータを載せることができる。
ってなってるんだろうか

http://journal.mycom.co.jp/articles/2009/09/03/hot_chips21_server/002.html

70 ：Socket774：2009/09/08(火) 02:27:10 ID:pDASjNp3

出た頃には時代遅れとか、インテルは笑わしてくれるな

71 ：Socket774：2009/09/09(水) 03:24:11 ID:x1uBQTAG

>>69
Sandy BridgeもL3とIGPがRing。

72 ：,,・´∀｀・,,）っ-○○○：2009/09/10(木) 22:56:13 ID:NYMGAvzW

続報なさ過ぎるわい

73 ：Socket774：2009/09/10(木) 23:00:17 ID:eqTIGewB

ぱたっと途絶えたよな
別に『やっぱまた延期するわ』っていう発表あっても全然驚かないわ

74 ：Socket774：2009/09/10(木) 23:08:05 ID:ZwEndIZd

4月に公開した円盤は絵に描いた餅でFA？

75 ：Socket774：2009/09/10(木) 23:14:47 ID:zGzFbKrt

もち、株価対策

76 ：,,・´∀｀・,,）っ-○○○：2009/09/10(木) 23:15:07 ID:NYMGAvzW

あれが「Larrabee 3」だろ
知る限りLarrabeeの仕様は2回変更されてるから。
情報出たてのころSIMDはSSE互換だった。

77 ：Socket774：2009/09/10(木) 23:20:13 ID:gEIqgr4E

>>76
Intel claims it works on Larrabee 1
http://blog.livedoor.jp/amd646464/archives/51378160.html

78 ：,,・´∀｀・,,）っ-○○○：2009/09/10(木) 23:22:32 ID:NYMGAvzW

生まれてもない子の歳をかぞえてもしゃーないってのが中の人の見解か
ごもっとも

79 ：Socket774：2009/09/10(木) 23:27:57 ID:ssT8wx7J

ネタはないし、夜も更けたし、もうそろそろ寝ようぜ。

601 ：,,・´∀｀・,,）っ-●◎○ [sage] ：2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeのサンプルはDreamworksで評価されてるようだが

80 ：,,・´∀｀・,,）っ-○○○：2009/09/10(木) 23:28:52 ID:NYMGAvzW

俺の手元にあるシミュレータって何だろうな

81 ：Socket774：2009/09/10(木) 23:33:33 ID:ssT8wx7J

騒がしいな、眠れねーだろ

50 ：Socket774 [sage] ：2009/03/30(月) 23:05:49 ID:RNqRpRRq
シミュレータをサンプル扱いするなんて前代未聞！
さすが団子さんだぜ

ばーか

62 ：,,・´∀｀・,,）っ-●◎○ [sage] ：2009/03/31(火) 00:00:02 ID:YbyWNvCs
> TheINQのCharlie "Groo" DemerjianがLarrabeeのサンプルが今年の秋にも
> 開発者向けに配布されると伝えているす

ここでの開発者が【ソフトの】開発者のことを指してることに気づいてほしい。
ハード開発者はIntelだけだ。

そして「サンプル」とは一般開発者向けにはprotorype primitiveのこと。
確かにあれの公開は彼の言ったとおり約半年遅れの今年3月になった。

ハードだと思って一喜一憂してたのはおまいらだけだよ

63 ：MACオタ＞団子さん [sage] ：2009/03/31(火) 00:09:28 ID:3FaCOFUY
>>62
"silicon"って書いてあるのですが？
http://www.realworldtech.com/forums/index.cfm?action=detail&id=96437&threadid=96378&roomid=2
　　---------------------
　　the Taiwanese were expecting silicon in January.
　　---------------------
Intelはチップの開発メーカーであって、ビデオカードやマザーボードの開発メーカーは別途いますよ。

64 ：,,・´∀｀・,,）っ-●◎○ [sage] ：2009/03/31(火) 00:11:09 ID:YbyWNvCs
また宇宙から電波でも拾ったんでしょ。
なんせ彼のPenrynにはHyperThreadingが実装されてるんだし。

66 ：Socket774 [sage] ：2009/03/31(火) 00:17:43 ID:PgS7bnB4
http://www.xbitlabs.com/news/video/display/20080117222433_Intel_Promises_to_Sample_Larrabee_Processors_in_Late_2008.html

> “Larrabee first silicon should be late this year in terms of samples
> and we’ll start playing with it and sampling it to developers and I
> still think we are on track for a product in late ’09, 2010 timeframe,”
> said Paul Otellini, chief executive officer of Intel.

これも宇宙からの電波かもしれんｗ

82 ：,,・´∀｀・,,）っ-○○○：2009/09/10(木) 23:35:45 ID:NYMGAvzW

PenrynにHyper Threadingが搭載されてるDemakasejan劇場再開？

83 ：Socket774：2009/09/10(木) 23:37:07 ID:WDPZD/Mb

劇場は閉幕した。寝ろ。

601 ：,,・´∀｀・,,）っ-●◎○ [sage] ：2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeのサンプルはDreamworksで評価されてるようだが

84 ：,,・´∀｀・,,）っ-○○○：2009/09/10(木) 23:39:34 ID:NYMGAvzW

シリコンIDFで出てたのにまだ言ってるのか。
君の会社ではWestmereのサンプルには触る機会あったかね？
ちなみにSandy BridgeのLoad/Storeポートの番号くらいまでは俺の中では既出情報

85 ：,,・´∀｀・,,）っ-○○○：2009/09/10(木) 23:45:10 ID:NYMGAvzW

ちなみにLarrabeeのLoad/Storeはマルチポートになってて1コア当たり64バイト/clk
L1キャッシュがGPUのレジスタファイルのように使えるってのはあながち嘘じゃない

86 ：Socket774：2009/09/10(木) 23:46:09 ID:uEESRbPF

久々に団子を見ちゃった…
見ないようにしてたのに…
見ちゃった…

87 ：,,・´∀｀・,,）っ-○○○：2009/09/10(木) 23:47:51 ID:NYMGAvzW

>>86
　　　　　　　　　　　　　／￣＼
　　　　　　　　　　　　　|　　　　 |
　　　　　　　　　　　　　＼＿／
　　　　　　　　　　　　　／￣＼
　　　　　　　　　　　　　|　　　　 |
　　　　　　　　　　　　　＼＿／
　　　　　　　　　　　　　／￣＼
　　　　　　　　　　　　　|　　　　 |
　　　　　　　　　　　　　＼＿／
　　　　　　　　　　　　　　　|
　　　　　　　　　　　／￣￣　＼
　　　　　　　　　　／　　＼　／　　＼
　　　　　　　　／　　 ⌒　　　⌒ 　　＼　　　　　　よくぞこのスレを開いてくれた
　　　　　　　　 |　　　　（__人__）　　　　|　　　　　　褒美として団子を買う権利をやる
　　　　　　　　＼　　　｀ ⌒´　　　　／　　　☆
　　　　　　　　　/ヽ､--ー､＿＿,-‐´ ＼─／
　　　　　　　／　> 　　ヽ▼●▼<＼　　||ｰ､.
　　　　　　 / ヽ､　　　＼ i　|｡|　|/　ヽ　(ニ､｀ヽ.
　　　　　　.l　　　ヽ　　　 l　|｡|　| ｒ-､y　｀ﾆ　ﾉ＼
　　　　　　l　　　　_|＿＿_|ー─ | ￣ l 　　｀~ヽ＿ノ

88 ：Socket774：2009/09/10(木) 23:50:30 ID:vZTK50aJ

しがないレンダ屋やってるが、俺んとこにはれれべーのサンプル来ないぞ。
イソ〒ル死ね！！！

601 ：,,・´∀｀・,,）っ-●◎○ [sage] ：2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeのサンプルはDreamworksで評価されてるようだが

89 ：,,・´∀｀・,,）っ-○○○：2009/09/10(木) 23:57:11 ID:NYMGAvzW

ところでOpcode 64 67 90って知らない？
ひでーよな。公開情報なのに、「Larrabee」でググっても出てこないんだぜ。

90 ：Socket774：2009/09/10(木) 23:59:34 ID:UKUBWjV/

よくわかんないけど↓を貼ると何か御利益でもあるの？

601 ：,,・´∀｀・,,）っ-●◎○ [sage] ：2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeのサンプルはDreamworksで評価されてるようだが

91 ：,,・´∀｀・,,）っ-○○○：2009/09/11(金) 00:00:45 ID:NYMGAvzW

FS LCP NOP

92 ：,,・´∀｀・,,）っ-○○○：2009/09/11(金) 00:01:25 ID:gMJd18aF

>>90
あるんじゃね？

601 ：,,・´∀｀・,,）っ-●◎○ [sage] ：2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeのサンプルはDreamworksで評価されてるようだが

93 ：Socket774：2009/09/11(金) 00:03:59 ID:rXAIs8Ib

これ貼ると競馬で大当たりするらしいよ

601 ：,,・´∀｀・,,）っ-●◎○ [sage] ：2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeの(silicon)サンプルはDreamworksで評価されてるようだが

94 ：,,・´∀｀・,,）っ-○○○：2009/09/11(金) 00:10:58 ID:gMJd18aF

ハワイのパチンコ当たった当たった

601 ：,,・´∀｀・,,）っ-●◎○ [sage] ：2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeの(silicon)サンプルはDreamworksで評価されてるようだが

95 ：Socket774：2009/09/11(金) 02:59:11 ID:enteOS7V

で、いつ出るのさ？

96 ：Socket774：2009/09/11(金) 11:13:12 ID:3QC2sAa0

HD5870チップサイズ338mm2で2.6Tflopsらしいけど、Larrabeeどうなってるの？

601 ：,,・´∀｀・,,）っ-●◎○ [sage] ：2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeの(silicon)サンプルはDreamworksで評価されてるようだが

97 ：Socket774：2009/09/11(金) 11:20:51 ID:f6yZbazf

>>96
500mm^2～600mm^2で2Tflops？？

601 ：,,・´∀｀・,,）っ-●◎○ [sage] ：2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeの(silicon)サンプルはDreamworksで評価されてるようだが

98 ：Socket774：2009/09/11(金) 11:56:30 ID:8Ydr1nqT

え、LNIのバイトコードって公開されたの？

99 ：Socket774：2009/09/11(金) 13:30:20 ID:iaWmjiq8

(´･ω･`)ぬるぽ

100 ：Socket774：2009/09/11(金) 17:48:52 ID:4hpwDdvT

さぁふるえるがいい

101 ：Socket774：2009/09/11(金) 17:49:33 ID:4hpwDdvT

糞ダンゴ

102 ：Socket774：2009/09/13(日) 00:31:35 ID:fy4lEUFU

IDFでのデモ疲労まであと１０日！

103 ：Socket774：2009/09/14(月) 18:51:34 ID:Rnj1CaHV

Intel、9月22日～24日に開催予定のIDFの内容を予告
～32nm製品やJasper Forestなどの詳細が明らかに
http://pc.watch.impress.co.jp/docs/news/20090914_315467.html

さらには並列コンピューティングを実現する「Larrabee」などについての説明などについても行なうという。

104 ：Socket774：2009/09/14(月) 20:03:42 ID:XcTQeugU

いよいよ動くLarrabeeが見れるのか！！
ん？

＞「Larrabee」などについての説明などについても行なうという。
＞bee」などについての説明などについて

＞　　　　　説　　明

（ﾟдﾟ）

105 ：Socket774：2009/09/14(月) 22:44:38 ID:mZHuztw8

(´・ω・`)スモークチーズはあるかい？

106 ：Socket774：2009/09/15(火) 07:36:46 ID:esRh0S5A

もしかしてローンチさせた時にはもう開発環境が充実している、みたいな
状態を目指しているのかな。かなり慎重にことを進めているように見える

107 ：Socket774：2009/09/15(火) 09:14:34 ID:hhc3bmdv

プロジェクト失敗の責任を取らされる形で
ゲルたんがクビってホント？

108 ：,,・´∀｀・,,）っ-○○○：2009/09/15(火) 22:19:18 ID:CtE/fxwg

>>106
それはそうだ。ハードだけ出してソフト開発者に丸投げじゃCellとなにも変わらん

ハード出す機会を逸し続けてるのも確かだが
どこそこ開発環境の整備に手間取ってるのも確かだな
C++に限ればThreading Building Blocksみたいな成果物は出てきてはいるが
本命のCtはまだだし。

だが丸投げのAMDなんかよりは遙かにマシとはいえる

109 ：Socket774：2009/09/15(火) 22:20:39 ID:UIzxxCZs

http://sylphys.ddo.jp/upld2nd/pc3/src/1253018648473.png
笠原ﾜﾛｽ

110 ：Socket774：2009/09/15(火) 23:13:02 ID:AeHDYv/U

つまりインテルは本気じゃないという事ですね

111 ：Socket774：2009/09/16(水) 00:22:44 ID:0AZr+VwB

糞ダンゴ

112 ：Socket774：2009/09/16(水) 00:23:24 ID:0AZr+VwB

さぁふるえるがいい

113 ：Socket774：2009/09/16(水) 11:21:31 ID:XwXgMKPl

GT300の歩留まりが2%以下らしいな
これはつまりAMDにライバルがいなくなったと思っていい

114 ：Socket774：2009/09/16(水) 11:29:45 ID:21jorwK+

GPU市場の蝋燭の火が消える
そのほんの一瞬の輝きに過ぎん

115 ：Socket774：2009/09/16(水) 12:14:44 ID:XwXgMKPl

たしかに　これで競争が無くなることによる性能upの期待は薄れたね
AMD一強になる可能性大

116 ：Socket774：2009/09/16(水) 12:30:38 ID:21jorwK+

単なるお絵かき発熱器は
ベンチしか用が無いってことさ

117 ：Socket774：2009/09/16(水) 19:19:29 ID:p+3P5vC0

発売がDX10からDX11必須な時期に延期になって
その対応をすべてソフト部隊が行うんだからどんなけ大変なんだろかと。
ハード実装されてるAtiNvのドライバ開発部隊だって数百人規模なのに･･･

118 ：Socket774：2009/09/16(水) 19:51:03 ID:21jorwK+

ハード実装とおっしゃいますが
DX10以降、ほとんどはshaderで置き換えだよ
つまりは、DX9以前のありふれた機能であっても
プログラマがかかにゃならんの

119 ：Socket774：2009/09/16(水) 20:09:40 ID:UHnTpmIi

>>116
ちゃんと役立つ暖房器具をバカにすんな
http://blog.livedoor.jp/amd646464/archives/51405072.html

120 ：Socket774：2009/09/17(木) 04:02:24 ID:hMOkTMxo

>>118
テッセレーターやROPはハードウェア実装だろ？
それすらもソフトウェアで書かねばならないLarrabeeが
GPUに勝つためには製造プロセスで1世代先をいくか
ダイサイズを大きくして、できる限り演算ユニットに
トランジスタ数を割くかのどちらかしかない

3DCG以外の汎用並列処理ならLarrabeeを使うメリットが
あるだろうが、グラフィックに限っていえばLarrabeeが
GPUに勝てる見込みはないだろう

121 ：Socket774：2009/09/17(木) 06:58:52 ID:Xg1D6Iol

勝つ必要が無いもの
ATI,nvは所詮ベンチ専用

122 ：,,・´∀｀・,,）っ-○○○：2009/09/17(木) 07:26:57 ID:ZP1RrD/W

HW実装のテッセレータって必要なの？
ソフト実装だとどのくらいの性能上のコストになるとか定量的な比較ができないことには
どうとも言えない
西川いわくMS的にはもともとソフトでの実装を想定してたものらしいし

123 ：Socket774：2009/09/17(木) 11:25:34 ID:ZM8rN7CE

POWER7は帯域モンスターらしい。
Larrabeeは何とどんな太さで繋げられるかわからないことには
何に使えるのか判断できない

124 ：Socket774：2009/09/17(木) 11:50:46 ID:5n0pXN4Y

まったく…団子は嘘ばっかり言いすぎ
だからあんな顔になったりするんだよ

125 ：Socket774：2009/09/17(木) 18:53:45 ID:YkoJn40H

New Larrabee silicon taped out weeks ago
http://www.semiaccurate.com/2009/09/16/new-larrabee-silicon-taped-out-weeks-ago/

126 ：Socket774：2009/09/17(木) 22:43:48 ID:qE4c2kzb

Larrabee has a host of bugs which prevented public showings of the Ax silicon.
That said, almost all problems are said to be fixed in the move from Ax to B0 silicon.

ちょ
http://pc11.2ch.net/test/read.cgi/jisaku/1245944113/2
2 ：Socket774：2009/06/26(金) 00:46:41 ID:K0n9bRUo
FUDzilllaがソフトウェアサポートやドライバの遅れを報じてるけど、
これは真相を隠すための言い訳リーク情報で、
実際はファーストシリコンがまともに動作せず、開発チームは火の車状態。

127 ：Socket774：2009/09/17(木) 22:48:15 ID:u2qL0aep

テッセレータはDX10GPUとソフトエミュのデモで1fps以下のスピードを出せてたので
ソフトエミュでいいんじゃないのｗ

128 ：Socket774：2009/09/17(木) 22:59:58 ID:QsJX1gr/

601 ：,,・´∀｀・,,）っ-●◎○ [sage] ：2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeのサンプルはDreamworksで評価されてるようだが

129 ：Socket774：2009/09/17(木) 23:11:56 ID:o8CpOynW

バグだらけでまともに動かないAxシリコンを、
Dreamworksはいったいどうやって評価していたのだろう。

130 ：Socket774：2009/09/18(金) 01:51:09 ID:ef0pKKCE

殻割りしてキラキラしてて綺麗だな～～とか

131 ：Socket774：2009/09/18(金) 08:08:38 ID:ZD70ajJ8

そもそもソフト屋にとっては先にソフトのサイクルアキュレートなシミュレータさえ用意してもらえれば何とでもなるよ。
逆にそういったソフト開発ツールがないとエンジン開発もやりようがないし
先にチップだけ渡されてどうにかなるわけでもない
エンジニアリングサンプルが必要なのはハード設計屋。

132 ：Socket774：2009/09/18(金) 09:35:26 ID:nTMfhRp5

>>128
そっか、団子はバグ取りで遊んでたのか

601 ：,,・´∀｀・,,）っ-●◎○ [sage] ：2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeのサンプルはDreamworksで評価されてるようだが

133 ：Socket774：2009/09/18(金) 21:55:42 ID:esGm1GZn

　　　　　デケデケ　　　　　　|　　　　　　　　　　　　　　　|
　　　　　　　　ドコドコ　　＜　ぽおおおぉぉぉぉぉぉぉ＞
　　　☆　　　　　　ドムドム　|＿　＿　＿　＿　＿　＿|
　　　　　　　 ☆　　　ダダダダ! ∨　 ∨　∨　∨　∨　∨
　　ドシャーン!　　ヽ　　　　　　　　　オラオラッ!!　　　 ♪
　　　　　　　　　＝≡＝　∧＿∧　　　　　☆
　　　　　　♪ 　　／　〃(*‘ω‘ *)　　　　/　シャンシャン
　　　　♪　　　〆　┌＼と＼と.ヾ∈≡∋ゞ
　　　　　　　　　|| 　γ ⌒ヽヽコノ　　||
　　　　　　　　　||　ΣΣ 　.|:::|∪〓　||　　　♪
　　　　　　　 .／|＼人＿.ノノ _||_.　／|＼
　　　　　　　　　ドチドチ!

134 ：Socket774：2009/09/20(日) 16:26:19 ID:99plnXPo

ttp://wlog.flatlib.jp/item/1392

Mobile GPU

>電力も面積も限られているモバイル向け GPU にとってバス帯域は大きな問題です。
>タイルベースで深度判定のみ先行し、最小限のフラグメントのみレンダリングする
>PowerVR と同じように、AMD もチップ内の少量かつ高速な RAM を用いたタイルベース
>レンダリングを行っているようです。この辺の工夫も非常に興味深いところです。

135 ：Socket774：2009/09/23(水) 12:57:34 ID:3qoCto8i

>>50 >>104
デモ動画北！
http://www.4gamer.net/games/049/G004963/20090923003/

136 ：Socket774：2009/09/23(水) 13:40:05 ID:PM1+tYHR

Larrabee－次世代を感じさせる高性能と低消費電力、GeForce GTX 285を凌駕
http://pc.watch.impress.co.jp/docs/column/tawada/20090923_317271.html

137 ：Socket774：2009/09/23(水) 14:17:19 ID:D8NL496G

>>136
どーこー？？？？？

138 ：Socket774：2009/09/23(水) 15:15:08 ID:XQ6Yhu4u

Intel，IDF 2009で「Larrabee」の実機デモを披露。2010年以降，ハイエンド市場向けにグラフィックスカードを投入へ
ttp://www.4gamer.net/games/049/G004963/20090923003/

139 ：Socket774：2009/09/23(水) 15:51:51 ID:gyWCTvjt

なんかデモのフレームレートめちゃくちゃ低くねぇ?

140 ：Socket774：2009/09/23(水) 16:58:23 ID:6f2OgR95

試作段階とは、お披露目で自慢のレイトレがこの程度
なら既存のラスタライゼーションでは、HD5xxxやGTX3xxには勝てない

Larrabeeって、なにを売りにするの？

141 ：Socket774：2009/09/23(水) 17:03:11 ID:HRXdIN1C

日本語で

142 ：Socket774：2009/09/23(水) 17:09:02 ID:zLtMfCjn

90MHzのFPGAのSaarCORでさえもっとスムーズに動いていたような…
レイキャストぐらいハードで実装すりゃいいのに

143 ：Socket774：2009/09/23(水) 17:19:06 ID:smU1uwpm

リアルタイムレイトレーシングは技術者の夢だが
この程度の画質じゃ誰も食いつかないよな
せめてV-ray並のフォトリアル表現できないと
ttp://v-ray.jp/envyspot2008_june.shtml

Cell+RSXのように、GPUとCPU内蔵のLarrabeeによる協業を模索してるのか？

144 ：Socket774：2009/09/23(水) 18:00:19 ID:Wkv4bmi4

市場に出てないCPU持ってきて下駄履いてるのにそれか

145 ：Socket774：2009/09/23(水) 18:06:27 ID:4FqlwNtF

ネタ元
ttp://www.youtube.com/watch?v=mtHDSG2wNho
Quake Wars: Ray Traced

今回のintelデモ
ttp://www.youtube.com/watch?v=G-FKBMct21g
Sean Maloney's IDF 2009 Larrabee graphics demo

146 ：Socket774：2009/09/23(水) 20:31:42 ID:pmu5x0AV

N厨の火病りっぷりが面白いｗ

147 ：Socket774：2009/09/23(水) 23:53:16 ID:ZJq+quF3

OpenCLより開発の多いCUDA、スペックが足りないララビー、蚊帳の外のAMD

148 ：Socket774：2009/09/24(木) 00:20:59 ID:3fSSpCHe

【IDF 2009レポート】ショーン・マローニ氏基調講演レポート
～Larrabeeのデモを初公開
http://pc.watch.impress.co.jp/docs/news/event/20090924_317313.html

149 ：Socket774：2009/09/24(木) 00:43:06 ID:ox/cpnhF

CtならCTならなんとかしてくれる・・・。

150 ：Socket774：2009/09/24(木) 00:44:05 ID:lA0rdcYE

団子さんはゲーム用グラフィックスプロセッサとしては興味ないんだっけ？

いや俺もないんだけど

151 ：Socket774：2009/09/24(木) 00:47:31 ID:w49PsoMK

1600コアの時代にたかだか4コアだの8コアだのいってるCPUを語ってる場合か

152 ：Socket774：2009/09/24(木) 00:55:40 ID:K9wMNQXv

場合だよ。
Lynnはリリースされて、次の新石は年末のClarkdale/Arrandaleだからな。
その次は翌年H1のWestmere-EP。

153 ：Socket774：2009/09/24(木) 00:56:35 ID:ox/cpnhF

>>151
1600コアの汎用プロセッサ現る。

154 ：Socket774：2009/09/24(木) 03:18:09 ID:WedKA8Gw

Software developement systems shipping now って具体的に何なんだろう

ttp://www.4gamer.net/games/049/G004963/20090923003/

155 ：Socket774：2009/09/24(木) 05:30:50 ID:VKhYkx2Q

Ctのベータテストだよ

156 ：Socket774：2009/09/24(木) 10:37:55 ID:miQ0oZWI

>>151
1600コアって何の妄想だよｗ

157 ：Socket774：2009/09/24(木) 12:56:31 ID:sMN1gZGp

>>143
なにこれ
まさかCGなの？

158 ：Socket774：2009/09/24(木) 15:29:49 ID:btEYJ88k

>>148
>最初のデモにしてはずいぶんと地味なデモだったような気がしなくもない
とかPCWatchの中の人も書いちゃってるぐらいだから危ないかもなー

159 ：,,・´∀｀・,,）っ-○○○：2009/09/24(木) 22:17:00 ID:Jgvf5I8y

>>156
SIMD演算器のエレメント数じゃないの？
その計算で行くとCore i7は4Way(128ビット)SIMD演算器×3だから48コアな。

160 ：Socket774：2009/09/25(金) 11:16:49 ID:rU98ea/N

>>157
CGだよ
仕事で建築パースとか作ってるが、本当に実写並みの出力が得られる。
これをリアルタイム描画できるなら、Larrabeeを使う意味はあるが
こないだのデモを見る限りでは11nm世代になるまで無理そうだな

161 ：Socket774：2009/09/25(金) 11:18:52 ID:rU98ea/N

1600コアはHD5870のSP数のことでしょ。
CPUは汎用処理目的（完全ブログラマブル）
GPUは固定処理目的（一部プログラマブル）
比べること自体ナンセンス

162 ：Socket774：2009/09/25(金) 11:35:17 ID:2PG2Z7Bh

SP一個で1コアとかNvidiaがホントに言ってるんだぜｗ

163 ：Socket774：2009/09/25(金) 11:43:35 ID:fHyEtWh+

>143　>>157
今もう映画でも、魔法やレーザービームみたいな特殊効果が
必要ないシーンでも、セット作ったりロケに行くよりもCGの方が安いと
見積もられたらCGで作ってしまう

164 ：Socket774：2009/09/25(金) 21:10:17 ID:uxsVD9Jo

そして3DCGよりも安いと見積もられたらマットペイントの一枚絵＋AE処理で作っちゃう

165 ：Socket774：2009/09/27(日) 13:07:30 ID:Wzs0T7Ci

ゲームに使うとか言ってるが普通に無茶だろう
そういえば新型PS3をリークしたニュースに来年PS4が出るみたいなこと書いてあった気がするが
まさか変態ハード好きのソニーが新ハードに積むんじゃねえだろうな

166 ：Socket774：2009/09/27(日) 14:25:24 ID:RmGAS4Y9

http://www.geocities.jp/andosprocinfo/wadai09/20090926.htm

167 ：Socket774：2009/09/27(日) 16:22:49 ID:5i2BlXJq

>>165
Cellの投資をPS3,PS4,PS5の複数世代で回収するために
スケーラブルアーキテクチャを採用したのだから
Cell拡張版以外使う気ないでしょ

22nm世代になったらPS4出すんじゃない？
サードはみんな任天堂のHD機に流れそうな予感がするけど

168 ：Socket774：2009/09/27(日) 16:38:11 ID:Dnlc9DhR

http://pc11.2ch.net/test/read.cgi/jisaku/1246074491/716-717

169 ：Socket774：2009/09/27(日) 17:33:23 ID:+IiWdWhO

もうPS4はSandy Bridge + Larrabeeみたいなもんでいいよ。

170 ：Socket774：2009/09/27(日) 19:01:23 ID:/Ly3tsMN

それだとWindowsを入れられるけど、OtherOSのインストールが
できないならCPUに何を選んでもユーザーには大差ないね。

171 ：,,・´∀｀・,,）っ-○○○：2009/09/27(日) 20:18:33 ID:wZhgRL9c

>>167
PS3以外の展開やってるのは東芝くらいなんだが・・・
単にLRBniで遊びたいなら、Haswell世代でミッドレンジ以下に統合されるわけで

172 ：Socket774：2009/09/27(日) 20:59:46 ID:YdIXc3Pt

北森やtechreportのコメント欄見ても終戦モードだな
もうダメポ

173 ：,,・´∀｀・,,）っ-○○○：2009/09/27(日) 21:04:15 ID:wZhgRL9c

っつーか、並列度が高いでもないし小回りもきかない128ビットSIMD専用コアが
コア数だけ「スケール」してもあまり旨味はないと思うんだが。
プリファードスロットのみを使う似非スカラ演算の性能は頗る悪いし。
本物のスカラ演算ができて64ビットアドレッシングもでき、
ワイドだが柔軟なSIMD拡張を持つLarrabeeに比べて何が有利なんだよ？

4PPE+32SPEで単精度1TFLOPS（ピーク）になるようだが、45nmで400～500mm²程度のダイサイズだぜ。
既にスケーラビリティの優位性がない。

つーか、Cellのスケーラビリティの根拠って、SPEはローカルメモリ形式でグローバルメモリとのアクセスもDMAだから
コヒーレント制御がないわけだが。
それって多くのデメリットも孕んでるわけで。コヒーレント制御なしで読み書きするだけならLRBniでも全てのSIMD命令で使えるし。

174 ：Socket774：2009/09/27(日) 21:14:34 ID:n5SFXhZm

とりあえず、なんか勘違いしてるラデオソ信者が鬱陶しい

175 ：,,・´∀｀・,,）っ-○○○：2009/09/27(日) 21:18:21 ID:wZhgRL9c

まあPrototype Libraryあたり読んだらLarrabeeの本質わかると思うんだが。
命令セットレベルで多倍長整数や高度なマトリクス演算にフォーカスしてる。
IntelはTOP500のシェア90%オーバーを目指さないと気が済まないようだ

GPUとして期待外れで結構だろ。
そもそもスパコン用途のニーズとして最低限必要な柔軟性を捨ててまでGPU（笑）を追求する必要がない。

176 ：Socket774：2009/09/27(日) 21:41:12 ID:2VeUhgpA

>>175
＞GPUとして期待外れで結構だろ
はい、団子から頂きました

177 ：Socket774：2009/09/27(日) 21:48:20 ID:KV/IZaHJ

＞4PPE+32SPEで単精度1TFLOPS（ピーク）になるようだが、45nmで400～500mm？xB2;程度のダイサイズだぜ。

マジか・・・90nmCellが1PPE+8SPEで235mm^2だからせいぜい300mm^2かと思ってた

178 ：,,・´∀｀・,,）っ-○○○：2009/09/27(日) 22:05:42 ID:wZhgRL9c

>>177
http://pc.watch.impress.co.jp/docs/2008/0206/kaigai416.htm
45nmは1PPE+8SPEで115.46mm²

HPC向けのは倍精度ユニット強化分だけダイサイズが大きくなるから、これの4倍＋α程度のダイサイズになると思う
つーか、その巨大Cellは、2009年登場予定だったのが未だに出てないんだが。

TOP500の最上位クラスはIBMの出方次第になる気がする。
もしCellに拘ってTOP500の1位を余所に取られるようなことになれば、政府からの発注も受けられなくなるからね。
んでもってIBMがソリューション屋としてLarrabeeを選択すれば全てが終わる希ガス。

179 ：Socket774：2009/09/27(日) 22:26:17 ID:KV/IZaHJ

>>178
なんだよそんな全く最適化されてない隙間だらけのダイが根拠だったのかよ。

＞つーか、その巨大Cellは、2009年登場予定だったのが未だに出てないんだが。
2010年後半だろ？
http://img411.imageshack.us/img411/9205/roadmap1kh0.png

180 ：,,・´∀｀・,,）っ-○○○：2009/09/27(日) 22:31:32 ID:wZhgRL9c

おいおい、PS3のだから、倍精度強化版じゃないぞ？

リング間のインターコネクト回路も用意しないといけないし
減る要因より増える要因の方が多いぞ

181 ：Socket774：2009/09/27(日) 22:32:55 ID:WToZSfyw

>>177
300mm2で3TFLOPSの時代に
500mm2で1TFLOPSとかｗ

182 ：Socket774：2009/09/27(日) 22:33:22 ID:Dy9idI82

隙間だらけといっても、最適化して2割くらい小さくなったとしても、400mm2くらい。
300mm2にするには、最適化だけで3割以上小さくしないといけないから、
さすがにそれはないだろう。

183 ：Socket774：2009/09/27(日) 22:33:56 ID:9CXY1a1f

>>181
で、それは汎用的につかえるのかね？

184 ：,,・´∀｀・,,）っ-○○○：2009/09/27(日) 22:38:14 ID:wZhgRL9c

> ＞つーか、その巨大Cellは、2009年登場予定だったのが未だに出てないんだが。
> 2010年後半だろ？

延期になったのか。

1モジュール当たりの価格で1 PPE + 8 eSPE版（8000ドル前後）の更に倍以上になるのは確実だろうな
LarrabeeがなくてもSandy Bridgeが出るからFLOPS当たり価格は更に下落するし

185 ：Socket774：2009/09/27(日) 22:39:23 ID:WToZSfyw

>>183
ゲームにおいてはCellよりはよほど

186 ：,,・´∀｀・,,）っ-○○○：2009/09/27(日) 22:39:57 ID:wZhgRL9c

>>183
1エレメント5Way VLIWのうち3D処理でも実質3Way程度しか動いてない。
2D処理だと2Wayかそれ以下。

ピークFLOPS数と実効FLOPS数の乖離激しすぎ。
スパコンなんかに使えるわけがない。

187 ：Socket774：2009/09/27(日) 22:45:19 ID:9CXY1a1f

>>185
アクセラレータだからそんなもんだよな。

188 ：,,・´∀｀・,,）っ-○○○：2009/09/27(日) 22:49:25 ID:wZhgRL9c

Havok Clothを人形1体動かすのですらヒイヒイ言ってる程度のが
アーキの改良がないままコア数倍増した程度でどうにかなるわけがない。

流石に非GPU処理やらせたらCellの32コアのほうが実効性能は上だろう

189 ：Socket774：2009/09/27(日) 23:14:58 ID:r6tgVI9D

GPGPU性能ではもうすでに追いつけないレベルになっちまったな・・・

190 ：Socket774：2009/09/28(月) 06:57:22 ID:E1AFoXSi

そうだね、ATIはきえるしかないなｗ

191 ：Socket774：2009/09/28(月) 07:10:54 ID:T2IK/9L9

デモ地味すぎ

192 ：Socket774：2009/09/28(月) 07:21:45 ID:5Hd9sEZA

Transcript読んだがコード短くしたかった意図もあるだろこれ
GPUで書くと120行だけどLRBならC++を使えるからたったの25行なんだぜ？
まあ素敵！
ってどこの通販番組だ

193 ：Socket774：2009/09/28(月) 07:24:51 ID:wXQW5x+U

面白い面白い

194 ：Socket774：2009/09/28(月) 07:25:39 ID:bG0lXWYD

期待外れ

195 ：Socket774：2009/09/28(月) 22:41:34 ID:xow961ab

Larrabeeは期待外れもいいとこｗ
団子、乙ｗｗ

196 ：,,・´∀｀・,,）っ-○○○：2009/09/28(月) 23:04:27 ID:L7aVFlKw

なにを「期待」してたんだ？
それ期待じゃなくて「勘違い」だろ

197 ：Socket774：2009/09/28(月) 23:04:30 ID:KM4hOA+n

GT300がなかなか出てこなくてイライラする気持ちはわかる

198 ：,,・´∀｀・,,）っ-○○○：2009/09/28(月) 23:05:53 ID:L7aVFlKw

Sandy Bridgeのサイクルアキュレートシミュレータ面白すぎる。

199 ：Socket774：2009/09/29(火) 22:18:48 ID:TXg5r9oW

>>197
それもう出ないかもね。

200 ：Socket774：2009/09/30(水) 14:03:49 ID:YaMThjT2

>199
HD4ｋの時ATIが情報をひた隠しにしたようにnVもGT300で隠し続けてるんだと思う
ただ難産は事実で潤沢に出回るのは来年半ば位なんじゃないかと
時期を逸した商品になりそう

201 ：Socket774：2009/10/01(木) 00:46:05 ID:lJo9q5gh

GT 212みたいな水子が既に出てるしな。

202 ：Socket774：2009/10/01(木) 05:33:45 ID:CkkrzygI

http://pc.watch.impress.co.jp/img/pcw/docs/318/463/kaigai1.jpg
やはり次世代プロセッサに移った

203 ：Socket774：2009/10/01(木) 09:19:08 ID:1XovdYzE

こりゃずいぶん変えてきたね。歩留まり大丈夫か？

204 ：Socket774：2009/10/01(木) 11:23:10 ID:AElgrLY8

今までララビーを馬鹿にしてきたゲフォ厨はマンセーに鞍替えしますか

205 ：Socket774：2009/10/01(木) 20:02:20 ID:jPKGHD9O

これでGPUとして買うならATI一拓になった

206 ：Socket774：2009/10/01(木) 21:42:36 ID:PNrgnS0O

>>205
俺は、CPUアクセラレータとしてららびーを応援してる。
ミドルのららびーが待ち遠しい。
そんな俺のGPUはれぃでぃおん4670たーぼ。

207 ：かーみーん：2009/10/01(木) 21:49:00 ID:68i9P2Bf

応援はいらないから20億＄よこせ

208 ：Socket774：2009/10/01(木) 22:48:48 ID:PNrgnS0O

>>207
俺の人生の何回分ですか。。。

209 ：Socket774：2009/10/02(金) 13:46:35 ID:WPKRggcK

地下王国換算で2万回ぐらい

210 ：Socket774：2009/10/03(土) 15:18:24 ID:15UKjmpq

Pat Gelsinger left Intel because of Larrabee fiasco?
http://www.brightsideofnews.com/news/2009/9/18/pat-gelsinger-left-intel-because-of-larrabee-fiasco.aspx

211 ：Socket774：2009/10/03(土) 15:45:19 ID:rQox7uA1

ゲルたんは悪くない。むしろ被害者。
口八丁手八丁のLarry SeilerやTom Forsythに騙されただけ。

212 ：Socket774：2009/10/03(土) 15:51:37 ID:K9RcF7Or

>>210

　L　a　r　r　a　b　e　e　終　わ　っ　た　な　（藁

213 ：Socket774：2009/10/03(土) 15:59:59 ID:Uovy1lal

あらら、Larrabeeって結局大失敗に終わったのか

214 ：Socket774：2009/10/03(土) 16:16:13 ID:qG6YDrVi

発売もしてないものを失敗と評するおかしい。だが、
バグ餅のAxシリコン世代ですらA6までリビジョン重ねてるから、
マスクコスト含めてどんだけ金かけてんのとは思う。
他社の金が入ってるIA64とは違い100％Intelの持ち出しだろうし。
ただし先月の組織再編で部門としての格は上がっている。

http://ja.wikipedia.org/wiki/Larrabee
> Larrabeeの技術ベースとなっているのは、Intelが多額の資金を投入
> している技術研究プロジェクト「テラスケール・リサーチ」である。
> ちなみに、同社は今年第2四半期だけで調査・開発費用に
> 14億7,000万ドルを投資したが、この金額はライバルであるAMDの、
> 同四半期における売上高をも超えている。

215 ：Socket774：2009/10/03(土) 16:57:55 ID:K9RcF7Or

>>214
インテル必死すなぁ

216 ：Socket774：2009/10/03(土) 17:22:45 ID:aDV0CVOB

そのWikipediaの書き方だと、テラスケール・リサーチに14億7000万ドル突っ込んでいるような
誤解を招きかねない文章だな。
14億7000万ドルって、その四半期のR&Dの全額。
毎四半期AMDの売上並みの額をR&Dに突っ込んでいる。

217 ：Socket774：2009/10/03(土) 17:43:16 ID:gZl+A5Dw

いいかげんもうちょっとくらいスリムになってもいいんじゃないのかねintelは

218 ：Socket774：2009/10/03(土) 19:32:56 ID:iVSe+AIj

>>210
まあ同じ妄想でも安藤のが説得力があるわな
プライオリティはXeon(Nehalem-EP) ＞＞＞ Larrabeeだし
ttp://www.geocities.jp/andosprocinfo/wadai09/20090919.htm
>　　Gelsinger氏も，このところNehalemが快調で良い位置に付けていると思われたのですが，（9月24日からのIDFでキーノートを喋ることになっていたのですが）突然の退社です。
>真相は不明ですが，IntelではOttelini氏が，まだまだ頑張りそうであり，Maloney氏の方が歩がよさそうで，なかなかCEOにはなれそうにない。
>一方，EMCではTucci CEOが2012年までは頑張るという表明をしたということは，裏返すとそこで辞めるということであり，2012年のCEOの最有力候補のポジションの方が魅力があったということでしょうか。

他
EMC、インテルの“ミスターx86”ゲルシンガー氏を引き抜く
ttp://www.computerworld.jp/news/trd/162249.html

219 ：Socket774：2009/10/04(日) 04:53:26 ID:peD6Cgui

Larrabeeなんてどうせ出す出す詐欺でしょ

220 ：Socket774：2009/10/04(日) 06:40:03 ID:jHQ1Z0HD

出す出す詐欺とは模型を発表することですね

221 ：Socket774：2009/10/04(日) 17:29:04 ID:Qp4yxDyB

Larrabeeはグラフィックをソフトウェアで処理するのなら
GPUではなくグラフィックアクセラレータと呼んだほうがいいのでは？

222 ：Socket774：2009/10/04(日) 19:50:42 ID:ND/qXxHW

>>221
昔、GPUはそんな感じで呼ばれてたよね。
GPUって言い出したのってNvだっけ？？

223 ：Socket774：2009/10/04(日) 22:42:35 ID:ciUP8XPl

昔、グラフィックアクセラレータって言葉はむしろハードワイヤードを指していた
CPUのメモリ読み書きを使わずにVRAMに書き込むハードウェアがそう呼ばれた

224 ：,,・´∀｀・,,）っ-○○○：2009/10/04(日) 22:57:43 ID:TL0QkM36

CPUでフレームバッファ読み書きしてた時代への回帰だな
WindowsとかLinuxでGPUアクセラレータが効いてない状態だと全部画面描画をCPUでやるわけだが
その「CPU描画」に特化したのがLarrabee

乱暴に言ってしまえばね

225 ：Socket774：2009/10/05(月) 00:17:17 ID:+ugReYtd

Larrabeeの場合、1コア分が、1シェーダークラスタ相当みたいな感じでいいのかな？
できることの柔軟性は全然違うだろうけど

226 ：Socket774：2009/10/05(月) 11:38:08 ID:Mi7FxhjD

http://akiba-pc.watch.impress.co.jp/tmp/blog/20091003/spop9.jpg

227 ：Socket774：2009/10/05(月) 12:43:50 ID:7Bti/4dy

>>226
ワロタｗ

228 ：Socket774：2009/10/05(月) 12:51:32 ID:tlYiEPPS

これはATi買収の準備を始めてると取っていいのか？

229 ：Socket774：2009/10/05(月) 13:35:31 ID:a9FWu+H7

ｲﾝﾃﾙが結構前に言ってたじゃん
「ｳﾁのｵﾝﾎﾞが気に入らないんだったらﾗﾃﾞでもつけてろ」って

230 ：Socket774：2009/10/05(月) 18:23:43 ID:5d0H5ogS

ヤンデレ担当者に萌えたｗｗｗ

231 ：Socket774：2009/10/08(木) 13:12:46 ID:6ixaHlGr

見えてきたSandy Bridgeと，見えてこないLarrabee。Intelのプロセッサロードマップアップデート
http://www.4gamer.net/games/098/G009883/20091007054/

> 　だがその一方，「標準グラフィックスインタフェースとしてのDirectXやOpenGL，
> OpenCLもサポートする」とは言われたものの，
> そのパフォーマンスは最後まで公開されなかった。
> Larrabeeの評価を開始しているベンダーの関係者によれば，
> 「現時点では一般的なGPUとして評価できる段階にない」そうだ。
> 　また，Sean Maloney（ショーン・マローニ）上級副社長も，
> 将来的にLarrabeeコアをCPUへ統合する計画に変わりはないとしつつも，
> いつ，どの市場へ投入するするかについては「いまは語れない」の一点張りである。
>
> 　付け加えるなら，Larrabee計画の顔役ともいえる
> Patrick P. Gelsinger（パット・ゲルシンガー）上級副社長が，
> IDF 2009の直前にIntelを退職するという“事件”もあったが，
> それと関連してか，この数か月，業界内にはLarrabeeについて，
> 後ろ向きな情報が飛び交っている。
> なかには「IntelがLarrabee計画を中止する」といったものまで含まれていたほど。
> 「Larrabeeは，TSMCの40nm プロセスで製品化される見通し」
> という半導体業界筋の情報や，
> 「Gelsinger氏とともに，主要エンジニアもIntelを去った」という情報もある。

ﾜﾀ？

232 ：Socket774：2009/10/08(木) 13:22:21 ID:T+6wbE/7

LarrabeeはCellGPUみたいに頓挫かｗ

233 ：Socket774：2009/10/08(木) 14:46:03 ID:GoWscHif

節操がないなぁ
NVIDIAのほうがやばいだろ

Nvidia kills GTX285, GTX275, GTX260, abandons the mid and high end market
Full on retreat, can't compete with ATI
ttp://www.semiaccurate.com/2009/10/06/nvidia-kills-gtx285-gtx275-gtx260-abandons-mid-and-high-end-market/

285は既にEOL、260は11or12月にEOL、275は2週間以内にEOL、295も終わりそう。
ハイエンド、ミドルレンジから脱落する。
Fermiの派生モデルはテープアウトすらしていないので、少なくとも2Qは掛かる。
Fermiはダイサイズあたりの性能が低く派生モデルを作ってもフルラインナップで価格競争力で劣る。
ハンダの欠陥問題、G212の失敗、G214の大失敗、G215の遅延、G216とG218の壊れたGDDR5コントローラ。
救世主となるチップはない、プランBはない、全て失敗した。
赤字販売を続けるか、撤退して少ない赤字を出すかしかない。
資金が尽きる前に開発の問題を修正し競争力のある製品を出せるかが問題。
1月にはローエンドからも脱落する。
Nvidiaは全てのパートナーから憎まれており助けてくれるパートナーはいない。
Nvidiaに必要なのは経営陣の総入れ替えだが、その出て行くべき奴らは株主なので起こりそうもない。
ゲームオーバー。
ジェンセンは年俸1ドルでも貰い過ぎである。
--------------------

GT300がコケるなら対抗製品であるLarrabeeの製品化を急ぐ必要はなくなる。
AMDが弱ってるからLGA1366のライン縮小するのと同じ原理でね。

234 ：Socket774：2009/10/08(木) 14:56:16 ID:eLt7yjzV

nvidiaが弱ってるから余裕かましてるのか、larrabeeが順調じゃないからGT300もそれにあわせてるのか
どっちもありそうだな

235 ：Socket774：2009/10/08(木) 15:02:12 ID:IK7Sv4Rf

まぁ、外野がどこが勝った負けただと下世話に騒ぐのとは関係なく、
どの現場も技術的に物凄く難しいことに直面し挑戦してるってこったね。

ララもFermiも諦めないで世に出てきてほしいもんだ。

236 ：Socket774：2009/10/08(木) 15:48:05 ID:GoWscHif

ライターが「業界筋が～」って書くときは、金握らされてFUDを書いてるときの常套句だけどな
Larrabeeの不安煽って得する陣営って、どこかわかったようなもんだろ。

利益だせるゲームの要求スペックは相対的にローエンドに下がってきてるし
IntelはあのGMAで労せずしてGPUの覇権を得ようとしてるわけで、
ダイサイズの割に単価の安いディスクリート市場なんて
討つべき相手がいなくなれば効率の悪い投資でしかない。

「GMAの性能が気に入らないならRadeonでも刺してろ」ってIntelの本心だろ。
出る前からわかりきってることだがGPGPU要素の薄い従来GPUの延長としてなら
LarrabeeよりRadeonのほうが優秀だ。
CPU市場を脅かそうとしたNVIDIAが自滅するなら、ディスクリート版Larrabee
という巨大な防波堤は無駄な投資に終わる。

237 ：Socket774：2009/10/08(木) 16:05:53 ID:BgGo9xIl

アクセラレータプロセッサを売ろうとしても、HPCや
動画エンコード専用じゃぁ市場が狭すぎて売れる価格で出せない。
　↓
ミドル～ハイエンドGPU機能をおまけに付けてやれば、たくさん出るから
安く出来るぞ。GPU -> Teslaの逆をやればいいじゃまいか。
　↓
そもそもディスクリートGPUの市場がどんどん無くなってきたお　←今ここ
　↓
しょうがないCPUコアに統合するか、2014～2015年位まで待って。またね～

238 ：Socket774：2009/10/08(木) 16:19:20 ID:6ixaHlGr

保守的な人間がなんと多いことｗ

239 ：Socket774：2009/10/08(木) 17:55:24 ID:8CZbsXkC

>>236
主要エンジニアが会社を去ったら必ずニュースになるからな
公式からもそのエンジニアの情報が削除されるし

240 ：Socket774：2009/10/13(火) 10:14:58 ID:1IVtbDMn

やれやれFermiが難産とわかったらレスが付かなくなったな

241 ：Socket774：2009/10/13(火) 10:19:18 ID:tMZdXraz

ワロスｗ

242 ：Socket774：2009/10/13(火) 10:54:04 ID:Z2yHuX/g

An Inconvenient Truth: Intel Larrabee story revealed - Bright Side Of News*
http://www.brightsideofnews.com/news/2009/10/12/an-inconvenient-truth-intel-larrabee-story-revealed.aspx

243 ：Socket774：2009/10/13(火) 11:17:05 ID:tMZdXraz

>Intel knows that the future of the company is at stake
ハイハイFUD乙

244 ：Socket774：2009/10/13(火) 11:23:26 ID:mf6lsKCq

>>243
その文だけだと、検索した感じでは、インテルの命運を分ける。じゃないか？？

245 ：Socket774：2009/10/13(火) 12:47:01 ID:1IVtbDMn

投機屋にとっては短期で利益の出せない開発計画なんて
不満の種でしかないからな。
圧倒的黒字出してても前年同期比で利益落ちたら即株価に跳ね返る。

その点、信心深い（が金は無い）信者達に万々歳され続ける某企業は
たとえ倒産リスクのある企業にリストアップされてても
ある意味お目出度いやら何やら。

246 ：,,・´∀｀・,,）っ-○○○：2009/10/14(水) 01:44:35 ID:BZHRxyoI

Fermiって劣化Larrabeeだろ。

どこそこ性能ネックだぞこれ

247 ：Socket774：2009/10/14(水) 01:48:46 ID:soAqgjKt

いいからLarrabee出せよ

248 ：,,・´∀｀・,,）っ-○○○：2009/10/14(水) 01:50:33 ID:BZHRxyoI

いいからモックアップ出せよ

249 ：,,・´∀｀・,,）っ-○○○：2009/10/14(水) 02:01:11 ID:BZHRxyoI

Fermi could run an OS
ttp://www.fudzilla.com/content/view/15940/34/

SIMD全命令プレディケート対応といい
どこまでも劣化コピーだよな

250 ：Socket774：2009/10/14(水) 06:07:32 ID:jH/+JW9D

Intel knows that they've completely messed up with the current generation
and the company decided to trash away the part of current design
and re-design the SIMD units from ground up.
This means the current diagrams featuring 16-wide SIMD unit are out the door,
because that design doesn't work.
Newly designed SIMD units will still probably be 16-wide and take AVX instructions,
but it will be GPU-like and not CPU-like.

251 ：Socket774：2009/10/14(水) 06:27:17 ID:g43xzJRl

まlarrabeeのデモもモックだけどな
PenD同様

252 ：Socket774：2009/10/14(水) 08:44:04 ID:+Mn3R7lJ

>>251　いつものコテハン忘れてるぞ

　　　　　　,,,
(　ﾟдﾟ)つ┃
　　　（・´ω`・）

253 ：Socket774：2009/10/14(水) 10:44:05 ID:pwDUNm5B

FermiとLarrabeeでベイパー合戦てかｗ

254 ：Socket774：2009/10/14(水) 21:48:49 ID:lX2bMnnF

前に聞いたB0シリコンが8/15にテープアウトという噂が本当なら
来年半ばに出る機会が高い
ただし、製品化するのはB0とは限らない
一回の仕様変更ならさらに三か月追加とすると2010に出したいならせいぜいあと三回...

255 ：Socket774：2009/10/15(木) 00:11:04 ID:NHyQIliY

うーん、たぶん来年半ばくらいに思っておいて正解だと思うよ。
実物見たことないけど。HD68xxは間に合わないでしょう。

でも俺はx86万能みたいな宗教は進化の弊害にしかならんと思うし、
HPCに関してはMagny-CoursとFermi直結したほうが速いと思う。

256 ：Socket774：2009/10/15(木) 00:14:09 ID:YTC2bPib

>>255
CPUに取り込むのが前提だからx86なんだよ

257 ：Socket774：2009/10/15(木) 00:31:42 ID:NHyQIliY

逐次＋並列の異種混合のほうが速いって。恐らく。
インオーダーのPentiumを掻き集めてもなぁ……という気が。
レイトレは得意だろうけど。

258 ：,,・´∀｀・,,）っ-○○○：2009/10/15(木) 00:41:06 ID:I+UKJFoq

x86みたいなフォーマットだからこそメモリアドレッシングを直列化してパイプライン実行できるんだが。
インオーダのx86であるAtomにすらスカラ性能で勝てるRISCは少ないのが事実
（ちなみに命令帯域/clkはP5よりAtomのほうが狭いです）

ちなみに最近鼻息粗くしてるCortex-A9はアウトオブオーダ

259 ：,,・´∀｀・,,）っ-○○○：2009/10/15(木) 00:46:28 ID:I+UKJFoq

＞逐次＋並列の異種混合のほうが速いって。恐らく。

その「逐次＋並列の異種混合」をオンダイで実現してるのがLarrabeeな。

同じ512SP相当ならFLOPS数はLarrabeeのほうがFermiより稼げる。
ピーク・実効値ともにね。
Fermiのホワイトペーパー読めばどこそこ駄目仕様なのがわかる

260 ：Socket774：2009/10/15(木) 00:54:20 ID:rkKfNFR3

>>257
> 逐次＋並列

コアごとに16wideものベクトルユニット積んでるララビがまさにそれじゃね？

261 ：Socket774：2009/10/15(木) 00:56:39 ID:oi+9nr8q

革新的なアーキテクチャを目指していたが開発は
遅れに遅れ製品化される頃には着実に改良を
重ねてきた競合に太刀打ちできなくなったでござるの巻

262 ：,,・´∀｀・,,）っ-○○○：2009/10/15(木) 00:59:29 ID:I+UKJFoq

Fermiがな。

512SPで倍精度650GFLOPSだ！
しかしLarrabeeも512SP相当で少なくとも800GFLOPSオーバーだ！

低消費電力で勝つる？
そりゃあのエンジニアリングサンプル（笑）に電源供給できないからなｗｗ

263 ：Socket774：2009/10/15(木) 01:02:42 ID:YTC2bPib

レイトレなんてそれこそGPUの方が得意な処理だよ

264 ：,,・´∀｀・,,）っ-○○○：2009/10/15(木) 01:04:38 ID:I+UKJFoq

index * scale + base + dispのメモリアドレッシングだけでだいぶオペレーション密度稼いでるんだよね。
本当の意味でGPUの並列度とx86のスカラの利点がFusionしてる。

FermiはSPあたりのロード・ストア命令の最大発行回数がGT200の半分に落ちてるんだぜ。
FLOPS数弾き出す以前に、データ供給がネック。仕様からしてお㍗ル

265 ：,,・´∀｀・,,）っ-○○○：2009/10/15(木) 01:09:30 ID:I+UKJFoq

>>263
そーでもない。

演算ユニットのスループットは勿論必要だが、より効率を上げるためには
レイトレース結果を再利用するための読み書き両対応でそこそこの容量のキャッシュが必要。

しかしFermiのL2キャッシュはたったの768KB！Larrabee（8MB）の10分の1。
帯域が十分あるわけでもない。
てか、確保したらしたでメモリ帯域分だけでTDP300Wオーバーになるだろ。
キャッシュのほうが電力的に優しい。

266 ：Socket774：2009/10/15(木) 01:27:19 ID:wMe4w240

>>264
>index * scale + base + dispのメモリアドレッシング
しがらみのない新規プロセッサこそ、↑のパイプライン化をもっとスマートに
やってもよさそうなもんだが、どこもやろうとしないのは何でじゃろ？
存外どうしようもない(クダラナイ)理由のような気もするが。

267 ：Socket774：2009/10/15(木) 01:40:32 ID:nPzYoCXU

Larrabee RAM間のバンド幅はいつ公開されるん

268 ：Socket774：2009/10/15(木) 01:42:28 ID:zLyfGi2G

そんなにハードル上げまくってどうするｗ

269 ：Socket774：2009/10/15(木) 01:43:25 ID:KqiUfhOA

Larrabeeの場合、どれくらい狭い外部帯域幅でくるのかが楽しみ

270 ：,,・´∀｀・,,）っ-○○○：2009/10/15(木) 01:54:51 ID:I+UKJFoq

キャッシュを大きめに取ってタイルレンダに特化したぶん、外部帯域は相対的に広く取る必要がないからね。
それだけでTDP節約でき、クロックに振る余裕が出来る。

FermiのTDPの半分はGDDR5でできています
ってのは笑えない冗談。
早かれ遅かれGPUはタイルレンダに移行する。中の人自身がそういってるし。
NVIDIAもまた先延ばしにしてるだけにすぎない。

271 ：Socket774：2009/10/15(木) 02:01:37 ID:AmfbvI81

>>261
あの売れてないゲーム機と同じだね。

272 ：,,・´∀｀・,,）っ-○○○：2009/10/15(木) 02:15:09 ID:I+UKJFoq

NVIDIAのGPUが載っかるゲーム機って勝てない法則があるよね

273 ：,,・´∀｀・,,）っ-○○○：2009/10/15(木) 02:33:02 ID:I+UKJFoq

>>268
逆にFermiの明らかな低スペックが暴かれた今、どこまでIntelが手抜きしてくるか心配でならない
だってこうだろ

１．HPCにおけるCUDA＆Cell除け
２．IGP版Larrabeeのテスト
３．ひょっとしたらGPUとしても案外売れるんじゃね？

自称パラノイアのIntelにとって最大の戦略目標は言うまでもなく１。
Xeonで得たHPC市場のシェアを脅かす存在の排除。
あとはそれほど優先度高くはない。

ちなみにRadeonは最初から敵ではない。敢えて言えばNVIDIA潰しという点で利害関係が一致してる。

274 ：Socket774：2009/10/15(木) 03:33:31 ID:gKRSsnUF

必死だなｗ

275 ：Socket774：2009/10/15(木) 05:49:37 ID:n+7lweU8

団子さんはGDDR5の消費電力について書く時、
Rambusの言っている数字を使うけれど、
Samsungは多少いい数字を出してきますよ。
http://pc.watch.impress.co.jp/img/pcw/docs/319/593/html/ph05.jpg.html

276 ：Socket774：2009/10/15(木) 06:19:57 ID:q6gIqkR5

samsungのGDDR乗ってるVGAは買う気が起きない。

いや、使う気が起きない。

277 ：Socket774：2009/10/15(木) 08:37:33 ID:W57wLnY+

>>275
本当に多少の誤差でしかないな
同じメモリなら結局帯域比例には違いないし

GPUダイ側のインターフェイスや冷却ファンも考慮すると
実質これより遙かに食ってるわけで
将来性のない設計なのは違いない。

278 ：Socket774：2009/10/15(木) 08:51:05 ID:6I6eVo/3

FermiのL2はVictim Cache？
スクラッチパッドをL1に最大まで割り当てた場合ダイ全体で48KB×16=768KB
InclusiveだとL2の意味が殆どなくなる。
どっちにしてもHPCには少なすぎるが。

279 ：Socket774：2009/10/15(木) 11:54:44 ID:n71c16QL

>>272
任天堂がしんじゃうぅぅぅううううううううううううううううううう。
ttp://gigazine.net/index.php?/news/comments/20091014_next_ds/

280 ：Socket774：2009/10/15(木) 15:43:38 ID:fj6awrx6

レイトレデモ、ｼｮﾎﾞ
http://journal.mycom.co.jp/articles/2009/10/14/gtc06/001.html

281 ：Socket774：2009/10/15(木) 15:59:52 ID:6I6eVo/3

陰影焼きこんだテクスチャで第一印象だけは誤魔化せるから
見た目しょぼいほうがかえってレイトレの効果がわかりやすい。
レイトレだけでリアルタイム描画できるのが現世代でそこまでって
言ってしまえばそうなんだが。

あとはLarrabeeでもやったようなリアルタイムの水面表現だな。
Nが自信があるなら同じようなデモでぶつけてくるんだろうが。

282 ：Socket774：2009/10/15(木) 20:08:37 ID:rBAP1Pdj

Is Intel's Larrabee suffering from Boeing 787 syndrome?
http://www.glgroup.com/News/Is-Intels-Larrabee-suffering-from-Boeing-787-syndrome--44083.html

283 ：Socket774：2009/10/15(木) 20:32:39 ID:YTC2bPib

レイトレがリアルタイム描画勝負でラスタライズの描画クオリティを上回れるのって
ハード性能的にもまだ数世代掛かりそうな感じ。
どっちにしろ家庭用ゲーム機が対応しないと始まらないけど。

284 ：Socket774：2009/10/15(木) 21:26:34 ID:srancKAX

一足飛びにレイトレは無いと思うのだけどなァ
まずはタイルレンダに移行してラスタライズにおける帯域・演算のムダを
徹底的に取り除いていかないと

285 ：Socket774：2009/10/15(木) 21:42:47 ID:gKRSsnUF

レイトレってのは結局光の物理処理なんだよ

286 ：,,・´∀｀・,,）っ-○○○：2009/10/15(木) 22:46:11 ID:I+UKJFoq

GPUがグラフィックプロセッサとして効率がよかったのはほぼ全部固定機能でやってた一昔前までの話で
中途半端にソフト化してからクソ化した

VRAMのメモリレイテンシが長い
↓
同時稼働スレッド数を増やすしかない
↓
スレッドあたりのローカルレジスタ／メモリの割当てが少ない
↓
メインメモリに待避するしかない
↓　　　　　　　　　　　　　　　↓
(最初に戻る)　　　　　　VRAM帯域が必要
　　　　　　　　　　　　　　　　　↓
　　　　　　　　　　　　　　増やしたら電力馬鹿食い
　　　　　　　　　　　　　　　　　↓
　　　　　　　　　　　　　　　先がない←今ここ

キャッシュ増量してタイルレンダすればスレッド数そんなに増やさなくても低レイテンシにできる。
最近言い出したビア貫通＋EDRAMだのは結局はタイルレンダ移行前提の方策。

287 ：Socket774：2009/10/15(木) 23:05:20 ID:srancKAX

ソフト化（シェーダ化）ってのも、見た目維持しつつVRAM帯域の削減を目的としたものだったのだけど、
結局シェーダが食ったり吐いたりするデータ量が際限無く増えるハメになっちゃってる
全然プロシージャルな脳ミソになれてないんだよなーゲームプログラマどもが
それに付き合い続けちゃってるVGAメーカーとMS…

288 ：Socket774：2009/10/15(木) 23:12:22 ID:srancKAX

VRAM帯域の増減が、あまりにもリニアでクリティカルにゲームの
FPS増減に直結する現状は本当に嘆かわしい

289 ：,,・´∀｀・,,）っ-○○○：2009/10/16(金) 00:00:16 ID:I+UKJFoq

GeForceに特化した美麗なグラフィックのFPS出そうとして
結局出て来たのがテクスチャデータだけで十数GBのCrysisという化け物ソフト

結局この流れは不幸なんだよね。
テクスチャ作るのだってコストだし、物量に物言わせた力技で押し切るループから抜け出さないと
まあ、そのために物理演算強化してプロシージャル生成したいとか言ってるわけなんだが。

つーか、専門卒主体の日本のゲームプログラマは高等数学使いこなすような向きじゃないから
どういう風向きになっても余り有利じゃないと思うんだが
DSみたいな限られたスペックで箱庭ゲームを作るのが一番向いてるって話になる。

290 ：Socket774：2009/10/16(金) 00:00:39 ID:tiOsBMJ/

団子さんは本当にLarrabeeが好きなんだな。
俺も以前は期待してたけど、自分の研究でCPUとGPUの実力差が
身に染みてしまって、今ではFermi待ち焦がれ中です。

Larraさんは排熱だけ気をつけてやってください。

291 ：Socket774：2009/10/16(金) 00:01:19 ID:R6+6n6qI

>>261
初代ITANIUMを思い出した

292 ：Socket774：2009/10/16(金) 00:04:21 ID:lVlVKAJY

Merced、口に出すだけでも嬉しかったあの頃。

293 ：,,・´∀｀・,,）っ-○○○：2009/10/16(金) 00:12:35 ID:CyybyJRa

>>290
うーん、俺も最初はピーク浮動小数演算性能でもFermiはLarrabeeを超えると思ってたんだけど
白書出てきた時点で無理だとわかった。

x86の命令フォーマットは複数のオペレーションを串刺しでパッキングし
パイプラインで直列実行することを容易にしている。
敢えて言うが、Larrabeeはx86のコード資産のためではなくパフォーマンスのためにx86である必要があるんだよ。

そこらに蔓延るRISC信者に騙されてはいけない。
POWERがどうだ。Core MAに歯が立たなくてIPC重視のPPC970を放棄し、
電力効率かなぐり捨てて高クロックでぶんまわすというNetBurstにも似た暴挙
末期ントッシュだよ。

GeForceのシェーダはネイティブコードがSIMDのRISCベースISAなんだが
命令供給数が2つと決まっててオペレーション数を稼げないのが現実。
この辺が実効性能で更にLarrabeeに負けると断言する理由
机上シミュレーションはやってみてる

あー、汎用演算じゃなくてGPUのほうのスペックとしてはどうかはわからんよ。
パラダイムそのものが変わらない限りGPUとしてはRadeon１択じゃないの

294 ：Socket774：2009/10/16(金) 00:23:49 ID:EeDbhu6x

そのパラダイムを牛耳っているのが、DirectXというAPI
PowerVRは、1も2もこのAPIに蹂躙された
タイルレンダリングには専用のグラAPIがどうしたって必要…ん、嫌な思い出が走馬灯のように

295 ：,,・´∀｀・,,）っ-○○○：2009/10/16(金) 00:23:56 ID:CyybyJRa

Larrabeeも32コアではFermiと同じ512SP相当なんで、単純にクロック出た方が勝つ。

あとさ、>>290
Fermiが予定よりメモリ帯域妥協したのはその辺で天井（300W制限）にぶつかったってことだから
まあ消費電力はLarrabeeより高くなることは覚悟したほうがいいよ。

296 ：,,・´∀｀・,,）っ-○○○：2009/10/16(金) 00:31:45 ID:CyybyJRa

何度も蹂躙されることを恐れずにパラダイムシフトが起きるまで投資し続けられるだけの
体力がある企業なんて現実的にはIntelしかないんじゃないの？

んでIntelは実際具体的に何やってるかというと、並列化支援ライブラリ開発してる企業を買収しまくってるようだが。
有名どころだとRapidMindとか

297 ：Socket774：2009/10/16(金) 00:34:10 ID:7OF5t5B7

>>294
実質的にDirectXは主導権握った会社が仕様を決定する感じだしな。

298 ：,,・´∀｀・,,）っ-○○○：2009/10/16(金) 00:39:42 ID:CyybyJRa

9.0cあたりまではNV主導で動いてきた気がする

Xbox360での採用を機に10.1あたりでからATI主導
というよりNVIDIAがついてきてない

299 ：,,・´∀｀・,,）っ-○○○：2009/10/16(金) 00:57:45 ID:CyybyJRa

まあLarrabeeを「強制的に」普及させればAPI戦争も勝機はあるんじゃね。
それがIntelに可能なのはGMAが証明している。

そこそこのサイズにカットダウンしてCPUに統合する。
実際出来るようになるのがHaswell世代以降なんだろうけど

300 ：Socket774：2009/10/16(金) 01:15:07 ID:QvOEXJtn

もしLarrabeeをDXの想定する標準ハードウェアにするなら、
DirectX 9から10よりも大きな不連続は間違いないし、
nvもATIも付いてこないだろうから実質LRB専用APIになるだろう。
NSPの二の舞にならなければいいけどね。

301 ：,,・´∀｀・,,）っ-○○○：2009/10/16(金) 01:19:13 ID:CyybyJRa

「IntelのSIMD拡張」という連続性がある。
1024ビットのSIMDまで想定したフレキシブルなレジスタ待避命令（XSAVE）を導入してるから
Windows7以降はMSの都合関係なしにIntelの都合でどうにでもSIMD拡張できる

302 ：Socket774：2009/10/16(金) 01:21:07 ID:CgwQBJwN

DirectXがだんだかハードウェアを抽象化する方向性にきてるから
ATi、nV主導のAPIでもLarrabeeが生かせるようになったりしないのかな

303 ：,,・´∀｀・,,）っ-○○○：2009/10/16(金) 01:23:33 ID:CyybyJRa

共通フレームワークと言っても各アーキテクチャ向け最適化はなんだかんだで個別対応だからな
NVIDIAはゲームデベロッパーにあまり開発支援しなくなった
ATIが埋め合わせる形で支援して人気伸ばしてる。

ゲーム性能を欲するユーザーがついてきてないのにGPGPUにかまけてたNVIDIAの自業自得

304 ：,,・´∀｀・,,）っ-○○○：2009/10/16(金) 01:35:41 ID:CyybyJRa

まあDirectXもVLIWアレイプロセッサとSIMD型RISCプロセッサで同じように動く程度には抽象化されてる。
グラフィックパイプラインはあくまで抽象化されたもので、ステージ間のデータの受け渡し方すら
定義されていない。

極論Larrabeeの場合ジオメトリシェーディング→ラスタライズ→ピクセルシェーディングの処理を
同じ命令ストリームで同じレジスタ使って連続でやってもいいわけ。

NVIDIAの1ゲーム1ドライバみたいな馬鹿馬鹿しい開発サポートがありならIntelは何でもありだな

305 ：Socket774：2009/10/16(金) 01:48:50 ID:EeDbhu6x

最終的に同一の画像がレンダリングされている、それが担保されていれば良い
描画途中のステート、バッファ等は一切ユーザープログラムから参照不可

そういう完全抽象化3DAPIが理想なのにね
ハード側のアーキがAPIに縛られすぎてつまらんわ

306 ：,,・´∀｀・,,）っ-○○○：2009/10/16(金) 02:16:08 ID:CyybyJRa

っていうかね
DirectXそのものは基本的なAPIのみで、それでいきなりゲーム作り始めるデベロッパーは
今時あんまりいないでしょ
1枚か2枚か噛ませたゲームエンジンをベースに作るでしょ。
PS3とかMacとかの非DirectX環境でも動くようにしようと思えばそうするでしょ。

結局ゲームエンジン屋に対し、Larrabeeでの動作時にDirectXと並行して
Larrabeeネイティブ命令を旨く使ってくれるように支援することが大事なのでは？
まあ固定機能に縛られずにエンジン書きたい開発者の心をがっちり掴むことだね。

307 ：Socket774：2009/10/16(金) 02:20:58 ID:Uq0bRsJn

で、来年中には出るのか？

308 ：Socket774：2009/10/16(金) 05:26:55 ID:oxPYdkr/

なんでAPIとしてDirectXに拘るのかわからん。
OpenGLでいいだろうに。

309 ：Socket774：2009/10/16(金) 10:46:01 ID:zE/a6yWW

ATIとNVIDIAで別々に拡張して互換性がないから。

310 ：Socket774：2009/10/16(金) 10:47:52 ID:salnxbbH

IPPの拡張とかでごまかすんじゃね？グラフィックも含めて。

311 ：Socket774：2009/10/16(金) 11:03:27 ID:OPllrNtm

将来OpenCLがOpenGLを包含するとか言ってるけど、
ちょっと無理なのでは？

DirectX compute shaderは制限の緩和されたPixel Shaderのような設計で、
Direct3Dに良くなじんでいる。逆に言うとサーバ環境では使えないとか
Direct3Dの基礎知識無いとマニュアル読んでもちんぷんかんぷんだとか
制限はあるけど、主にデスクトップのグラフィック加工用（第二Pixel Shader）
として割り切ってる。何というか、方向性が違うから対立するものじゃないし
ゲーム用途ならDirect3Dでいいじゃん、と思う。

312 ：Socket774：2009/10/16(金) 12:30:37 ID:zE/a6yWW

「Windows限定」ならな
ハードに縛られるかOSに縛られるかで、結局画一的な方法がないんだよ

313 ：Socket774：2009/10/16(金) 14:56:23 ID:BidBOZx+

ttp://pc.watch.impress.co.jp/docs/news/20091016_322120.html
開発コードネーム“Larrabee”(ララビー)で開発を進めているディスクリートGPUについて触れ
日本時間の17日に、Larrabeeの性能データを初めて公開することを明らかにした。

314 ：Socket774：2009/10/16(金) 15:08:02 ID:mmKeAftf

>>313
スライドにあるtexture logic じゃないfixed function て中身まだ不明？

315 ：Socket774：2009/10/16(金) 15:10:47 ID:hlVVOAN6

よっしあああああFerimi脂肪おおおおおおおおおおおおおおお！！！

316 ：Socket774：2009/10/16(金) 15:28:54 ID:zE/a6yWW

レガシーGPU機能を捨てられないまま中途半端にHPCに振ったNVIDIAと
そもそもGPU機能に関してしがらみが無いので汎用に振ったIntel

317 ：Socket774：2009/10/16(金) 16:10:10 ID:go1RpYLW

性能データってなによ？

318 ：Socket774：2009/10/16(金) 16:19:13 ID:hOPYDxtg

Intelが米国のメイヨー病院と共同で開発したメディカル用のアプリケーションを利用したLarrabeeの性能データ、
とあるからCTスキャンのボクセルデータじゃないかな。

319 ：Socket774：2009/10/16(金) 16:31:24 ID:gRUMmml9

フーリエ解析？FFT勝負？

320 ：Socket774：2009/10/16(金) 20:20:27 ID:XAPrst5S

Larrabeeは、”GPU”ではない。
インテルは、新しい概念の呼称を与えるべきだ。
名付けることによって、新たな製品カテゴリーが明確化される。

321 ：Socket774：2009/10/16(金) 20:35:48 ID:qu4HfCgh

明日！wktk！！！

322 ：Socket774：2009/10/16(金) 20:41:37 ID:/4yguRUj

fixed function=固定機能

＞レガシーGPU機能を捨てられないまま中途半端にHPCに振ったNVIDIAと
＞そもそもGPU機能に関してしがらみが無いので汎用に振ったIntel

？？

323 ：Socket774：2009/10/16(金) 20:53:03 ID:zE/a6yWW

>>322
fixed functionどこ？どれだけ食ってる？
http://www.pcgameshardware.com/&menu=browser&mode=article&image_id=1127811&article_id=695022&page=1

324 ：Socket774：2009/10/16(金) 21:06:51 ID:/4yguRUj

さぁｗ

325 ：Socket774：2009/10/16(金) 21:12:44 ID:dOPzGs71

CPUのノウハウがないNVIDIAがGP路線を突き進めたところでカスしか生み出されないな

326 ：Socket774：2009/10/16(金) 21:27:00 ID:zE/a6yWW

>>324
後藤の記事くらい最低限読んでくれ。
GPU固有の固定機能なんてテクスチャユニットくらいしかないのは既報。
http://pc.watch.impress.co.jp/docs/2008/0804/kaigai457.htm

327 ：Socket774：2009/10/16(金) 21:47:09 ID:/4yguRUj

だからそのテクスチャユニット以外に固定機能が在る絵になってるんだろ
上のプレゼンはよｗ

328 ：Socket774：2009/10/16(金) 21:52:22 ID:zE/a6yWW

Power Control Unit

329 ：Socket774：2009/10/16(金) 21:54:22 ID:/4yguRUj

ｗ
あなたこそ、誤答記事をよく読んだら良いんじゃない

Larrabeeパイプラインの最大の特徴は、固定ハードウェア(Fixed Function Hardware)をできる限り排除し、
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　^^^^^^^^^^^^^^^^^
ほぼフルプログラマブルなプロセッサを作り上げたことだ
^^^^^

330 ：Socket774：2009/10/16(金) 21:55:02 ID:zE/a6yWW

GPU特有の固定機能がTMU以外にあるなんて誰も言ってない

331 ：Socket774：2009/10/16(金) 21:57:58 ID:/4yguRUj

ｗｗｗ

332 ：Socket774：2009/10/16(金) 21:59:00 ID:zE/a6yWW

各コア組み込みのStructure Converterも従来x86にはない
ある意味ではGPUのための固定機能だしな

333 ：Socket774：2009/10/16(金) 22:00:41 ID:/4yguRUj

へーｗ

334 ：Socket774：2009/10/16(金) 22:02:52 ID:zE/a6yWW

電力管理ユニットはfixed functionですか？
バナナはおやつですか？

335 ：Socket774：2009/10/16(金) 22:08:47 ID:zE/a6yWW

固定機能に依存してるかどうかはあるなしじゃなくて
どれだけの割合食ってるかの程度問題だ。

http://i40.tinypic.com/20iv3oj.png
http://www.geeks3d.com/20080912/nvidias-gt200-inside-a-parallel-processor/

336 ：Socket774：2009/10/16(金) 23:48:47 ID:41Jp3xPJ

>>313
GTX280じゃなくてTeslaと比較すればいいのに

337 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 00:53:27 ID:6Eq7iFe7

Teslaって逆に固定機能ユニットが死んだダイの再利用なんじゃないかと思えてきた

338 ：Socket774：2009/10/17(土) 05:51:41 ID:O2JSA3LO

larrabeeに固定機能はない！！ｗ

339 ：Socket774：2009/10/17(土) 06:23:51 ID:duVcaP5F

>>314
LarrabeeのFixed Function LogicはTexture Filter LogicだけだとSIGGRAPH2008の論文に書いてある
そのスライドは2006年辺りから使いまわしてるから、当時はHD decoderとかも検討してたのかもな～

340 ：Socket774：2009/10/17(土) 06:37:49 ID:WOYbKCgb

約束の朝が来たというのに公表はまだなのか

341 ：Socket774：2009/10/17(土) 07:33:31 ID:WOYbKCgb

Innovation@Intel
ttp://www.intel.com/pressroom/innovation/innovation.htm#101609a
ttp://techresearch.intel.com/UserFiles/en-us/File/terascale/Mayo_IEEE_VIS2009_FINAL.PDF

342 ：Socket774：2009/10/17(土) 07:51:06 ID:5sBlP9Av

64coreとな

343 ：Socket774：2009/10/17(土) 08:58:08 ID:b1GwOcaa

>>341
・まだシミュレーターでの見積もり　ただしcycle　accurateなので大嘘ではないかも
・転送がボトルネック。両側で圧縮展開すればはやい、と主張
・そもそもLarrabee向きアルゴリズムの提案とセット。
　HPCでの頻出するよく知られた課題のテストは避けている？

344 ：Socket774：2009/10/17(土) 09:02:49 ID:Y1cDNSPU

GTX280と余り変わらないってどういう事？

345 ：Socket774：2009/10/17(土) 09:10:32 ID:duVcaP5F

ほぼCONCLUSIONSだけ読んだ
・Larrabeeのパフォーマンスは高精度のシミュレーターによるもの。
・動作クロックは1GHzで16, 32, 64コアでシミュレーションしている。
・16コア@1GHzのLarrabeeでGTX 280より平均1.5倍速く、シングルコアのHarpertownの10倍速い。
・32コアと64コアではCPU-Larrabee間でのデータ転送がボトルネックになる。
　もし、このデータ転送のコストが0ならば32コアでは(CPUの)24倍速くなり、64コアでは42倍速くなる。
・しかしこのボトルネックを放置すると32コアでも64コアでも11倍しか速くならない。
・この問題を解決するためにデータセットを可逆圧縮するSIMDと親和性の高いアルゴリズムを実装した。
　これによってデータを三分の一以下に圧縮できる。また、解凍のオーバーヘッドも30パーセント未満である。
・データセットの圧縮によって転送に要する時間を平均して20-30パーセントに削減した。
・それによって、32コアでは19倍性能が向上、64コアでは31倍性能が向上するという実験結果が得られた。

346 ：Socket774：2009/10/17(土) 09:15:39 ID:duVcaP5F

>16コア@1GHzのLarrabeeでGTX 280より平均1.5倍速く～
ちょっと正確じゃなかった。正しくはこう。
16コア@1GHzのLarrabeeは理論演算性能がGTX 280の半分だが、それでもGTX 280より平均1.5倍速く～

347 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 11:10:05 ID:6Eq7iFe7

> ・この問題を解決するためにデータセットを可逆圧縮するSIMDと親和性の高いアルゴリズムを実装した。
>　これによってデータを三分の一以下に圧縮できる。また、解凍のオーバーヘッドも30パーセント未満である。

まさかのgzip転送・・・
どこのUNIX板コピペだよって思ったけど、割とSIMDと相性良いんだね

348 ：Socket774：2009/10/17(土) 11:18:28 ID:0hnLYEkE

>>251
この中に入っていたのはgeforceなんです。本当にごめんなさい。
http://www.4gamer.net/games/049/G004963/20090923003/screenshot.html?num=002

349 ：Socket774：2009/10/17(土) 11:21:23 ID:6Td23772

>algolithm ZLIB

ほんとだGZIP転送だw

350 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 11:26:34 ID:6Eq7iFe7

「ｳﾘのFermiにもgzipデコード専用ロジックを搭載するﾆﾀﾞ！」

351 ：Socket774：2009/10/17(土) 11:26:43 ID:aImjh/H4

GZIPは画像データの圧縮に使ってるみたいだな
ロスレスJPEGとの比較に言及してるから

352 ：Socket774：2009/10/17(土) 11:28:38 ID:Nc3cn+o5

>>350

604 ：Socket774 [sage] ：2009/10/15(木) 15:27:58 ID:fjojjPvn
東洋人の顔が全部韓国人に見える病気か・・・カワイソウに・・・
ジェン・スン・フアンは台湾出身なのに。

353 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 11:31:31 ID:6Eq7iFe7

>>352
ごめん社長はどうでもいいんだ
俺脳内用語でNVIDIAの短縮形がNIDA

354 ：Socket774：2009/10/17(土) 11:32:02 ID:jv2XHVsD

>>348
元気出せよ、ほらまだ自慢のFなんとかが今年中に出るんだろ？
ララビなんか蹴散らせるって！

355 ：Socket774：2009/10/17(土) 11:33:26 ID:IWmZa7BP

>>349
ってことはデータセット転送部分はGPLかｗ

356 ：Socket774：2009/10/17(土) 11:36:39 ID:fFan8dX6

よく読むと

私達の圧縮アルゴリズムを一般的に使われるZLIBと比べると…

って書いてあるから、ZLIBはあくまでも比較対照じゃね？

357 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 11:38:33 ID:6Eq7iFe7

>>355
んなこたない。MSがPNG使えなくなるじゃん。
zlibはzlib licenceという比較的緩いオープンソースライセンス

358 ：Socket774：2009/10/17(土) 11:41:23 ID:fFan8dX6

やっぱり「俺らの圧縮アルゴリズムはZLIBよりSIMDと親和性が高くていいぜ」
って話になってるな。どんなアルゴリズムか知らんが。

359 ：Socket774：2009/10/17(土) 11:42:45 ID:fFan8dX6

固定長の圧縮アルゴリズムとしか分からん

360 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 11:43:54 ID:6Eq7iFe7

まあSIMD特化のDeflate実装と思われるんだが
GPGPUにおいてPCIeがボトルネックってずっと前から言われてたことだし。
これのポータブルな実装作ったら流行るんじゃね？

まあRadeonだのGeForceだののシェーダがx86そのものなLarrabeeほどの柔軟性があるとは思えんが

361 ：Socket774：2009/10/17(土) 11:49:14 ID:/yh5obMr

うんうん、柔軟性が大事だから
Nehalem－SandyBridge－IvyBridge－Haswell－ソフランS
使うことにするわ

362 ：Socket774：2009/10/17(土) 17:03:34 ID:b1GwOcaa

シミュレーターがあるのに、GPUとしての性能も公開しないし、
HPC分野でよくある課題の処理能力も公開しない。
そういうものから逃げてるように見えて印象はよくないのう、今の所は

363 ：Socket774：2009/10/17(土) 17:08:28 ID:zjj6bCSF

もうそういうところにしか希望が見出せないのかな？
今回のはコマーシャルペーパーではないよ。
それに医療向けは長年狙ってきた分野。

364 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 17:24:22 ID:6Eq7iFe7

今回のは商業イベントではなくIEEEという権威ある学会だからね。
1年以上仕込んだ「研究論文」だ。

365 ：Socket774：2009/10/17(土) 17:29:09 ID:b1GwOcaa

>341の内容はIntelの内輪以外が追試可能なのかな
不能だとしたらそれは学術論文とは言えなんだが

366 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 17:39:04 ID:6Eq7iFe7

「僕の考えた最強のCPU」の性能評価系の論文はいくつか読んだことがあるが
シミュレータのソースが公開されてるものは見たことがない

まあ、圧縮アルゴリズムにしても、商品として売れる物をみすみす無償公開するとは思えんが。

367 ：Socket774：2009/10/17(土) 17:39:56 ID:zjj6bCSF

電書鳩飛ばして聞いてみろよ。

368 ：Socket774：2009/10/17(土) 17:41:55 ID:HmIEqDgp

601 ：,,・´∀｀・,,）っ-●◎○ [sage] ：2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeのサンプルはDreamworksで評価されてるようだが

369 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 17:42:38 ID:6Eq7iFe7

そうだよ。サンプル的なサイクルアキュレートシミュレータだよ。

370 ：Socket774：2009/10/17(土) 17:55:06 ID:b1GwOcaa

今すぐには無理でもいずれ検証できればいいという基準で査読通してるのかね。
まあ査読者の編成にも営利企業の人間が多数いるだろうし
自分の側が投稿する時のことを考えたら
検証不能なpaperは通さないなんて厳格な態度は取れないのかもね

371 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 17:55:19 ID:6Eq7iFe7

サンプル＝物理的なダイとか浅はかな思い込みだな。
物理的なダイがないとソフト開発できないなんてのはまともなシミュレータが貰えない弱小ベンダーの詭弁

んで、LRB SDKっていわれるものは機密保持契約を結んだゲームエンジン屋やレンダラ屋に先行評価版が
提供されているのは2008年時点の話。

まあ例の「アレ」はちょっとライセンス緩いから俺でもアクセスできるわけだが
Core MAみたいなアウトオブオーダなCPUまで正確に所要サイクル吐き出すからびっくりする

372 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 17:58:54 ID:6Eq7iFe7

>>370
NVIDIAの役員がスタンフォードの教授という立場利用してLarrabeeの悪口言うくらいだから始末に困る。

アメリカには科学研究費補助金みたいな制度がないから原則企業の都合で成り立ってる。
アメリカの学会に日本ほどのクリーンさはない。

373 ：Socket774：2009/10/17(土) 17:59:46 ID:qJ54lz9o

ム板からきますた
NVIDIA終了記念パピコ

374 ：Socket774：2009/10/17(土) 18:45:39 ID:hMO9u+9p

サンプルシリコンはよく聞くけど、サンプルシミュレータなんて一般的じゃないな

375 ：Socket774：2009/10/17(土) 18:49:11 ID:1ssiCl8q

Larrabee？中止でしょ

376 ：Socket774：2009/10/17(土) 18:54:16 ID:t9PSPMbn

今日発表のデータって出てる？？
あっちはまだ16日だったりする？？？

377 ：Socket774：2009/10/17(土) 19:02:56 ID:V7sQukyE

出てるけどインテル必死だなｗｗｗｗ
しか書いてない。

378 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 19:03:06 ID:6Eq7iFe7

>>374
狭い了見ですな

379 ：Socket774：2009/10/17(土) 19:09:44 ID:t9PSPMbn

>>377
なんじゃそりゃ～！！
和訳でるなら見たいとこだな。

380 ：Socket774：2009/10/17(土) 20:07:39 ID:/PDYkEpi

なまえを C'est la vieに変えちまえ～

381 ：Socket774：2009/10/17(土) 21:04:46 ID:D5brKARu

シミュレーターのベンチ結果ってハードウェアが理想通りの動作をした場合の値なんでしょ？
現在それが出来るサンプルハードウェアは存在するのですかね。
まあ、しないからシミュレーターなんでしょうけど。

なんだかNvidiaとIntelが「僕が考えた最強のプロセッサー」対決をしているだけにみえるのは気のせいかな。
何時になったら実機を使ったデモやベンチマークが出てくるんだろうか。

382 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 21:06:59 ID:6Eq7iFe7

Intelのはキャッシュミスやページフォルトまでシミュレーションできるぞ

383 ：Socket774：2009/10/17(土) 21:57:03 ID:Y1cDNSPU

完全にシミュレートできるなら、どの製品でもバグは無いんじゃないかな
だからシミュレートなんだよね

384 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 22:15:42 ID:6Eq7iFe7

シミュレートを否定したらGPGPUの使い道が（ｒｙ

385 ：Socket774：2009/10/17(土) 23:08:53 ID:5sBlP9Av

曲がりなりにもIDFでデモをしたのに性能評価は実測じゃなくシミュレートっていうのが残念な感じ
現状のサンプルじゃまともな評価も出来んってことでしょ

386 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 23:24:57 ID:6Eq7iFe7

んあ？
圧縮アルゴリズムの開発から1週間や2週間で書けるレベルの論文だとでも思ってるのか？

というより常識的に考えれば論文はIDFより前に提出してる
まず査読があって、通ったものが大々的に発表される

そもそも今回の論文の意図する所はなんだと思う
圧縮フォーマットの動的展開は効率が悪いと思われてるが帯域をセーブする上で有用であることが示された。
これは、x86の複雑だが命令密度の高い命令セットの底力に対するアナグラムにもなっている。

387 ：Socket774：2009/10/17(土) 23:26:15 ID:b1GwOcaa

日付から考えてIEEE VisWeek 2009 のプレゼンターの原稿締め切りは
IDFより前なんじゃないの

388 ：Socket774：2009/10/17(土) 23:27:10 ID:iRbpjrqw

アナグラムって　あん時の匂い → アントニオ猪木
みたいなやつか？

389 ：Socket774：2009/10/17(土) 23:30:15 ID:/PDYkEpi

アナロジー言いたかったちゃうん？

390 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 23:31:25 ID:6Eq7iFe7

そうとも言う（ｷﾘｯ

391 ：Socket774：2009/10/17(土) 23:32:05 ID:Y1cDNSPU

>>384
えｗ

392 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 23:33:44 ID:6Eq7iFe7

だってさ、HPCの用途ってシミュレーションばっかだぞ

393 ：Socket774：2009/10/17(土) 23:43:15 ID:5sBlP9Av

ウェハが公開されたのが4月だから9月のデモがファーストシリコンってわけじゃないだろ
時間が無いと言うことはない

それでも実働チップが使えないんだからバグが多すぎたか
あるいは噂にあるように多少の設計変更が行われたか
少なくとも順調では無いように見えるね

394 ：Socket774：2009/10/17(土) 23:43:56 ID:Y1cDNSPU

ハードウェアをシミュレートして、ベンチマークをシミュレートするか・・・ｗ

395 ：Socket774：2009/10/17(土) 23:46:14 ID:OIDRM4wX

Dreamworksとやらには大金払って評価してもらってるのか？
顧客がシミュレーターで評価とかやらんような気がする。

396 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 23:46:23 ID:6Eq7iFe7

まあL2キャッシュのチューンなんかは最後まで解らんね
それでも多くとも±1割以内には誤差を抑えてくるのがプロだが

というか今回の結果は誤差を補正して覆せるレベルの差じゃないことくらいわかるだろう

397 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 23:49:07 ID:6Eq7iFe7

>>395
もともとOpteronクラスタでCG作ってた会社だけどクソさ加減に失望してIntelに乗り換えた。
以降IntelはここのCG映画のスポンサーでエンジン開発の技術協力もしてる

398 ：Socket774：2009/10/17(土) 23:52:14 ID:OIDRM4wX

>>397
なるほどデータセンター一棟、ビルワンフロア、開発人員さらに大金ぐらい出してるのか。

399 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 23:54:09 ID:6Eq7iFe7

>>398
さあどうだか
http://www.facebook.jp/note.php?note_id=135678442067

400 ：,,・´∀｀・,,）っ-○○○：2009/10/17(土) 23:59:06 ID:6Eq7iFe7

IntelはCore MAも含めてCPUのシミュレータを作ってる
てかVTuneの技術転用だからお手の物だが。
中の人に「Larrabeeスゲー」と言わしめたのも
そもそもIntelのシミュレータの精度の高さの実績があってこそのもの

つーか実物が出荷されるまでソフト開発が出来ないなんてのは
競合他社に遅れを取ることになるから
開発ツールとシミュレータの先行配布なんてのは親密なパートナーなら当たり前

401 ：Socket774：2009/10/17(土) 23:59:44 ID:tSXH96B2

>>397
Pen4とかC2Dのころから？

402 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 00:05:21 ID:ug3wQg4J

>>401
たしか45nmのHarpertownの頃。
レイトレはSIMD性能とキャッシュ容量がきくからね。
あの頃から大きく引き離してたでしょ。

403 ：Socket774：2009/10/18(日) 00:06:54 ID:Y1cDNSPU

親密なパートナー・・・
今回特定のパートナーだけでなく、公の場にベンチ性能を出したのが全部ハードも含めシミュレートだった

404 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 00:12:21 ID:ug3wQg4J

NVIDIAは粗雑な作りのモックアップを出すことで株価にどう影響するかの経営シミュレートが必要だな

405 ：Socket774：2009/10/18(日) 00:13:34 ID:AZzDWBph

Intel 740みたいにならんことを祈るばかり(-人-)　

406 ：Socket774：2009/10/18(日) 00:21:27 ID:noR9Po30

Larrabeeは単純なメニーコアとしても使えるんだろうし
FusionとかFermiはCellの二の舞になるかな

407 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 00:25:27 ID:ug3wQg4J

Intelとてあんまり性能良いのを安く出してXeonの6コアとか8コアを注目しなくなったらそれはそれで
経営戦略ミスなわけだが。

408 ：Socket774：2009/10/18(日) 00:32:22 ID:dF0SJZE2

>>406
そりゃ無理だわいまさらPen3クラスのコアとかｗ
しかもSIMDユニットに互換性無いだろ。
演算性能でfermi圧倒してGPU性能で僅差まで詰めないとポシャるがな。

409 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 00:33:37 ID:ug3wQg4J

＞そりゃ無理だわいまさらPen3クラスのコアとかｗ
はいダウト

410 ：Socket774：2009/10/18(日) 00:35:15 ID:dF0SJZE2

>>409
pen4クラスでも同じコア増やしても効率が下がり続けるだけ。
LNBを含めて成功しないと意味なし。

411 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 00:36:46 ID:ug3wQg4J

はい、妄想もう一つ入りました

412 ：Socket774：2009/10/18(日) 00:37:49 ID:dF0SJZE2

じゃあpen3 500コアのCPU発売していてくださいね。

413 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 00:42:28 ID:ug3wQg4J

初代「Pentium」のパイプラインが土台なんだがｗｗｗ
わずか550万トランジスタで当時ウン百万のRISCマシンの性能に迫った傑作

414 ：Socket774：2009/10/18(日) 00:43:09 ID:noR9Po30

個人的興味はエンコ一択
GPGPUやSpursは質が悪いから
intelは基本買わんことにしてるが
もし速度もワットパフォも二倍とか言われたらさすがに
買わざるを得んわ

415 ：Socket774：2009/10/18(日) 00:43:39 ID:dF0SJZE2

>>413
ああそうだったねインオーダーだね。単なる勘違い。

416 ：Socket774：2009/10/18(日) 00:44:53 ID:dF0SJZE2

CPUは３年前から３年後まで進化なし頭打ち。
2012年にDual GPU cardPCの割合が50%。
2015年 nvidia GPU は5000SPへ
さあどうなるか

417 ：Socket774：2009/10/18(日) 00:45:48 ID:AZzDWBph

そんなあからさまに話題逸らさなくていいですよ(-人-)

418 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 00:45:53 ID:ug3wQg4J

500mm²使ってもシェーダ部分の面積は1/3とかそんなん（←CUDAとして使えるのはあくまでこの部分）
これでピーク性能ならまだしも実効性能で勝とうなど甘い

419 ：Socket774：2009/10/18(日) 00:47:19 ID:dF0SJZE2

>>418
ROPの部分ぐらいしか違いはないでしょ。
ROPはコア面積の１割程度っぽいが。

420 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 00:48:13 ID:ug3wQg4J

失礼、550万はPentium Proだな
P54Cは310万

421 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 00:50:58 ID:ug3wQg4J

>>419
GT200だが
http://www.anandtech.com/video/showdoc.aspx?i=3341&p=8

GPGPUとして使えないブロックが多すぎだろ

422 ：Socket774：2009/10/18(日) 00:52:10 ID:dF0SJZE2

ビット演算もハードウェアで積んでるし
インテルが論文で出したようなことは既に解決済みのにほい。

423 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 00:54:22 ID:ug3wQg4J

> ビット演算もハードウェアで積んでるし
AND NOT OR XORならG80時代からあったぞ馬鹿め

424 ：Socket774：2009/10/18(日) 00:55:00 ID:dF0SJZE2

>>421
テクスチャユニットはララビもあるでしょ。
ララビもL2で埋め尽くされ点じゃないですか。

425 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 00:57:50 ID:ug3wQg4J

L2は有用だろ。VRAMに何度も読んで書いてやるのはトラフィックと電力の無駄
特に汎用演算においてはな

426 ：Socket774：2009/10/18(日) 01:05:51 ID:dF0SJZE2

スループットコンピューティングと逆の考えですな。
過去の遺産にトランジスタと大量に裂くのはどうなんですかな。

まあL2の話を除いてもGPUとして使う以上ROP以外はnvidiaとかわらんしょ。

427 ：Socket774：2009/10/18(日) 01:10:16 ID:dF0SJZE2

>>423
マスクじゃなくてね追加されてるから調べてみてね。

428 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 01:15:31 ID:ug3wQg4J

は？
グローバルメモリの帯域増加はピン増加とともに消費電力の増加に直結し性能向上の阻害要因になりつつあるから
ローカルメモリを増やして伝送コストを削減しするのが今のスループットコンピューティングのトレンドだぞ。
NVIDIA自身のトップが言ってるんだ。
しかし理想とは裏腹にFermiにいたってもVRAM帯域依存の時代遅れのアーキで頑張ってるわけだが。
GPUのしがらみで汎用コンピューティング性能向上が阻害されてるんだよ

それともx86デコーダのことか？
最近はx86のフォーマットは命令の密度が高いベターVLIWとして見直されてるのに
未だにクソだクソとわめき散らすアホがいる。
Larrabee用に更にアドレッシングモードを強化され命令密度を更に増している。

429 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 01:17:01 ID:ug3wQg4J

>>427
まさか要素毎プレディケートのこと言ってるのか？

なんつーか、何でそんな今更・・・

430 ：Socket774：2009/10/18(日) 01:17:24 ID:uLhRZ3D2

今までのスループットコンピューティングが、10のトランジスタで10の性能を目指しすぎたんだよ
10のトランジスタで5の性能、と妥協すれば用途が格段に広がるとIntelは考えた

431 ：Socket774：2009/10/18(日) 01:17:38 ID:8n12R55c

Cellの逆襲がはじまｒ・・・・

432 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 01:19:48 ID:ug3wQg4J

>>431
だんごやさんがわかもとぼいすで暴れるぞ
ぶるぁぁぁぁ

433 ：Socket774：2009/10/18(日) 01:26:08 ID:dF0SJZE2

演算性能でfermi圧倒してGPU性能で僅差まで詰めないとポシャる。

あとは双方出てみないとわかんない。larrabeeが駄目っぽいのは何となくわかる。

434 ：Socket774：2009/10/18(日) 01:27:08 ID:uLhRZ3D2

x86をまるごとフィーチャーする事で、将来L1L2キャッシュの容量・レイテンシ・帯域が変更できる
SIMDエンジンの速度・所要クロック数を改良できる
初代のPentiumパイプラインすら設計変更できてしまう
互換性の鬼、Intelらしい思想

435 ：Socket774：2009/10/18(日) 01:28:09 ID:781gUhb1

>>431
逆襲って言うか、7コア以上で一番多数出荷してるのはCellでしょう。
GPUはまだアクセラレーターとしてしか機能させてもらってないから
GPUの方がもっと多コアに相当するとか言わないでね

436 ：Socket774：2009/10/18(日) 01:28:13 ID:txVfGMJS

CellのLSが素晴らしかったかという事だな。

437 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 01:29:40 ID:ug3wQg4J

Fermiが競争力を失うことだけはわかっている。
ただでさえGT200に失望したのにそれより更に輪をかけてクソになってる

438 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 01:30:32 ID:ug3wQg4J

>>435
GT200はSM＝1コアとして見ると30コアだぞ

439 ：Socket774：2009/10/18(日) 01:31:56 ID:S1X3tlQb

メイヨー病院との共同論文か……

これを思い出すなｗ
>ttp://www-03.ibm.com/press/us/en/attachment/23251.wss?fileId=ATTACH_FILE2&fileName=cell-reg.pdf

440 ：Socket774：2009/10/18(日) 01:32:35 ID:uLhRZ3D2

32コアのうち、最初の2コアをネハレンコアに差し替えてL3追加して新CPUできあがり

441 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 01:32:40 ID:ug3wQg4J

>>435
CellはシングルコアPPC＋ダイ組み込みのアクセラレータ8つ（あるいは1つ死亡）
C言語のtime関数すら使えないようなのを勝手にコアにカウントするなよ。

442 ：Socket774：2009/10/18(日) 01:33:44 ID:781gUhb1

将来も絶対無理だと思うが、プロセッサ全数の可動実績統計が
取れたら面白いだろうな。　高速だが買った人に使い切ってもらえてない
CPUとか、遅いんだが酷使されてるCPUとかあるかもしれない

443 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 01:35:01 ID:ug3wQg4J

Turbo Boostみたいな機能がありがたがられること自体、メニーコア路線のアンチテーゼ的だね

444 ：Socket774：2009/10/18(日) 01:35:45 ID:lMGzz80e

CellのSPEは汎用に使うにはISA削りすぎ
GPUに使うにはSIMDがショート過ぎてトランジスタ効率悪過ぎじゃないか？

445 ：Socket774：2009/10/18(日) 01:38:45 ID:mEEmMAm8

SPEを馬鹿にする奴はCELLを知った風になってるだけだ
SPEをメインに書(ry

俺も最初は信じられなかったさ……

446 ：Socket774：2009/10/18(日) 01:45:44 ID:uLhRZ3D2

1命令を演算するのに、コードL1の帯域を4バイト消費する、という冷厳な事実
RISCいじってるといつも気になるこのムダさ

447 ：Socket774：2009/10/18(日) 01:49:05 ID:NI9iQ+pi

SPEってRISC思想を貫き通し過ぎてアドレッシングとか滅茶苦茶弱いんだっけ？
コンパイラを意識してSIMDを4並列に留めたのに、やっぱりハンドコーディングじゃないと
まともな性能出ないとか聞いたけど、実際にいじってる人からするとこの評判は本当なのか？

448 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 01:51:10 ID:ug3wQg4J

スカラ演算もどきをやったらAtom 1.6GHz(HT)＞SPE2個(3.2GHz)なんてことも珍しくないよ

どうせSIMD特化のコアが大量にあってもやることはデータレベル並列向けの処理くらいしかないんだし
スカラ演算ユニットとよりワイドなSIMDユニットのっけたほうが実用的だとそこで悟った

演算目的ごとにレジスタの種別を分けないことや高クロック路線は
古典的なRISCの教科書どおりのアプローチだがやはり古典は古典だった。
流行らなくなったのは必ず理由がある。
SPEがやったのはバッドノウハウの再試行だったわけだ。

449 ：Socket774：2009/10/18(日) 01:55:37 ID:+w65WwI/

そりゃメイヨ～
http://medgadget.com/archives/2007/04/playstation_3s_cell_chip_to_handle_medical_imaging.html
http://www-03.ibm.com/technology/resources/technology_cell_pdf_IBM_Mayo_Demo.pdf

450 ：Socket774：2009/10/18(日) 02:07:52 ID:5y1gqY5d

>>341 >>345 >>439 >>449
「ちょい前のメインストリームx86プロセッサと比較してウン十倍速いお！」

名誉病院フラグｋｔｋｒ

451 ：Socket774：2009/10/18(日) 02:16:34 ID:uEuM1INR

Larrabeeって1コアあたりL2分込で4000～5000万トランジスタくらいある感じだけど
演算器の大半はベクトルユニット分なのか？

452 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 02:24:44 ID:ug3wQg4J

そこまで大きくはない
まあ演算器で一番面積占めてるのはベクトル関係だろうな。

453 ：Socket774：2009/10/18(日) 02:30:09 ID:dF0SJZE2

LSU半分になったとかいうけどLSU含めたL1&共有メモリまで等速になったのかも知れないな。
今までは3SMまとめで用意してあったのが1SMあたりに変わってるから。
まあとにかく出てみないとわからんな。

454 ：Socket774：2009/10/18(日) 02:32:44 ID:dF0SJZE2

あと整数演算パイプが完全に分離されてるからやはり論文に書いてあったようなことは想定内の可能性は極大だ。

455 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 02:39:40 ID:ug3wQg4J

Larrabeeだと各コア毎に上り下り512bit/clkのデータ読み書きが出来るL1があって
演算のほうも512bit LoadとStoreのdual issue可能

等速だろうと32SPあたり16WayのLSU1基の時点で既に競争力ない

456 ：Socket774：2009/10/18(日) 02:43:20 ID:dF0SJZE2

512bitだったら同じじゃないか。

457 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 02:50:00 ID:ug3wQg4J

同じなわけがないだろ
Fermiの場合2つの命令ストリームに供給しなきゃいけないのに。

458 ：Socket774：2009/10/18(日) 02:54:49 ID:dF0SJZE2

んだな。チョット酒飲んでボケてた。
そこでシェアードメモリのかつようかと。

しかしLSU自体の性能はGT200と変わってない可能性があるということ。

459 ：Socket774：2009/10/18(日) 02:58:11 ID:DviltBq3

なあ、素人質問で悪いがLarrabeeに、もしも、
CellのPPUに相当するような働きの
x86コアを1個くらい乗せたら1チップで完結してしまうのか？

460 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 03:11:38 ID:ug3wQg4J

>>458
だからさー
シェアードメモリからレジスタにデータ移すのに必要なユニットなんだったっけ？

461 ：Socket774：2009/10/18(日) 03:12:09 ID:+N/dmDWr

>>407
なるほどな、その視点があったか
Larrabeeはあまりにも速すぎた可能性がある（あった）と
戦略的に遅らされてるか、あるいは社内で潰し合いになってるのかもしれん

462 ：Socket774：2009/10/18(日) 04:12:26 ID:NILOjX0R

>>385
>>341のpdfを読めばわかるが、この論文は2009年3月31日に書き上げられたものだぞ。
執筆期間は2008年10月～2009年3月あたりだと推測されるからシリコンがあるわけがない。

463 ：Socket774：2009/10/18(日) 04:22:25 ID:pxmideGl

TDP100W位のLarrabee(16コア 2GHz)をCPUソケットに差してWindowsを動かしたら、i7 920より快適になるのか？
WebブラウザやOffice(Word excel)、メディアプレーヤーとかはどうなるんだろう。

464 ：Socket774：2009/10/18(日) 09:24:08 ID:UrCMrncY

>>460
それは謎だな、確かに。
なぜ16×2のSPに対してロードストアユニットが16wayしかないのか。
しかし逆に言えばシミュレーションの結果、
16wayで問題ないと判断されたのではないか？

例えば、レジスタで完結するサイクルもある。
各ワープはアウトオブオーダーに切り替えて実行されるのだから、
片方がロードストアユニットを使っている間は、
もう片方はレジスタで完結するワープに切り替えて実行するとか。

465 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 19:05:57 ID:ug3wQg4J

L/S待ちのワープが溜まっていくだろ。

466 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 19:33:40 ID:ug3wQg4J

SPARCの場合だとLoadの頻度は4命令に1回、Storeはその1/5くらいの割合だっけ
ただSPARCはアドレッシングモードが貧弱なので実質的には

GT300の場合は基本Scatter/Gather操作だから、1サイクルはあくまでベストケースで
同一の512ビットラインに収まってない場合は、最悪16サイクル分かかる（GT200までの仕様）

それとも、16基ってのは文字通り16基なんだろうか？
ものすごい帯域が得られるが。

467 ：Socket774：2009/10/18(日) 19:33:41 ID:IAgXWbG3

俺も変だと思うが、問題ないからそうなってるんじゃないって事。
話にならんくらいパフォーマンスが落ちるなら、そんな設計しないだろう。

468 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 19:41:11 ID:ug3wQg4J

CUDAの性能がどんなもんかは知ってるから
その辺改善してくるとは思えない。
まあGPUとしては同じ値をコピーして使い回すケースが多いから画像処理には十分なんだろうが

根本的にGPGPUのニーズに合わせて設計するって発想がないと思うんだ。
まあ、GPUとしてはそれでいいんだが。

469 ：Socket774：2009/10/18(日) 19:48:07 ID:IAgXWbG3

今回はかなりORNLの要求通りに設計してる気がするのだが
倍精度にしろECCにしろ

470 ：Socket774：2009/10/18(日) 19:52:57 ID:781gUhb1

ORNLと懇意なのかもしれないが、doubleやECCはHPCの本格的な
ユーザーなら誰でも要求する項目だな

471 ：Socket774：2009/10/18(日) 19:56:37 ID:IAgXWbG3

そりゃ"Fermi"の名を偶然とは思うまい

472 ：,,・´∀｀・,,）っ-○○○：2009/10/18(日) 20:05:43 ID:ug3wQg4J

そりゃECCなしなんかはスパコン用としては論外だからね。
TeslaがCellに比べてクソ安かったのはその辺。
ECCサポートしたら容赦なくボるだろ。

それは機能の問題であって性能とは関係ない
というか、GT200は倍精度性能が低い分相対的にはロード・ストアの性能にゆとりが余裕があったわけで
その意味じゃ倍精度の実効性能の向上率は低く留まる可能性がある

LarrabeeでもScatter/Gatherはあるし64バイトラインに収まらない場合はやはり複数サイクル数はかかる
だからこそLoad/Storeはスレッド単位で基本毎サイクル発行出来るようになってるし、
キャッシュコントローラに発行してプリフェッチと同時にキャッシュ上で固めておいて貰うような
命令まで用意されてるわけだが

473 ：Socket774：2009/10/19(月) 00:29:49 ID:p8VEjLZf

LarrabeeってECCつかないんじゃないの？

474 ：,,・´∀｀・,,）っ-○○○：2009/10/19(月) 00:35:45 ID:lG+f+kn0

未だに何コアで何GHｚで出るかも把握してない奴の噂レベルではそうなってるね。

475 ：Socket774：2009/10/19(月) 00:38:57 ID:p8VEjLZf

いやあ、実際、俺は何コアで何GHzかも知らないんだけど、そこんとこどうなの？

476 ：Socket774：2009/10/19(月) 00:40:21 ID:WHENelbL

>>474
ECC版は用意されるらしいが形態は未だ不明だよな？
俺はLGA1567だと推測しているが

477 ：,,・´∀｀・,,）っ-○○○：2009/10/19(月) 00:40:58 ID:lG+f+kn0

なんでIntelから出るレポートのクロックが常に1GHzだと思う？

478 ：Socket774：2009/10/19(月) 00:42:15 ID:DM2fqpf2

どうも思わない

479 ：,,・´∀｀・,,）っ-○○○：2009/10/19(月) 01:00:17 ID:lG+f+kn0

・中の人曰く「パイプラインはAtomより短い」

あと、Nehalemは面積当たりのトランジスタ数がPenrynのほぼ半分だから
Nehalemを物差しにしてトランジスタ数の予想するのは当てにならない。
SRAMや低クロック駆動部位はそれなりにトランジスタ密度は高くなる。

480 ：Socket774：2009/10/19(月) 01:13:48 ID:CWnMOC2L

Intelジャスティン・ラトナーCTO来日会見
http://pc.watch.impress.co.jp/docs/news/20091016_322120.html
>●Larrabeeの性能データは明日土曜日の朝に公開
>なお、同氏よればIntelが米国のメイヨー病院と共同で開発したメディカル用
>のアプリケーションを利用したLarrabeeの性能データを、日本時間の 17日の
>朝に公開することを明らかにした。データはCore i7+NVIDIAのGeForce GTX
>280とLarrabeeとの比較データになっているそうで、初めてLarrabeeの性能
>データが公開されることになる。

これってどこで公開されているの？

481 ：Socket774：2009/10/19(月) 01:15:46 ID:HfdgFfMr

>>341？

482 ：Socket774：2009/10/19(月) 01:21:31 ID:p8VEjLZf

>>479
じゃあ、あんまりクロックあがんないんだ。
2GHzくらいはいくもんだと思ってたよ。

483 ：Socket774：2009/10/19(月) 01:44:22 ID:daKN0x1I

atomはバリバリの高クロックマシンじゃないの
Lrbは4GHｚじゃ動かんくらいなもんだろ
じゃ16ｘ2ｘ2Ghzより8ｘ2ｘ4Ghzのほうが
いいんじゃねという言うのはないのかね

484 ：Socket774：2009/10/19(月) 01:48:27 ID:agB8dYHD

昔の情報じゃ1.7-2.5GHzって流れてたけどな
2GHzは超えるんじゃねーの

485 ：Socket774：2009/10/19(月) 01:57:50 ID:/D/6lE9g

ららびやふぇるみクラスのでっかいチップが2GHｚでうごいたらあつくてしぬ

486 ：Socket774：2009/10/19(月) 01:58:51 ID:CWnMOC2L

熱密度の問題じゃないか？
面積あたりの極所熱の話ね。

487 ：,,・´∀｀・,,）っ-○○○：2009/10/19(月) 02:03:42 ID:lG+f+kn0

>>483
18段パイプラインでクロック上がるような設計に見えるが
意外とクロックマージンがないのがAtomですよ

488 ：,,・´∀｀・,,）っ-○○○：2009/10/19(月) 02:08:11 ID:lG+f+kn0

ここまでやって2.385GHz
http://i4memory.com/f15/msi-wind-u100-meets-ln2-11829/#post100631

Atomは2GHzが事実上の上限でしょ

489 ：Socket774：2009/10/19(月) 02:19:01 ID:n9svXwQN

結局、クロックは、NvidiaのSPとどっこいどっこいか、やや落ちるくらいか。

490 ：Socket774：2009/10/19(月) 02:50:16 ID:IV8a3/xc

次期XboxにATIのGPUが引き続き採用という噂が上がってるけど
Larrabeeの売り込みに失敗したのかな

http://digimaga.net/2008/09/the-rumor-that-intel-begins-in-xbox-720.html
　噂によると、インテルはXbox 720に2009～2010年に製品化される見通しの新しいGPU『Larrabee』を採用してもらうために、
マイクロソフトのご機嫌取りに必死だということだ。

491 ：Socket774：2009/10/19(月) 02:52:20 ID:tQfCOpeq

LarrabeeがGPUを簡単に滅ぼしてしまっては
面白くないので、それはそれで良い

492 ：Socket774：2009/10/19(月) 08:45:05 ID:ROrwZ7lC

んでもIntelなら、やろうと思えば必殺のプロセス技術で
競合を負かすまで大規模化高回転化してくるんじゃない？
一発目はハイエンドと決定してるから、
供給限界の300Wを超えなければ消費電力はあんまり気にしなくていいし。

493 ：Socket774：2009/10/19(月) 11:55:27 ID:S7PjmKPV

現状で実機デモも出来ない完成度なのに無理だろ。

494 ：Socket774：2009/10/19(月) 12:38:40 ID:VE93KYWI

イソテルはクソドライバーしか書けないからGPUは無理よ

495 ：Socket774：2009/10/19(月) 12:40:10 ID:SxRujOWW

>>480
大人の事情で中止ｗ
まあ察してやれ

496 ：Socket774：2009/10/19(月) 12:56:32 ID:MihX92Du

>>490
MSと任天堂のATi組は次世代もATi使うよっていってたと思う
ララビーはもっぱらPS4搭載の噂だった

497 ：Socket774：2009/10/19(月) 13:35:15 ID:CqzLgSH6

任天の次世代携帯機はTegraみたいだけど、据置はどうすんだろね。

498 ：Socket774：2009/10/19(月) 14:09:34 ID:R5nzVCRN

枯れた技術使うからATIじゃないすか

499 ：Socket774：2009/10/19(月) 15:28:29 ID:Z0d3nTly

Larrabeeみたいな初物ゲーム機に使ったらCellの二の舞だろ・・・

500 ：Socket774：2009/10/19(月) 16:29:57 ID:7Ok7RBZG

なんかここインテルの広報みたいなのがいるね

501 ：Socket774：2009/10/19(月) 17:34:33 ID:9AConIlX

AMDの広報は無差別で荒らし回ってるがね

502 ：Socket774：2009/10/19(月) 19:24:15 ID:S7PjmKPV

intelの広報程でもない

503 ：Socket774：2009/10/19(月) 19:55:22 ID:geajUA5T

引き続き「ぼくのかんがえたさいきょうのららびぃ」をお楽しみください。

504 ：Socket774：2009/10/19(月) 21:16:26 ID:BCSNK0Zj

http://www.donanimhaber.com/AMDden_Nvidia_Fermi_atagi_iste_detaylar-16160.htm
ＡＴＩのfudスライドｗ
ttp://resources.vr-zone.com/image_deposit/up2/12558204291df7f95851.jpg

505 ：Socket774：2009/10/19(月) 23:01:12 ID:Og5n40Dg

>>504
具体的なデータによる批判はfudとは言わない
fudは陰湿な宣伝のことを言う

506 ：Socket774：2009/10/19(月) 23:03:13 ID:xlkJE3jW

偏向しまくりなのは確か

507 ：Socket774：2009/10/20(火) 00:17:42 ID:NuDezeTV

ATIも本気でFermiにHD5870で勝てるとは思っていないだろう
HD4800で一定の信頼を得た今だからこそFUDが効く

508 ：Socket774：2009/10/20(火) 01:37:41 ID:rdgAWPcm

それでもOpenCLなら、OpenCLなら何とかしてくれる。。。

509 ：Socket774：2009/10/20(火) 01:41:49 ID:4mWXgtrr

その前にOpenCLの仕様がCUDA寄りなのをなんとかしないと

510 ：,,・´∀｀・,,）っ-○○○：2009/10/20(火) 01:46:52 ID:WF20KXbI

PaperDragonプラットフォームかっけー

511 ：Socket774：2009/10/20(火) 03:51:56 ID:m8tF/wuU

larrabeeのことかｗ

512 ：Socket774：2009/10/20(火) 03:56:13 ID:wxw7SbBF

Dragonと言えばAMD

513 ：Socket774：2009/10/20(火) 04:06:28 ID:m8tF/wuU

5870で2.72笑（tflops）とか1600笑（sp)とかかｗ
5970で5.44笑（tflops）とか3200笑（sp)とかかｗ

うけるだろうなｗ

514 ：Socket774：2009/10/20(火) 04:15:44 ID:F0HYLi5n

larrabeeはROP追加すればGPUとしてかなりマシになると思うんだが
そんな事は検討すらされてないのだろうか？

515 ：Socket774：2009/10/20(火) 04:27:26 ID:m8tF/wuU

ＲＯＰってのはメモリへの出力装置に過ぎんが

516 ：Socket774：2009/10/20(火) 04:36:26 ID:3z+r6Ts2

ポリゴンのラスタライズは？

517 ：Socket774：2009/10/20(火) 04:56:55 ID:m8tF/wuU

理論パイプラインのVSとPSの間に位置する、いわゆるラスタライザユニットがそれだが

こいつだと上に2つ
ttp://www.4gamer.net/games/085/G008506/20091016074/images/block_F.gif

ラスタライザはいまのGPUにとって一番のネックになっているという

518 ：Socket774：2009/10/20(火) 05:52:19 ID:/wwWR19P

固定ハードウェアってやつは、性能がボトルネックになったり大量に遊んだり融通きかん
テクスチャユニットも、各コアに有効な命令追加して外してくれ

519 ：Socket774：2009/10/20(火) 05:56:22 ID:/wwWR19P

まぁ、コア何個か融通してボトルネックになってる固定ハードウェアを
エミュレートして手伝わせりゃ良いのか

520 ：Socket774：2009/10/20(火) 06:17:26 ID:9P8PlTZf

インテルのシミュレーターが優秀すぎるが故に出せない罠にはまってるとみるｗ

521 ：Socket774：2009/10/20(火) 07:00:45 ID:YVZ+5PTm

もう面倒だからエミュレーターをリリースすればいいんじゃね？

522 ：Socket774：2009/10/20(火) 09:02:39 ID:9Qv3ng1E

>>518
コアに有効な命令追加したからあんだけ小さくなったんだろ

523 ：Socket774：2009/10/20(火) 10:16:16 ID:mQCv35gX

ララビー牧場

524 ：Socket774：2009/10/20(火) 10:29:29 ID:9Qv3ng1E

というか圧縮テクスチャ程度ならダイレクトにロード命令で取り出す機能がある。
逆になんで専用ハードウェアがあるのか謎

525 ：Socket774：2009/10/20(火) 10:36:33 ID:9Qv3ng1E

あ・・・固定機能はテクスチャフェッチ専用かも

526 ：Socket774：2009/10/20(火) 11:09:14 ID:Z+pSbbyF

http://www.techarp.com/showarticle.aspx?artno=575&pgno=3

527 ：Socket774：2009/10/20(火) 16:38:48 ID:l8ucWtIn

あれ、Larabeeの性能データどうなったの？

528 ：Socket774：2009/10/20(火) 16:42:32 ID:cQp1ePvf

過去ログ読まない奴って何なの？

529 ：Socket774：2009/10/20(火) 22:06:10 ID:a5kZlAf4

>>528
俺も知りたいんだが、過去ログのどれさ？

全部みたが、性能データなど見当たらないんだが。

530 ：Socket774：2009/10/20(火) 22:10:02 ID:RVm4iFa6

節穴

531 ：Socket774：2009/10/21(水) 00:18:14 ID:fjxqaNAZ

larrabeeの先輩のCellさんの話があったよ。よく聞いておけよ！

http://pc.watch.impress.co.jp/docs/news/event/20091020_322898.html

>とはいえ、PS3のように「それでもSPEを使わざるを得ない」という追い込み
>方をすると、数年でSPE Programmingが普及し始めることもあるわけで、
>環境の作り方次第とも言える

ためになるな～。偉いね～。

532 ：Socket774：2009/10/21(水) 01:28:15 ID:oF8lF193

そしてRadeonが天下を取るのであった。

533 ：Socket774：2009/10/21(水) 01:48:10 ID:CdTnRCol

http://www.fudzilla.com/content/view/16048/1/

534 ：,,・´∀｀・,,）っ-○○○：2009/10/21(水) 02:02:15 ID:pXjOHmBL

>>533
そりゃIntelもAMDも将来的には自社CPUに統合されてディスクリート必要なくなりますよとか言われて
黙ってはいそうですかできるかいな。
それでしか食っていけないのに

535 ：Socket774：2009/10/21(水) 04:52:05 ID:bciarCnU

>>526
ゲームごとにこれだけワークロードが被っているなら
トランジスタ効率の良い固定機能にハードウェア資源を割り振るべきだな

536 ：Socket774：2009/10/21(水) 06:52:57 ID:+257CLMT

>>535
馬鹿乙～

537 ：Socket774：2009/10/21(水) 07:09:42 ID:ZDk44Sh2

40nm現行品と4年前の90nm世代とを比較

944 ：214=884：2009/10/20(火) 21:46:36 ID:aIGOM8X3
>>928
アイドルとゆめりあ実行中のみだけど測ってみた。
ワットチェッカー読み。
構成は>>214

GT220 DDR2(玄人志向 GF-GT220-E512HD) >>884
アイドル時：55W
ゆめりあ時：91W
ゆめりあスコア：27000

7600GT(ELSA GRADIAC 776GT)
アイドル時：58W
ゆめりあ時：89W
ゆめりあスコア：24500

538 ：Socket774：2009/10/21(水) 07:12:22 ID:Z3i57Pyp

ゆめりあで何が測れると思ってるんだか

539 ：Socket774：2009/10/21(水) 07:24:59 ID:XSJho8bQ

Tropics v1.2

【設定】デフォルト＋フルスクリーン
【備考】OC無し全部定格

【VGA】MSI NX7900GS-T2D256E-HD（Geforce7900GS 256MB
　【DirectX9.0】
　・FPS：8.7
　・Scores:220

【VGA】Leadtek WinFast GT220 1024MB DDR3　LP（Geforce GT220
　【DirectX9.0】
　・FPS：26.4
　・Scores：665

540 ：,,・´∀｀・,,）っ-○○○：2009/10/21(水) 07:38:35 ID:pXjOHmBL

>>538
勃起時のながさ

541 ：Socket774：2009/10/21(水) 07:49:18 ID:+257CLMT

団子＝HENTAI
テストに出ます

542 ：Socket774：2009/10/21(水) 11:04:13 ID:m+72l9FM

テクスチャユニットって、DX11の新しいテクスチャ圧縮BC6・BC7とか、対応ちゃんとできてるのか？

543 ：Socket774：2009/10/21(水) 11:58:29 ID:9jNFLX7g

norm,srgb,float16ならx86コアでハードレベルで対応してる。
必要なら1コアくらい展開用にまわしてパイプライン処理すればよいのでは。

544 ：Socket774：2009/10/21(水) 21:16:28 ID:m+72l9FM

？それは不動小数点数圧縮テクスチャ展開してAFで補間してピクセル1個出力してLRBコアに渡す
ってとこまでできないと固定ユニットの意味なんにもないでしょ？
「展開」できなきゃゴミ

545 ：,,・´∀｀・,,）っ-○○○：2009/10/21(水) 21:24:33 ID:pXjOHmBL

「展開」機能はあるってば

546 ：Socket774：2009/10/21(水) 21:45:00 ID:0PNRK4e+

話が噛み合ってなくてワロタ

547 ：,,・´∀｀・,,）っ-○○○：2009/10/21(水) 21:48:25 ID:pXjOHmBL

不動小数点を英訳するとFixed Precision

548 ：,,・´∀｀・,,）っ-○○○：2009/10/21(水) 21:51:06 ID:pXjOHmBL

fixed point orz

549 ：Socket774：2009/10/21(水) 22:14:25 ID:m+72l9FM

すまん浮動小数点ねｗ HDR圧縮テクスチャちゃんと対応してるんなら、問題ないか
あと補間処理も、DX11では相当柔軟性が求められてるけど対応しきれてるんか
Radeonは補間処理を逆に固定ユニットからシェーダ処理に切り替えてるけども

550 ：Socket774：2009/10/22(木) 10:17:45 ID:chCinYxS

bycubicだけあれば。

551 ：,,・´∀｀・,,）っ-○○○：2009/10/22(木) 22:42:20 ID:QfHQkvVn

Intelコンパイラがコード吐けばいいんだから、下手すりゃSPEC登録できるよな。

552 ：,,・´∀｀・,,）っ-○○○：2009/10/22(木) 22:54:23 ID:QfHQkvVn

普通のC/C++やFortranで書いたコードがそのまんま動いて、
自動ベクトル化コンパイラさえあればSIMD化まで自動でやってくれるのがLarrabee
GPGPUらしいプログラミング手法など必要なし。

片や、専用のプログラミング言語をこれから整備しようかとかいうレベルのハードあり。
しかも実効効率では前者優位っぽいぞと。

こうなればストリーミングプロセッサとしてみた場合勝負にならんレベルの差はあるな。
GPUとしてはまあ別だが。

553 ：Socket774：2009/10/23(金) 03:41:57 ID:amFZOc2d

＞Intelジャスティン・ラトナーCTO来日会見
＞http://pc.watch.impress.co.jp/docs/news/20091016_322120.html
＞>●Larrabeeの性能データは明日土曜日の朝に公開
＞>なお、同氏よればIntelが米国のメイヨー病院と共同で開発したメディカル用
＞>のアプリケーションを利用したLarrabeeの性能データを、日本時間の 17日の
＞>朝に公開することを明らかにした。データはCore i7+NVIDIAのGeForce GTX
＞>280とLarrabeeとの比較データになっているそうで、初めてLarrabeeの性能
＞>データが公開されることになる。
＞これってどこで公開されているの？
この答えはどの発言なの？

554 ：,,・´∀｀・,,）っ-○○○：2009/10/23(金) 07:42:09 ID:Ue3qZdbi

文盲か

555 ：Socket774：2009/10/23(金) 19:15:52 ID:amFZOc2d

>>553
そんな反応しなくてもいいんじゃね？性格

556 ：Socket774：2009/10/23(金) 19:45:10 ID:EkdqFPZa

文豪か

557 ：Socket774：2009/10/23(金) 20:23:21 ID:yqSHjrml

fermiの場合2サイクルで1WARPなんだな
てっきり1サイクルかと思ってた

558 ：Socket774：2009/10/24(土) 06:42:20 ID:pemM3G0d

>Core i7+NVIDIAのGeForce GTX 280とLarrabeeとの比較データ
このデータて無いだろ、盲目はオマエだ>>554

559 ：,,・´∀｀・,,）っ-○○○：2009/10/24(土) 11:45:56 ID:/pRpwPyp

ﾌﾟｯ

560 ：Socket774：2009/10/24(土) 12:08:12 ID:eodc6NNt

数日前から粘着してる558がアホすぐる件について

561 ：Socket774：2009/10/24(土) 12:33:57 ID:pemM3G0d

>>560 >>559
スレ荒らすな

562 ：Socket774：2009/10/24(土) 12:46:30 ID:zWzLR82M

Fermiはモックだけで比較結果すらない状態

563 ：Socket774：2009/10/24(土) 12:56:45 ID:H3hCSfz9

>>558
http://techresearch.intel.com/UserFiles/en-us/File/terascale/Mayo_IEEE_VIS2009_FINAL.PDF
その答え

564 ：Socket774：2009/10/24(土) 13:02:56 ID:Nl8u6FHx

http://www.shader.jp/xoops/html/modules/wordpress/index.php?p=896

>Geeks3D.comからのネタですが,NVIDIAのFermiを使ったPhysXのデモのビデオというのがYouTubeにあるみたいですね．
>NVIDIA Fermi: PhysX Destruction Demo from GPU Technology Conference
>http://www.geeks3d.com/20091003/nvidia-fermi-physx-destruction-demo-from-gpu-technology-

565 ：Socket774：2009/10/24(土) 13:06:14 ID:Nl8u6FHx

>“Fermi”は11月下旬に公開されるということだった。ただ、この予定は容易
>にずれうるものらしい。最初のサンプルは既にできており、重要顧客や
>アナリストにはお披露目しているという。

http://northwood.blog60.fc2.com/blog-entry-3183.html

566 ：Socket774：2009/10/24(土) 13:30:20 ID:oiMNAGHc

NVIDIA「どうです？この流体シミュレーション。超リアルでしょう？」
ゲーム屋「カクカクじゃん。こんなの取り入れたらゲームになんないよ」

567 ：Socket774：2009/10/24(土) 15:02:49 ID:jesrjDKY

リアルレンダリングとフェイク3Dが逆転する日って、いつなんだろ？

568 ：Socket774：2009/10/24(土) 15:03:57 ID:UqLj/pyh

CGは全てフェイクだぞ

569 ：Socket774：2009/10/24(土) 15:26:57 ID:7nSBsXJX

>>564
GPU Technology Conference のデモはモックアップしか用意できなかったうえ
デモ表示してるPC個体も非公開で全然信用されてない。

570 ：,,・´∀｀・,,）っ-○○○：2009/10/24(土) 17:28:32 ID:/pRpwPyp

モックしか出せないってのは
製造委託先にすら渡ってないってことだからね。

11月に出るって言ってる製品がだよ
ありえない

571 ：Socket774：2009/10/24(土) 18:00:28 ID:eFEbHVaV

larrabeeのことか

572 ：Socket774：2009/10/24(土) 18:11:10 ID:2zkG6XI0

IDF公開の青いボードはモックじゃないぜ？ｗ

573 ：Socket774：2009/10/24(土) 18:12:22 ID:+4GhHlk0

シリコン自体作り直しでしょ

574 ：Socket774：2009/10/24(土) 18:15:49 ID:eFEbHVaV

>IDF公開の青いボードはモックじゃないぜ？ｗ

その根拠は出力端子と補助電源端子が在ったからかｗ

575 ：Socket774：2009/10/24(土) 18:19:01 ID:2zkG6XI0

え？じゃああのGulftownのデモ機は偽物ってこと？ｗ

576 ：Socket774：2009/10/24(土) 18:19:05 ID:eodc6NNt

そのレベルから疑い始めたらキリが無いだろ
N厨の言いがかりきめえな

577 ：Socket774：2009/10/24(土) 18:20:58 ID:eFEbHVaV

なんせintelはモックデモが得意ですから
PenDをお忘れかｗ

578 ：,,・´∀｀・,,）っ-○○○：2009/10/24(土) 18:30:55 ID:/pRpwPyp

おいお前ら、天才NVIDIAさまが作ったTDP0Wの画期的なGPUを馬鹿にすんなよｗｗｗ

579 ：Socket774：2009/10/24(土) 18:31:56 ID:2zkG6XI0

PenDｗｗｗお話になりませんねｗｗｗｗ

580 ：Socket774：2009/10/24(土) 18:38:00 ID:eFEbHVaV

あれで本物のデモならしょぼ過ぎること林の如し
ちなみに

>Intelは4GHzクロックのPentium 4を，当初は今年の4Qに出すと言っていたのが，
>今年の7月には来年1Qに延期され，そして今回は延期ではなく中止と発表されました。
>クロックを上げる代わりに，内蔵キャッシュを1MBから2MBに増加したり，
>FSBにスピードを上げるなどの別の方法で性能を改善していくという方向の路線転換の一環であり，
>その先のPentium系のデュアルコアチップを既にテープアウトしたと，会見したIntelのプラットフォームのマーケティング部長が述べたと報道されています。

>面白いのは「デュアルコアチップを既にテープアウトした」という発言で，
>この裏を考えるとテープアウトはしたがウエファはまだ出来ていないということであり，
>つまり，9月のFall Developer's Forumのデモの時にはデュアルコアチップは無かったことを認めたも同然です。
>ということで，9月18日の話題で紹介したIntelのデモはモックアップだという見方を裏づけています。

581 ：Socket774：2009/10/24(土) 18:39:57 ID:XHcr/Gi9

DX10の時はATiが半年遅れたけど、その時はどう言われていたんだろうか

582 ：Socket774：2009/10/24(土) 18:46:57 ID:eFEbHVaV

R600はボロクソにいわれてたよ
なんせ馬鹿でかくて熱いくせに遅いんだから
メモコンGDDR4対応のクセにも64bit管理で前世代より粒度がでかくなった

一番のガンは無駄に帯域だけでかかったリングバスかな

583 ：Socket774：2009/10/24(土) 18:52:16 ID:2zkG6XI0

>>580
ほおｗなるほどｗだからFermiはモックアップなのねｗ

584 ：Socket774：2009/10/24(土) 18:55:09 ID:lDY/ah92

PenDのデモは2PのXeonで代替できるんじゃないの？

585 ：Socket774：2009/10/24(土) 19:07:05 ID:eFEbHVaV

larrabeeモックのデモも単に在り物を動かしたに過ぎん

586 ：,,・´∀｀・,,）っ-○○○：2009/10/24(土) 19:13:50 ID:/pRpwPyp

　　　　　　　　　　　∬
　　　　　　　　　 |:|ID:eFEbHVaV
　　　　　 _＿＿＿|:|＿＿＿
　　　　,ｲ´　　ノ´　　　　ヽ. ｀ヽ.　新しいバイトも入って
　　　 {　　 ●　　（__人__）　●.}　　Win7どころじゃ
　　　ﾞ'ゝ、　　　｀ ⌒´ 　 _ .,ノ　　ないんだよね
　　　　/　￣￣￣￣￣￣ｨヽ
　　　/ 　　　　　　　　　　　　|
　　　 |.　⌒＼　　　 ,.────.､　ｷﾞｰｺ　ｷﾞｰｺ
　　　ｌ　＼/￣＼（(| i'￣￣￣｀i | ).））
　　　ｌ　　uUUU二| |..||￣,','￣| |￣￣￣￣￣.「＿＿＿＿＿
￣￣￣￣￣￣￣￣|_|~|| 　~~~~|_|.　 Fermi　　.|
　　　　　　　　　　　　　||＿＿＿＿_　　　　　__|]
　　　　　　　　　　　　　　　　　　　 ┌!!_______!!.!

587 ：Socket774：2009/10/24(土) 19:20:27 ID:eFEbHVaV

で？
どうしたよモックン

588 ：Socket774：2009/10/24(土) 19:29:57 ID:2zkG6XI0

そうｗあれはLarrabeeとET: QuakeWarsという在り物を使ってリアルタイムレイトレのデモをしたに過ぎんのよｗ

589 ：Socket774：2009/10/24(土) 19:31:37 ID:eFEbHVaV

で、それがlarrabeeである根拠はｗ
ま、あの程度で限界ってのがlarrabeeの実力かｗ

590 ：Socket774：2009/10/24(土) 19:33:33 ID:eFEbHVaV

てか、なんで目玉の演算デモは無しなん？
core i7処理のモックってバレルから？

591 ：,,・´∀｀・,,）っ-○○○：2009/10/24(土) 19:34:16 ID:/pRpwPyp

そうだよあの程度だよ。水面や金属表現があの程度だよ。
それ以外のテクスチャまで変質したらただの詐欺という。

592 ：Socket774：2009/10/24(土) 19:34:22 ID:eodc6NNt

切断模型を展示してモックアップだと突っ込まれるのがNVIDIA
実機でデモをしてモックアップだと言いがかりを付けられるのがIntel

593 ：Socket774：2009/10/24(土) 19:35:24 ID:7DVrGp+3

謎の青蒼モンスター
http://www.hardwarezone.com/img/data/articles/2009/3023/others_larrabee1.jpg
http://techon.nikkeibp.co.jp/article/NEWS/20090924/175534/fig3.jpg
http://www.4gamer.net/games/049/G004963/20090923003/SS/002.jpg
http://global.hkepc.com/database/images/200909250739084879200016.jpg

594 ：Socket774：2009/10/24(土) 19:35:52 ID:zRMbmDXb

リングバスの製品は鬼門だね、Cell、R600、Larrabee……

595 ：,,・´∀｀・,,）っ-○○○：2009/10/24(土) 19:37:31 ID:/pRpwPyp

Xeon MP・・・

596 ：Socket774：2009/10/24(土) 19:38:28 ID:eFEbHVaV

動きも無く非常に見栄えのする
良いデモだったなｗ

597 ：,,・´∀｀・,,）っ-○○○：2009/10/24(土) 19:39:16 ID:/pRpwPyp

通電しないビデオカードのことかー

598 ：Socket774：2009/10/24(土) 19:40:53 ID:+4GhHlk0

あのデモは動きなさすぎだった
元がああいう場面だって言い訳は可能だが、
性能を見せるなら他のソース選べよって話

599 ：,,・´∀｀・,,）っ-○○○：2009/10/24(土) 19:41:58 ID:/pRpwPyp

あのレベルの水面表現がどんだけ大変か解ってないだろ

600 ：Socket774：2009/10/24(土) 19:43:30 ID:+4GhHlk0

あの程度しか出来ないんだったらレイトレなんかやる意味ないわ

601 ：Socket774：2009/10/24(土) 19:44:00 ID:eFEbHVaV

intelがlarrabee向けに作らせてるモノがあった筈なんだが
それの動画もintelのサイトで見た記憶がある
なんでそれじゃねーんだよって思ったわ
先ず

602 ：,,・´∀｀・,,）っ-○○○：2009/10/24(土) 19:45:39 ID:/pRpwPyp

>>600
帯域に任せて焼き込みテクスチャ貼るクライシス手法がいつまでも通用するならな

603 ：Socket774：2009/10/24(土) 19:46:25 ID:eFEbHVaV

苦労を数えて奇を論ずる遊びに過ぎんって

604 ：Socket774：2009/10/24(土) 19:49:34 ID:eodc6NNt

N厨はデバッグ終わってないシリコンで製品版と同等のパフォーマンスが出ると思っているのが痛い

605 ：Socket774：2009/10/24(土) 19:52:45 ID:eFEbHVaV

淫厨は教祖様がすべて正しいと思っているのが面白い

606 ：,,・´∀｀・,,）っ-○○○：2009/10/24(土) 19:54:03 ID:/pRpwPyp

http://www.guru3d.com/news/intel-larrabee-larrabee-demo-surfaces/
最後のURL見れば解るが、"server"なんだよね。
はなからゲーム用じゃない。

607 ：Socket774：2009/10/24(土) 19:56:03 ID:2zkG6XI0

NVはこれ以上敵を作らない方が良いよ？ｗただでさえ四面楚歌状態なのにｗ

608 ：,,・´∀｀・,,）っ-○○○：2009/10/24(土) 19:56:10 ID:/pRpwPyp

嘘も100度言えばFermiが早く出る！

609 ：Socket774：2009/10/24(土) 19:59:51 ID:eFEbHVaV

嘘も100度言えばlarrabeeの実物が出てくる！

610 ：Socket774：2009/10/24(土) 21:43:41 ID:1MP9pAZD

ララビは1コアでfermiの4倍のパフォーマンスが出るわけですね
OpenGLのエミュレーションでもati,nvidiaを楽々と抜きさってくれることを期待してます
流石に固定パイプラインでは勝てないでしょうが、これからのOpenGLは固定パイプライン廃止なんで
一層ららびに有利になるんでしょうね

611 ：Socket774：2009/10/24(土) 21:51:39 ID:eFEbHVaV

つまり、ようやくDX10相当になったのねopengl

612 ：,,・´∀｀・,,）っ-○○○：2009/10/24(土) 22:14:05 ID:/pRpwPyp

OpenGLよりOpenRTだろう

613 ：Socket774：2009/10/27(火) 05:07:29 ID:cxCLDmUf

レイトレーシングが一般的に成ればfermiがゴミになるのは眼に見えている。

614 ：Socket774：2009/10/27(火) 17:52:13 ID:hE6Is9I7

Fermiやローンチ版Larrabeeが主戦力の時期は
まだレイトレーシングが一般的になる時期じゃない。
一般的になる時期になったらnvは（それまで生きていたらだが）たぶん
がらっと変えてくる。これまでもコロコロ変えてきた

615 ：Socket774：2009/10/27(火) 18:02:00 ID:M2W6g1u8

レイトレーシングが一般的になった時、x86を持たないNVIDIAはPC市場から消える
これは約束された敗北であり確定した未来

616 ：Socket774：2009/10/27(火) 21:53:03 ID:ClodaWOb

なんかレイトレに夢持ってる人が居るみたいだけど
ラジオシティを伴わない光線追跡したって大してリアルになんねーよ？
モデリングの問題だってあるし。

で、ラジオシティのエネルギー場計算はそれなりにパワー居るけど
計算しちまえばレイトレにも従来法にも適用は可能。

617 ：,,・´∀｀・,,）っ-○○○：2009/10/27(火) 22:07:13 ID:p0qmGqi2

リアルタイムでラジオは無いだろ・・・

むしろ現世代Larrabeeがすぐに可能になりそうなメソッドってA-Bufferじゃないの

618 ：Socket774：2009/10/27(火) 22:47:47 ID:bWD4nPRt

なんだ、やっぱり落とし穴があるのか。
結局そんなうまい話はないんだな…。

619 ：,,・´∀｀・,,）っ-○○○：2009/10/27(火) 22:50:20 ID:p0qmGqi2

てかA-Bufferの為に作られたような構造だ
DirectXが邪魔

620 ：Socket774：2009/10/28(水) 00:20:38 ID:38g4goGX

どのA-Bufferをいってるんか知らんけど、LucasFilm考案のやつなら
既存アルゴリズムの拡張だからそれこそLarrabeeである必要性は低いよ。
むしろピクセルシェーダの拡張だし。

必要な情報量が増えて転送量が上がる分、むしろLarrabeeには不利。

レイトレがLarrabeeに向くのはピクセル処理よりも交差判断の演算処理が
はるかに膨大になるっていう比較の問題であって、リアルな描画求めたら
結局オンラインレンダリングなんて夢物語に終わるし、まぁ微妙なところ。
無理にリアルタイムレンダリングに拘らないほうがいい。

621 ：,,・´∀｀・,,）っ-○○○：2009/10/28(水) 00:34:47 ID:y5ysAT1N

コア数増やすだけでスケーラビリティが得られるという点で将来性があるのでは？
Stencil Routed～かな。
もちろんNVIDIAも論文書いてるし、そのうち実装を出してくると思ってる。

自社に有利なメソッドを選ぶことでの差別化も大事だが、業界全体がついてこないことには。

622 ：,,・´∀｀・,,）っ-○○○：2009/10/28(水) 00:49:32 ID:y5ysAT1N

バケモンチップでっちあげた企業が登場したんでこっちに転載しておく

100コアの汎用プロセッサ「TILE-Gx100」が登場 - 米Tilera
http://journal.mycom.co.jp/news/2009/10/27/011/?rt=na

TILE-Gx Processors Family
http://tilera.com/products/TILE-Gx.php

623 ：Socket774：2009/10/28(水) 00:55:15 ID:6i0GCjY+

スレ違いだウンコ

624 ：,,・´∀｀・,,）っ-○○○：2009/10/28(水) 01:00:07 ID:y5ysAT1N

たとえば既存アーキテクチャでは、ROPから吐き出したピクセルデータを
ピクセルシェーダにダイレクトに渡せばいいものをVRAMに都度吐き出して
またそれをロードしてるわけで。

キャッシュ容量改善によるメモリ帯域消費の削減の余地はかなりある。
GDDR5でそれなりには帯域は確保するようだし多少キャッシュミスしても
トータルで帯域をセーブできれば十分元が取れるのでは。

625 ：,,・´∀｀・,,）っ-○○○：2009/10/28(水) 01:33:15 ID:y5ysAT1N

A-Bufferは最終工程までは並列処理に向くだけでなくて処理の順序関係すら依存性を排除できる。
Z-Bufferが1000人1001人脚なら、A-Bufferは1000人バラバラに走ってゴールテープ手前で
全員の足を結べば良いようなイメージね。そこまでの走り方は自由だ。

そこでだ、同時処理するスレッド数数を減らせばそれだけ1スレッドでキャッシュを有効活用できるよな？
スレッドがアクティブな間、キャッシュミスを減らすことが出来さえすればいい。

GeForceで1SMあたり32KBのShared Memoryがあっても、16ワープ動かせば
1ワープ当たり2KB程度の割当てしかない。
どのピクセルも同じように処理を進行させる必要があるからだ。
んで、絶対的に割り当てが少ないから、VRAMとGPUコアとの往復をちんたらデータ読み書きする羽目になる。

Larrabeeは1～4スレッドで各L2断片は256KB。
キャッシュめいっぱい割り当てたまま連続処理して、キリが良いところで別のコンテクストに渡せばいい。

これでもまだA-BufferでLarrabeeがより有利になる理由が解らん奴は首吊って氏ねばいいと思う。

626 ：Socket774：2009/10/28(水) 01:43:39 ID:uUesMLG2

でもA-Bufferだとメモリ食うんじゃねーの

627 ：,,・´∀｀・,,）っ-○○○：2009/10/28(水) 01:47:40 ID:y5ysAT1N

全体的には食うけど局所的には減らせる。

628 ：Socket774：2009/10/28(水) 01:48:21 ID:Gti1b6Em

喰うメモリの量が予測できないのが辛そう。
溢れそうになったら途中で一旦合成して続ける？

629 ：,,・´∀｀・,,）っ-○○○：2009/10/28(水) 01:52:05 ID:y5ysAT1N

Vistaあたりでホスト側メモリにスワップできるようになったよね。
A-Bufferを見越しての改良だと思ってたが

630 ：,,・´∀｀・,,）っ-○○○：2009/10/28(水) 01:53:08 ID:y5ysAT1N

あと、64ビットメモリアドレッシングが必要な理由がこれ

631 ：Socket774：2009/10/28(水) 01:55:44 ID:yCQKMqVt

だんごせんせー
小さすぎるキャッシュが結局メモリバンド食うってわかっててゲフォやラデのキャッシュ容量が大きくならないのは何でー？

632 ：,,・´∀｀・,,）っ-○○○：2009/10/28(水) 02:00:16 ID:y5ysAT1N

キャッシュはダイサイズ食うからだ。
というか低クロックの演算ユニット大量並列処理する分には焼け石に水。

多少SPの個数減らして高クロックで回転数あげるならキャッシュの意味も出てくる
（クロックが高くなるほど相対的にキャッシュのトランジスタ密度は高くなる）

633 ：Socket774：2009/10/28(水) 02:06:51 ID:0h3tB861

コアの”座標”に意味があるような稼動を想定してるみたいだな

ttp://www.tgdaily.com/images/stories/article_images/tilera/tilera4.jpg
ttp://www.tgdaily.com/content/view/44417/135/

634 ：Socket774：2009/10/28(水) 07:04:12 ID:38g4goGX

>>625
酷い勘違いをしているけど、別にZBufferだって最終工程まで並列処理できる。
透過処理を正しく行うには事前にポリンゴンをソートしておく必要がある（これはたいした負荷じゃない)のと、
それでもポリゴンが交差してしまった際に正しくない結果を招くというだけ。
これは何をしても解決しないし、A-BufferもZ-Bufferも並行処理度は変わらない。

A-Bufferはピクセル化と最終書き込みの際に透過処理用を情報をてんこ盛りで付加して
Z深度比較と同時に透過演算まで行う代物。これでポリゴン交差しても問題がなくなる。
つまりZ-Buffer法ではZ情報(ピクセルあたり32bitか64bit)を読み出せばすむだけの話が
A-Buffer法では輪郭マスクや透過度、さらには透過合成するために過去のピクセル情報まで
読み直さないといけない。

膨大なメモリを消費してでも透過描画を正しく行うのが A-Buffer の目的であって、
速度向上への寄与ないよ。

お得意のタイルレンダリングで局所的に扱えばキャッシュに収まる～といつもの台詞が
帰ってきそうだけど、一度に扱えるタイルが激減するのは明らかでその分並列度が下がるね。

Larrabee擁護したいだけの素人が適当なこと言ってると恥かくよｗ

>>628
リアルタイムで処理するにはそういった割り切りが必要になってくるね。
ATIとLarrabeeあたりは区画で切ってきそうだけどNVIDIAはバス幅広げて力で解決してきそうｗ

635 ：Socket774：2009/10/28(水) 07:17:10 ID:38g4goGX

あと、前に指摘したのにまだ理解してないみたいだけど、
通常のZ-Buffer（やA-Buffer)ではポリゴンはそのまま描き捨てればいいけど、
Larrabeeで使うタイルレンダリングでは区画が変わる毎に全てのポリゴンを再評価しないといけない。
過去の評価結果が再利用可能ではあるけど、キャッシュに乗り切らない場合はそれも足を引っ張るね。

キャッシュに頼る結果、性能を維持するにはシーンで扱えるポリゴン数が激減するのもLarrabeeの問題。

レイトレにするとNURBSやMetaBall使ってオブジェクト作れば、膨大な演算量がかかる
代わりにオブジェクトが消費するデータ量を減らすことが出来るので、そのへんも含めて
「相対的に」Larrabee向きっていうハナシ。

636 ：,,・´∀｀・,,）っ-○○○：2009/10/28(水) 08:30:40 ID:y5ysAT1N

>>634
> お得意のタイルレンダリングで局所的に扱えばキャッシュに収まる～といつもの台詞が
> 帰ってきそうだけど、一度に扱えるタイルが激減するのは明らかでその分並列度が下がるね。

あのさー、たかだか32コア～64コア動かすのに
ウン千スレッド必要ない設計なんだが。そこらのGPUみたいに。

637 ：,,・´∀｀・,,）っ-○○○：2009/10/28(水) 08:46:36 ID:y5ysAT1N

・メモリレイテンシを隠蔽するために大量のスレッドが動く設計になっている
・でも、キャッシュが効かないからVRAMのレイテンシが大きいんだよ。
・同時に動かすスレッドが常に大量にあるからキャッシュなんてききようがない
　（＋ダイサイズの制約もあるから簡単には増やせない）

既存資産の同時に解決するアーキテクチャなんて考えようがないんだよ、GPU屋には。
Larrabeeはスレッド数を多くしないといけない制約がない

言っておくがキャッシュに載っかりきる必要なんてないんだよ、ポリンゴンくん
たとえばトラフィックを半分程度に削減できるなら、2倍のヘッドルームが出来るのと同じことになる
クリーンヒットなんて求められてない。

ポリンゴンくんはキャッシュに頼るとVRAMの帯域が大幅に削られたり、レイテンシが大幅に伸びたり
する妄想に囚われてるようだが、同じGDDR5(or XDR2)を使う限りそれはないだろう。

ポリンゴンくんはさ、ハードの特性を正しく理解した上で
相対的にどうなのかを判断しよう

638 ：,,・´∀｀・,,）っ-○○○：2009/10/28(水) 08:53:02 ID:y5ysAT1N

ぶっちゃけると、タイルレンダリングである必要すらない。
キャッシュはプライオリティが高いデータが残るという特性は変わらないからね。

どっちかというとLarrabeeの場合レジスタ間よりもL1キャッシュ間オペレーションのほうが
演算密度を稼げる変なルールがある。

639 ：,,・´∀｀・,,）っ-○○○：2009/10/28(水) 09:23:53 ID:y5ysAT1N

並列処理「しないといけない」スレッドも相対的に減る。
並列処理してキャッシュを取り合うくらいなら逐次処理したほうがマシと言うことも時としてある。

GT200ではCUDAでは16ワープ、GPUとしては最大32アクティブワープ動かせるようになっているが、
Larrabeeはコアあたり1～4スレッドだ。むしろ、それ以上のアクティブスレッドは動かない。
大前提として同クラスのGPU程にはスレッド数が動かないし、
平均メモリレイテンシが遙かに小さいので動かす必要もない。

いまのところLarrabeeの方針は、メモリ帯域は減らすのではなく、確保しつつ、キャッシュによって得られる
一桁違いの広帯域と圧倒的な低レイテンシを有効活用することで更なる性能アップを目指すもので
外部帯域もRadeon程度には確保する。ただしGeForceほどには必要ない。
したがって

> 性能を維持するにはシーンで扱えるポリゴン数が激減する

という妄想が成立する道理もない。

640 ：Socket774：2009/10/28(水) 09:43:54 ID:UPKEboLc

アクティブスレッドあたりのキャッシュを大幅に増やすことで実VRAM間平均データスループットが減るのを
どういうわけか設計上の帯域まで減るいう思いこみが蔓延っている。
S3を除く現行のGPUが帯域律速に近い状態だから無理もないか。

641 ：Socket774：2009/10/28(水) 10:17:07 ID:dUyr2K4Y

http://hissi.org/read.php/jisaku/20090407/ZzdnZ3NSMVk.html

この馬鹿懲りずに来てるんだな。

642 ：Socket774：2009/10/28(水) 11:57:29 ID:66pxLNlc

blogか何かににまとめてほしい。

643 ：Socket774：2009/10/28(水) 12:01:21 ID:5ZCIquX/

団子さんはドメインを業者に取られたからモチベ下がってる

644 ：Socket774：2009/10/28(水) 12:53:18 ID:dUyr2K4Y

A-bufferも相対的にはLarrabee向き。
なぜなら固定機能に縛られず全コアで並列実行出来るから。

ただ本当に向いてるのはirregular Z-bufferのほうだろうけど。

645 ：Socket774：2009/10/28(水) 13:04:10 ID:4oZG04S/

A-bufferてもうRadeonがDirectComputeでやってるじゃん

646 ：Socket774：2009/10/28(水) 13:08:44 ID:dUyr2K4Y

広義的にはMSAAはA-bufferの応用

647 ：Socket774：2009/10/28(水) 13:16:12 ID:dUyr2K4Y

ttp://journal.mycom.co.jp/photo/column/graphics/008/images/003l.jpg
実際には次ステージへのデータフローもVRAMを経由してる。
データの半分でもオンダイで次のステージに送り込めれば
それだけでもトラフィックは減らせますぜ

648 ：Socket774：2009/10/28(水) 13:50:16 ID:uUesMLG2

RADEONのShaderExportって何のためにあるの？

649 ：Socket774：2009/10/28(水) 13:56:48 ID:dUyr2K4Y

>>648
XboxのXenosならeDRAMに出力して貯めておけるけど
RadeonはGeForce同様原則VRAMに流れちゃいますね
データ本体に関しては

650 ：Socket774：2009/10/28(水) 14:40:01 ID:YBOyxClR

＞一度に扱えるタイルが激減するのは明らかでその分並列度が下がるね
＞たとえば24領域つかって 64x64サイズのタイルを表現した場合、同時に扱えるフレーム領域は512x192程度でしかない
なんで1フレームにつき、Larrabeeの各コアは各タイルを1個だけしか処理しないんだよ、どんな糞実装だ
各タイルの処理時間も処理データ量もバラバラなのに…酷い固定観念だな

651 ：Socket774：2009/10/28(水) 14:44:38 ID:YBOyxClR

A-bufferは、最後のブレンディング処理が来るまで、
吐き出した半透明ピクセルをキャッシュ外に逃がせるから良いね
キャッシュはZテストに集中できる

652 ：Socket774：2009/10/28(水) 15:03:13 ID:dUyr2K4Y

>>650
こいつはLarrabee「だけは」キャッシュが全メモリ空間だと思い込んでる
池沼だから始末に困る。
何度指摘されても未だに学習できてない。

LarrabeeもVRAMにストリーム的にアクセスするのは今までと変わらない。
LarrabeeがRadeonやGeForceと違うのはコンテクストあたりの
ワークメモリの規模（数KBと数十～百KB）とワークメモリのVRAMへの
退避復帰の回数の違い。要はピクセルライン単位かタイル単位かの違いだ。
CPUコアが1つのタイルを処理している間、処理の終わったタイルを
VRAMに流し、次のタイルの準備をしている。
つまり、アホみたいにメモリ帯域が必要なのは変わらないが、処理単位が
大きくなることで出し入れ回数が減り、結果帯域消費量が減るんだ。

当たり前だがオンキャッシュで済ますにはキャッシュ容量は256KB/coreでも
全然足りない。多いに越したことはないがLarrabeeでも十分ってことはない。

653 ：Socket774：2009/10/28(水) 15:44:38 ID:lD/sRjv+

現場の意見 vs 願望の意見

654 ：Socket774：2009/10/28(水) 16:11:38 ID:jMLxfx1/

必死チェッカーみたら団子1位じゃん。おめでとう

655 ：Socket774：2009/10/28(水) 16:30:37 ID:dUyr2K4Y

同じことしか言ってないんだけどな
Larrabee関連のセッション真面目に聞いてたらわかる理屈なのに

656 ：Socket774：2009/10/28(水) 16:49:47 ID:CJLCa4Z/

リアルタイムレンダリングよりDirectX11のパフォーマンスがどうなるか気になる。
それ次第で、二社を一気に抜く可能性あるんじゃない。

657 ：Socket774：2009/10/28(水) 16:50:50 ID:CJLCa4Z/

リアルタイムレンダリング→リアルタイムレイトレーシング

658 ：Socket774：2009/10/28(水) 19:58:11 ID:tZhG4JAz

○○○
↑
これってウンコ？

659 ：,,・´∀｀・,,）っ-○○○：2009/10/29(木) 00:05:51 ID:uFX20jKt

グローバルメモリの長すぎるレイテンシを補うために
GPU屋は大量にスレッドを走らせることでサイクル数を埋め合わせ
CPU屋は低レイテンシのキャッシュでレジスタから溢れた作業変数を受け止めた。

>>648
アレはただのストアバッファだよ。データはメモリコントローラを通ってVRAMにストアされる
ステージ間で流れるのはコントロール用パケット。
「VRAMの○○番地にストアしたんでここから読んで処理しといてね」って情報かな。

660 ：Socket774：2009/10/29(木) 00:20:00 ID:qBJkU6dP

旧XboxのCPUが土壇場でAMDからIntelになったようにまだチャンスはある
次期Xboxで採用されるように出血覚悟で売り込むんだな

661 ：,,・´∀｀・,,）っ-○○○：2009/10/29(木) 00:33:59 ID:uFX20jKt

ないだろうな。

Intelが先のLarrabeeの実装でやろうとしてることってWindows 7やLinuxのKVMのハイパーバイザ上で
動くゲストOSを走らせ、その上でホストOSに依存しないアプリケーションを動かすことだ。

662 ：Socket774：2009/10/30(金) 16:04:52 ID:+lqwBPEV

,,・´∀｀・,,）っ-○○○とかいうキチガイコテをＮＧにしたらスッキリした

663 ：,,・´∀｀・,,）っ-○○○：2009/10/30(金) 22:11:01 ID:Qwa7YnBV

664 ：Socket774：2009/10/30(金) 22:13:47 ID:JyyqlR6E

>>663
おちゃめさん。

665 ：Socket774：2009/10/30(金) 22:55:03 ID:uhFYpqdF

Larrabeeって iAPX432以来の失敗作だろ？
10年後くらいに研究成果が花開くかもしれないけど。

666 ：,,・´∀｀・,,）っ-○○○：2009/10/30(金) 23:12:30 ID:Qwa7YnBV

それはItaniumだろ。
x86を否定するものはx86に敗れるのが常。
Atomに次ぐ成功を担う、x86の他市場制圧の矛でありHPC市場の盾

667 ：,,・´∀｀・,,）っ-○○○：2009/10/30(金) 23:41:02 ID:Qwa7YnBV

矛と盾といえば

Fermiのアーキテクチャは方向性のまったく違うものを追い求めて「矛盾」したアーキテクチャになってるがな。
断言するがあんなものの性能はLarrabeeの足元にも及ばない。
積和算に対してL1のロード／ストアの帯域が狭すぎてHPCには使い物にならん。
OpenCL（笑）みたいな新言語が必要な時点でPG単価的にも不利。

668 ：Socket774：2009/10/30(金) 23:44:29 ID:E8Q+PwcP

断言したなｗその言葉忘れんなよ

669 ：,,・´∀｀・,,）っ-○○○：2009/10/30(金) 23:59:28 ID:Qwa7YnBV

http://journal.mycom.co.jp/special/2008/cuda/007.html

↑
とまあ、この辺見ればわかるようにNVIDIAのシェーダは根本的にHPCでやるような
行列演算には不向きなんだよね。
ローカルメモリに対するロード・ストアのスループットが低すぎるから当たり前だ。

マトリクス演算ってグローバルメモリの帯域は比較的食わないんだが
キャッシュあるいはローカルメモリのスループットとか、同一値のブロードキャストを
如何に効率的に処理できるかが重要になる。

んで、シミュレーションしてみるにLarrabeeの命令セットはその手の行列演算がやたら強い。
1命令にロードとブロードキャストと積和算を畳み込めるような命令セット拡張は
x86のフォーマットと見事にマッチする。
これは間違いなくLINPACKモンスター。

670 ：,,・´∀｀・,,）っ-○○○：2009/10/31(土) 19:17:20 ID:i+EhVJVU

半可通には何やっても理解出来ないだろうがちょっと16x16行列同士の乗算のコード書いてみた。
http://www.dotup.org/uploda/www.dotup.org320005.txt.html

理論FLOPS値の8割以上は簡単に弾き出せる
vstoreは他のベクトル演算命令とペアリングできるから、もっと大きな行列だと、旨く組めば9割はいくかもな。

Larrabeeの効率が良すぎるかっていうと否、これがストリームプロセッサとして当たり前なのであって
Tesla（笑）なんかが話にならなすぎるわけだけどね。

671 ：,,・´∀｀・,,）っ-○○○：2009/11/01(日) 01:56:41 ID:mtXW/RVq

こっちにも貼っておくか。

LarrabeeのGather機構の実装にかかわる特許文書
http://www.freepatentsonline.com/20090172364.pdf

672 ：Socket774：2009/11/01(日) 17:06:25 ID:bHyPUcZV

今Larrabee出たらnVidia死にそうだな

673 ：Socket774：2009/11/01(日) 17:20:04 ID:KodRhKF7

で　LarrabeeもGT300も一体いつになったら発表されるんだ

674 ：Socket774：2009/11/01(日) 17:44:39 ID:BIZ2dPD5

↑馬鹿乙

675 ：,,・´∀｀・,,）っ-○○○：2009/11/03(火) 01:15:18 ID:b3VqoWan

http://www.nvidia.com/content/PDF/fermi_white_papers/NVIDIAFermiArchitectureWhitepaper.pdf

Fermiアークテクチャの白書抹消ｗｗｗｗｗｗｗ

676 ：Socket774：2009/11/03(火) 13:25:10 ID:Wk2xk4p+

よそあおってる暇あったらさっさとLarrabeeだせや

677 ：Socket774：2009/11/03(火) 15:44:12 ID:QpNIDtwi

無理言うなよｗｗｗ
出来ないから煽って誤魔化してるんだから

678 ：,,・´∀｀・,,）っ-○○○：2009/11/03(火) 15:48:45 ID:b3VqoWan

Fermiのことですねわかります

679 ：Socket774：2009/11/03(火) 15:55:31 ID:BiQQU6Fy

>>143
まだ今一歩か
http://photos.macnn.com/news/0910/nvidiafermi-demolg3.jpg
http://photos.macnn.com/news/0910/nvidiafermi-demolg1.jpg

680 ：Socket774：2009/11/03(火) 16:08:18 ID:t7eduXVR

レイトレ先こされたか

681 ：Socket774：2009/11/03(火) 16:25:09 ID:kXNPWsBX

油逆サバ読みすぎだろｗｗｗｗｗｗ

682 ：Socket774：2009/11/03(火) 16:25:49 ID:kXNPWsBX

誤爆しますた

683 ：,,・´∀｀・,,）っ-○○○：2009/11/03(火) 16:58:47 ID:b3VqoWan

>>679
なんか激しい誤解をしてるようだがその程度の静止画をレイトレで作る程度ならPentium 90MHzでも出来るぞ

684 ：Socket774：2009/11/03(火) 17:15:25 ID:wdfXfADw

レイトレをリアルタイムで実際にデモして一番進んでるのはラデなんだけどな

685 ：Socket774：2009/11/03(火) 17:22:37 ID:3tpxO526

あのデモ公開しないのかな？

686 ：,,・´∀｀・,,）っ-○○○：2009/11/03(火) 17:26:23 ID:b3VqoWan

http://www.golem.de/0808/61949.html

こんとき水面が動いてなかったこと考えればだいぶ進歩してるけどな

687 ：,,・´∀｀・,,）っ-○○○：2009/11/03(火) 22:01:46 ID:b3VqoWan

チャーリーデマ自演にこんな記事書かれれば絶望もするわな
遅れに遅れたLarrabeeですらB0までいってるのに

http://www.semiaccurate.com/2009/11/02/nvidia-finally-gets-fermi-a2-taped-out/

688 ：Socket774：2009/11/03(火) 22:26:57 ID:Zx4GSbq9

Intelの場合デバッグがかなり早く終わったMeromがB2だったからB0はまだ最終シリコンじゃねーと思うが
まあでもメニーコア化でコア自体はかなりシンプルだからデバッグは楽なのかも知れん
ああでも開発リソースをどの程度割り振るかにもよるし、、、
要するになんとも言えん

689 ：Socket774：2009/11/03(火) 23:20:55 ID:J9uXblLK

団子ってi752が発表されたときもこういうふうに期待しまくってたんだろうな

690 ：,,・´∀｀・,,）っ-○○○：2009/11/03(火) 23:27:50 ID:b3VqoWan

してねーよ

691 ：,,・´∀｀・,,）っ-○○○：2009/11/03(火) 23:30:05 ID:b3VqoWan

Fermiは積和算に対してLSUのスループットが低すぎるという、解決されてない明確なボトルネックがある。
倍精度ですら実効性能5割を切るFireStreamははなから問題になってない。
Larrabee以外選択肢にないんだよ。

単純明快な消去法だ。

692 ：Socket774：2009/11/03(火) 23:32:46 ID:wdfXfADw

ピークが違うのに実行効率だけ比べても

693 ：Socket774：2009/11/03(火) 23:37:40 ID:wt/n4k6l

Fermiの半端な共有L2キャッシュにNVIDIAの苦心が伺える

694 ：,,・´∀｀・,,）っ-○○○：2009/11/03(火) 23:38:10 ID:b3VqoWan

Larrabeeは32コアでFermiと同じ512SPだが？

もしFermiが実効性能50%程度ならLarrabee換算750MHzだね。

695 ：,,・´∀｀・,,）っ-○○○：2009/11/03(火) 23:39:06 ID:b3VqoWan

>>693
あれは苦しいね

L1合計：384KB
L2：768KB

696 ：,,・´∀｀・,,）っ-○○○：2009/11/04(水) 00:25:39 ID:4Ohrun5l

BLAS Performance見てみ
http://www.lunarc.lu.se/Documents/nvidia-workshop/files/presentation/50_Case_Studies.pdf

CPUに比べて圧倒的じゃないかって思っちゃうだろうけど
単精度ってピークの3割強程度しか出てないんですが。
まあ、SFUでの乗算が全く役に立たない上に、LSUがネックじゃこの程度だわな。

倍精度はほぼ額面通りの性能になってるが、これは倍精度ユニットが他のユニットに比べて
貧弱な分、相対的に他のオペレーションの供給が間に合ってるに過ぎない。

LarrabeeではSGEMM・DGEMMともに90%は弾き出せると見ている。
なぜなら乗算値のアドレス算出・ロード・ブロードキャスト・積和算を1命令で同時に行いながら、
スカラ側でキャッシュコントローラの操作やベクトルストアをいずれか1命令ペアにして
発行することができるからだ。

さて問題です。GEMMにおいて、32Wayの積和算ユニットに対し、同時に乗算値を供給するのに
ロードユニットは最低何Wayでなければいけないでしょうか？
これが解ればFermiのGPGPU性能に微塵も期待できなくなる

697 ：Socket774：2009/11/04(水) 01:01:36 ID:ViDtV1c8

HD5870を買った俺は勝ち組ってことですね

698 ：Socket774：2009/11/04(水) 10:28:43 ID:RhSxZUT4

カス以下です

699 ：Socket774：2009/11/04(水) 12:40:01 ID:V0K/Gwjf

http://japan.cnet.com/blog/petaflops/2009/10/30/entry_27035208/

>　天河の詳細は不明であるが、IntelのCPUはNehalem-EPで、AMDのGPUは
> FireStream9270Sであろうと推定されている。また、システムの理論性能は
> FireStreamの性能によるものと推定されており、実行性能比が46.7%と
> いった目を見張るほどの低性能の原因もGPUに依存している事を端的に
> 示しているものと思える。
>
>　広い意味でのGPU方式とはいえ、Cell+OpteronのRoadrunnerは実行比率に
> 於いても75.9％とCPU機に引けを取らない性能を示しており、いわゆる、
> 技術力や知性を感じるが、50％を切るようでは、そもそも、その理論性能の
> 計算方式が誤っているとしか言い様が無いことになる。

ATIならずともNVIDIAにも共通の問題だなこれは。

700 ：Socket774：2009/11/04(水) 13:10:42 ID:Jw6aV1fj

糞ブログ貼るなや

701 ：Socket774：2009/11/04(水) 22:47:59 ID:ppUpbeiB

これはシミュレータじゃないよね？
ttp://blog.livedoor.jp/amd646464/archives/51447036.html

702 ：,,・´∀｀・,,）っ-○○○：2009/11/04(水) 22:55:33 ID:4Ohrun5l

中国とは言ってるけど台湾だな
文字通りのチップなんじゃないの？B0が出た頃に動きがあると思ってたが・・・

いよいよFermiやばくなってきたな。

703 ：Socket774：2009/11/04(水) 22:57:34 ID:CGynSEyg

>>701
お偉いさんが直接売り込みをしにいった、という記事でそれ以上でも以下でもないぞ

704 ：Socket774：2009/11/04(水) 22:58:30 ID:BuGXIJhQ

チップセットか何かにバンドルすると安くなるみたいだな
世に出るIntelマザーの数 = Larrabeeの数みたいな状況になると競争にならんだろうな

705 ：Socket774：2009/11/04(水) 23:02:01 ID:TfWW0U45

ベンダの中の人だけど、紙っぺら見せられて
「凄いから採用しろ、売れるから」と連呼されて引いちゃった。

706 ：,,・´∀｀・,,）っ-○○○：2009/11/04(水) 23:03:21 ID:4Ohrun5l

日本にカードベンダなんてあったっけ？

707 ：Socket774：2009/11/04(水) 23:03:45 ID:BuGXIJhQ

カノプー

708 ：,,・´∀｀・,,）っ-○○○：2009/11/04(水) 23:05:51 ID:4Ohrun5l

>>704
ミッドレンジ以下のIntel CPUの数＝GMAの数に近い状況ってだけでも死ねる。

709 ：Socket774：2009/11/04(水) 23:19:53 ID:F/2OBjDt

>>705
Larrabeeは知婦瀬戸に内蔵
ドライバが安定しだす発売1年後が本命だろjk

710 ：Socket774：2009/11/04(水) 23:32:56 ID:29vUmbkt

CPUとオンダイにするんじゃないの？どんだけ微細化したらできるのか知らないけど

711 ：Socket774：2009/11/04(水) 23:45:27 ID:fa7CT0pj

LarrabeeはHaswellに入る。
オレゴンチームも加わったし。

712 ：,,・´∀｀・,,）っ-○○○：2009/11/05(木) 00:02:27 ID:4Ohrun5l

LRBniはAVX（256ビットSIMD）立ち上げのために意図的に情報規制してる気がする。
特許文書見るとアウトオブオーダパイプラインでLRBniを実行するモデルが出てるんだけどね。

713 ：Socket774：2009/11/06(金) 09:17:10 ID:Jkx+Kr9B

:::::::::::.:　.:. . ∧＿∧ . . . .: ::::::::
:::::::: :.: . .　/彡ミ゛ヽ;)ヽ、. ::: : ::　　>オレゴンチームも加わったし。
::::::: :.: . . / :::/:: ヽ、ヽ、i . .:: :.: ::　　
￣￣￣（_,ノ￣￣ヽ､_ノ￣

714 ：イン厨 ◆0tc5JBFuqkkI ：2009/11/06(金) 10:40:55 ID:itubXr6g

オレゴンチームはAMDの心強い味方だね

715 ：Socket774：2009/11/06(金) 11:13:11 ID:ze0XxWcH

元々Larrabeeにはネトバのアーキテクトが関わっているのに。

716 ：Socket774：2009/11/06(金) 13:07:39 ID:U1i38oKf

アム虫はNehalem-EPにボコられておいてまだオレゴン馬鹿にするのかｗｗｗ

717 ：Socket774：2009/11/06(金) 13:12:35 ID:FBnhbQfF

Core MAを流用した負け犬オレゴンが何だって？ｗ

718 ：Socket774：2009/11/06(金) 13:39:43 ID:ijYvU8H/

と意味不明な供述をしており

719 ：Socket774：2009/11/06(金) 13:58:55 ID:nZ0KCbuO

オレゴンが開発したP6を流用した(ry

720 ：Socket774：2009/11/07(土) 23:41:57 ID:LAUVLHP9

Larrabee搭載のボードって10万以内で買えるかな？

721 ：Socket774：2009/11/08(日) 00:10:09 ID:1KrdRL+2

>>720
GPUとしてなら、3万くらい？HPC用とが主のボードだったらそれでは買えないだろう。
どっちに振ってくるかしだいじゃね？

722 ：Socket774：2009/11/08(日) 00:22:33 ID:E3WDIh79

最初はExtream向けだから伝統の999ドルとか、GT300と同価格帯とか。そんな感じじゃないの。
メインストリーム向けが何時出るかはしらね。

723 ：Socket774：2009/11/08(日) 01:42:36 ID:Ocm7jgv1

結局、GT300の実行性能が50%で、Larrabeeが90%とかの差が出ても、
価格差がそれ以上で逆転してたら、一般向けの選択肢はGT300しかないんだよな。

Larrabeeはあんまり一般向けで出しませんとかなると、Cellのボードみたいに
100万近いとかなりそうな気がしてな。

でも、larrabeeを5万前後で売るってなったら、本気でGT300を殺せるかもっていう
気はするな。

724 ：Socket774：2009/11/08(日) 01:51:10 ID:LK2t8Fft

(`･ω･´)
http://www.4gamer.net/games/049/G004963/20090923003/SS/002.jpg
http://www.brightsideofnews.com/Data/2009_10_12/An-Inconvenient-Truth-Intel-Larrabee-story-revealed/INTC_Larrabee_PCB_Board_675.jpg

725 ：Socket774：2009/11/08(日) 09:43:33 ID:CUNmVoNd

Larabeeが出る頃には他社のGPGPUも進歩しててi740の二の舞になりそう

726 ：Socket774：2009/11/08(日) 10:37:10 ID:ONs+zHr/

ちゃんと製品化されればまだマシだが
ベイパーハードにならなきゃいいけどな

727 ：,,・´∀｀・,,）っ-○○○：2009/11/08(日) 11:23:55 ID:g0j+SMPB

>>725
コピペ君って馬鹿だな

728 ：Socket774：2009/11/08(日) 13:18:54 ID:E3WDIh79

コピペだからな

729 ：Socket774：2009/11/08(日) 17:47:32 ID:sgDqWIip

素人なんで、基本的なことかもしれないけど、
これって、メニイコアのCPUと何が違うの？

730 ：Socket774：2009/11/08(日) 17:54:17 ID:1KrdRL+2

>>729
基本はメニーコアと同じもの。
OSを動かす必要がないから、シンプルコアですむ。シンプルということは、小さくなる。
だから、今のシリコン予算でたくさん乗る。で、何でかしらないが、現状のCPUよりピークが高速に。

ららびーはコアのベースがMMXペンティアム+新命令って言われてるみたいだから、
OSも動かそうと思えば動くかもしれないけどね。
まぁ、どっちかって言うとアクセラレータのタグイだと思うよ。

731 ：Socket774：2009/11/08(日) 18:03:56 ID:1KrdRL+2

>>725
i740って当時の光源処理ちゃんとするから、ファイナルリアリティできれいにうつるんだぜ～。
決して高速なボードではなかったが、技術的にはいいボードだった。

732 ：Socket774：2009/11/08(日) 18:08:19 ID:sgDqWIip

これも基本的なことなのかもしれないけど、
Larrabeeを動かすには、
Larrabee専用のプログラムを書かなきゃいけないの？

733 ：Socket774：2009/11/08(日) 18:14:27 ID:1KrdRL+2

>>732
あんまりよく知らないけど、
ららびーを見つけるコードとか入れないといけないと思う。
後は、インテルの開発環境にお任せすればある程度の性能はでるかもしれん。
基本はペンティアムだし、スレッドにまつわる不具合とか最適化とかの知識が役に立つ気がする。

これらは、団子の人がよく知ってるんじゃないかな？？

734 ：Socket774：2009/11/08(日) 18:20:56 ID:sgDqWIip

いろいろ質問ばかりで申し訳ないんだけど、
将来Larrabeeが出たとして、純粋にGPUボードとして使って、
例えば、今あるFPSのゲームCall of Duty4:MWなんかが何のパッチをいれることなく動くの？

735 ：Socket774：2009/11/08(日) 18:24:09 ID:8oAkv/3I

あきらめろ

736 ：Socket774：2009/11/08(日) 19:03:07 ID:1KrdRL+2

>>738
ららびーの何処が良いって言うと。未来さ。
これからの汎用性を重視した流れに乗るために誠意開発中。ってこと。

何世代か前の固定機能で実現される機能に対しては弱い。
ハードの汎用性と機能の性能は反比例すると思っている。
固定機能をつければ、性能が上がるが汎用性が減る。そんなイメージ。

737 ：Socket774：2009/11/08(日) 19:42:15 ID:IGIvFcpR

>>734
DirectXに対応してれば可能なはず

738 ：,,・´∀｀・,,）っ-○○○：2009/11/08(日) 19:55:31 ID:g0j+SMPB

DLL遅延ロードのテクニック何重にも使わないといけないから
「ユニバーサルGPGPU」なアプリ作るのはめちゃ骨が折れるぞ
まあ一度仕組み作ってしまえばいいんだが
APIが変わる度に作り直しする羽目に・・・

739 ：Socket774：2009/11/08(日) 20:25:15 ID:1KrdRL+2

>>738
昔の3Dマークみたいな感じか。
確かP3用のDLLとかCPU専用のコード持ったモジュールに分けてたみたいだったな。
ファイル名からの推測だけどね。。。

740 ：Socket774：2009/11/09(月) 16:00:33 ID:v5Kv2U1F

http://pc.watch.impress.co.jp/docs/column/kaigai/20091109_327607.html
LarrabeeはSIMDとMIMDのバランス--Intel CTOが語る

741 ：Socket774：2009/11/10(火) 12:39:17 ID:W4B/Jj/1

もうHD5800が出てるし来年にはHD6xxxが出るのにいつまでたっても発売されないLarabeeに望みをかけるインテル信者の脳味噌を疑うね

742 ：Socket774：2009/11/10(火) 13:01:41 ID:9MrT2HHB

HPC分野ではRADEON（笑）なんて端から相手にされてない

743 ：Socket774：2009/11/10(火) 13:05:28 ID:3f+uE2MY

>>742
そう思ってたんだが、中国人は何を考えているのか……

744 ：Socket774：2009/11/10(火) 13:28:36 ID:9MrT2HHB

>>743
>>699だよな
韓国気象庁のCray機に実効コストパフォーマンスで大幅に負けてるし何考えてるんだか
http://japan.cnet.com/blog/petaflops/2009/10/02/entry_27034798/

745 ：Socket774：2009/11/10(火) 15:28:01 ID:eQelWDrD

エラそうにHPC分野を語るやつがスパコン漫遊日記（笑）

746 ：Socket774：2009/11/10(火) 15:52:31 ID:9MrT2HHB

能澤の指摘には理性的な反論ができないやつが多いな

747 ：Socket774：2009/11/10(火) 15:53:39 ID:C/R++PkD

radeはいつになったらVLIWをやめるのかね？

748 ：Socket774：2009/11/10(火) 16:04:04 ID:9MrT2HHB

額面2.7TFLOPS, 実効500GFLOPS程度でも威張れるうちは辞めないだろう

749 ：Socket774：2009/11/10(火) 16:37:29 ID:eQelWDrD

>>746
来年の後半に入るシステムが今年のシステムの２倍のCPだとして何がおかしい。
LINPACKの性能は10年で1000倍だぞ。

そもそも天河のシステムが適切かどうかは天河で動くアプリケーション次第だ。
スパコンはLINPACKの順位争うために作るものじゃねーんだよ。

750 ：Socket774：2009/11/10(火) 16:45:52 ID:9MrT2HHB

＞LINPACKの性能は10年で1000倍だぞ。

今は20世紀じゃありませんよ？
GPUですら8800GTXが2年近くも最強を誇ってたような、そんな閉塞感漂う
今日この頃。

751 ：Socket774：2009/11/10(火) 17:04:04 ID:9MrT2HHB

ついでに言うと2010年後半ということはNehalemかWestmere, AMDだと
Istanubulなんだよな。そんなにFLOPS単価変わるか？

ついでに言うとトランジスタ数割増加するだけでベクトル演算性能が
倍にブーストするようなAVX/FMAみたいなSIMD拡張のキャパビリティは
GPUはとっくの昔に使い果たしてる。あとはメモリ帯域枯渇で差を詰められるのみ。

752 ：Socket774：2009/11/10(火) 17:51:04 ID:eQelWDrD

>>750
あきれた。現にトップのシステムは11年でTFLOPSからPFLOPSになったんだが。
スパコン漫遊日記（笑）は見られてもTop500本家のサイトは見られないんだろうか。
http://www.top500.org/list/1997/06/100
http://www.top500.org/list/2008/06/100

再来年には10PFLOPSを超えるシステムが予定されていて、2001年のトップが
7.2TFLOPSだった事を考えれば21世紀に入ってからも勢いは全く衰えていない。

753 ：Socket774：2009/11/10(火) 17:56:31 ID:9MrT2HHB

呆れた。
石油が無尽蔵に沸いてくるとでも思ってるのだろうか？
その「トップ」の消費電力も調べてみるといいよ。
道理でエネルギー消費大国のアメリカしか残ってないわけだ。

754 ：Socket774：2009/11/11(水) 01:03:42 ID:j2PgbXxL

>>753
コンピュータの物理的限界はまだまだ遥か先だぞ。お前が生きている間は心配ないｗ

755 ：,,・´∀｀・,,）っ-○○○：2009/11/11(水) 01:22:44 ID:4AjAynUS

プロセス開発の資金的限界でバッタバッタしてますけどね。

756 ：Socket774：2009/11/11(水) 21:56:48 ID:mjo6UR1I

まあ、そこの所は当分Intelが頑張ってくれるでしょ。
苦労してASIC作っても数年で汎用プロセッサに抜かれる現状の終焉は
イコールx86からの解放なんだから。

757 ：Socket774：2009/11/12(木) 00:46:12 ID:ujcvkhhi

物理的な限界よりもたいてい経済的限界の方が先だな。
今だって冷やせば5GHｚ、6GHzで動くものをコストのかかる冷却方法を
避けてるから3GHｚ程度でしか使ってないのだし

758 ：,,・´∀｀・,,）っ-○○○：2009/11/12(木) 00:52:38 ID:gjkqx3Og

近年のx86の傾向として、SIMD拡張ばっかりフォーカスされてるが
bsr, bsfみたいな命令がなにげに1サイクルで処理できるようになったり
地味にスカラ性能の底上げを続けてるんだよね。

昔数10サイクルかかってた命令が1サイクルになるような
そんな余地が残ってるから、どの陣営も軒並みクロック上昇に行き詰まっても
x86だけは演算速度が上がっていく。
かつてはパイプラインを乱すからとRISC信者から馬鹿にされてた命令の数々が
パフォーマンスの要になっていくのだから面白い。

x86のトレンドは固定機能の充実だ。WestmereのAES拡張命令しかり。
GPUと逆を行ってるな。

759 ：Socket774：2009/11/12(木) 01:26:41 ID:MJctSeYD

AES拡張命令追加を知らなかった。なおさらNanoの存在意義がなくなるじゃないか。

760 ：,,・´∀｀・,,）っ-○○○：2009/11/12(木) 01:49:32 ID:gjkqx3Og

VIAのあれって専用コプロセッサに投げるんじゃなかったっけ。
WestmereのAESはSSE用のROMテーブルを拡張してソフト的に実行する。
Atomで使えたらARM対抗の意味でも美味しいんだけど。

761 ：Socket774：2009/11/12(木) 02:07:50 ID:O0PyOIh1

Fermiも多くの改良が入ってるだろうから期待しているが、
Larrabeeも気になるんだよな。
非正規化数のハードウェア処理ってトランジスタ喰うのかな。

CUDAのプログラミングモデルは慣れたら分かりやすいから好きだが、
Ctはどうなんだろ。ゲームは速いのかLarrabee……？

手に入れたら自分用のエンコーダーでも書いてみたいね。
しかし、だんごさんの話は難しいんだが、x86は何で勉強すればいいのやら。

762 ：Socket774：2009/11/12(木) 11:27:07 ID:ISABqOq3

拡張命令の拡充とCPU-GPU統合が進めば
GPGPU?そんなのもあったね
みたいになっていくんだろうなぁ･･･

763 ：Socket774：2009/11/12(木) 15:07:47 ID:rzd4km3Z

サウンドボードとかNICもオンボで十分になっちゃったしね

764 ：Socket774：2009/11/12(木) 15:20:12 ID:rzd4km3Z

Larabeeはi752の二の舞になる予感

765 ：Socket774：2009/11/12(木) 17:43:30 ID:e0wbjpgM

なるほど統合化で成功するわけですね

766 ：Socket774：2009/11/12(木) 19:53:40 ID:eUzk/MFR

Larabeeが出たときに、既存のゲームがそのままで動くかどうかについてソースある？
動いたとして、高速で動作する見込みあるの？
Larabee専用に特殊なプログラムが必要なら普及しない。それはPS3が既に、現実に実証した。
ゲームに厳密な3Dなど必要ない。スーパーコンピュータ用途？我々一般ユーザーには一切関係ない。

767 ：Socket774：2009/11/12(木) 19:55:46 ID:zH5/dAQu

Larrabeeスタイルが流行るのは・・・5年後だ！

768 ：Socket774：2009/11/12(木) 20:12:31 ID:BCCy5umP

>Larabeeが出たときに、既存のゲームがそのままで動くかどうかについてソースある？
さあ？

>動いたとして、高速で動作する見込みあるの？
さあ？

>Larabee専用に特殊なプログラムが必要なら普及しない。
馬鹿乙。

>ゲームに厳密な3Dなど必要ない。スーパーコンピュータ用途？我々一般ユーザーには一切関係ない。
ゲームの進化を否定するなら、GPUは別の用途を開拓しなきゃね。自家撞着乙。

769 ：Socket774：2009/11/12(木) 21:03:18 ID:Jw6e/r4i

>>766
Larrabeeについては先ず、本当に発売されるかどうかを心配するべきだから。
そんなこと聞いてもまともに答えられる人はいないよ。

770 ：Socket774：2009/11/12(木) 21:29:00 ID:ISABqOq3

自演乙。
しかしその程度じゃここを延焼させるのは無理だと思う
どっかのスレみたいに最強とか勝利とかいう意地の張り合いとは無縁だし。

771 ：Socket774：2009/11/12(木) 21:44:18 ID:MJctSeYD

>>766
他のGPUに最適化されたゲームが高速に動作するかと言えばNoだ。だから帰れ。
ゲームしかしない厨房が一般ユーザー代表みたいなツラすんじゃねぇよ。

772 ：Socket774：2009/11/12(木) 21:57:04 ID:ISABqOq3

一応、基礎の基礎として
強いて言うならディスプレイドライバ自体が各社のチップ向けの「特殊なプログラム」だね
それが為に「我々一般ユーザー」からは各種の癖をもったチップの動作が何がしかのパフォーマンスの高低程度の違いしか見えなくなる
GPUに関してそれに＋して特殊なプログラムが必要かと言えばNOだと思うよ

他の用途に使うなら何がしかのアクセラレータソフトが用意されるかもしれないけど。

773 ：Socket774：2009/11/12(木) 22:11:15 ID:eXGJoukr

ゲーム向けを否定するならNVIDIAのGT300系相手に粋がるの止めたら
有効活用できるアプリのあてもないハードを商品化するほどIntelも酔狂じゃないだろ

774 ：Socket774：2009/11/12(木) 22:21:23 ID:4+F7GlpN

粋がってないよ。HPC分野では相手にならないだけよ。そしてHPC分野のパフォーマンスは後のゲーム生きてくるんだよ。

775 ：Socket774：2009/11/12(木) 22:31:50 ID:gExf3Qqb

NV厨の思考は相変わらず支離滅裂だな
AMD厨以下だこいつら

776 ：Socket774：2009/11/12(木) 22:32:04 ID:mvT5BbKe

CUDAってかなり普及してるイメージがあるけど、実際は対応ソフトは数えるほどしかないって言うｗ
殆どホビープログラマーの戯れに使われてるぐらいｗ

777 ：Socket774：2009/11/12(木) 22:57:30 ID:ISABqOq3

なーんか変なのがまだ頑張ってるのかな

Larrabeeの面白い部分は全部がx86命令の走るプロセッサであること。
GPUとして使うならソフトウェア描画(笑)と言われても反論できないしそれがそのまま利点
GPGPUとして使う場合も同様。x86としての仕様の制約はもちろん受けるとしても
元がGPUのチップと比べれば遥かに汎用性に富む。無駄が出にくい。

そーいや昔書き換え可能なチップ使ったﾏﾙﾁﾒﾃﾞｨｱﾌﾟﾛｾｯｻなるものがあったねぇ･･･

778 ：Socket774：2009/11/12(木) 23:04:43 ID:vlf3kVz7

ってかLarrabeeに否定的なのってNVIDIAくらいでしょ

779 ：Socket774：2009/11/12(木) 23:07:26 ID:5cUSS3xQ

妄想乙

780 ：Socket774：2009/11/12(木) 23:09:32 ID:vlf3kVz7

768Kぽっちのキャッシュでパフォーマンスが稼げるなら苦労はしねーわ

781 ：,,・´∀｀・,,）っ-○○○：2009/11/12(木) 23:15:54 ID:gjkqx3Og

> Larabee専用に特殊なプログラムが必要なら普及しない。それはPS3が既に、現実に実証した。
なんで「CUDA」とか「OpenCL」に置き換えてもそのまんま通用するようなこと言うの？

Larrabeeは普通のCPUのようにCで組める。

782 ：,,・´∀｀・,,）っ-○○○：2009/11/12(木) 23:16:35 ID:gjkqx3Og

>>777
いいIDだなISA

783 ：Socket774：2009/11/12(木) 23:20:15 ID:5cUSS3xQ

>>782
不覚にもワロス

784 ：Socket774：2009/11/12(木) 23:20:36 ID:M+87Np5Y

団子ってスルー耐性無いよな

785 ：Socket774：2009/11/12(木) 23:21:00 ID:Q2HDuxM7

某おすすめMMOのプロデューサーもLarrabeeに興味を示してるみたいだな

786 ：Socket774：2009/11/12(木) 23:22:10 ID:CPAlOd/6

じゃぁISAつながりでｗ
団子はx86に追加してほしいインストラクションって何かある？
スカラーでもAVX系でもいいよ。
自分はAMD SSE5のIMAC系のがやはり欲しい。あとビット加工色々。

787 ：Socket774：2009/11/12(木) 23:26:43 ID:puFpaW2O

AMD discovers several Fusion mantras, disses Larrabee
http://www.tgdaily.com/hardware-features/44524-amd-discovers-several-fusion-mantras-disses-larrabee
「ララビーはダイサイズ大き過ぎ、脅威にならない」

Is Larrabee For the Rest of Us?
http://www.ddj.com/hpc-high-performance-computing/221601028
ララビーは誇大広告、神秘、論争に取り囲まれています。
多くのプログラマがプログラミングの難局に直面するでしょう。

788 ：Socket774：2009/11/12(木) 23:31:19 ID:4+F7GlpN

なるほどNVIDIA GPUの現状ですね。

789 ：Socket774：2009/11/12(木) 23:35:24 ID:CPAlOd/6

>>787
上はともかく、下の記事の要約をそう書くのは
お里が知れも程がある、てかGPGPUでRegExp
やれるもんならやってみろｗ

790 ：,,・´∀｀・,,）っ-○○○：2009/11/12(木) 23:36:07 ID:gjkqx3Og

・Assembler
・普通のC
・普通のC++
・普通のC++ ＆ Threading Building Blocks
・Ct
・OpenCL
・Compute Shader

好きな言語・フレームワークで頑張れ

アセンブラは動的コンパイラなんて信用できない自力で性能を限界まで引き出したい人向けの最終手段であって
別にアプリ書きは意識する必要なんて無い。
必要に応じてゲームエンジン屋が対応すればいい話だし。

>>786
AMD XOPのIMACはイマイチなんだよな。何処で使えるの？
VPCMOVとかVPPERMは好き。
とにかくSIMD整数で4オペランドの融合演算命令はもっと欲しい。ビットローテート＋加算とか、加算＋加算とか。

あとFMA4のimm8が4ビット余ってるからブロードキャストのオプションが欲しい。
Larrabeeの fmadd231ps v1, v2, [rsi] {1to16} でロード・ブロードキャスト・積和を1サイクルでまとめて実行できるのは面白い。

でも俺的ブームはAjaxなんだよね

791 ：,,・´∀｀・,,）っ-○○○：2009/11/12(木) 23:43:28 ID:gjkqx3Og

文字列操作はそもそも横方向のオペレーションに対してOpenCLとかCUDAなんかは言語仕様上も不自由なんで
GPUには全く向いてない

Larrabeeを文字列に使うとして、内部UTF32で扱うデータベースではそれなりに使えるかもしれないね。
CtにはサーチやリダクションのAPIがあるし。

792 ：Socket774：2009/11/12(木) 23:49:53 ID:ujcvkhhi

>>787
x86である利点とLRBniの利点を同時に生かすことは難しいみたいだね。

x86であることを最大限生かす、既存のアルゴリズムやバイナリ利用では
LRBniは全然活躍せずLarrabeeの潜在能力の大半は遊ぶ。LRBniを最大限
生かそうとしたらアルゴリズムをラディカルに見直さなければならず、
既存のx86資産に出番はない。

793 ：Socket774：2009/11/12(木) 23:52:25 ID:ujcvkhhi

訂正　バイナリ利用　→　ソース利用

794 ：,,・´∀｀・,,）っ-○○○：2009/11/12(木) 23:54:53 ID:gjkqx3Og

>>792
何も理解してないみたいだな。
少なくとも高機能なメモリ演算機能付きのロードとブロードキャストと積和算をプレディケートつけて1命令で実行するのに
x86のようなパイプライン化されたCISCである必要はある。

795 ：Socket774：2009/11/13(金) 00:02:41 ID:ylMv4C36

RadeやGefoなんかのGPUとLarrabeeは
ただのパートのおばちゃんとインテリジェントなパートのおばちゃんぐらいの違いがある

796 ：,,・´∀｀・,,）っ-○○○：2009/11/13(金) 00:03:47 ID:gjkqx3Og

Fermiはよく訓練されたパートのおばちゃんくらい？

797 ：Socket774：2009/11/13(金) 00:08:01 ID:fMK+yZ9Z

じゃあ68000系の終盤の奴でもいいのかな？　パイプライン化されてるらしいけど。
RP2見たときSuperH版ララビーできないかな、と思ったけどあれはRISCだからダメかね。
和製GPGPUの夢は叶わないか。

798 ：Socket774：2009/11/13(金) 00:13:54 ID:1mzFjSO7

>>790
ついに団子もトータルフットボールに目覚めたか

799 ：Socket774：2009/11/13(金) 00:17:01 ID:UbYLRIYt

マニアックだな。イングランドやスペインならわかるが。

800 ：Socket774：2009/11/13(金) 00:19:09 ID:4APSLWus

【２ちゃんねる10週年】神秘の「乳,,・´∀｀・,,）っ-○○○」の秘密とは？
http://pc11.2ch.net/test/read.cgi/jisaku/9240911011/

801 ：Socket774：2009/11/13(金) 00:19:12 ID:1mzFjSO7

オランダがマニアックとかアリエン

802 ：,,・´∀｀・,,）っ-○○○：2009/11/13(金) 00:41:29 ID:TwafIZZ/

Larrabeeとは話がそれるが

Atomの開発者コミュニティサイト
http://appdeveloper.intel.com/en-us/contest/contest-entry?id=199

Atom限定でApp Storeみたいなサイト立ち上げる気らしいな。
OSはWindowsとMoblin対応

803 ：Socket774：2009/11/13(金) 02:41:01 ID:m52nILxf

後藤がAtom何十個も使ったLarrabeeもやろうと思えば出来るとか言ってたが、
Bobcat何十個も使ったAMD Larrabeeもやろうと思えば出来るのかな？

804 ：Socket774：2009/11/13(金) 02:50:25 ID:wEg1hWRd

もうちょっとシンプルなコアの方がいいだろう

805 ：Socket774：2009/11/13(金) 08:39:52 ID:mScuLNJc

Bobcatは無理。
in-order使ってるしダイサイズでかすぎ。

806 ：Socket774：2009/11/13(金) 11:32:38 ID:fMK+yZ9Z

>>805
http://pc.watch.impress.co.jp/docs/column/kaigai/20091112_328392.html
その点は大丈夫！　BobcatはOut-of-Orderだから。in-orderじゃないから。

807 ：Socket774：2009/11/13(金) 22:15:50 ID:mScuLNJc

やべ、素で間違ったｗ
けど32nmプロセスで現行メーンストリーム半分サイズってことはCPUコアだけで25mm2以上だろう？
全然話にならない。シンプルコアにout-of-orderって時点でもうアウト。

808 ：Socket774：2009/11/13(金) 22:28:20 ID:fMK+yZ9Z

BOBCATはあり得ないにしても昔のCPUをプロセス1世代ごとにクロック何割増し、っていう単純計算をしていくと、
1GHz～2GHzに達するものは結構ある。AMD版ララビーを作れないとは思わない。

んなことするならなんのためにAtiを買ったのか、と。

809 ：Socket774：2009/11/13(金) 22:32:12 ID:3QEHNsiP

将来的にAMD版Larrabeeが必ず出ると思うが
十中八九Larrabeeが市場を拓くまで出てこない

810 ：,,・´∀｀・,,）っ-○○○：2009/11/14(土) 00:28:15 ID:8rfW0ww8

暇だからブロックダイアグラム書いてみた
https://cacoo.com/diagrams/KeccJpwpIUqEA6DS

811 ：,,・´∀｀・,,）っ-○○○：2009/11/14(土) 00:30:43 ID:8rfW0ww8

キャッシュ周りがgdgdだな

812 ：Socket774：2009/11/14(土) 02:46:05 ID:92ftGpIR

>>807
Ontarioは40nm

813 ：Socket774：2009/11/14(土) 03:20:55 ID:0mOzxaqI

>>807，812
プロセス世代ごとに限られたトランジスタ数で沢山積めるのは、って事なら
ダイサイズ比較よりトランジスタ数で比較した方がいいのではないかね。

814 ：Socket774：2009/11/17(火) 13:20:24 ID:15NgLx8q

今日Fermi発表されたね

815 ：Socket774：2009/11/17(火) 17:16:01 ID:3tmbKmJu

理論スループット1.26TFLOPSとか相手にならんだろ。
Larrabeeの32core版が1GHzでしかまわらなくても実効性能で勝てる範囲。

816 ：Socket774：2009/11/18(水) 02:05:55 ID:nEWQ2AiR

世界の半導体業界ＴＯＰ２０

米国：
インテル　TI　クアルコム　AMD　フリースケール・セミコンダクター　ブロードコム　マイクロン　NVIDIA　Marvell　アナログ・デバイセズ

日本：
東芝　ルネサステクノロジー　ソニー　NEC　パナソニック　シャープ　エルピーダメモリ　ローム　富士通

韓国：
サムスン電子　ハイニックス

それ以外：
STマイクロエレクトロニクス（伊・仏・スイスの合弁）　インフィニオン（ドイツ）　NXPセミコンダクターズ（オランダ）　MediaTek（台湾）

世界的には３カ国に半導体企業の分布が偏っている。
ここから考えたら業界最大手のＩｎｔｅｌに対抗するのは誰がやるにしても大変だぞ～・・・・。
ＡＭＤは財務が超ヤバくて、もはや単独で生き残るのが難しく見えてきている。
だからこそ、身売り噂がある。候補はＮＶＩＤＩＡ、ＩＢＭ、Samsungの３社らしい。
だか、しかし、たとえＡＭＤが韓国・中国の企業になったとしても絶対にAMDを潰してはいけない。

もしもＡＭＤが潰れるとIntelがシェアと価格の両面でハイスコアを叩き出すようになる。

817 ：Socket774：2009/11/18(水) 02:50:58 ID:aDNDILPO

VIA…

818 ：,,・´∀｀・,,）っ-○○○：2009/11/18(水) 02:53:21 ID:r93Gw0lQ

Intelを今後苦しめるのはARMだと思うが、逆に低価格向けという棲み分けがARMを苦しめることになると思う。
マスク作成のコストだって世代を重ねるごとに上がってるし、そうなると面積単価の高いほうが相対的に有利になる

819 ：Socket774：2009/11/18(水) 02:53:22 ID:Puto/hVn

身売りとか出たのGFの更に前だろ馬鹿じゃねーの

820 ：Socket774：2009/11/18(水) 03:12:24 ID:nEWQ2AiR

AMDの株価は、ネイティブクアッドコアPhenomの失敗で非常に安くなっています。
AMDがATIを買収した金額で、AMDもATIも買えてしまう状況にあります。

現在、ＡＭＤに資金を提供しているのは「ムバダラ開発公社」「ＡＴＩＣ」というアラブ首長国連邦の政府系投資会社で、
バックにいるＵＡＥとしては豊富なキャッシュを元手に半導体産業を中近東に立ち上げようとしている。
目的は石油依存経済からの脱却のため。
この一環としてＡＭＤの価値を判断したんだろう。政府系投資会社は豊富な石油や天然ガスによる収入や貿易黒字等による外貨準備高などで
投資資金を調達するが、情報公開をマトモにやっていないのが欠点で、運営実態は非常に不透明。
http://eetimes.jp/news/3486
http://eetimes.jp/article/20643
http://d.hatena.ne.jp/dubai_investment/20080601/1212333615
http://dobizdubai.blogspot.com/2008_06_01_archive.html
http://www.energyjl.com/2008_folder/October/08new1014_1.html
http://www.uaeinteract.com/japanese/business/
http://www.dso.ae/

インテルに対抗しようとしたら出資する側もそれなりの組織になってくる。

821 ：Socket774：2009/11/18(水) 18:30:49 ID:BqCqn+kz

http://www.heise.de/newsticker/meldung/SC09-Intel-demonstriert-Larrabee-mit-ueber-1-Teraflops-862305.html
単精度行列積で実効1TFLOPS程度らしい

822 ：Socket774：2009/11/18(水) 20:12:10 ID:dvEuMSn3

441 名前：名称未設定[sage] 投稿日：2009/11/18(水) 18:52:34 ID:EopSiN2r0
信頼度低めの日本語訳
ttp://www.heise.de/newsticker/meldung/SC09-Intel-demonstriert-Larrabee-mit-ueber-1-Teraflops-862305.html
SC09でシングルカードのLarrabeeがSGEMMで1TFoverというデモが行われた。現行最速のTesla C1060は320GF。
1TFのデモは試作品のOCによって行われた。(多分2006年の80コアと同じ手法)
OCしない場合は理論性能712GFでSGEMMは417GF？

堅固な情報統制の行われていたLarrabeeだが、「遅延は無かった(by ラトナー)」。
GPGPUはCPUとのデータのやり取りがボトルネック。
IntelはQPIでCPUとLarrabeeを直結しメモリ空間を共有(M-Y-O)するモデルを出す。

Nehalem-EX 'も' 2010年前半に出す。HPC向けに6コアの高クロック版を出す。

823 ：Socket774：2009/11/18(水) 20:16:40 ID:PEHftHnx

>GPGPUはCPUとのデータのやり取りがボトルネック。
結局どんなカード出してもそこだなｗｗ

824 ：Socket774：2009/11/18(水) 20:49:10 ID:/vI1oujJ

>GPGPUはCPUとのデータのやり取りがボトルネック。
やはりHaswellでLarrabee統合するIntel大勝利ということか

825 ：Socket774：2009/11/19(木) 01:14:49 ID:g+VFmgPH

で　いつでるんだよ　買いたくても買えないだろ
あと1年くらい285でいいや

826 ：Socket774：2009/11/20(金) 09:50:07 ID:EZ+MSw47

ttp://www.hardware-infos.com/news.php?news=3308
この記事も読むと、通常417GFlopsで、たまに最大値で712GFlopsがでたって感じなんだけど。
OCして出た1006GFlopsも最大値らしいけど。
SGEMMって数値417～712GFlopsみたいに変動するようなもの？
それともたまにキャッシュに上手くヒットして跳ね上がっているだけ？

827 ：,,・´∀｀・,,）っ-○○○：2009/11/20(金) 10:02:00 ID:OfG4YBQO

変わるよ。
ただソフト側はチューニング不足だと思う。

828 ：Socket774：2009/11/20(金) 10:57:07 ID:C1KDBq6T

通常417GFlops/理論上800GFlopsでも大したもんだよ。
半導体規模が上がってくる段階でGPGPUは完全に脱落する。

829 ：Socket774：2009/11/20(金) 12:21:32 ID:Q2hNirbp

4.7TFLOPSのGPUが買える時代に417GFLOPSとなｗ

830 ：Socket774：2009/11/20(金) 14:24:00 ID:7qiryw4n

全部のALUがフル稼働かつFP積和算だけを実行した場合というありえない
条件での最大理論値を引き合いに出してもねぇ
同じ条件ならその4.7TFLOPS（ｷﾘｯのカードは実効300GFも出ないと思うんだ。
ある意味で前世代での実績があるし。

演算ユニットあたりのメモリ帯域の狭さ、キャッシュメモリの少なさ、
ホスト間転送帯域・・・これら全てボトルネック要因。

831 ：Socket774：2009/11/20(金) 14:29:25 ID:7qiryw4n

ちなみにNVIDIAもAMDもHPC向けにデュアルGPUカードを出した実績がないし
出してもホスト間帯域命のGPGPUでは役に立たない。

通信帯域がネックになって性能がスケールしないからな。
グラフィックとは勝手が違うんだ。アホ。

832 ：Socket774：2009/11/20(金) 15:03:34 ID:Q2hNirbp

はぁ・・・実績ですか
既にTOP500で5位、電力性能で4位につけてるだがねぇｗ
しかも前世代の4000シリーズでｗ
ララ？ゲフォ？そんなのどこにあるのですか？ｗ
そいつらが出てくる頃には単体で10TFLOPS超のHD6000シリーズにフルボッコされてるよｗ

833 ：Socket774：2009/11/20(金) 15:36:28 ID:7qiryw4n

じゃあ実績をみてみようか。

順位がわかるなら算数くらいはわかるだろ？
http://www.top500.org/system/performance/10186
CPU分の性能を差し引かずに計算しても

563,100GFLOPS/2560枚 ≒ 219GFLOPS/枚

ACML-GPUじゃSGEMM（単精度）でもせいぜい倍精度の2倍の
440GFLOPS程度が関の山。

デュアルカードはスケールしないしそもそもRadeonそのものが効率が悪い。
これが現実。

10TF？
ありえないｗ妄想もほどほどに。

834 ：Socket774：2009/11/20(金) 15:38:19 ID:EZ+MSw47

天河のGPU部分の性能って実際どれくらいなんだろうね。
ttp://www.geocities.jp/andosprocinfo/wadai09/20091114.htm
にある構成の推測が正しかったら、LINPACKの数字の半分近くは
CPU部分でたたき出してるような気がするんだけど。

835 ：Socket774：2009/11/20(金) 15:58:47 ID:7qiryw4n

>>834
いい線いってるね。
HarpertownやNehalemオンリーのクラスタが90％超えを達成してるし
GPUのドライバタイム分を差し引いてざっと概算しても200TF程度はCPU側で稼いでると見られる。

メモリ帯域は演算ユニットあたりでみると相対的に世代を重ねるごとに狭くなっている。
スレッドあたりのスクラッチパッドメモリが少なすぎる。
理論性能だけが先走りして実効性能がついていかないのも道理だ。

836 ：Socket774：2009/11/20(金) 16:30:10 ID:00uZYiY0

CPU側が200ちょっとだとGPU一つあたり140GFlops程度？
チューニングでどのくらい改善出来んのさコレ

837 ：Socket774：2009/11/20(金) 17:12:15 ID:7qiryw4n

>>836
4870単体のAMD公式のチューニング済みの実効値がこんなもの。
SGEMM - 300 GFLOPS
DGEMM - 137 GFLOPS

X2のデータは見つからなかった。
575/750MHzにクロックダウンすると105GFLOPS/s
単純計算でデュアルGPUだから210GFLOPS/sくらいは目指せそうだが
PCIeがネックかもしれんね。

LarrabeeのSIMDはfloat×16またはdouble×8のフラット構成なので、
DGEMMのスループットはSGEMMのちょうど半分程度。
そんなに悪くないね。

838 ：Socket774：2009/11/20(金) 17:20:10 ID:5S9T64DO

あのアーキで単体10Tとか出そうとしたらカードが爆発するよｗ

839 ：Socket774：2009/11/20(金) 17:35:17 ID:/GAhXL3t

HD6xxxはアーキ変えるんじゃなかったか

840 ：Socket774：2009/11/20(金) 17:42:36 ID:e4J+eHaQ

なぜ実行性能が悪いのにHD4870X2は2560枚も使われてんの？

841 ：Socket774：2009/11/20(金) 17:46:02 ID:Ec2SYhTq

Project X

Radeon HD4870のピーク値を目指した者達

842 ：Socket774：2009/11/20(金) 17:46:59 ID:EZ+MSw47

効率悪いけど、1枚100～200GFlopsならXeonやOpteron使うより性能上だからじゃないの？
あと安かったんじゃないだろうか。

843 ：Socket774：2009/11/20(金) 18:26:40 ID:7qiryw4n

あと1枚あたりの性能が倍精度に関しては、それでもCellやTesla C1060のピークを超えるし
FireStreamじゃなくて4870X2なのもまあ安いからだろうな。
開発費が異常に高い気がするが業者がボってる感が否めない。

Intelが本気を出すと怖いってことは確かだ

844 ：Socket774：2009/11/20(金) 23:58:49 ID:Cp11ytIR

ID:7qiryw4nは、典型的なラデ信者だな
flopsでしか判断できない脳みそが痛々しい

845 ：,,・´∀｀・,,）っ-○○○：2009/11/21(土) 00:57:23 ID:9TZ5jYVD

FLOPSはパワーだ！
正義だ！

だが特定条件でしか動かないような浮動小数ユニットなんて理論値に入れるな紛らわしい。

LoadとSwizzleを並列動作させて出せるFLOPS数だけを理論値とせよ。

846 ：Socket774：2009/11/21(土) 01:07:42 ID:thfPDx/4

ならベンチマークを作り直せ

847 ：Socket774：2009/11/21(土) 03:12:52 ID:n8wKGSNY

現行のベンチマークでも性能出て無いだろｗｗｗｗ

848 ：Socket774：2009/11/21(土) 08:20:57 ID:vYqwQs1a

>>826
これ何コア？

849 ：Socket774：2009/11/21(土) 09:16:20 ID:LWzlnfKD

Larrabee(16コアと仮定)
●レジスタ
1コアで512-bit× 128本
16コア 32bit換算で、合計32,768本
●L1キャッシュ 1コア 32KB ＋ 32KB
1024KB
●L2キャッシュ 1コア 256KB
　4096KB

Fermi
http://pc.watch.impress.co.jp/img/pcw/docs/326/442/kaigai11.jpg

HD5870
●レジスタ
非公開
●L1キャッシュ 800KB
32KB ＋ 8KB * 20
●L2キャッシュ 512KB
　128KB * 4

Larrabeeはレジスタの本数は少ないが、L2キャッシュは圧倒的に多いな
HD5870はなぜかレジスタ非公開何かまずいのかね公開すると

850 ：Socket774：2009/11/21(土) 09:47:54 ID:n8wKGSNY

TSMCは40nmから引き続き32nmでもトラブってるらしい
LRB勝利フラグがどんどん立っていくな
ttp://www.semiaccurate.com./2009/11/20/tsmc-rumored-have-killed-their-32nm-node/

851 ：Socket774：2009/11/21(土) 09:54:36 ID:4qXobJiX

IBMが主張してるように32nmクラスになるとHigh-kが必須って事だったのかな
TSMCはHigh-k採用は28nmからだし

852 ：,,・´∀｀・,,）っ-○○○：2009/11/21(土) 11:49:30 ID:9TZ5jYVD

>>849
ちなみに先日デモされたLarrabeeは24コアだってよ
32コアの8コア無効版と思われる。

853 ：Socket774：2009/11/21(土) 17:16:29 ID:n8wKGSNY

それ記者の妄想
32コアで750MHzだった可能性もあるわな
なんせESの動作クロックだし

854 ：,,・´∀｀・,,）っ-○○○：2009/11/21(土) 17:27:12 ID:9TZ5jYVD

まあそうだな。

855 ：Socket774：2009/11/21(土) 18:52:06 ID:vYqwQs1a

だから417GFlopsは何コアでクロックかもわからないよね
実行効率も推し量るようがないな

856 ：Socket774：2009/11/21(土) 20:01:38 ID:XAzMJ9Uk

Larrabee遅いな
このままずるずる遅れてAVXでいいんじゃねという流れになりそう

857 ：Socket774：2009/11/21(土) 20:12:28 ID:p3tdg2wd

AVXの先にあるものなのに・・・

858 ：Socket774：2009/11/21(土) 20:29:40 ID:d0VgIhZL

そのサイトで5月に書かれてた32コア2GHzは出ないかも知れないな
Fermiのクロックが20%下がったから

859 ：Socket774：2009/11/21(土) 20:38:12 ID:QRKzZawn

キャッシュはまあわかるがレジスタって何さ
spとかFPUとかその中身のことなのか？

860 ：Socket774：2009/11/21(土) 20:41:03 ID:p3tdg2wd

レジスタはレジスタさ

861 ：Socket774：2009/11/22(日) 00:29:06 ID:c5yKE2Wb

Larrabeeはソフトウェアパイプラインにするとこによって
例えば、固定機能のROPが忙しいときには固定だと誰も助けに来ないし
逆に、暇なときは他の忙しい処理の助けにいかない

つまり、負荷分散できないから効率が悪い
と言う説明を聞いてなるほど！と思ったんだがだったらなぜLarrabeeはテクスチャは固定なんだと・・・

862 ：,,・´∀｀・,,）っ-○○○：2009/11/22(日) 00:38:24 ID:Htnio03U

例によってシミュレーションで検討の結果でしょ。
テクスチャユニットは利用頻度が高いから固定的にリソース割り当てた方がいいって考えたのでは？

とはいっても最低限の数しかないし、テクスチャの量が多い場合は
必要に応じてコア側でソフト処理する必要がありそうな。

863 ：Socket774：2009/11/22(日) 00:54:38 ID:exRSVgyX

負荷分散で効率を謳うなら、徹底してテクスチャもソフトウェアでやって欲しかったね
まあ、それでもライバルGPUよりも全然先進的だけど

この業界は、進化が速いからね
油断していると、すぐに対応されてしまう

864 ：Socket774：2009/11/22(日) 00:55:25 ID:+J13NvsS

865 ：Socket774：2009/11/22(日) 01:02:52 ID:bwZPg29m

大事なこと？

866 ：Socket774：2009/11/22(日) 01:23:53 ID:2DY63vva

>>861
>Why use fixed function texture logic?
>・Texture filtering needs specialized data access to unaligned 2x2 blocks of pixels
>・Filtering is optimized for 8-bit color values
>・Code would take 12x longer for filtering or 40x longer if texture decompression is required

要するに多くのコアをテクスチャの処理に食われてしまい
かえって負荷分散のメリットを削ぐことになるから

867 ：Socket774：2009/11/22(日) 01:25:39 ID:2DY63vva

ちなみに例のシミュレーターでは専用のテクスチャユニットは実装されてない（全ての処理をx86コアでやっている）ので
1GHzという低いクロック数も相まって、製品版は更に性能が上がる余地があると言える

868 ：Socket774：2009/11/22(日) 01:41:46 ID:exRSVgyX

つまり、負荷分散って担当のパイプラインで重い処理があると
他のパイプラインを担当する人間が自分の仕事を投げ出して
助けにいくから全体の効率が落ちるって事だね

なんとなく、負荷分散の仕組みが分かったよ

869 ：,,・´∀｀・,,）っ-○○○：2009/11/22(日) 02:02:17 ID:Htnio03U

>>867
例の名誉病院の件？
あれは可逆圧縮を売りにしてるわけで、不可逆圧縮画像のデコードが出来てもあまり役に立たないような。

870 ：Socket774：2009/11/22(日) 05:17:27 ID:x6S2Vc78

>>869
こっち
ttp://en.wikipedia.org/wiki/File:Slide_scaling.jpg

871 ：Socket774：2009/11/22(日) 09:20:38 ID:ztnJVAc0

固定機能=3Dゲーム用途アクセラレーター

既存GPUでも、Larrabeeみたいなソフトウェアもできるよ
SPのみで実行して、固定機能は経由しなければいいだけ

例えば、レイトレとかはラスタライズじゃないから固定機能は経由しない
まあ、インテル信者だからLarrabeeは絶対買うけどね

872 ：,,・´∀｀・,,）っ-○○○：2009/11/22(日) 11:12:02 ID:Htnio03U

レイトレでもテクスチャは使うだろ？

873 ：Socket774：2009/11/22(日) 11:45:09 ID:ztnJVAc0

レイトレでもテクスチャ使うよ
そして、Larrabeeもそのテクスチャ使う

874 ：Socket774：2009/11/22(日) 11:47:55 ID:gPgF01GI

テクスチャの読み込みは固定機能じゃないのかと

875 ：Socket774：2009/11/22(日) 12:32:27 ID:ztnJVAc0

きちんと入力しないと、実行できない出来そこないのコンピュータみたいな
流れになってきたな

テクスチャは、固定機能だがLarrabeeもテクスチャは固定機能だろ
つまり、既存GPUがLarrabeeみたいなソフトウェア処理をするために
テクスチャが固定機能かどうかなんてまったく関係ない

876 ：Socket774：2009/11/22(日) 15:36:34 ID:gPgF01GI

きちんと入力しても、実行できない出来そこないのコンピュータみたいなレスだな。

レイトレは固定機能使わないって発言に対する突っ込みなのにララビーみたいな
ソフト処理がどうのこうのとかずれてんだよ。

877 ：Socket774：2009/11/22(日) 17:19:04 ID:gGriCWhq

グラフィックスなんてもうどうでもいいんだよ
だってもう遊ぶゲームが無いんだから、PCゲーにはｗ
コンシューマーからの残飯でベンチは60fps以上で空回りｗ
PCで出しても売上げ比率10パー以下ｗ（例MW2
ﾃｸｽﾁｬとかどうでもいいのｗ

878 ：Socket774：2009/11/22(日) 17:26:28 ID:e7o5l+TD

まぁPCでゲーム遊んでるヤシがヌビの凋落を喜ぶなんて自傷行為以外のなにものでもない罠
連中が技術支援与えて底上げしてたんだから

879 ：Socket774：2009/11/22(日) 17:50:55 ID:ae1knjPI

>>877
紙芝居のエロゲも全然衰えないし
ツクール製RPGでも名作は50時間とか普通に遊べるからなあ
グラフィックスのクオリティだけじゃもう押し切れないっぽい

880 ：Socket774：2009/11/22(日) 17:58:18 ID:r4Q4DoyF

スクエアっていう反面教師がいるだろ
あと人によってはMGS4も

グラがいいことに越した事は無いがそっちの比重ばっかになりゃゲームはつまらなくなる
KOFとかゴミグラだったが人気はでたろう

881 ：Socket774：2009/11/22(日) 18:27:35 ID:gkErZw0o

×フォトリアルは全てのゲームに不要
○フォトリアルは一部のゲームにしか必要じゃない

882 ：Socket774：2009/11/22(日) 23:08:38 ID:s7aFD853

>>880
日本にしかない気がするプリレンダリング3DゲームではGPUは
動画再生支援に必要。
よってGPUのパワーは3Dゲームにはとても重要。

ん？

883 ：Socket774：2009/11/22(日) 23:17:13 ID:qe+EbEeD

>>879
ファミコンエミュで遊んだら結構面白かったってのと同じか。

884 ：Socket774：2009/11/23(月) 06:49:56 ID:qcXHIkVH

グラから音楽まで全部フリー素材だがelonaが相当面白いよｗｗｗ
オブリが好きなら絶対ハマルはず

885 ：Socket774：2009/11/23(月) 08:59:02 ID:wTfHoFM+

キャッシュコヒーレンシの縛りがあると
どうしてもスケーリングの足かせになると思うんだけど大丈夫なんだろうか。
45nや32nでよくても更にその先のトランジスタを活かせるのかどうか。

886 ：Socket774：2009/11/23(月) 09:01:36 ID:srrKjRXu

Intelは3Dトーラスまで検討してたが
まあリングバスなうちは余裕と見ていいだろ

887 ：,,・´∀｀・,,）っ-○○○：2009/11/23(月) 11:23:48 ID:nT9DryEJ

>>885
コヒーレンシの縛りなんてmovnt*の登場時点で破壊されてますが

L1キャッシュすっとばしてロードとか出来ますよ普通に

888 ：Socket774：2009/11/23(月) 13:06:14 ID:wTfHoFM+

>>887
それキャッシュ使ってないって事で
それ多用して性能でんの？
タイルレンダと合わなくない？

889 ：,,・´∀｀・,,）っ-○○○：2009/11/23(月) 14:46:27 ID:nT9DryEJ

L2にあるデータをL1に確保せずに読み出すときにも使えるよ。
共有データをL1に確保さえしなければスヌープは必要ない。

あと他にgatherpfd/scatterpfd命令ってのがあってだな

890 ：,,・´∀｀・,,）っ-○○○：2009/11/23(月) 15:06:21 ID:nT9DryEJ

1キャッシュライン＝ベクトルレジスタ1本分

方策としては
・そのレジスタに確保するまで別のレジスタだけで読んでおく
・スレッド切替して別のスレッドを実行する

読み込んだ後は各スレッドローカルで使ってるアドレス領域に格納して再利用することもできる。

SSE4.1に類似命令があるだろ
http://gpu.fixstars.com/index.php/WriteCombine%E3%83%A1%E3%83%A2%E3%83%AA%E3%82%A2%E3%82%AF%E3%82%BB%E3%82%B9%E3%82%92%E9%AB%98%E9%80%9F%E5%8C%96%E3%81%99%E3%82%8B

891 ：Socket774：2009/11/23(月) 18:25:48 ID:ePuUMmJU

Larrabeeは、スーパーコンピュータ用途がメインって認識でOKですよね？

892 ：Socket774：2009/11/23(月) 18:32:44 ID:srrKjRXu

正解じゃない

893 ：Socket774：2009/11/23(月) 18:39:38 ID:ePuUMmJU

では、間違っているっていうこと？」

894 ：Socket774：2009/11/23(月) 18:44:16 ID:CQy3M83n

メニーコア構想の具現化の一つ

895 ：Socket774：2009/11/24(火) 15:57:45 ID:OHQyeGHS

Cellのパクリなんて言われてますが？

342 名前：集気ビン(コネチカット州)[sage] 投稿日：2009/11/24(火) 12:22:49.92 ID:Ar1dyVcR
昔はCellの事をバカにして笑い物にしてたIntelが
「やっぱりCellの方向性が正しかったかも、ﾃﾍｯ///」とか言って露骨にパクってきてるし
すごい議論されててメインストリームになりつつあるし
やはり巨人IBMの先見性がすごいというか、クタラギもすごい人だと思うよ。

379 名前：鑿(山形県)[] 投稿日：2009/11/24(火) 15:21:25.64 ID:cnLIpv5I
>>342
LarrabeeのどこがCellに似てんだよ
ニワカもほどほどにな

383 名前：ビーカー(関西地方)[sage] 投稿日：2009/11/24(火) 15:41:09.99 ID:oEkrjBen
>379
Cellの論文見てからCoreシリーズの開発が始まったけど、すぐ行き詰ってLarrabeeになった。
似てないじゃんなく特許回避しながらARMアーキでCellの再現をしただけだろう？
その代償がコア数増加・消費電力・周波数を犠牲にするハメになっちゃった
Larrabeeの設計自体はかなり良い物なんだけど

387 名前：るつぼ(富山県)[sage] 投稿日：2009/11/24(火) 15:48:21.73 ID:UDNWPfFk
>>379
似てる部分は結構あるよ
ISAはx86だけどコア自体はシンプルなベクタプロセッサでSPEと似てる
キャッシュ機構もSPEのLSのように最大性能を発揮できるようLSのようなスクラッチパッドモードがある
（キャッシュ機構のままだと数個のコアしか連動できずメニーコアのLarrabeeにとって効率が悪く適さない）

違いも多いけど今のところCellに最も近い設計思想と言えるのがLarrabee

IBM「なんかゲハ界隈でアンチソニーがCell撤退って騒いでるけど撤退しねーよ。カス。」
ttp://tsushima.2ch.net/test/read.cgi/news/1259015555/387

896 ：Socket774：2009/11/24(火) 16:22:16 ID:fGs7S9Ly

はっきり言ってニュー速のスレなんかどうでもいい

897 ：Socket774：2009/11/24(火) 17:03:48 ID:RQdqsZRS

ゲハニートのCell起源説には呆れるが

> 似てないじゃんなく特許回避しながらARMアーキでCellの再現をしただけだろう？

いつから
　A　R　M　
になったんだｗｗｗ

> キャッシュ機構もSPEのLSのように最大性能を発揮できるようLSのようなスクラッチパッドモードがある

FermiのL1と勘違いしてるようだがスクラッチパッド「モード」なんてない。
prefetchとコヒーレント無視のwrite-throughの専用命令なら
Pentium IIIから存在しているが、あくまでそれの延長の技術として
スヌープの回避方法が提供されている。

こいつら最高にアホ

898 ：Socket774：2009/11/24(火) 17:34:29 ID:jYE8VafB

よその板の低レベルな喧嘩をいちいち持ち込んでくんなよ…

899 ：Socket774：2009/11/24(火) 17:43:57 ID:7n+zc8OS

ララビーはキャンセルなの？

900 ：Socket774：2009/11/24(火) 17:54:11 ID:1ayzPV/z

フェルミーはキャンセルされそうだね

901 ：Socket774：2009/11/24(火) 18:22:23 ID:dPj4zyY9

このスレとかIntel次世代スレとか、木どころか葉脈見て森見ないようなやつばっかだな

902 ：,,・´∀｀・,,）っ-○○○：2009/11/24(火) 22:11:54 ID:hPX1Nh9Y

BYTE
WORD
DWORD
QWORD
DQWORD/XMMWORD
YMMWORD
???

903 ：Socket774：2009/11/24(火) 22:22:53 ID:sOTYc8Q2

ttp://blog.livedoor.jp/amd646464/archives/51457463.html

904 ：Socket774：2009/11/24(火) 23:04:06 ID:nOQx4sqY

このスレ的にGPUとしLRBは期待できないでおｋ？

905 ：Socket774：2009/11/24(火) 23:05:55 ID:1ayzPV/z

グラボはラデ音でも買えばいいと思うよ by Intel

906 ：Socket774：2009/11/24(火) 23:12:37 ID:gXXLGqDd

了解。手ごろなHD5850買ってくる。

907 ：Socket774：2009/11/24(火) 23:14:59 ID:nOQx4sqY

なんでテクスチャユニットついてるん？

908 ：Socket774：2009/11/24(火) 23:17:52 ID:ELEBIXpN

>>907
普及させるために仮面かぶってるからさ。

909 ：Socket774：2009/11/24(火) 23:22:45 ID:nOQx4sqY

なんでタイリングするん？

910 ：,,・´∀｀・,,）っ-○○○：2009/11/24(火) 23:29:27 ID:hPX1Nh9Y

VRAMの帯域消費量を節約するため。

ピクセルライン単位でちびちび転送して処理するからあのデータが足りないとかいって
帯域をひたすら浪費する。
ある程度の大きさずつキャッシュに確保して纏めて処理したほうがトラフィック削減できる。

ああ、PowerVRがどうとか言ってるのはアホなんで構う必要なし。
そんな帯域狭いわけがないだろ。

911 ：Socket774：2009/11/24(火) 23:29:41 ID:ELEBIXpN

>>909
過去のDXとかとの互換性であったほうがいいのかなぁ？？
タイリングアーキテクチャはDxではキャンセルされてしまったので、グライドみたいな立ち位置じゃね？

912 ：,,・´∀｀・,,）っ-○○○：2009/11/24(火) 23:41:34 ID:hPX1Nh9Y

VRAM転送だけで何十Wも消費するので、キャッシュを旨く使って消費電力を抑えれば
その分の余剰TDPキャパの枠内でコアをオーバークロックすることができる

なんて実装が登場するかもしれないね。

913 ：Socket774：2009/11/25(水) 00:06:42 ID:wpIpnjnJ

タイリングレンダで発生するシェーダ間の中間データはどこに置くん？

914 ：,,・´∀｀・,,）っ-○○○：2009/11/25(水) 00:16:31 ID:XnXiDy9n

運が良ければそのままL2キャッシュにそのまま保持。
Cellじゃないんだからバケツリレーする必要なんてないよ。

ストリーム処理の粒度は粗くなり、今までのGPUでは絶え間なくなく流れてた
VRAMのフローは途切れ途切れになる。
いや、それがIntelの目論見なんだけど。

段階的にタイルに移行し、ゆくゆくはCPUコアと統合し、L3キャッシュでバッファリングすることで
より狭い帯域のメモリで動かせるようになったり、CPU間と高速にデータやりとりしたりってことが
できるようになる。

GPUは帯域食いのイメージがあるが、実は意外と食わないってのはあまり知られてない事実。
演算ユニット単位で見るとメモリ帯域はものすごく狭い。
要するにデータの局所性はCPUと比べてものすごく高い。
局所性があるならキャッシュは有効だ。
十分なキャッシュ容量を与えないからこそ無駄にトラフィックが浪費されるわけで。

915 ：Socket774：2009/11/25(水) 02:07:44 ID:zXg+k36V

GPUっていうかリアルタイム3Dグラフィックスは、もっと帯域食わない方法が沢山あるという事だな
ハードワイヤード実装でレンダリングパイプラインが固定され続けて15年が経った、と
俺たち末端のプログラマはそのハードの仕組みに従うしかないからなー

916 ：Socket774：2009/11/25(水) 02:22:55 ID:wpIpnjnJ

>>914
> 運が良ければそのままL2キャッシュにそのまま保持。
なんでそんな望み薄いことにかけるん？
テッセレータ死んでしもたん？

917 ：Socket774：2009/11/25(水) 07:16:35 ID:jDb1580z

キャッシュ内タイルレンダで帯域ハッピーなんて
とてもじゃないがLarrabee世代で実現できるような話じゃない。
後プロセス3世代くらい進めば物になるのかもしれんが。

918 ：,,・´∀｀・,,）っ-○○○：2009/11/25(水) 08:10:36 ID:XnXiDy9n

>>916
なんで「賭け」？
あったらあったでトラフィック削れるし、無いなら無いでかまわんのだよ。
キャッシュにないなら、メモリからとってくればいいじゃない。
そこは従来のGPUと変わらん。
ロードして必要データがキャッシュにある別の部位を処理するタスクに切り替えて間を繋ぐ。
そこも従来のGPUとかわらんし、むしろ条件は良い。

だが大丈夫、その程度で望み薄いとか言ったら、10分の1以下のL2キャッシュ容量しかないGeForceやRadeonは
「絶望的にありえない」から。

なぜ運任せになるかって、OSが入るから。カーネルタイムで処理が遮られるし、場合によってキャッシュが流される。
しかし全部のコアでカーネルが動くわけじゃない。
そこを避けさえすれば、明示的にコントロールすることすら可能だ。

あとFermiも含めテッセレータはソフト実装だから安心しろ。
FermiではCUDAで実装するんじゃね？
ソフト実装ではHull Shaderステージと内部処理レベルで統合してしまってもかまわんのだよ。
むしろそっちのほうが好都合だろう。

919 ：,,・´∀｀・,,）っ-○○○：2009/11/25(水) 08:19:40 ID:XnXiDy9n

>>917
俺が言ってることを復唱しなくても十分だよ。行間読めない人？

＞ゆくゆくはCPUコアと統合し、
が1世代の話に見えるか？

いずれにせよストリーム処理には変わりないが、きわめて高確率で処理対象の近傍のデータが
キャッシュに載ってるからメモリまで取りに行く頻度は激減する。

920 ：Socket774：2009/11/25(水) 08:51:26 ID:Ef07keRK

で、一世代目はいつ出るの？

921 ：Socket774：2009/11/25(水) 09:13:41 ID:qLJteFOD

早かれ遅かれ来年の中頃

922 ：Socket774：2009/11/25(水) 09:25:44 ID:ntSsR84y

なにげに楽しみだったんだけど、結構遅いんだな。

923 ：Socket774：2009/11/25(水) 11:08:07 ID:30IufTra

http://www.ddj.com/architect/221601028
http://domino.research.ibm.com/comm/research_people.nsf/pages/scarpazza.pubs.html/$FILE/2009-11-10-ddj-larrabee.pdf

IBMワトソン研究所の中の人のLarrabee解説。
非数値演算分野、たとえば正規表現マッチングでも使い物になるという
研究成果のお話だそうだ。

なにより重要なのはIBMスパコンがLarrabeeを採用する可能性が開けてきたこと。
この研究者はCellに関する論文をいくつも手がけている。

924 ：Socket774：2009/11/25(水) 11:56:18 ID:DwMNJha2

その論文のことじゃないが、
論文て肯定的な時だけ出すんじゃないぞ。±どちらでも書く。
これはこのように駄目でした、でも業績一つ稼げるんだから

925 ：Socket774：2009/11/25(水) 12:04:41 ID:DwMNJha2

こういう人達は素人fanboyみたいに、知らないまま否定する、ということは
しない。必ず検討する。そして検討に時間を費やした以上は
その労力を自分のキャリア・業績としてカウントされる形で残そうとする。
検討したということと、採用へ傾いたということとはほとんど独立している。

926 ：Socket774：2009/11/25(水) 12:22:47 ID:qLJteFOD

その言い分だと、彼に研究すらされてない
TeslaやFireStreamは検討にすら値しないってことだけどな

927 ：Socket774：2009/11/25(水) 12:29:50 ID:30IufTra

>>924
君が思ってる以上に米国の企業研究所は利益性に関してシビアだぞ。
なんで他社の製品の有用性を誇示し、自社製品のCellの商売上
不利益になりかねないレポートをIBMの名前で書かせる必要がある？

IBMが給料を出して研究者にLarrabeeの応用法を示させたことが
何を意味するのか、いくら鈍感でもわからないわけがないだろう。

928 ：Socket774：2009/11/25(水) 13:15:19 ID:DwMNJha2

>>927
IntelはLarabeeがx86であることを大きな柱として宣伝してるけど
>923　には既存の資産ではだめで新たに書き下ろさないと性能を
発揮させられないという意味の事が書かれている。
それなのに>927の目には、Intelの主張全肯定の”有用性の誇示”にみえるのか？

929 ：Socket774：2009/11/25(水) 14:06:02 ID:30IufTra

>>927
> IntelはLarabeeがx86であることを大きな柱として宣伝してるけど

それはx86は互換性くらいしかメリットが無いと思い込みたいお前の感想だろう。
[x86] [compatibility]でくまなく検索してみればわかるが
氏は一っ言も言ってない。

> 既存の資産ではだめで新たに書き下ろさないと性能を
> 発揮させられない

そんなのはCellは無論のこと歴代POWERアーキも通ってきた道で
ネガキャンには成りえない。

930 ：Socket774：2009/11/25(水) 14:38:44 ID:qLJteFOD

>>923を読んでわかった真実：

928は>>923を読解していない

931 ：Socket774：2009/11/25(水) 15:41:51 ID:30IufTra

↓これは自分自身のことを言ってたんだね

> 素人fanboyみたいに、知らないまま否定する

932 ：Socket774：2009/11/25(水) 21:52:18 ID:sNlazQoU

テッセレータって結局分割自体より
増大後の頂点処理のほうが重かったりする

933 ：Socket774：2009/11/25(水) 22:41:45 ID:96O39zqu

IBMがXeonサーバーばんばん売ってる間はインテル様もヨイショしないとな
Larrabeeお願いしますだぁって

934 ：,,・´∀｀・,,）っ-○○○：2009/11/25(水) 22:53:09 ID:XnXiDy9n

滑らかな曲線描くために頂点を増やすとかやんなくてもソフト実装されるラスタオペレーション側で
補完したほうがよっぽど処理は軽いと思うんだがね。
とか燃料投下してみる

935 ：,,・´∀｀・,,）っ-○○○：2009/11/25(水) 23:05:37 ID:XnXiDy9n

>>923のは普通にブックマークに入れてたわ。

Is Larrabee For the Rest of Us?
- Larrabeeは置き去りにされた人々にとって救世主になりうるか？

使い古された言い回しだが（"the computer for the rest of us"って昔の末筋凸腫の売り文句）
高スループット指向のプロセッサが数値計算に特化したものばかり幅をきかす昨今
今回実装を紹介する正規表現エンジンのような非数値計算用途においても実用に耐えうる
プロセッサが求められてるってのが同氏の論点。

どっちかというと貶されてるのはGPGPU。Cellもそうかもしれないね。

IBMは競合他社の技術であっても、気に入ったものがあれが食いつかずにはいられない。
Sunに散々噛みつかれながらもJavaに肩入れしていったけど
そういう社風だからこそJVM-JITとかEclipseみたいな傑作が生みだされたわけで。

936 ：,,・´∀｀・,,）っ-○○○：2009/11/25(水) 23:33:20 ID:XnXiDy9n

そもそもIBMは半導体製造業である前にソリューション屋だから
ソニー東芝の3馬鹿連合の腐れ縁引きずって商機を逃すような馬鹿な真似はしない。

937 ：Socket774：2009/11/26(木) 00:08:55 ID:Cr5sHBSq

>>918
> >>916
> なんで「賭け」？
> あったらあったでトラフィック削れるし、無いなら無いでかまわんのだよ。
> キャッシュにないなら、メモリからとってくればいいじゃない。
> そこは従来のGPUと変わらん。

従来のGPUのグラフィクスはストリーム処理だから、そこでメモリにアクセスすることはないでしょ。
GPUの中をぐるぐる回るんだよ。

一方Larrabeeはタイルレンダのためそれができない。
VRAMに一時バッファを設けないといけない。
例えばテッセレーションする場合、分割しうる最大頂点数分バッファ確保しないといけない。
でそれが終わってタイルレンダ始めるときにL2に頂点が残ってる可能性なんて考えるだけ無駄。

Larrabeeでタイルを使うのは>>910のような積極的な理由でなく、
そうしないといわゆるROPの処理(特にZCull)で性能が出ないから仕方なくという面が
強いと思うな。

団子さんもGPUとしはLarrabeeに期待してないでしょ？

938 ：,,・´∀｀・,,）っ-○○○：2009/11/26(木) 00:13:46 ID:Y7m0S63w

＞従来のGPUのグラフィクスはストリーム処理だから、そこでメモリにアクセスすることはないでしょ。
＞GPUの中をぐるぐる回るんだよ。

はぁ～？

939 ：,,・´∀｀・,,）っ-○○○：2009/11/26(木) 00:15:30 ID:Y7m0S63w

Larrabeeに批判的なひとって
Larrabeeに対する理解どころか
GPUの構造に対する理解も無いんですね

940 ：,,・´∀｀・,,）っ-○○○：2009/11/26(木) 00:21:49 ID:Y7m0S63w

メモリ（VRAM）はGPUの「外」にあります。カード上には溶接されてますけどね。

残念なことに、GPUの「中」に全部データ置いておけるほどFLIP-FLOP回路無いんですよ

941 ：Socket774：2009/11/26(木) 00:22:02 ID:Cr5sHBSq

>>938
> ＞従来のGPUのグラフィクスはストリーム処理だから、そこでメモリにアクセスすることはないでしょ。
> ＞GPUの中をぐるぐる回るんだよ。
>
> はぁ～？

あ団子さんいたw
テクスチャとかのことでなく>>913のことね。
だいたい従来のGPUはメモリに置き場所確保しないから置きようがないよ。

942 ：,,・´∀｀・,,）っ-○○○：2009/11/26(木) 00:39:40 ID:Y7m0S63w

たとえばXbox360はVRAMの帯域狭い代わりに12MBのeDRAMがあって
ROPから吐き出されたラスタ出力データは（以下略

943 ：,,・´∀｀・,,）っ-○○○：2009/11/26(木) 00:48:38 ID:Y7m0S63w

＞分割しうる最大頂点数分バッファ確保しないといけない。
ちなみにこれは換言するならば、キャッシュ上にバッファの断片を確保できる分だけの頂点単位で
分割処理すればキャッシュミスなしでステージ間を繋ぐことができるってことね

944 ：Socket774：2009/11/26(木) 01:06:40 ID:Cr5sHBSq

>>942
それがLarrabeeとどう関係あるの？
360のタイリングはPredicated Tilingというやり方で最大4分割までと決まってる。
でプリミティブ単位でどのタイルに含まれるかを2bitのtagで残しておく。
LarrabeeのタイリングはPowerVRと同じなので360とは違う。

>>943
Larrabee専用にそう作れば可能だろうね。
でもピクセルシェーダを何回も回さないといけないので結局効率が落ちそうだよ。

945 ：,,・´∀｀・,,）っ-○○○：2009/11/26(木) 01:07:23 ID:Y7m0S63w

＞LarrabeeのタイリングはPowerVRと同じ
基地外キター

946 ：Socket774：2009/11/26(木) 01:08:53 ID:Cr5sHBSq

そりゃ全く同じじゃないけどさ、
そこは言葉のあやってことで許してよ。

947 ：,,・´∀｀・,,）っ-○○○：2009/11/26(木) 01:23:19 ID:Y7m0S63w

あ、ちなみにL2にヒットするようにスケジューリングして動かすってのはLarrabee側の
タスクスケジューラの仕事であって、「専用」に組む必要は無いっしょ。
高級言語ランタイムで提供されるAPIで遣り繰りだけならね。

だが敢えてDirectXなどクソ食らえと言っておく。
音楽配信におけるApple、検索エンジンにおけるGoogleがそうであるように
猫も杓子もMSに主導権持たせる必要など無い。

948 ：Socket774：2009/11/26(木) 01:36:51 ID:Cr5sHBSq

しまった2bitじゃなくて4bitだった。

>>947
DX11は結構長く使われそうな雰囲気。
レイトレ時代は早くてその後だろなー。

949 ：Socket774：2009/11/26(木) 01:38:44 ID:qJQYxatM

>>947
クソ言う暇があったら自分で作れや

950 ：,,・´∀｀・,,）っ-○○○：2009/11/26(木) 01:51:30 ID:Y7m0S63w

コンシューマ優先のうちは、Xbox独り勝ちにでもならない限りは
どのみちクロスプラットフォームのミドルウェアで対応することになるからね。
柵の多いDirectXに囚われず自由にカスタムエンジン書きたい酔狂なエンジン屋さんがいるかぎり
ソフトウェアレンダラはそれなりに使われることになるでしょうよ

ちなみにEPICはLarrabeeべた褒め

951 ：,,・´∀｀・,,）っ-○○○：2009/11/26(木) 02:04:03 ID:Y7m0S63w

因みに言うとEPICってFPSのデファクトスタンダードたる杏里あるエンジン作ってる所ね。
いまはIntelとガチ癒着状態。だからこそRTRTのデモがQuake Warsなわけで。

>>948
> レイトレ時代は早くてその後だろなー。
どのみちUE4はレイトレベースになるわけ無いから。
だがLarrabeeで本領発揮するエンジンになるのはほぼ確定。

952 ：Socket774：2009/11/26(木) 02:36:32 ID:PN0R5pd0

＞ 360のタイリングはPredicated Tilingというやり方で最大4分割までと決まってる。
＞でプリミティブ単位でどのタイルに含まれるかを2bitのtagで残しておく。
tagを8bitにすりゃ、Predicated Tilingは最大256分割できるってこったろ？
んで、各タイルを別コア別スレッドでバラバラに担当する
PowerVRだって次世代の奴はそんな感じの処理になってるでしょ、噂のPSP2の4コア版とかさ

953 ：Socket774：2009/11/26(木) 02:42:52 ID:PN0R5pd0

あぁ、tagはタイルまたがるのか、んじゃ256bitねｗ
今までの3D描画って、頂点情報をケチりすぎだよ

954 ：Socket774：2009/11/26(木) 06:20:07 ID:MCZHFaAT

Intel Larrabee to surprise with performance, launch in 1H 2010? - Bright Side Of News*
ttp://www.brightsideofnews.com/news/2009/11/25/intel-larrabee-to-surprise-with-performance2c-launch-in-1h-2010.aspx

955 ：Socket774：2009/11/26(木) 06:35:09 ID:lE1PI2D4

URLだけでFUDだとわかる

956 ：Socket774：2009/11/26(木) 11:30:54 ID:sU+BbSs7

>>948
ちなみに今のゲーム業界ではマルチ開発が前提だからDXは大した支配力無い。
そもそもDXを直に叩いてゲーム作るデベロッパーなんて今時殆どいない。
ミドルウェア屋がゲームAPIの実権を掌握してる。
それでなくともデフォルトの左手系ではなくOpenGLと同じ右手系での利用が常態化してる。

そもそもIntelがLarrabeeをゲームGPUとして売り込むことに強気なのは、
DirectX(MS)のヒエラルキに縛られないフルプログラマブルGPUとして、
Tim Sweeney率いるEpic Gamesらの強い支持が得られてるからに他ならん。
DirectXやOpenGLは最初からレガシーAPIという位置づけ。

Epicは急進的で、C++やCUDAで全てのGPUパイプラインを実装できるように
すべきだと主張している。FermiもHPC市場を追いかけてるように見えて
実はEpicに合わせてプログラマブル化を進めている。

無論、Epicの連中にDirectXやOpenGLは死滅するなんていわれてMSは機嫌よくない。
GPGPU環境のより進んだGeForceをDirectX世代でRadeonの下位に位置づけることで
GeForceのほうが「世代遅れ」だとミスリードするに至ってる。
PS3のミドルウェアですらソフトウェア実装されてるテッセレータを
今更固定機能なんて時代錯誤もはなはだしいが。

957 ：Socket774：2009/11/26(木) 12:41:40 ID:j54scJPX

>>954
Teslaはぶっ潰せる目処が立ったんだろうな

958 ：Socket774：2009/11/26(木) 12:44:49 ID:HZufnNHz

ミドルウェアやさんってMSほど分け隔てなく（実質はともかく建前上は）
GPUメーカーに配慮するかな？
DXがしかとされるようになったらミドルウェアやさんが気に入った
1、2社以外はスルーされるようになるんじゃないか。
今でさえ乏しいGPUハードの種類がもっと絞られそう

959 ：Socket774：2009/11/26(木) 12:51:13 ID:nKsRvtaU

MSとべったりのAMDはどうなってしまうのやら

960 ：Socket774：2009/11/26(木) 12:58:08 ID:sU+BbSs7

Unreal Engine 3は360重視でPS3は残念なことになってるからね。
（わかりやすいところで言うとPS3版ラストレムナント開発凍結）

360は元々256MBしか積まない予定だったがTimがゴネて512MBになった。
CPUとGPUのメモリ共用が理想で、その次の世代はCPU機能を持ったGPU
（あるいはその逆）を前提にエンジンを作ろうとしてた。
EpicにとってCPUとGPUを分け隔てるDirectXは邪魔で邪魔でしょうがない。

ソニーがPS4にLarrabeeを検討したのはCellの置き換えっていうよりは
Epicの機嫌をとりたいから。
CPUにCell、GPUにLarrabee（あるいはFermi）という構成をとる
可能性はあるが、どれを選んでもCellのSPEをもてあますので
悩ましいところでしょうな。

961 ：Socket774：2009/11/26(木) 13:07:51 ID:xfommyfh

でもお高いんでしょう？

962 ：Socket774：2009/11/26(木) 15:09:58 ID:IzeF88yN

Epicのドル箱タイトルであるGears of War3を次世代機で出すといってるんだから
パブリッシャーのMSとベッタリついていくしか無いだろうに
Tim Sweeneyのララビマンセーは、要するに360の次世代機にLarrabee積めよという一種の要請だろ

963 ：Socket774：2009/11/26(木) 16:48:16 ID:kd5Pa1Ni

さらなる次世代では、GPUはららびーが共通で、CPUがぱわーシリーズの特注って構図になりえるのかねぇ。
さらに、いんてるが、ららびー採用してくれたら、カスタムさんでーぶりっじを特価で！とかいったりするんだろうか。

964 ：Socket774：2009/11/26(木) 17:42:36 ID:sU+BbSs7

PC版の次期UEでDirectX, CUDA(Fermi), LRBni のマルチバックエンド対応
ってのが落としどころになりそう。
PS4, Xbox3は2012年ごろと言われてるし、Larrabeeのローンチに際し
なんらかのタイトルを用意してるとすればそれが最初で最後の
プレゼンの機会になりそうだね。

965 ：Socket774：2009/11/26(木) 17:52:07 ID:oh++9WhP

おいおいｗ何しれっとFermi入れてんだｗ

966 ：Socket774：2009/11/26(木) 18:05:41 ID:zXd9r/pq

DXCSでプログラム書けばFermiでも動くんだからCUDA使う意味がわからない

967 ：Socket774：2009/11/26(木) 18:29:53 ID:oh++9WhP

Larrabeeは従来のGPUに比べて大きく変わってるから次世代エンジンの改革が生きてくるが
Fermiは既存のDXパイプライン処理の方が効率がよい

968 ：Socket774：2009/11/26(木) 19:46:53 ID:sU+BbSs7

PhysX・・・

969 ：Socket774：2009/11/26(木) 21:21:37 ID:cgpBtAkP

>>967
?

970 ：,,・´∀｀・,,）っ-○○○：2009/11/26(木) 22:20:49 ID:Y7m0S63w

そういえばCompute Shader上で動く物理エンジンってあったっけ？

一応HavokはOpenCL対応のあらゆるプラットフォームに移植されるが
UT3とかで使ってるPhysXのほうは・・・
なんなのかねNVIDIAの懐の狭さは

971 ：,,・´∀｀・,,）っ-○○○：2009/11/26(木) 22:45:48 ID:Y7m0S63w

なにやら香ばしい話になってるなぁ

PLAYSTATION 4はPOWER7採用
http://ps3clan.nl/2009/11/sony-kiest-voor-ibm-power7-cpu-playstation-4/

972 ：Socket774：2009/11/26(木) 22:50:29 ID:HpYiJ7iZ

GPUにEvergreen世代で勝ちも負けも無いPS4完成

973 ：Socket774：2009/11/26(木) 22:59:52 ID:/2sLxjxo

Larrabee採用よりもリアリティあるな

974 ：,,・´∀｀・,,）っ-○○○：2009/11/26(木) 23:04:10 ID:Y7m0S63w

> TBDR based PowerVR 6

なにこれ

975 ：Socket774：2009/11/26(木) 23:05:36 ID:7OPHqTfk

>>970
Compute Shader対応はまだじゃないかな。
SM5.0前提にせんと使い物にならなないから、
結局DX11対応ハードの普及がボトルネックに
なるんじゃないかと思う。

976 ：Socket774：2009/11/27(金) 00:24:02 ID:cmGdpQP7

>>971
『僕が考えた最強ゲーム機PS4はこうだ！！』

977 ：Socket774：2009/11/27(金) 00:58:55 ID:oGP++eDz

>>976
久多良木さんのいた頃は、実際にそうだったんだからな。
僕(社長)の考えた最強ゲーム機。
恐ろしい会社だ。

978 ：Socket774：2009/11/27(金) 01:48:12 ID:mTACslvt

>>974
Tile Based Deferred Rendering Based PowerVR 6
くどい言い方だw

979 ：Socket774：2009/11/27(金) 05:11:28 ID:Txi5KG5o

PS4がPower7ってことは次期箱もPower7かのう
どっちもクロック限界が見えてるPower5のカスタムチップから互換性持ったまま性能向上しようとしたらそれしかなさそうだし

980 ：Socket774：2009/11/27(金) 09:41:52 ID:uc0tFE/G

>>957
HPC版XeonMP(Nehalem-EX 6C)はLarrabeeをDMIリンクするための母艦だと思うんだ。
CPUコアだけならWestmere-EPの方が価格性能比で勝るだろうし。
FLOPS/$の安売りはしないってことだな

981 ：Socket774：2009/11/27(金) 12:15:18 ID:4FdJofhT

larrabee動かすのにxeonが要るのか？おれが見た図ではlarrabeeが互いに4つリンクされてた

982 ：Socket774：2009/11/27(金) 13:00:03 ID:uc0tFE/G

あれは凍結。
てかDMIじゃなくてQPIか。

ハードウェアを仮想化して論理的に1チップ1コンピュータで動かすモデルになるとか。
アプリからはホストとゲストは別マシンで、高速なネットワークに繋がれてるように見える。
グラボ版と同じプログラミングモデルがとれる。

983 ：Socket774：2009/11/27(金) 13:30:05 ID:D7mBF9pc

>>982
>>822に書いてあるけど、QPI版の計画はまだ生きているようだよ。

984 ：Socket774：2009/11/27(金) 13:46:51 ID:rY5hVohY

改めて読んだが日本語訳は信頼度低いな。
M-Y-Oだから共有仮想メモリモデルって訳するのが妥当。

新しい概念と見せかけて現行のGPGPU-ホスト間の接続モデルと変わらん。

985 ：Socket774：2009/11/27(金) 17:26:45 ID:Xg0U4fuo

ぬび厨は知ったかでものを言うから困る