Intel Larrabee 4コア

このエントリーをはてなブックマークに追加
1Socket774
Intel Larrabee 1コア
http://pc11.2ch.net/test/read.cgi/jisaku/1217915128/
Intel Larrabee 2コア
http://pc11.2ch.net/test/read.cgi/jisaku/1238152183/
Intel Larrabee 3コア
http://pc11.2ch.net/test/read.cgi/jisaku/1245944113/

Larrabeeはやくくてくれーーーーーーーーっっ!!
2Socket774:2009/07/29(水) 06:21:13 ID:IxOdZ7gg
しらんがな
3Socket774:2009/07/30(木) 05:07:18 ID:P3uQTmXv
糞スレ上げ
4Socket774:2009/07/30(木) 15:09:26 ID:7axByCOW
糞スレじゃねーよ。
で、情報まだ?
5Socket774:2009/07/30(木) 15:40:54 ID:goqnzu7r
なんで糞スレじゃないってわかるの?
6Socket774:2009/07/30(木) 23:55:19 ID:uL6jWk38
 
7Socket774:2009/07/31(金) 13:44:10 ID:a4Ui7vT4
楽しみだけど、前スレが11レスで落ちたからみんな待ってないのかなw
8Socket774:2009/08/01(土) 00:52:46 ID:icLUd671
さ ぁ ふ る え る が い い
9Socket774:2009/08/02(日) 19:21:12 ID:WC0lIxM1
やぁみんな!期待に応えて増えたよ!!

(´・ω・`)(´・ω・`)(´・ω・`)(´・ω・`)(´・ω・`)(´・ω・`)(´・ω・`)(´・ω・`)

(´・ω・`)なんて増殖するとか思ったの?

(´・ω・`)=3
10Socket774:2009/08/03(月) 22:12:58 ID:RvC5CoNw
(´・ω・`)くさいスレだねぇ
11Socket774:2009/08/04(火) 16:43:51 ID:CjHHLmBz
(´・ω・`)クサッ!このスレニオウヨー
12Socket774:2009/08/05(水) 18:56:40 ID:wuH6f42X
(´・ω・`)ショボンヌ帝国in自作PCと聞いて飛んできました
13Socket774:2009/08/06(木) 02:56:52 ID:p7+4GVSB
(´・ω・`)自演乙

(´・ω・`)=3
14Socket774:2009/08/06(木) 12:03:01 ID:/IQwbrLZ
カワイソ( ´・ω・)ス
15Socket774:2009/08/07(金) 13:45:34 ID:EZ6PkUOd
(´・ω・`)はじめまして

(´・ω・`)っ● つまらないウンコですがどうぞ
16Socket774:2009/08/07(金) 17:09:19 ID:EZ6PkUOd
(´・ω・`)…

(´・ω・`)一時間以内にガッされなかったら神になれる
17Socket774:2009/08/07(金) 17:31:23 ID:3b52XyaW
       ミ ____
       ミ/\     \
          /   \___\
       /    /     /  ガッ
  ∧_∧/    /  人  /
 (´・ω・`)\  /  <  >_∧∩
 (   つノ .\/___V `Д´)/
                  />>16
18Socket774:2009/08/07(金) 17:47:35 ID:I4VhoorW
(´・ω・`)ぬるぽ!!!
19Socket774:2009/08/07(金) 23:26:45 ID:I4VhoorW
(´・ω・`)ぬるぽ
20Socket774:2009/08/07(金) 23:27:28 ID:I4VhoorW
(´・ω・`)オラオラ!ぬるぽ!!!ぬるぽぬるぽぬるぬるるるぬるぽぬるぽっぽーー!!
21Socket774:2009/08/08(土) 16:52:45 ID:ZvHxXlD+
(´・ω・`)ぬるぽ
22Socket774:2009/08/08(土) 20:57:29 ID:ZvHxXlD+
(´・ω・`)まだまだぬるぽ
23Socket774:2009/08/08(土) 21:46:32 ID:ZvHxXlD+
(´・ω・`)ウェーハッハッハ!ガッしてみやがれクソども!

(´・ω・`)ぬるっぽ〜♪
24Socket774:2009/08/09(日) 03:45:28 ID:i6swSJDZ
(´・ω・`)ぬる〜♪ぬるるるっぽっぽ〜♪
25Socket774:2009/08/09(日) 12:25:38 ID:i6swSJDZ
(´・ω・`)本当にガッされないねぇ

(´・ω・`)俺しかいない予感!

(´・ω・`)ぬるぽ!!
26Socket774:2009/08/09(日) 20:39:59 ID:nWWj98yb
(´・ω・`)ぬるぽ
27Socket774:2009/08/09(日) 20:44:22 ID:lOoQGexw
(´・ω・`)?
28Socket774:2009/08/09(日) 21:00:34 ID:E26ztVih
( ´・ω・`)ここはどこだい?
29Socket774:2009/08/10(月) 00:37:31 ID:Yi7VUnFs
(´・ω・`)ようこそぶりゃんぬスレへ
30Socket774:2009/08/10(月) 14:02:49 ID:jq0/yY6d
(´・ω・`)ウンチ
31Socket774:2009/08/10(月) 15:20:39 ID:Yr6rwJUL
(´・ω・`)アウー
32Socket774:2009/08/10(月) 18:38:16 ID:H/5/+15o
(´・ω・`)っL
33Socket774:2009/08/11(火) 08:02:05 ID:dXCnHG73
(´・ω・`)
 つLと
34Socket774:2009/08/11(火) 13:07:56 ID:KmWnCyDG
(´・ω・`)私がLです
35Socket774:2009/08/12(水) 01:56:38 ID:rkkDHriU
(´・ω・`)私が変なオジサンです
36Socket774:2009/08/12(水) 03:43:37 ID:EevvA2p4
(´・ω・`)じゃあ俺は変なガンダムだ
37Socket774:2009/08/13(木) 16:23:11 ID:20mnFBnp
(´・ω・`)いえ…私は…変なゼロです…
38Socket774:2009/08/14(金) 03:32:41 ID:l65pgJNU
(´・ω・`)俺はフルチンだ
39Socket774:2009/08/14(金) 11:59:26 ID:NrZTY11I
(´・ω・`)それはそれは・・・
40Socket774:2009/08/15(土) 12:55:38 ID:pZ4KKrl8
                    ,===,====、
                   _.||___|_____||_
..                 /   /||___|^ l    
..              (*‘ω‘ *)//||   |口| |ω‘ *)   ぽおおおお
.             ./(^(^ .//||...||   |口| |c  )    
...               /   //  ||...||   |口| ||し
.......       (*‘ω‘ *) //....  ||...||   |口| ||
         /(^(^ //  ....  .||...||   |口| ||
 ""    :::'' |/   |/ '' "  :::  ⌒  :: ⌒⌒⌒ :: ""  `
 :: ,, ::::: ,, ; ̄ ̄ ̄  "、 :::: " ,, , :::   " :: " ::::  "
41Socket774:2009/08/15(土) 15:00:08 ID:EpTdQWUe
(´・ω・`)そろそろまぜろよ
42Socket774:2009/08/17(月) 21:34:45 ID:5/ZxUtle
      ちんぽっぽ
    ∧ ∧          ぼいーーんっ!
 (>=◎‘ω‘ *)   (´⌒(´⌒;;
  /_./ 〉 ⊂_ノ`  (´⌒(´≡≡≡(´⌒;;;≡≡≡⌒;;
 〈/ )/__ノ,ミ ≡≡≡(´⌒;;;≡≡≡
 (_/^´  (´⌒(´⌒;;
43Socket774:2009/08/18(火) 05:27:20 ID:9J0pgkBl
結局プログラム組むのがGPGPUより糞大変で
GPUが進んでるGPGPUの動きに合わせるしかなさそうだな
PS4とかに使えばいいんじゃね
44Socket774:2009/08/18(火) 05:40:57 ID:RoY7i9uV
オマエバカナノ
45Socket774:2009/08/18(火) 17:16:45 ID:K+gXN2wP
ヨクワカラナイケドオレハバカダヨ
46Socket774:2009/08/19(水) 14:15:16 ID:1Njqmjmn
(´・ω・`)うるせーハゲ
47Socket774:2009/08/19(水) 20:33:22 ID:e72U57hf
>>44
普通のCPU同然みたいに使えるとか思ってんの?
48Socket774:2009/08/19(水) 21:06:40 ID:8CIehTnA
少なくとも、あと2世代先のGPUよりは
49Socket774:2009/08/21(金) 00:13:32 ID:MSawTMCn
50Socket774:2009/08/21(金) 00:27:37 ID:Sokjx14I
アンチの工作うざい
順調だっつってんだろ

http://www.intel.co.jp/jp/intel/pr/press/jointhp.htm
このPentiumベースの最初のメニーコアアーキテクチャプロセッサ
「Larrabee(TM)」は、インテルによって設計、製造、販売される予定で、
量産出荷は2009年になる見込みです。

http://www.intel.co.jp/jp/intel/pr/press98/980601.htm
インテル コーポレーション(本社:米国カリフォルニア州サンタクララ)
は、本日、「Larrabee(TM) プロセッサ」の生産スケジュールの変更を
顧客に連絡したと発表しました。連絡された最新の生産スケジュール
によると、同プロセッサのサンプル出荷は2009年に、また、当初
2009年に予定されていた量産出荷は、2010年半ばに予定されています。

http://techon.nikkeibp.co.jp/article/NEWS/20080118/145725/
米Intel社は,「Larrabee(ララビ)」を搭載した実機を使った
3次元グラフィックスデモを初公開した。2009年9月22日から
米国サンフランシスコで開催中の「IDF Fall 2009」の基調講演で,
社長兼CEOのPaul Otellini氏自らが,デモを披露した。
Larrabeeは,すでに特定メーカ向けのサンプル出荷が始まっている。
51Socket774:2009/08/21(金) 07:58:29 ID:UZyhN9oP
http://northwood.blog60.fc2.com/blog-entry-3071.html

◇“Larrabee”は第3世代なのか?
Larrabee is Intel’s third attempt(Fudzilla)
http://www.fudzilla.com/content/view/15098/34/

Silicon Valley内の情報によると、現在Intelが言う“Larrabee”は3世代目になるという。
最初の2世代は大きく熱かった。なので、Intelの考えていたものとは合致せず、失敗となった。そして第3世代は2010年の中盤にお披露目される。
噂では“Larrabee 3”はやはり大きく手厚いが、性能面では現行世代のGeForce GTX 295やRadeon HD 4870X2を超えられるという。
ただし、NVIDIAもAMD-ATiもGPUのリフレッシュを計画しており、“Larrabee 3”ローンチ時点ではIntelはNVIDIAやAMD-ATiに追いつくことは出来そうにない。

>最初の2世代は大きく熱かった。なので、Intelの考えていたものとは合致せず、失敗となった。
>最初の2世代は大きく熱かった。なので、Intelの考えていたものとは合致せず、失敗となった。
>最初の2世代は大きく熱かった。なので、Intelの考えていたものとは合致せず、失敗となった。

>Larrabee 3”ローンチ時点ではIntelはNVIDIAやAMD-ATiに追いつくことは出来そうにない。
>Larrabee 3”ローンチ時点ではIntelはNVIDIAやAMD-ATiに追いつくことは出来そうにない。
>Larrabee 3”ローンチ時点ではIntelはNVIDIAやAMD-ATiに追いつくことは出来そうにない。


プゲラwwwwwwwwwwwwwwwwwwwwwwwwwww
52Socket774:2009/08/21(金) 08:24:43 ID:A+3vQr1W
どんなに画期的なんかと期待してたんだが
他社のGPUとたいして変わらないのか。
53Socket774:2009/08/21(金) 10:36:25 ID:6IFyWUVy
大分前から微妙臭がしてたけどな…
個人的にはLarrabeeまでGMAで頑張るって方が終わってる
54Socket774:2009/08/21(金) 12:08:21 ID:lkUHBnsP
そこでnVidia買収ですよ。
55Socket774:2009/08/21(金) 13:28:19 ID:lGEIWCyq
性能がよくないだけで残念な空気になるとは。
Larrabeeはプログラミング用のおもちゃとして使うものだと思ってた。
56Socket774:2009/08/23(日) 21:18:04 ID:oTF6+N0T

バン       バンバンバン゛ン バンバン
バン(∩‘ω‘ *)  バンバンバンバン゛ン
 _/_ミつ/ ̄ ̄ ̄/
    \/___/ ̄
57Socket774:2009/08/24(月) 23:16:48 ID:chzU3t7k
     /      /|
      | ̄ ̄ ̄ ̄ |  |
      |[]::       |  |
      |──── |  |
      |[]::       |  | 
      |_____|  |
ガラッ  |_____|  |    過疎かね?
.  彡/(・ω・ ) /|  |  
   | ̄ ̄ ̄ ̄|  |/    
   |____|/
58Socket774:2009/08/26(水) 04:06:51 ID:YbgQRfFD
ハードウェア固定機能を搭載したGPUに勝てるのか?
ソフトウェアによる柔軟性は性能とのトレードオフ
単体CPUとしてみれはタダのPentiumだし
GPUとしてみても、固定機能をソフトウェアで実装してやらないと
動かないメンドクサイ存在

Cellのように「プログラミングが難しくてアプリケーションが作れません!」
となる確率極大

オープンソースの「メニーコアCPU用GPUエミュレーションライブラリ」を出さないと無理
59Socket774:2009/08/26(水) 05:47:45 ID:hvajBTj+
CPUとGPUの構造が単純化して性能向上に繋がったらいいんだけど
60Socket774:2009/08/26(水) 06:23:04 ID:UwMnfQUD
DX10の時点でDX9以前の固定機能は盲腸
texture unitは残るだろうけどね
61Socket774:2009/08/26(水) 11:33:26 ID:oOWcshg0
LinuxでのOpenGL, OpenCLあたりに関して言えば、Larrabeeが出るころには
Gallum3DのLarrabee Driverを作れば対応出来るようになっているはず。
62Socket774:2009/08/26(水) 13:21:23 ID:bZGUlnFW
で結局、実用性はあるんか?
乗り換えるメリットねーならいらんし

どーなのよ
63Socket774:2009/08/26(水) 15:35:52 ID:9kbihJiO
LarrabeeのマルチスレッドプログラミングってPOSIXのpthreadみたいにできるのかな?
できればプログラムの移植が楽になるんだが…
64Socket774:2009/08/28(金) 08:41:37 ID:QgSoP0Kz
金でゴリ押しの普及させようとしても、Cellみたいにローカルな感じになるんだろうな
ずっと続けるためにはLarrabee2とか出さないといけないし
並列コンピューティングのシェアがCUDAに奪われたから作ったんだろうけど、Larrabeeにするメリットが無い
ソフト開発の流れを、いかにLarrabee向けにするかだよな
出荷されても対応ソフトも無くて、ローエンドなGPUとして使うしかないんだろ?
65Socket774:2009/09/03(木) 18:04:05 ID:oFeoXptx
http://www.4gamer.net/games/032/G003263/20090903008/
マイクロソフトが担当する技術セッションではお馴染みの「顔」である。
ご存じの方も多いと思うが,川西氏が得意とするのはグラフィックス。

そのため,このセッションも「裏のタイトルは,『Larrabee』(ララビー,開発コードネーム)の準備をしよう,

次世代の準備をしようというノリ」にしようかと考えていたそうだ。
66Socket774:2009/09/03(木) 18:51:29 ID:mg594UxK
その写真のオカマ野郎が団子ってわけか
67Socket774:2009/09/03(木) 19:03:28 ID:IdWZrO4K
まぁDX9で十分だもんな
Crytecもすでに次世代手法に移ってるけど
現行法は限界だから美しいグラフィックを求めるというならららb、いや次世代しか選択肢はないよな

そこまでグラフィッククオリティ求めてねーよというならDX9で十分
もっと美しいグラフィックでゲームしたいっていうなら
68Socket774:2009/09/03(木) 19:03:37 ID:oFeoXptx
MS(DX)がどう進もうとしてるかは明らかやね

>Microsoftの日本法人であるマイクロソフトでプラットフォーム エバンジェリストを務める川西裕幸氏だ。
>マイクロソフトが担当する技術セッションではお馴染みの「顔」である。
>ご存じの方も多いと思うが,川西氏が得意とするのはグラフィックス。

http://blogs.msdn.com/hiroyuk/default.aspx
川西 裕幸のブログ
Windows Graphics & Presentaiton Technologies for Developers
69Socket774:2009/09/03(木) 20:56:38 ID:UinmzS0l
Nehalem EXのL3は24MBフラットじゃなくて3MBづつでリングバスで
繋がってるんだとさ。キャッシュをリングバスでってのはLarrabeeで
ぶっつけ本番じゃないんだな。

Larrabeeでも
>複数のリング区間に別のデータを載せることができる。
ってなってるんだろうか

http://journal.mycom.co.jp/articles/2009/09/03/hot_chips21_server/002.html
70Socket774:2009/09/08(火) 02:27:10 ID:pDASjNp3
出た頃には時代遅れとか、インテルは笑わしてくれるな
71Socket774:2009/09/09(水) 03:24:11 ID:x1uBQTAG
>>69
Sandy BridgeもL3とIGPがRing。
72,,・´∀`・,,)っ-○○○:2009/09/10(木) 22:56:13 ID:NYMGAvzW
続報なさ過ぎるわい
73Socket774:2009/09/10(木) 23:00:17 ID:eqTIGewB
ぱたっと途絶えたよな
別に『やっぱまた延期するわ』っていう発表あっても全然驚かないわ
74Socket774:2009/09/10(木) 23:08:05 ID:ZwEndIZd
4月に公開した円盤は絵に描いた餅でFA?
75Socket774:2009/09/10(木) 23:14:47 ID:zGzFbKrt
もち、株価対策
76,,・´∀`・,,)っ-○○○:2009/09/10(木) 23:15:07 ID:NYMGAvzW
あれが「Larrabee 3」だろ
知る限りLarrabeeの仕様は2回変更されてるから。
情報出たてのころSIMDはSSE互換だった。
77Socket774:2009/09/10(木) 23:20:13 ID:gEIqgr4E
78,,・´∀`・,,)っ-○○○:2009/09/10(木) 23:22:32 ID:NYMGAvzW
生まれてもない子の歳をかぞえてもしゃーないってのが中の人の見解か
ごもっとも
79Socket774:2009/09/10(木) 23:27:57 ID:ssT8wx7J
ネタはないし、夜も更けたし、もうそろそろ寝ようぜ。

601 :,,・´∀`・,,)っ-●◎○ [sage] :2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeのサンプルはDreamworksで評価されてるようだが
80,,・´∀`・,,)っ-○○○:2009/09/10(木) 23:28:52 ID:NYMGAvzW
俺の手元にあるシミュレータって何だろうな
81Socket774:2009/09/10(木) 23:33:33 ID:ssT8wx7J
騒がしいな、眠れねーだろ

50 :Socket774 [sage] :2009/03/30(月) 23:05:49 ID:RNqRpRRq
シミュレータをサンプル扱いするなんて前代未聞!
さすが団子さんだぜ


ばーか

62 :,,・´∀`・,,)っ-●◎○ [sage] :2009/03/31(火) 00:00:02 ID:YbyWNvCs
> TheINQのCharlie "Groo" DemerjianがLarrabeeのサンプルが今年の秋にも
> 開発者向けに配布されると伝えているす

ここでの開発者が【ソフトの】開発者のことを指してることに気づいてほしい。
ハード開発者はIntelだけだ。

そして「サンプル」とは一般開発者向けにはprotorype primitiveのこと。
確かにあれの公開は彼の言ったとおり約半年遅れの今年3月になった。

ハードだと思って一喜一憂してたのはおまいらだけだよ

63 :MACオタ>団子 さん [sage] :2009/03/31(火) 00:09:28 ID:3FaCOFUY
>>62
"silicon"って書いてあるのですが?
http://www.realworldtech.com/forums/index.cfm?action=detail&id=96437&threadid=96378&roomid=2
  ---------------------
  the Taiwanese were expecting silicon in January.
  ---------------------
Intelはチップの開発メーカーであって、ビデオカードやマザーボードの開発メーカーは別途いますよ。

64 :,,・´∀`・,,)っ-●◎○ [sage] :2009/03/31(火) 00:11:09 ID:YbyWNvCs
また宇宙から電波でも拾ったんでしょ。
なんせ彼のPenrynにはHyperThreadingが実装されてるんだし。

66 :Socket774 [sage] :2009/03/31(火) 00:17:43 ID:PgS7bnB4
http://www.xbitlabs.com/news/video/display/20080117222433_Intel_Promises_to_Sample_Larrabee_Processors_in_Late_2008.html

> “Larrabee first silicon should be late this year in terms of samples
> and we’ll start playing with it and sampling it to developers and I
> still think we are on track for a product in late ’09, 2010 timeframe,”
> said Paul Otellini, chief executive officer of Intel.

これも宇宙からの電波かもしれんw
82,,・´∀`・,,)っ-○○○:2009/09/10(木) 23:35:45 ID:NYMGAvzW
PenrynにHyper Threadingが搭載されてるDemakasejan劇場再開?
83Socket774:2009/09/10(木) 23:37:07 ID:WDPZD/Mb
劇場は閉幕した。寝ろ。

601 :,,・´∀`・,,)っ-●◎○ [sage] :2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeのサンプルはDreamworksで評価されてるようだが
84,,・´∀`・,,)っ-○○○:2009/09/10(木) 23:39:34 ID:NYMGAvzW
シリコンIDFで出てたのにまだ言ってるのか。
君の会社ではWestmereのサンプルには触る機会あったかね?
ちなみにSandy BridgeのLoad/Storeポートの番号くらいまでは俺の中では既出情報
85,,・´∀`・,,)っ-○○○:2009/09/10(木) 23:45:10 ID:NYMGAvzW
ちなみにLarrabeeのLoad/Storeはマルチポートになってて1コア当たり64バイト/clk
L1キャッシュがGPUのレジスタファイルのように使えるってのはあながち嘘じゃない
86Socket774:2009/09/10(木) 23:46:09 ID:uEESRbPF
久々に団子を見ちゃった…
見ないようにしてたのに…
見ちゃった…
87,,・´∀`・,,)っ-○○○:2009/09/10(木) 23:47:51 ID:NYMGAvzW
>>86
              / ̄\
             |     |
              \_/
              / ̄\
             |     |
              \_/
              / ̄\
             |     |
              \_/
               |
            /  ̄  ̄ \
          /  \ /  \
         /   ⌒   ⌒   \      よくぞこのスレを開いてくれた
         |    (__人__)     |      褒美として団子を買う権利をやる
         \    ` ⌒´    /   ☆
         /ヽ、--ー、__,-‐´ \─/
        / >   ヽ▼●▼<\  ||ー、.
       / ヽ、   \ i |。| |/  ヽ (ニ、`ヽ.
      .l   ヽ     l |。| | r-、y `ニ  ノ \
      l    _|___|ー─ |  ̄ l   `~ヽ_ノ
88Socket774:2009/09/10(木) 23:50:30 ID:vZTK50aJ
しがないレンダ屋やってるが、俺んとこにはれれべーのサンプル来ないぞ。
イソ〒ル死ね!!!

601 :,,・´∀`・,,)っ-●◎○ [sage] :2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeのサンプルはDreamworksで評価されてるようだが
89,,・´∀`・,,)っ-○○○:2009/09/10(木) 23:57:11 ID:NYMGAvzW
ところでOpcode 64 67 90って知らない?
ひでーよな。公開情報なのに、「Larrabee」でググっても出てこないんだぜ。
90Socket774:2009/09/10(木) 23:59:34 ID:UKUBWjV/
よくわかんないけど↓を貼ると何か御利益でもあるの?

601 :,,・´∀`・,,)っ-●◎○ [sage] :2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeのサンプルはDreamworksで評価されてるようだが
91,,・´∀`・,,)っ-○○○:2009/09/11(金) 00:00:45 ID:NYMGAvzW
FS LCP NOP
92,,・´∀`・,,)っ-○○○:2009/09/11(金) 00:01:25 ID:gMJd18aF
>>90
あるんじゃね?

601 :,,・´∀`・,,)っ-●◎○ [sage] :2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeのサンプルはDreamworksで評価されてるようだが
93Socket774:2009/09/11(金) 00:03:59 ID:rXAIs8Ib
これ貼ると競馬で大当たりするらしいよ

601 :,,・´∀`・,,)っ-●◎○ [sage] :2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeの(silicon)サンプルはDreamworksで評価されてるようだが
94,,・´∀`・,,)っ-○○○:2009/09/11(金) 00:10:58 ID:gMJd18aF
ハワイのパチンコ当たった当たった

601 :,,・´∀`・,,)っ-●◎○ [sage] :2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeの(silicon)サンプルはDreamworksで評価されてるようだが
95Socket774:2009/09/11(金) 02:59:11 ID:enteOS7V
で、いつ出るのさ?
96Socket774:2009/09/11(金) 11:13:12 ID:3QC2sAa0
HD5870チップサイズ338mm2で2.6Tflopsらしいけど、Larrabeeどうなってるの?


601 :,,・´∀`・,,)っ-●◎○ [sage] :2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeの(silicon)サンプルはDreamworksで評価されてるようだが
97Socket774:2009/09/11(金) 11:20:51 ID:f6yZbazf
>>96
500mm^2〜600mm^2で2Tflops??

601 :,,・´∀`・,,)っ-●◎○ [sage] :2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeの(silicon)サンプルはDreamworksで評価されてるようだが

98Socket774:2009/09/11(金) 11:56:30 ID:8Ydr1nqT
え、LNIのバイトコードって公開されたの?
99Socket774:2009/09/11(金) 13:30:20 ID:iaWmjiq8
(´・ω・`)ぬるぽ
100Socket774:2009/09/11(金) 17:48:52 ID:4hpwDdvT
さ ぁ ふ る え る が い い
101Socket774:2009/09/11(金) 17:49:33 ID:4hpwDdvT
糞ダンゴ
102Socket774:2009/09/13(日) 00:31:35 ID:fy4lEUFU
IDFでのデモ疲労まであと10日!
103Socket774:2009/09/14(月) 18:51:34 ID:Rnj1CaHV
Intel、9月22日〜24日に開催予定のIDFの内容を予告
〜32nm製品やJasper Forestなどの詳細が明らかに
http://pc.watch.impress.co.jp/docs/news/20090914_315467.html

さらには並列コンピューティングを実現する「Larrabee」などについての説明などについても行なうという。
104Socket774:2009/09/14(月) 20:03:42 ID:XcTQeugU
いよいよ動くLarrabeeが見れるのか!!
ん?

>「Larrabee」などについての説明などについても行なうという。
>bee」などについての説明などについて

>     説  明

( ゚д゚ )
105Socket774:2009/09/14(月) 22:44:38 ID:mZHuztw8
(´・ω・`)スモークチーズはあるかい?
106Socket774:2009/09/15(火) 07:36:46 ID:esRh0S5A
もしかしてローンチさせた時にはもう開発環境が充実している、みたいな
状態を目指しているのかな。かなり慎重にことを進めているように見える
107Socket774:2009/09/15(火) 09:14:34 ID:hhc3bmdv
プロジェクト失敗の責任を取らされる形で
ゲルたんがクビってホント?
108,,・´∀`・,,)っ-○○○:2009/09/15(火) 22:19:18 ID:CtE/fxwg
>>106
それはそうだ。ハードだけ出してソフト開発者に丸投げじゃCellとなにも変わらん


ハード出す機会を逸し続けてるのも確かだが
どこそこ開発環境の整備に手間取ってるのも確かだな
C++に限ればThreading Building Blocksみたいな成果物は出てきてはいるが
本命のCtはまだだし。

だが丸投げのAMDなんかよりは遙かにマシとはいえる
109Socket774:2009/09/15(火) 22:20:39 ID:UIzxxCZs
110Socket774:2009/09/15(火) 23:13:02 ID:AeHDYv/U
つまりインテルは本気じゃないという事ですね
111Socket774:2009/09/16(水) 00:22:44 ID:0AZr+VwB
糞ダンゴ
112Socket774:2009/09/16(水) 00:23:24 ID:0AZr+VwB
さ ぁ ふ る え る が い い
113Socket774:2009/09/16(水) 11:21:31 ID:XwXgMKPl
GT300の歩留まりが2%以下らしいな
これはつまりAMDにライバルがいなくなったと思っていい
114Socket774:2009/09/16(水) 11:29:45 ID:21jorwK+
GPU市場の蝋燭の火が消える
そのほんの一瞬の輝きに過ぎん
115Socket774:2009/09/16(水) 12:14:44 ID:XwXgMKPl
たしかに これで競争が無くなることによる性能upの期待は薄れたね
AMD一強になる可能性大
116Socket774:2009/09/16(水) 12:30:38 ID:21jorwK+
単なるお絵かき発熱器は
ベンチしか用が無いってことさ
117Socket774:2009/09/16(水) 19:19:29 ID:p+3P5vC0
発売がDX10からDX11必須な時期に延期になって
その対応をすべてソフト部隊が行うんだからどんなけ大変なんだろかと。
ハード実装されてるAtiNvのドライバ開発部隊だって数百人規模なのに・・・
118Socket774:2009/09/16(水) 19:51:03 ID:21jorwK+
ハード実装とおっしゃいますが
DX10以降、ほとんどはshaderで置き換えだよ
つまりは、DX9以前のありふれた機能であっても
プログラマがかかにゃならんの
119Socket774:2009/09/16(水) 20:09:40 ID:UHnTpmIi
>>116
ちゃんと役立つ暖房器具をバカにすんな
http://blog.livedoor.jp/amd646464/archives/51405072.html
120Socket774:2009/09/17(木) 04:02:24 ID:hMOkTMxo
>>118
テッセレーターやROPはハードウェア実装だろ?
それすらもソフトウェアで書かねばならないLarrabeeが
GPUに勝つためには製造プロセスで1世代先をいくか
ダイサイズを大きくして、できる限り演算ユニットに
トランジスタ数を割くかのどちらかしかない

3DCG以外の汎用並列処理ならLarrabeeを使うメリットが
あるだろうが、グラフィックに限っていえばLarrabeeが
GPUに勝てる見込みはないだろう
121Socket774:2009/09/17(木) 06:58:52 ID:Xg1D6Iol
勝つ必要が無いもの
ATI,nvは所詮ベンチ専用
122,,・´∀`・,,)っ-○○○:2009/09/17(木) 07:26:57 ID:ZP1RrD/W
HW実装のテッセレータって必要なの?
ソフト実装だとどのくらいの性能上のコストになるとか定量的な比較ができないことには
どうとも言えない
西川いわくMS的にはもともとソフトでの実装を想定してたものらしいし
123Socket774:2009/09/17(木) 11:25:34 ID:ZM8rN7CE
POWER7は帯域モンスターらしい。
Larrabeeは何とどんな太さで繋げられるかわからないことには
何に使えるのか判断できない
124Socket774:2009/09/17(木) 11:50:46 ID:5n0pXN4Y
まったく…団子は嘘ばっかり言いすぎ
だからあんな顔になったりするんだよ
125Socket774:2009/09/17(木) 18:53:45 ID:YkoJn40H
126Socket774:2009/09/17(木) 22:43:48 ID:qE4c2kzb
Larrabee has a host of bugs which prevented public showings of the Ax silicon.
That said, almost all problems are said to be fixed in the move from Ax to B0 silicon.

ちょ
http://pc11.2ch.net/test/read.cgi/jisaku/1245944113/2
2 :Socket774:2009/06/26(金) 00:46:41 ID:K0n9bRUo
FUDzilllaがソフトウェアサポートやドライバの遅れを報じてるけど、
これは真相を隠すための言い訳リーク情報で、
実際はファーストシリコンがまともに動作せず、開発チームは火の車状態。
127Socket774:2009/09/17(木) 22:48:15 ID:u2qL0aep
テッセレータはDX10GPUとソフトエミュのデモで1fps以下のスピードを出せてたので
ソフトエミュでいいんじゃないのw
128Socket774:2009/09/17(木) 22:59:58 ID:QsJX1gr/
601 :,,・´∀`・,,)っ-●◎○ [sage] :2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeのサンプルはDreamworksで評価されてるようだが
129Socket774:2009/09/17(木) 23:11:56 ID:o8CpOynW
バグだらけでまともに動かないAxシリコンを、
Dreamworksはいったいどうやって評価していたのだろう。
130Socket774:2009/09/18(金) 01:51:09 ID:ef0pKKCE
殻割りしてキラキラしてて綺麗だな〜〜とか
131Socket774:2009/09/18(金) 08:08:38 ID:ZD70ajJ8
そもそもソフト屋にとっては先にソフトのサイクルアキュレートなシミュレータさえ用意してもらえれば何とでもなるよ。
逆にそういったソフト開発ツールがないとエンジン開発もやりようがないし
先にチップだけ渡されてどうにかなるわけでもない
エンジニアリングサンプルが必要なのはハード設計屋。
132Socket774:2009/09/18(金) 09:35:26 ID:nTMfhRp5
>>128
そっか、団子はバグ取りで遊んでたのか

601 :,,・´∀`・,,)っ-●◎○ [sage] :2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeのサンプルはDreamworksで評価されてるようだが
133Socket774:2009/09/18(金) 21:55:42 ID:esGm1GZn

     デケデケ      |               |
        ドコドコ   < ぽおおおぉぉぉぉぉぉぉ>
   ☆      ドムドム |_ _  _ _ _ _|
        ☆   ダダダダ! ∨  ∨ ∨ ∨ ∨ ∨
  ドシャーン!  ヽ         オラオラッ!!    ♪
         =≡= ∧_∧     ☆
      ♪   / 〃(*‘ω‘ *)    / シャンシャン
    ♪   〆  ┌\と\と.ヾ∈≡∋ゞ
         ||  γ ⌒ヽヽコ ノ  ||
         || ΣΣ  .|:::|∪〓  ||   ♪
        ./|\人 _.ノノ _||_. /|\
         ドチドチ!
134Socket774:2009/09/20(日) 16:26:19 ID:99plnXPo
ttp://wlog.flatlib.jp/item/1392

Mobile GPU

>電力も面積も限られているモバイル向け GPU にとってバス帯域は大きな問題です。
>タイルベースで深度判定のみ先行し、最小限のフラグメントのみレンダリングする
>PowerVR と同じように、AMD もチップ内の少量かつ高速な RAM を用いたタイルベース
>レンダリングを行っているようです。この辺の工夫も非常に興味深いところです。
135Socket774:2009/09/23(水) 12:57:34 ID:3qoCto8i
136Socket774:2009/09/23(水) 13:40:05 ID:PM1+tYHR
Larrabee−次世代を感じさせる高性能と低消費電力、GeForce GTX 285を凌駕
http://pc.watch.impress.co.jp/docs/column/tawada/20090923_317271.html
137Socket774:2009/09/23(水) 14:17:19 ID:D8NL496G
>>136
どーこー?????
138Socket774:2009/09/23(水) 15:15:08 ID:XQ6Yhu4u
Intel,IDF 2009で「Larrabee」の実機デモを披露。2010年以降,ハイエンド市場向けにグラフィックスカードを投入へ
ttp://www.4gamer.net/games/049/G004963/20090923003/
139Socket774:2009/09/23(水) 15:51:51 ID:gyWCTvjt
なんかデモのフレームレートめちゃくちゃ低くねぇ?
140Socket774:2009/09/23(水) 16:58:23 ID:6f2OgR95
試作段階とは、お披露目で自慢のレイトレがこの程度
なら既存のラスタライゼーションでは、HD5xxxやGTX3xxには勝てない

Larrabeeって、なにを売りにするの?
141Socket774:2009/09/23(水) 17:03:11 ID:HRXdIN1C
日本語で
142Socket774:2009/09/23(水) 17:09:02 ID:zLtMfCjn
90MHzのFPGAのSaarCORでさえもっとスムーズに動いていたような…
レイキャストぐらいハードで実装すりゃいいのに
143Socket774:2009/09/23(水) 17:19:06 ID:smU1uwpm
リアルタイムレイトレーシングは技術者の夢だが
この程度の画質じゃ誰も食いつかないよな
せめてV-ray並のフォトリアル表現できないと
ttp://v-ray.jp/envyspot2008_june.shtml

Cell+RSXのように、GPUとCPU内蔵のLarrabeeによる協業を模索してるのか?
144Socket774:2009/09/23(水) 18:00:19 ID:Wkv4bmi4
市場に出てないCPU持ってきて下駄履いてるのにそれか
145Socket774:2009/09/23(水) 18:06:27 ID:4FqlwNtF
ネタ元
ttp://www.youtube.com/watch?v=mtHDSG2wNho
Quake Wars: Ray Traced

今回のintelデモ
ttp://www.youtube.com/watch?v=G-FKBMct21g
Sean Maloney's IDF 2009 Larrabee graphics demo
146Socket774:2009/09/23(水) 20:31:42 ID:pmu5x0AV
N厨の火病りっぷりが面白いw
147Socket774:2009/09/23(水) 23:53:16 ID:ZJq+quF3
OpenCLより開発の多いCUDA、スペックが足りないララビー、蚊帳の外のAMD
148Socket774:2009/09/24(木) 00:20:59 ID:3fSSpCHe
【IDF 2009レポート】ショーン・マローニ氏基調講演レポート
〜Larrabeeのデモを初公開
http://pc.watch.impress.co.jp/docs/news/event/20090924_317313.html
149Socket774:2009/09/24(木) 00:43:06 ID:ox/cpnhF
CtならCTならなんとかしてくれる・・・。
150Socket774:2009/09/24(木) 00:44:05 ID:lA0rdcYE
団子さんはゲーム用グラフィックスプロセッサとしては興味ないんだっけ?

いや俺もないんだけど
151Socket774:2009/09/24(木) 00:47:31 ID:w49PsoMK
1600コアの時代にたかだか4コアだの8コアだのいってるCPUを語ってる場合か
152Socket774:2009/09/24(木) 00:55:40 ID:K9wMNQXv
場合だよ。
Lynnはリリースされて、次の新石は年末のClarkdale/Arrandaleだからな。
その次は翌年H1のWestmere-EP。
153Socket774:2009/09/24(木) 00:56:35 ID:ox/cpnhF
>>151
1600コアの汎用プロセッサ現る。
154Socket774:2009/09/24(木) 03:18:09 ID:WedKA8Gw
Software developement systems shipping now って具体的に何なんだろう

ttp://www.4gamer.net/games/049/G004963/20090923003/
155Socket774:2009/09/24(木) 05:30:50 ID:VKhYkx2Q
Ctのベータテストだよ
156Socket774:2009/09/24(木) 10:37:55 ID:miQ0oZWI
>>151
1600コアって何の妄想だよw
157Socket774:2009/09/24(木) 12:56:31 ID:sMN1gZGp
>>143
なにこれ
まさかCGなの?
158Socket774:2009/09/24(木) 15:29:49 ID:btEYJ88k
>>148
>最初のデモにしてはずいぶんと地味なデモだったような気がしなくもない
とかPCWatchの中の人も書いちゃってるぐらいだから危ないかもなー
159,,・´∀`・,,)っ-○○○:2009/09/24(木) 22:17:00 ID:Jgvf5I8y
>>156
SIMD演算器のエレメント数じゃないの?
その計算で行くとCore i7は4Way(128ビット)SIMD演算器×3だから48コアな。
160Socket774:2009/09/25(金) 11:16:49 ID:rU98ea/N
>>157
CGだよ
仕事で建築パースとか作ってるが、本当に実写並みの出力が得られる。
これをリアルタイム描画できるなら、Larrabeeを使う意味はあるが
こないだのデモを見る限りでは11nm世代になるまで無理そうだな
161Socket774:2009/09/25(金) 11:18:52 ID:rU98ea/N
1600コアはHD5870のSP数のことでしょ。
CPUは汎用処理目的(完全ブログラマブル)
GPUは固定処理目的(一部プログラマブル)
比べること自体ナンセンス
162Socket774:2009/09/25(金) 11:35:17 ID:2PG2Z7Bh
SP一個で1コアとかNvidiaがホントに言ってるんだぜw
163Socket774:2009/09/25(金) 11:43:35 ID:fHyEtWh+
>143 >>157
今もう映画でも、魔法やレーザービームみたいな特殊効果が
必要ないシーンでも、セット作ったりロケに行くよりもCGの方が安いと
見積もられたらCGで作ってしまう
164Socket774:2009/09/25(金) 21:10:17 ID:uxsVD9Jo
そして3DCGよりも安いと見積もられたらマットペイントの一枚絵+AE処理で作っちゃう
165Socket774:2009/09/27(日) 13:07:30 ID:Wzs0T7Ci
ゲームに使うとか言ってるが普通に無茶だろう
そういえば新型PS3をリークしたニュースに来年PS4が出るみたいなこと書いてあった気がするが
まさか変態ハード好きのソニーが新ハードに積むんじゃねえだろうな
166Socket774:2009/09/27(日) 14:25:24 ID:RmGAS4Y9
167Socket774:2009/09/27(日) 16:22:49 ID:5i2BlXJq
>>165
Cellの投資をPS3,PS4,PS5の複数世代で回収するために
スケーラブルアーキテクチャを採用したのだから
Cell拡張版以外使う気ないでしょ

22nm世代になったらPS4出すんじゃない?
サードはみんな任天堂のHD機に流れそうな予感がするけど
168Socket774:2009/09/27(日) 16:38:11 ID:Dnlc9DhR
169Socket774:2009/09/27(日) 17:33:23 ID:+IiWdWhO
もうPS4はSandy Bridge + Larrabeeみたいなもんでいいよ。
170Socket774:2009/09/27(日) 19:01:23 ID:/Ly3tsMN
それだとWindowsを入れられるけど、OtherOSのインストールが
できないならCPUに何を選んでもユーザーには大差ないね。
171,,・´∀`・,,)っ-○○○:2009/09/27(日) 20:18:33 ID:wZhgRL9c
>>167
PS3以外の展開やってるのは東芝くらいなんだが・・・
単にLRBniで遊びたいなら、Haswell世代でミッドレンジ以下に統合されるわけで
172Socket774:2009/09/27(日) 20:59:46 ID:YdIXc3Pt
北森やtechreportのコメント欄見ても終戦モードだな
もうダメポ
173,,・´∀`・,,)っ-○○○:2009/09/27(日) 21:04:15 ID:wZhgRL9c
っつーか、並列度が高いでもないし小回りもきかない128ビットSIMD専用コアが
コア数だけ「スケール」してもあまり旨味はないと思うんだが。
プリファードスロットのみを使う似非スカラ演算の性能は頗る悪いし。
本物のスカラ演算ができて64ビットアドレッシングもでき、
ワイドだが柔軟なSIMD拡張を持つLarrabeeに比べて何が有利なんだよ?

4PPE+32SPEで単精度1TFLOPS(ピーク)になるようだが、45nmで400〜500mm²程度のダイサイズだぜ。
既にスケーラビリティの優位性がない。

つーか、Cellのスケーラビリティの根拠って、SPEはローカルメモリ形式でグローバルメモリとのアクセスもDMAだから
コヒーレント制御がないわけだが。
それって多くのデメリットも孕んでるわけで。コヒーレント制御なしで読み書きするだけならLRBniでも全てのSIMD命令で使えるし。
174Socket774:2009/09/27(日) 21:14:34 ID:n5SFXhZm
とりあえず、なんか勘違いしてるラデオソ信者が鬱陶しい
175,,・´∀`・,,)っ-○○○:2009/09/27(日) 21:18:21 ID:wZhgRL9c
まあPrototype Libraryあたり読んだらLarrabeeの本質わかると思うんだが。
命令セットレベルで多倍長整数や高度なマトリクス演算にフォーカスしてる。
IntelはTOP500のシェア90%オーバーを目指さないと気が済まないようだ

GPUとして期待外れで結構だろ。
そもそもスパコン用途のニーズとして最低限必要な柔軟性を捨ててまでGPU(笑)を追求する必要がない。
176Socket774:2009/09/27(日) 21:41:12 ID:2VeUhgpA
>>175
>GPUとして期待外れで結構だろ
はい、団子から頂きました
177Socket774:2009/09/27(日) 21:48:20 ID:KV/IZaHJ
>4PPE+32SPEで単精度1TFLOPS(ピーク)になるようだが、45nmで400〜500mm?xB2;程度のダイサイズだぜ。

マジか・・・90nmCellが1PPE+8SPEで235mm^2だからせいぜい300mm^2かと思ってた
178,,・´∀`・,,)っ-○○○:2009/09/27(日) 22:05:42 ID:wZhgRL9c
>>177
http://pc.watch.impress.co.jp/docs/2008/0206/kaigai416.htm
45nmは1PPE+8SPEで115.46mm²

HPC向けのは倍精度ユニット強化分だけダイサイズが大きくなるから、これの4倍+α程度のダイサイズになると思う
つーか、その巨大Cellは、2009年登場予定だったのが未だに出てないんだが。

TOP500の最上位クラスはIBMの出方次第になる気がする。
もしCellに拘ってTOP500の1位を余所に取られるようなことになれば、政府からの発注も受けられなくなるからね。
んでもってIBMがソリューション屋としてLarrabeeを選択すれば全てが終わる希ガス。
179Socket774:2009/09/27(日) 22:26:17 ID:KV/IZaHJ
>>178
なんだよそんな全く最適化されてない隙間だらけのダイが根拠だったのかよ。

>つーか、その巨大Cellは、2009年登場予定だったのが未だに出てないんだが。
2010年後半だろ?
http://img411.imageshack.us/img411/9205/roadmap1kh0.png
180,,・´∀`・,,)っ-○○○:2009/09/27(日) 22:31:32 ID:wZhgRL9c
おいおい、PS3のだから、倍精度強化版じゃないぞ?

リング間のインターコネクト回路も用意しないといけないし
減る要因より増える要因の方が多いぞ
181Socket774:2009/09/27(日) 22:32:55 ID:WToZSfyw
>>177
300mm2で3TFLOPSの時代に
500mm2で1TFLOPSとかw
182Socket774:2009/09/27(日) 22:33:22 ID:Dy9idI82
隙間だらけといっても、最適化して2割くらい小さくなったとしても、400mm2くらい。
300mm2にするには、最適化だけで3割以上小さくしないといけないから、
さすがにそれはないだろう。
183Socket774:2009/09/27(日) 22:33:56 ID:9CXY1a1f
>>181
で、それは汎用的につかえるのかね?
184,,・´∀`・,,)っ-○○○:2009/09/27(日) 22:38:14 ID:wZhgRL9c
> >つーか、その巨大Cellは、2009年登場予定だったのが未だに出てないんだが。
> 2010年後半だろ?

延期になったのか。

1モジュール当たりの価格で1 PPE + 8 eSPE版(8000ドル前後)の更に倍以上になるのは確実だろうな
LarrabeeがなくてもSandy Bridgeが出るからFLOPS当たり価格は更に下落するし

185Socket774:2009/09/27(日) 22:39:23 ID:WToZSfyw
>>183
ゲームにおいてはCellよりはよほど
186,,・´∀`・,,)っ-○○○:2009/09/27(日) 22:39:57 ID:wZhgRL9c
>>183
1エレメント5Way VLIWのうち3D処理でも実質3Way程度しか動いてない。
2D処理だと2Wayかそれ以下。

ピークFLOPS数と実効FLOPS数の乖離激しすぎ。
スパコンなんかに使えるわけがない。
187Socket774:2009/09/27(日) 22:45:19 ID:9CXY1a1f
>>185
アクセラレータだからそんなもんだよな。
188,,・´∀`・,,)っ-○○○:2009/09/27(日) 22:49:25 ID:wZhgRL9c
Havok Clothを人形1体動かすのですらヒイヒイ言ってる程度のが
アーキの改良がないままコア数倍増した程度でどうにかなるわけがない。

流石に非GPU処理やらせたらCellの32コアのほうが実効性能は上だろう
189Socket774:2009/09/27(日) 23:14:58 ID:r6tgVI9D
GPGPU性能ではもうすでに追いつけないレベルになっちまったな・・・
190Socket774:2009/09/28(月) 06:57:22 ID:E1AFoXSi
そうだね、ATIはきえるしかないなw
191Socket774:2009/09/28(月) 07:10:54 ID:T2IK/9L9
デモ地味すぎ
192Socket774:2009/09/28(月) 07:21:45 ID:5Hd9sEZA
Transcript読んだがコード短くしたかった意図もあるだろこれ
GPUで書くと120行だけどLRBならC++を使えるからたったの25行なんだぜ?
まあ素敵!
ってどこの通販番組だ
193Socket774:2009/09/28(月) 07:24:51 ID:wXQW5x+U
面白い面白い
194Socket774:2009/09/28(月) 07:25:39 ID:bG0lXWYD
期待外れ
195Socket774:2009/09/28(月) 22:41:34 ID:xow961ab
Larrabeeは期待外れもいいとこw
団子、乙ww
196,,・´∀`・,,)っ-○○○:2009/09/28(月) 23:04:27 ID:L7aVFlKw
なにを「期待」してたんだ?
それ期待じゃなくて「勘違い」だろ

197Socket774:2009/09/28(月) 23:04:30 ID:KM4hOA+n
GT300がなかなか出てこなくてイライラする気持ちはわかる
198,,・´∀`・,,)っ-○○○:2009/09/28(月) 23:05:53 ID:L7aVFlKw
Sandy Bridgeのサイクルアキュレートシミュレータ面白すぎる。
199Socket774:2009/09/29(火) 22:18:48 ID:TXg5r9oW
>>197
それもう出ないかもね。
200Socket774:2009/09/30(水) 14:03:49 ID:YaMThjT2
>199
HD4kの時ATIが情報をひた隠しにしたようにnVもGT300で隠し続けてるんだと思う
ただ難産は事実で潤沢に出回るのは来年半ば位なんじゃないかと
時期を逸した商品になりそう
201Socket774:2009/10/01(木) 00:46:05 ID:lJo9q5gh
GT 212みたいな水子が既に出てるしな。
202Socket774:2009/10/01(木) 05:33:45 ID:CkkrzygI
http://pc.watch.impress.co.jp/img/pcw/docs/318/463/kaigai1.jpg
やはり次世代プロセッサに移った
203Socket774:2009/10/01(木) 09:19:08 ID:1XovdYzE
こりゃずいぶん変えてきたね。歩留まり大丈夫か?
204Socket774:2009/10/01(木) 11:23:10 ID:AElgrLY8
今までララビーを馬鹿にしてきたゲフォ厨はマンセーに鞍替えしますか
205Socket774:2009/10/01(木) 20:02:20 ID:jPKGHD9O
これでGPUとして買うならATI一拓になった
206Socket774:2009/10/01(木) 21:42:36 ID:PNrgnS0O
>>205
俺は、CPUアクセラレータとしてららびーを応援してる。
ミドルのららびーが待ち遠しい。
そんな俺のGPUはれぃでぃおん4670たーぼ。
207かーみーん:2009/10/01(木) 21:49:00 ID:68i9P2Bf
応援はいらないから20億$よこせ
208Socket774:2009/10/01(木) 22:48:48 ID:PNrgnS0O
>>207
俺の人生の何回分ですか。。。
209Socket774:2009/10/02(金) 13:46:35 ID:WPKRggcK
地下王国換算で2万回ぐらい
210Socket774:2009/10/03(土) 15:18:24 ID:15UKjmpq
211Socket774:2009/10/03(土) 15:45:19 ID:rQox7uA1
ゲルたんは悪くない。むしろ被害者。
口八丁手八丁のLarry SeilerやTom Forsythに騙されただけ。
212Socket774:2009/10/03(土) 15:51:37 ID:K9RcF7Or
>>210

 L a r r a b e e 終 わ っ た な (藁
213Socket774:2009/10/03(土) 15:59:59 ID:Uovy1lal
あらら、Larrabeeって結局大失敗に終わったのか
214Socket774:2009/10/03(土) 16:16:13 ID:qG6YDrVi
発売もしてないものを失敗と評するおかしい。だが、
バグ餅のAxシリコン世代ですらA6までリビジョン重ねてるから、
マスクコスト含めてどんだけ金かけてんのとは思う。
他社の金が入ってるIA64とは違い100%Intelの持ち出しだろうし。
ただし先月の組織再編で部門としての格は上がっている。

http://ja.wikipedia.org/wiki/Larrabee
> Larrabeeの技術ベースとなっているのは、Intelが多額の資金を投入
> している技術研究プロジェクト「テラスケール・リサーチ」である。
> ちなみに、同社は今年第2四半期だけで調査・開発費用に
> 14億7,000万ドルを投資したが、この金額はライバルであるAMDの、
> 同四半期における売上高をも超えている。
215Socket774:2009/10/03(土) 16:57:55 ID:K9RcF7Or
>>214
インテル必死すなぁ
216Socket774:2009/10/03(土) 17:22:45 ID:aDV0CVOB
そのWikipediaの書き方だと、テラスケール・リサーチに14億7000万ドル突っ込んでいるような
誤解を招きかねない文章だな。
14億7000万ドルって、その四半期のR&Dの全額。
毎四半期AMDの売上並みの額をR&Dに突っ込んでいる。
217Socket774:2009/10/03(土) 17:43:16 ID:gZl+A5Dw
いいかげんもうちょっとくらいスリムになってもいいんじゃないのかねintelは
218Socket774:2009/10/03(土) 19:32:56 ID:iVSe+AIj
>>210
まあ同じ妄想でも安藤のが説得力があるわな
プライオリティはXeon(Nehalem-EP) >>> Larrabeeだし
ttp://www.geocities.jp/andosprocinfo/wadai09/20090919.htm
>  Gelsinger氏も,このところNehalemが快調で良い位置に付けていると思われたのですが,(9月24日からのIDFでキーノートを喋ることになっていたのですが)突然の退社です。
>真相は不明ですが,IntelではOttelini氏が,まだまだ頑張りそうであり,Maloney氏の方が歩がよさそうで,なかなかCEOにはなれそうにない。
>一方,EMCではTucci CEOが2012年までは頑張るという表明をしたということは,裏返すとそこで辞めるということであり,2012年のCEOの最有力候補のポジションの方が魅力があったということでしょうか。


EMC、インテルの“ミスターx86”ゲルシンガー氏を引き抜く
ttp://www.computerworld.jp/news/trd/162249.html
219Socket774:2009/10/04(日) 04:53:26 ID:peD6Cgui
Larrabeeなんてどうせ出す出す詐欺でしょ
220Socket774:2009/10/04(日) 06:40:03 ID:jHQ1Z0HD
出す出す詐欺とは模型を発表することですね
221Socket774:2009/10/04(日) 17:29:04 ID:Qp4yxDyB
Larrabeeはグラフィックをソフトウェアで処理するのなら
GPUではなくグラフィックアクセラレータと呼んだほうがいいのでは?
222Socket774:2009/10/04(日) 19:50:42 ID:ND/qXxHW
>>221
昔、GPUはそんな感じで呼ばれてたよね。
GPUって言い出したのってNvだっけ??
223Socket774:2009/10/04(日) 22:42:35 ID:ciUP8XPl
昔、グラフィックアクセラレータって言葉はむしろハードワイヤードを指していた
CPUのメモリ読み書きを使わずにVRAMに書き込むハードウェアがそう呼ばれた
224,,・´∀`・,,)っ-○○○:2009/10/04(日) 22:57:43 ID:TL0QkM36
CPUでフレームバッファ読み書きしてた時代への回帰だな
WindowsとかLinuxでGPUアクセラレータが効いてない状態だと全部画面描画をCPUでやるわけだが
その「CPU描画」に特化したのがLarrabee

乱暴に言ってしまえばね
225Socket774:2009/10/05(月) 00:17:17 ID:+ugReYtd
Larrabeeの場合、1コア分が、1シェーダークラスタ相当みたいな感じでいいのかな?
できることの柔軟性は全然違うだろうけど
226Socket774:2009/10/05(月) 11:38:08 ID:Mi7FxhjD
227Socket774:2009/10/05(月) 12:43:50 ID:7Bti/4dy
>>226
ワロタw
228Socket774:2009/10/05(月) 12:51:32 ID:tlYiEPPS
これはATi買収の準備を始めてると取っていいのか?
229Socket774:2009/10/05(月) 13:35:31 ID:a9FWu+H7
インテルが結構前に言ってたじゃん
「ウチのオンボが気に入らないんだったらラデでもつけてろ」って
230Socket774:2009/10/05(月) 18:23:43 ID:5d0H5ogS
ヤンデレ担当者に萌えたwww
231Socket774:2009/10/08(木) 13:12:46 ID:6ixaHlGr
見えてきたSandy Bridgeと,見えてこないLarrabee。Intelのプロセッサロードマップアップデート
http://www.4gamer.net/games/098/G009883/20091007054/

>  だがその一方,「標準グラフィックスインタフェースとしてのDirectXやOpenGL,
> OpenCLもサポートする」とは言われたものの,
> そのパフォーマンスは最後まで公開されなかった。
> Larrabeeの評価を開始しているベンダーの関係者によれば,
> 「現時点では一般的なGPUとして評価できる段階にない」そうだ。
>  また,Sean Maloney(ショーン・マローニ)上級副社長も,
> 将来的にLarrabeeコアをCPUへ統合する計画に変わりはないとしつつも,
> いつ,どの市場へ投入するするかについては「いまは語れない」の一点張りである。
>
>  付け加えるなら,Larrabee計画の顔役ともいえる
> Patrick P. Gelsinger(パット・ゲルシンガー)上級副社長が,
> IDF 2009の直前にIntelを退職するという“事件”もあったが,
> それと関連してか,この数か月,業界内にはLarrabeeについて,
> 後ろ向きな情報が飛び交っている。
> なかには「IntelがLarrabee計画を中止する」といったものまで含まれていたほど。
> 「Larrabeeは,TSMCの40nm プロセスで製品化される見通し」
> という半導体業界筋の情報や,
> 「Gelsinger氏とともに,主要エンジニアもIntelを去った」という情報もある。

ワタ?
232Socket774:2009/10/08(木) 13:22:21 ID:T+6wbE/7
LarrabeeはCellGPUみたいに頓挫かw
233Socket774:2009/10/08(木) 14:46:03 ID:GoWscHif
節操がないなぁ
NVIDIAのほうがやばいだろ

Nvidia kills GTX285, GTX275, GTX260, abandons the mid and high end market
Full on retreat, can't compete with ATI
ttp://www.semiaccurate.com/2009/10/06/nvidia-kills-gtx285-gtx275-gtx260-abandons-mid-and-high-end-market/


285は既にEOL、260は11or12月にEOL、275は2週間以内にEOL、295も終わりそう。
ハイエンド、ミドルレンジから脱落する。
Fermiの派生モデルはテープアウトすらしていないので、少なくとも2Qは掛かる。
Fermiはダイサイズあたりの性能が低く派生モデルを作ってもフルラインナップで価格競争力で劣る。
ハンダの欠陥問題、G212の失敗、G214の大失敗、G215の遅延、G216とG218の壊れたGDDR5コントローラ。
救世主となるチップはない、プランBはない、全て失敗した。
赤字販売を続けるか、撤退して少ない赤字を出すかしかない。
資金が尽きる前に開発の問題を修正し競争力のある製品を出せるかが問題。
1月にはローエンドからも脱落する。
Nvidiaは全てのパートナーから憎まれており助けてくれるパートナーはいない。
Nvidiaに必要なのは経営陣の総入れ替えだが、その出て行くべき奴らは株主なので起こりそうもない。
ゲームオーバー。
ジェンセンは年俸1ドルでも貰い過ぎである。
--------------------

GT300がコケるなら対抗製品であるLarrabeeの製品化を急ぐ必要はなくなる。
AMDが弱ってるからLGA1366のライン縮小するのと同じ原理でね。
234Socket774:2009/10/08(木) 14:56:16 ID:eLt7yjzV
nvidiaが弱ってるから余裕かましてるのか、larrabeeが順調じゃないからGT300もそれにあわせてるのか
どっちもありそうだな
235Socket774:2009/10/08(木) 15:02:12 ID:IK7Sv4Rf
まぁ、外野がどこが勝った負けただと下世話に騒ぐのとは関係なく、
どの現場も技術的に物凄く難しいことに直面し挑戦してるってこったね。

ララもFermiも諦めないで世に出てきてほしいもんだ。
236Socket774:2009/10/08(木) 15:48:05 ID:GoWscHif
ライターが「業界筋が〜」って書くときは、金握らされてFUDを書いてるときの常套句だけどな
Larrabeeの不安煽って得する陣営って、どこかわかったようなもんだろ。

利益だせるゲームの要求スペックは相対的にローエンドに下がってきてるし
IntelはあのGMAで労せずしてGPUの覇権を得ようとしてるわけで、
ダイサイズの割に単価の安いディスクリート市場なんて
討つべき相手がいなくなれば効率の悪い投資でしかない。

「GMAの性能が気に入らないならRadeonでも刺してろ」ってIntelの本心だろ。
出る前からわかりきってることだがGPGPU要素の薄い従来GPUの延長としてなら
LarrabeeよりRadeonのほうが優秀だ。
CPU市場を脅かそうとしたNVIDIAが自滅するなら、ディスクリート版Larrabee
という巨大な防波堤は無駄な投資に終わる。
237Socket774:2009/10/08(木) 16:05:53 ID:BgGo9xIl
アクセラレータプロセッサを売ろうとしても、HPCや
動画エンコード専用じゃぁ市場が狭すぎて売れる価格で出せない。
 ↓
ミドル〜ハイエンドGPU機能をおまけに付けてやれば、たくさん出るから
安く出来るぞ。GPU -> Teslaの逆をやればいいじゃまいか。
 ↓
そもそもディスクリートGPUの市場がどんどん無くなってきたお ←今ここ
 ↓
しょうがないCPUコアに統合するか、2014〜2015年位まで待って。またね〜
238Socket774:2009/10/08(木) 16:19:20 ID:6ixaHlGr
保守的な人間がなんと多いことw
239Socket774:2009/10/08(木) 17:55:24 ID:8CZbsXkC
>>236
主要エンジニアが会社を去ったら必ずニュースになるからな
公式からもそのエンジニアの情報が削除されるし
240Socket774:2009/10/13(火) 10:14:58 ID:1IVtbDMn
やれやれFermiが難産とわかったらレスが付かなくなったな
241Socket774:2009/10/13(火) 10:19:18 ID:tMZdXraz
ワロスw
242Socket774:2009/10/13(火) 10:54:04 ID:Z2yHuX/g
An Inconvenient Truth: Intel Larrabee story revealed - Bright Side Of News*
http://www.brightsideofnews.com/news/2009/10/12/an-inconvenient-truth-intel-larrabee-story-revealed.aspx
243Socket774:2009/10/13(火) 11:17:05 ID:tMZdXraz
>Intel knows that the future of the company is at stake
ハイハイFUD乙
244Socket774:2009/10/13(火) 11:23:26 ID:mf6lsKCq
>>243
その文だけだと、検索した感じでは、インテルの命運を分ける。じゃないか??
245Socket774:2009/10/13(火) 12:47:01 ID:1IVtbDMn
投機屋にとっては短期で利益の出せない開発計画なんて
不満の種でしかないからな。
圧倒的黒字出してても前年同期比で利益落ちたら即株価に跳ね返る。

その点、信心深い(が金は無い)信者達に万々歳され続ける某企業は
たとえ倒産リスクのある企業にリストアップされてても
ある意味お目出度いやら何やら。
246,,・´∀`・,,)っ-○○○:2009/10/14(水) 01:44:35 ID:BZHRxyoI
Fermiって劣化Larrabeeだろ。


どこそこ性能ネックだぞこれ
247Socket774:2009/10/14(水) 01:48:46 ID:soAqgjKt
いいからLarrabee出せよ
248,,・´∀`・,,)っ-○○○:2009/10/14(水) 01:50:33 ID:BZHRxyoI
いいからモックアップ出せよ
249,,・´∀`・,,)っ-○○○:2009/10/14(水) 02:01:11 ID:BZHRxyoI
Fermi could run an OS
ttp://www.fudzilla.com/content/view/15940/34/

SIMD全命令プレディケート対応といい
どこまでも劣化コピーだよな
250Socket774:2009/10/14(水) 06:07:32 ID:jH/+JW9D
Intel knows that they've completely messed up with the current generation
and the company decided to trash away the part of current design
and re-design the SIMD units from ground up.
This means the current diagrams featuring 16-wide SIMD unit are out the door,
because that design doesn't work.
Newly designed SIMD units will still probably be 16-wide and take AVX instructions,
but it will be GPU-like and not CPU-like.
251Socket774:2009/10/14(水) 06:27:17 ID:g43xzJRl
まlarrabeeのデモもモックだけどな
PenD同様
252Socket774:2009/10/14(水) 08:44:04 ID:+Mn3R7lJ
>>251 いつものコテハン忘れてるぞ

      ,,,
( ゚д゚)つ┃
    (・´ω`・)
253Socket774:2009/10/14(水) 10:44:05 ID:pwDUNm5B
FermiとLarrabeeでベイパー合戦てかw
254Socket774:2009/10/14(水) 21:48:49 ID:lX2bMnnF
前に聞いたB0シリコンが8/15にテープアウトという噂が本当なら
来年半ばに出る機会が高い
ただし、製品化するのはB0とは限らない
一回の仕様変更ならさらに三か月追加とすると2010に出したいならせいぜいあと三回...
255Socket774:2009/10/15(木) 00:11:04 ID:NHyQIliY
うーん、たぶん来年半ばくらいに思っておいて正解だと思うよ。
実物見たことないけど。HD68xxは間に合わないでしょう。

でも俺はx86万能みたいな宗教は進化の弊害にしかならんと思うし、
HPCに関してはMagny-CoursとFermi直結したほうが速いと思う。
256Socket774:2009/10/15(木) 00:14:09 ID:YTC2bPib
>>255
CPUに取り込むのが前提だからx86なんだよ
257Socket774:2009/10/15(木) 00:31:42 ID:NHyQIliY
逐次+並列の異種混合のほうが速いって。恐らく。
インオーダーのPentiumを掻き集めてもなぁ……という気が。
レイトレは得意だろうけど。
258,,・´∀`・,,)っ-○○○:2009/10/15(木) 00:41:06 ID:I+UKJFoq
x86みたいなフォーマットだからこそメモリアドレッシングを直列化してパイプライン実行できるんだが。
インオーダのx86であるAtomにすらスカラ性能で勝てるRISCは少ないのが事実
(ちなみに命令帯域/clkはP5よりAtomのほうが狭いです)

ちなみに最近鼻息粗くしてるCortex-A9はアウトオブオーダ
259,,・´∀`・,,)っ-○○○:2009/10/15(木) 00:46:28 ID:I+UKJFoq
>逐次+並列の異種混合のほうが速いって。恐らく。

その「逐次+並列の異種混合」をオンダイで実現してるのがLarrabeeな。

同じ512SP相当ならFLOPS数はLarrabeeのほうがFermiより稼げる。
ピーク・実効値ともにね。
Fermiのホワイトペーパー読めばどこそこ駄目仕様なのがわかる
260Socket774:2009/10/15(木) 00:54:20 ID:rkKfNFR3
>>257
> 逐次+並列

コアごとに16wideものベクトルユニット積んでるララビがまさにそれじゃね?
261Socket774:2009/10/15(木) 00:56:39 ID:oi+9nr8q
革新的なアーキテクチャを目指していたが開発は
遅れに遅れ製品化される頃には着実に改良を
重ねてきた競合に太刀打ちできなくなったでござるの巻
262,,・´∀`・,,)っ-○○○:2009/10/15(木) 00:59:29 ID:I+UKJFoq
Fermiがな。

512SPで倍精度650GFLOPSだ!
しかしLarrabeeも512SP相当で少なくとも800GFLOPSオーバーだ!

低消費電力で勝つる?
そりゃあのエンジニアリングサンプル(笑)に電源供給できないからなww
263Socket774:2009/10/15(木) 01:02:42 ID:YTC2bPib
レイトレなんてそれこそGPUの方が得意な処理だよ
264,,・´∀`・,,)っ-○○○:2009/10/15(木) 01:04:38 ID:I+UKJFoq
index * scale + base + dispのメモリアドレッシングだけでだいぶオペレーション密度稼いでるんだよね。
本当の意味でGPUの並列度とx86のスカラの利点がFusionしてる。

FermiはSPあたりのロード・ストア命令の最大発行回数がGT200の半分に落ちてるんだぜ。
FLOPS数弾き出す以前に、データ供給がネック。仕様からしておhル
265,,・´∀`・,,)っ-○○○:2009/10/15(木) 01:09:30 ID:I+UKJFoq
>>263
そーでもない。

演算ユニットのスループットは勿論必要だが、より効率を上げるためには
レイトレース結果を再利用するための読み書き両対応でそこそこの容量のキャッシュが必要。

しかしFermiのL2キャッシュはたったの768KB!Larrabee(8MB)の10分の1。
帯域が十分あるわけでもない。
てか、確保したらしたでメモリ帯域分だけでTDP300Wオーバーになるだろ。
キャッシュのほうが電力的に優しい。
266Socket774:2009/10/15(木) 01:27:19 ID:wMe4w240
>>264
>index * scale + base + dispのメモリアドレッシング
しがらみのない新規プロセッサこそ、↑のパイプライン化をもっとスマートに
やってもよさそうなもんだが、どこもやろうとしないのは何でじゃろ?
存外どうしようもない(クダラナイ)理由のような気もするが。
267Socket774:2009/10/15(木) 01:40:32 ID:nPzYoCXU
Larrabee RAM間のバンド幅はいつ公開されるん
268Socket774:2009/10/15(木) 01:42:28 ID:zLyfGi2G
そんなにハードル上げまくってどうするw
269Socket774:2009/10/15(木) 01:43:25 ID:KqiUfhOA
Larrabeeの場合、どれくらい狭い外部帯域幅でくるのかが楽しみ
270,,・´∀`・,,)っ-○○○:2009/10/15(木) 01:54:51 ID:I+UKJFoq
キャッシュを大きめに取ってタイルレンダに特化したぶん、外部帯域は相対的に広く取る必要がないからね。
それだけでTDP節約でき、クロックに振る余裕が出来る。

FermiのTDPの半分はGDDR5でできています
ってのは笑えない冗談。
早かれ遅かれGPUはタイルレンダに移行する。中の人自身がそういってるし。
NVIDIAもまた先延ばしにしてるだけにすぎない。
271Socket774:2009/10/15(木) 02:01:37 ID:AmfbvI81
>>261
あの売れてないゲーム機と同じだね。
272,,・´∀`・,,)っ-○○○:2009/10/15(木) 02:15:09 ID:I+UKJFoq
NVIDIAのGPUが載っかるゲーム機って勝てない法則があるよね
273,,・´∀`・,,)っ-○○○:2009/10/15(木) 02:33:02 ID:I+UKJFoq
>>268
逆にFermiの明らかな低スペックが暴かれた今、どこまでIntelが手抜きしてくるか心配でならない
だってこうだろ

1.HPCにおけるCUDA&Cell除け
2.IGP版Larrabeeのテスト
3.ひょっとしたらGPUとしても案外売れるんじゃね?

自称パラノイアのIntelにとって最大の戦略目標は言うまでもなく1。
Xeonで得たHPC市場のシェアを脅かす存在の排除。
あとはそれほど優先度高くはない。

ちなみにRadeonは最初から敵ではない。敢えて言えばNVIDIA潰しという点で利害関係が一致してる。
274Socket774:2009/10/15(木) 03:33:31 ID:gKRSsnUF
必死だなw
275Socket774:2009/10/15(木) 05:49:37 ID:n+7lweU8
団子さんはGDDR5の消費電力について書く時、
Rambusの言っている数字を使うけれど、
Samsungは多少いい数字を出してきますよ。
http://pc.watch.impress.co.jp/img/pcw/docs/319/593/html/ph05.jpg.html
276Socket774:2009/10/15(木) 06:19:57 ID:q6gIqkR5
samsungのGDDR乗ってるVGAは買う気が起きない。

いや、使う気が起きない。
277Socket774:2009/10/15(木) 08:37:33 ID:W57wLnY+
>>275
本当に多少の誤差でしかないな
同じメモリなら結局帯域比例には違いないし

GPUダイ側のインターフェイスや冷却ファンも考慮すると
実質これより遙かに食ってるわけで
将来性のない設計なのは違いない。
278Socket774:2009/10/15(木) 08:51:05 ID:6I6eVo/3
FermiのL2はVictim Cache?
スクラッチパッドをL1に最大まで割り当てた場合ダイ全体で48KB×16=768KB
InclusiveだとL2の意味が殆どなくなる。
どっちにしてもHPCには少なすぎるが。
279Socket774:2009/10/15(木) 11:54:44 ID:n71c16QL
>>272
任天堂がしんじゃうぅぅぅううううううううううううううううううう。
ttp://gigazine.net/index.php?/news/comments/20091014_next_ds/
280Socket774:2009/10/15(木) 15:43:38 ID:fj6awrx6
281Socket774:2009/10/15(木) 15:59:52 ID:6I6eVo/3
陰影焼きこんだテクスチャで第一印象だけは誤魔化せるから
見た目しょぼいほうがかえってレイトレの効果がわかりやすい。
レイトレだけでリアルタイム描画できるのが現世代でそこまでって
言ってしまえばそうなんだが。

あとはLarrabeeでもやったようなリアルタイムの水面表現だな。
Nが自信があるなら同じようなデモでぶつけてくるんだろうが。
282Socket774:2009/10/15(木) 20:08:37 ID:rBAP1Pdj
283Socket774:2009/10/15(木) 20:32:39 ID:YTC2bPib
レイトレがリアルタイム描画勝負でラスタライズの描画クオリティを上回れるのって
ハード性能的にもまだ数世代掛かりそうな感じ。
どっちにしろ家庭用ゲーム機が対応しないと始まらないけど。
284Socket774:2009/10/15(木) 21:26:34 ID:srancKAX
一足飛びにレイトレは無いと思うのだけどなァ
まずはタイルレンダに移行してラスタライズにおける帯域・演算のムダを
徹底的に取り除いていかないと
285Socket774:2009/10/15(木) 21:42:47 ID:gKRSsnUF
レイトレってのは結局光の物理処理なんだよ
286,,・´∀`・,,)っ-○○○:2009/10/15(木) 22:46:11 ID:I+UKJFoq
GPUがグラフィックプロセッサとして効率がよかったのはほぼ全部固定機能でやってた一昔前までの話で
中途半端にソフト化してからクソ化した

VRAMのメモリレイテンシが長い

同時稼働スレッド数を増やすしかない

スレッドあたりのローカルレジスタ/メモリの割当てが少ない

メインメモリに待避するしかない
↓               ↓
(最初に戻る)      VRAM帯域が必要
                 ↓
              増やしたら電力馬鹿食い
                 ↓
               先がない←今ここ


キャッシュ増量してタイルレンダすればスレッド数そんなに増やさなくても低レイテンシにできる。
最近言い出したビア貫通+EDRAMだのは結局はタイルレンダ移行前提の方策。
287Socket774:2009/10/15(木) 23:05:20 ID:srancKAX
ソフト化(シェーダ化)ってのも、見た目維持しつつVRAM帯域の削減を目的としたものだったのだけど、
結局シェーダが食ったり吐いたりするデータ量が際限無く増えるハメになっちゃってる
全然プロシージャルな脳ミソになれてないんだよなーゲームプログラマどもが
それに付き合い続けちゃってるVGAメーカーとMS…
288Socket774:2009/10/15(木) 23:12:22 ID:srancKAX
VRAM帯域の増減が、あまりにもリニアでクリティカルにゲームの
FPS増減に直結する現状は本当に嘆かわしい
289,,・´∀`・,,)っ-○○○:2009/10/16(金) 00:00:16 ID:I+UKJFoq
GeForceに特化した美麗なグラフィックのFPS出そうとして
結局出て来たのがテクスチャデータだけで十数GBのCrysisという化け物ソフト

結局この流れは不幸なんだよね。
テクスチャ作るのだってコストだし、物量に物言わせた力技で押し切るループから抜け出さないと
まあ、そのために物理演算強化してプロシージャル生成したいとか言ってるわけなんだが。



つーか、専門卒主体の日本のゲームプログラマは高等数学使いこなすような向きじゃないから
どういう風向きになっても余り有利じゃないと思うんだが
DSみたいな限られたスペックで箱庭ゲームを作るのが一番向いてるって話になる。
290Socket774:2009/10/16(金) 00:00:39 ID:tiOsBMJ/
団子さんは本当にLarrabeeが好きなんだな。
俺も以前は期待してたけど、自分の研究でCPUとGPUの実力差が
身に染みてしまって、今ではFermi待ち焦がれ中です。

Larraさんは排熱だけ気をつけてやってください。
291Socket774:2009/10/16(金) 00:01:19 ID:R6+6n6qI
>>261
初代ITANIUMを思い出した
292Socket774:2009/10/16(金) 00:04:21 ID:lVlVKAJY
Merced、口に出すだけでも嬉しかったあの頃。
293,,・´∀`・,,)っ-○○○:2009/10/16(金) 00:12:35 ID:CyybyJRa
>>290
うーん、俺も最初はピーク浮動小数演算性能でもFermiはLarrabeeを超えると思ってたんだけど
白書出てきた時点で無理だとわかった。

x86の命令フォーマットは複数のオペレーションを串刺しでパッキングし
パイプラインで直列実行することを容易にしている。
敢えて言うが、Larrabeeはx86のコード資産のためではなくパフォーマンスのためにx86である必要があるんだよ。

そこらに蔓延るRISC信者に騙されてはいけない。
POWERがどうだ。Core MAに歯が立たなくてIPC重視のPPC970を放棄し、
電力効率かなぐり捨てて高クロックでぶんまわすというNetBurstにも似た暴挙
末期ントッシュだよ。


GeForceのシェーダはネイティブコードがSIMDのRISCベースISAなんだが
命令供給数が2つと決まっててオペレーション数を稼げないのが現実。
この辺が実効性能で更にLarrabeeに負けると断言する理由
机上シミュレーションはやってみてる

あー、汎用演算じゃなくてGPUのほうのスペックとしてはどうかはわからんよ。
パラダイムそのものが変わらない限りGPUとしてはRadeon1択じゃないの
294Socket774:2009/10/16(金) 00:23:49 ID:EeDbhu6x
そのパラダイムを牛耳っているのが、DirectXというAPI
PowerVRは、1も2もこのAPIに蹂躙された
タイルレンダリングには専用のグラAPIがどうしたって必要…ん、嫌な思い出が走馬灯のように
295,,・´∀`・,,)っ-○○○:2009/10/16(金) 00:23:56 ID:CyybyJRa
Larrabeeも32コアではFermiと同じ512SP相当なんで、単純にクロック出た方が勝つ。

あとさ、>>290
Fermiが予定よりメモリ帯域妥協したのはその辺で天井(300W制限)にぶつかったってことだから
まあ消費電力はLarrabeeより高くなることは覚悟したほうがいいよ。

296,,・´∀`・,,)っ-○○○:2009/10/16(金) 00:31:45 ID:CyybyJRa
何度も蹂躙されることを恐れずにパラダイムシフトが起きるまで投資し続けられるだけの
体力がある企業なんて現実的にはIntelしかないんじゃないの?

んでIntelは実際具体的に何やってるかというと、並列化支援ライブラリ開発してる企業を買収しまくってるようだが。
有名どころだとRapidMindとか
297Socket774:2009/10/16(金) 00:34:10 ID:7OF5t5B7
>>294
実質的にDirectXは主導権握った会社が仕様を決定する感じだしな。
298,,・´∀`・,,)っ-○○○:2009/10/16(金) 00:39:42 ID:CyybyJRa
9.0cあたりまではNV主導で動いてきた気がする

Xbox360での採用を機に10.1あたりでからATI主導
というよりNVIDIAがついてきてない
299,,・´∀`・,,)っ-○○○:2009/10/16(金) 00:57:45 ID:CyybyJRa
まあLarrabeeを「強制的に」普及させればAPI戦争も勝機はあるんじゃね。
それがIntelに可能なのはGMAが証明している。

そこそこのサイズにカットダウンしてCPUに統合する。
実際出来るようになるのがHaswell世代以降なんだろうけど
300Socket774:2009/10/16(金) 01:15:07 ID:QvOEXJtn
もしLarrabeeをDXの想定する標準ハードウェアにするなら、
DirectX 9から10よりも大きな不連続は間違いないし、
nvもATIも付いてこないだろうから実質LRB専用APIになるだろう。
NSPの二の舞にならなければいいけどね。
301,,・´∀`・,,)っ-○○○:2009/10/16(金) 01:19:13 ID:CyybyJRa
「IntelのSIMD拡張」という連続性がある。
1024ビットのSIMDまで想定したフレキシブルなレジスタ待避命令(XSAVE)を導入してるから
Windows7以降はMSの都合関係なしにIntelの都合でどうにでもSIMD拡張できる
302Socket774:2009/10/16(金) 01:21:07 ID:CgwQBJwN
DirectXがだんだかハードウェアを抽象化する方向性にきてるから
ATi、nV主導のAPIでもLarrabeeが生かせるようになったりしないのかな
303,,・´∀`・,,)っ-○○○:2009/10/16(金) 01:23:33 ID:CyybyJRa
共通フレームワークと言っても各アーキテクチャ向け最適化はなんだかんだで個別対応だからな
NVIDIAはゲームデベロッパーにあまり開発支援しなくなった
ATIが埋め合わせる形で支援して人気伸ばしてる。

ゲーム性能を欲するユーザーがついてきてないのにGPGPUにかまけてたNVIDIAの自業自得
304,,・´∀`・,,)っ-○○○:2009/10/16(金) 01:35:41 ID:CyybyJRa
まあDirectXもVLIWアレイプロセッサとSIMD型RISCプロセッサで同じように動く程度には抽象化されてる。
グラフィックパイプラインはあくまで抽象化されたもので、ステージ間のデータの受け渡し方すら
定義されていない。

極論Larrabeeの場合ジオメトリシェーディング→ラスタライズ→ピクセルシェーディングの処理を
同じ命令ストリームで同じレジスタ使って連続でやってもいいわけ。

NVIDIAの1ゲーム1ドライバみたいな馬鹿馬鹿しい開発サポートがありならIntelは何でもありだな
305Socket774:2009/10/16(金) 01:48:50 ID:EeDbhu6x
最終的に同一の画像がレンダリングされている、それが担保されていれば良い
描画途中のステート、バッファ等は一切ユーザープログラムから参照不可

そういう完全抽象化3DAPIが理想なのにね
ハード側のアーキがAPIに縛られすぎてつまらんわ
306,,・´∀`・,,)っ-○○○:2009/10/16(金) 02:16:08 ID:CyybyJRa
っていうかね
DirectXそのものは基本的なAPIのみで、それでいきなりゲーム作り始めるデベロッパーは
今時あんまりいないでしょ
1枚か2枚か噛ませたゲームエンジンをベースに作るでしょ。
PS3とかMacとかの非DirectX環境でも動くようにしようと思えばそうするでしょ。

結局ゲームエンジン屋に対し、Larrabeeでの動作時にDirectXと並行して
Larrabeeネイティブ命令を旨く使ってくれるように支援することが大事なのでは?
まあ固定機能に縛られずにエンジン書きたい開発者の心をがっちり掴むことだね。
307Socket774:2009/10/16(金) 02:20:58 ID:Uq0bRsJn
で、来年中には出るのか?
308Socket774:2009/10/16(金) 05:26:55 ID:oxPYdkr/
なんでAPIとしてDirectXに拘るのかわからん。
OpenGLでいいだろうに。
309Socket774:2009/10/16(金) 10:46:01 ID:zE/a6yWW
ATIとNVIDIAで別々に拡張して互換性がないから。
310Socket774:2009/10/16(金) 10:47:52 ID:salnxbbH
IPPの拡張とかでごまかすんじゃね?グラフィックも含めて。
311Socket774:2009/10/16(金) 11:03:27 ID:OPllrNtm
将来OpenCLがOpenGLを包含するとか言ってるけど、
ちょっと無理なのでは?

DirectX compute shaderは制限の緩和されたPixel Shaderのような設計で、
Direct3Dに良くなじんでいる。逆に言うとサーバ環境では使えないとか
Direct3Dの基礎知識無いとマニュアル読んでもちんぷんかんぷんだとか
制限はあるけど、主にデスクトップのグラフィック加工用(第二Pixel Shader)
として割り切ってる。何というか、方向性が違うから対立するものじゃないし
ゲーム用途ならDirect3Dでいいじゃん、と思う。
312Socket774:2009/10/16(金) 12:30:37 ID:zE/a6yWW
「Windows限定」ならな
ハードに縛られるかOSに縛られるかで、結局画一的な方法がないんだよ
313Socket774:2009/10/16(金) 14:56:23 ID:BidBOZx+
ttp://pc.watch.impress.co.jp/docs/news/20091016_322120.html
開発コードネーム“Larrabee”(ララビー)で開発を進めているディスクリートGPUについて触れ
日本時間の17日に、Larrabeeの性能データを初めて公開することを明らかにした。
314Socket774:2009/10/16(金) 15:08:02 ID:mmKeAftf
>>313
スライドにあるtexture logic じゃないfixed function て中身まだ不明?
315Socket774:2009/10/16(金) 15:10:47 ID:hlVVOAN6
よっしあああああFerimi脂肪おおおおおおおおおおおおおおお!!!
316Socket774:2009/10/16(金) 15:28:54 ID:zE/a6yWW
レガシーGPU機能を捨てられないまま中途半端にHPCに振ったNVIDIAと
そもそもGPU機能に関してしがらみが無いので汎用に振ったIntel
317Socket774:2009/10/16(金) 16:10:10 ID:go1RpYLW
性能データってなによ?
318Socket774:2009/10/16(金) 16:19:13 ID:hOPYDxtg
Intelが米国のメイヨー病院と共同で開発したメディカル用のアプリケーションを利用したLarrabeeの性能データ、
とあるからCTスキャンのボクセルデータじゃないかな。
319Socket774:2009/10/16(金) 16:31:24 ID:gRUMmml9
フーリエ解析?FFT勝負?
320Socket774:2009/10/16(金) 20:20:27 ID:XAPrst5S
Larrabeeは、”GPU”ではない。
インテルは、新しい概念の呼称を与えるべきだ。
名付けることによって、新たな製品カテゴリーが明確化される。
321Socket774:2009/10/16(金) 20:35:48 ID:qu4HfCgh
明日!wktk!!!
322Socket774:2009/10/16(金) 20:41:37 ID:/4yguRUj
fixed function=固定機能

>レガシーGPU機能を捨てられないまま中途半端にHPCに振ったNVIDIAと
>そもそもGPU機能に関してしがらみが無いので汎用に振ったIntel

??
323Socket774:2009/10/16(金) 20:53:03 ID:zE/a6yWW
324Socket774:2009/10/16(金) 21:06:51 ID:/4yguRUj
さぁw
325Socket774:2009/10/16(金) 21:12:44 ID:dOPzGs71
CPUのノウハウがないNVIDIAがGP路線を突き進めたところでカスしか生み出されないな
326Socket774:2009/10/16(金) 21:27:00 ID:zE/a6yWW
>>324
後藤の記事くらい最低限読んでくれ。
GPU固有の固定機能なんてテクスチャユニットくらいしかないのは既報。
http://pc.watch.impress.co.jp/docs/2008/0804/kaigai457.htm
327Socket774:2009/10/16(金) 21:47:09 ID:/4yguRUj
だからそのテクスチャユニット以外に固定機能が在る絵になってるんだろ
上のプレゼンはよw
328Socket774:2009/10/16(金) 21:52:22 ID:zE/a6yWW
Power Control Unit
329Socket774:2009/10/16(金) 21:54:22 ID:/4yguRUj

あなたこそ、誤答記事をよく読んだら良いんじゃない

Larrabeeパイプラインの最大の特徴は、固定ハードウェア(Fixed Function Hardware)をできる限り排除し、
                                                    ^^^^^^^^^^^^^^^^^
ほぼフルプログラマブルなプロセッサを作り上げたことだ
^^^^^
330Socket774:2009/10/16(金) 21:55:02 ID:zE/a6yWW
GPU特有の固定機能がTMU以外にあるなんて誰も言ってない
331Socket774:2009/10/16(金) 21:57:58 ID:/4yguRUj
www
332Socket774:2009/10/16(金) 21:59:00 ID:zE/a6yWW
各コア組み込みのStructure Converterも従来x86にはない
ある意味ではGPUのための固定機能だしな
333Socket774:2009/10/16(金) 22:00:41 ID:/4yguRUj
へーw
334Socket774:2009/10/16(金) 22:02:52 ID:zE/a6yWW
電力管理ユニットはfixed functionですか?
バナナはおやつですか?
335Socket774:2009/10/16(金) 22:08:47 ID:zE/a6yWW
固定機能に依存してるかどうかはあるなしじゃなくて
どれだけの割合食ってるかの程度問題だ。

http://i40.tinypic.com/20iv3oj.png
http://www.geeks3d.com/20080912/nvidias-gt200-inside-a-parallel-processor/
336Socket774:2009/10/16(金) 23:48:47 ID:41Jp3xPJ
>>313
GTX280じゃなくてTeslaと比較すればいいのに
337,,・´∀`・,,)っ-○○○:2009/10/17(土) 00:53:27 ID:6Eq7iFe7
Teslaって逆に固定機能ユニットが死んだダイの再利用なんじゃないかと思えてきた
338Socket774:2009/10/17(土) 05:51:41 ID:O2JSA3LO
larrabeeに固定機能はない!!w
339Socket774:2009/10/17(土) 06:23:51 ID:duVcaP5F
>>314
LarrabeeのFixed Function LogicはTexture Filter LogicだけだとSIGGRAPH2008の論文に書いてある
そのスライドは2006年辺りから使いまわしてるから、当時はHD decoderとかも検討してたのかもな〜
340Socket774:2009/10/17(土) 06:37:49 ID:WOYbKCgb
約束の朝が来たというのに公表はまだなのか
341Socket774:2009/10/17(土) 07:33:31 ID:WOYbKCgb
342Socket774:2009/10/17(土) 07:51:06 ID:5sBlP9Av
64coreとな
343Socket774:2009/10/17(土) 08:58:08 ID:b1GwOcaa
>>341
・まだシミュレーターでの見積もり ただしcycle accurateなので大嘘ではないかも
・転送がボトルネック。両側で圧縮展開すればはやい、と主張
・そもそもLarrabee向きアルゴリズムの提案とセット。
 HPCでの頻出するよく知られた課題のテストは避けている?
344Socket774:2009/10/17(土) 09:02:49 ID:Y1cDNSPU
GTX280と余り変わらないってどういう事?
345Socket774:2009/10/17(土) 09:10:32 ID:duVcaP5F
ほぼCONCLUSIONSだけ読んだ
・Larrabeeのパフォーマンスは高精度のシミュレーターによるもの。
・動作クロックは1GHzで16, 32, 64コアでシミュレーションしている。
・16コア@1GHzのLarrabeeでGTX 280より平均1.5倍速く、シングルコアのHarpertownの10倍速い。
・32コアと64コアではCPU-Larrabee間でのデータ転送がボトルネックになる。
 もし、このデータ転送のコストが0ならば32コアでは(CPUの)24倍速くなり、64コアでは42倍速くなる。
・しかしこのボトルネックを放置すると32コアでも64コアでも11倍しか速くならない。
・この問題を解決するためにデータセットを可逆圧縮するSIMDと親和性の高いアルゴリズムを実装した。
 これによってデータを三分の一以下に圧縮できる。また、解凍のオーバーヘッドも30パーセント未満である。
・データセットの圧縮によって転送に要する時間を平均して20-30パーセントに削減した。
・それによって、32コアでは19倍性能が向上、64コアでは31倍性能が向上するという実験結果が得られた。
346Socket774:2009/10/17(土) 09:15:39 ID:duVcaP5F
>16コア@1GHzのLarrabeeでGTX 280より平均1.5倍速く〜
ちょっと正確じゃなかった。正しくはこう。
16コア@1GHzのLarrabeeは理論演算性能がGTX 280の半分だが、それでもGTX 280より平均1.5倍速く〜
347,,・´∀`・,,)っ-○○○:2009/10/17(土) 11:10:05 ID:6Eq7iFe7
> ・この問題を解決するためにデータセットを可逆圧縮するSIMDと親和性の高いアルゴリズムを実装した。
> これによってデータを三分の一以下に圧縮できる。また、解凍のオーバーヘッドも30パーセント未満である。

まさかのgzip転送・・・
どこのUNIX板コピペだよって思ったけど、割とSIMDと相性良いんだね
348Socket774:2009/10/17(土) 11:18:28 ID:0hnLYEkE
>>251
この中に入っていたのはgeforceなんです。本当にごめんなさい。
http://www.4gamer.net/games/049/G004963/20090923003/screenshot.html?num=002
349Socket774:2009/10/17(土) 11:21:23 ID:6Td23772
>algolithm ZLIB

ほんとだGZIP転送だw
350,,・´∀`・,,)っ-○○○:2009/10/17(土) 11:26:34 ID:6Eq7iFe7
「ウリのFermiにもgzipデコード専用ロジックを搭載するニダ!」
351Socket774:2009/10/17(土) 11:26:43 ID:aImjh/H4
GZIPは画像データの圧縮に使ってるみたいだな
ロスレスJPEGとの比較に言及してるから
352Socket774:2009/10/17(土) 11:28:38 ID:Nc3cn+o5
>>350

604 :Socket774 [sage] :2009/10/15(木) 15:27:58 ID:fjojjPvn
東洋人の顔が全部韓国人に見える病気か・・・カワイソウに・・・
ジェン・スン・フアンは台湾出身なのに。
353,,・´∀`・,,)っ-○○○:2009/10/17(土) 11:31:31 ID:6Eq7iFe7
>>352
ごめん社長はどうでもいいんだ
俺脳内用語でNVIDIAの短縮形がNIDA
354Socket774:2009/10/17(土) 11:32:02 ID:jv2XHVsD
>>348
元気出せよ、ほらまだ自慢のFなんとかが今年中に出るんだろ?
ララビなんか蹴散らせるって!
355Socket774:2009/10/17(土) 11:33:26 ID:IWmZa7BP
>>349
ってことはデータセット転送部分はGPLかw
356Socket774:2009/10/17(土) 11:36:39 ID:fFan8dX6
よく読むと

私達の圧縮アルゴリズムを一般的に使われるZLIBと比べると…

って書いてあるから、ZLIBはあくまでも比較対照じゃね?
357,,・´∀`・,,)っ-○○○:2009/10/17(土) 11:38:33 ID:6Eq7iFe7
>>355
んなこたない。MSがPNG使えなくなるじゃん。
zlibはzlib licenceという比較的緩いオープンソースライセンス
358Socket774:2009/10/17(土) 11:41:23 ID:fFan8dX6
やっぱり「俺らの圧縮アルゴリズムはZLIBよりSIMDと親和性が高くていいぜ」
って話になってるな。どんなアルゴリズムか知らんが。
359Socket774:2009/10/17(土) 11:42:45 ID:fFan8dX6
固定長の圧縮アルゴリズムとしか分からん
360,,・´∀`・,,)っ-○○○:2009/10/17(土) 11:43:54 ID:6Eq7iFe7
まあSIMD特化のDeflate実装と思われるんだが
GPGPUにおいてPCIeがボトルネックってずっと前から言われてたことだし。
これのポータブルな実装作ったら流行るんじゃね?








まあRadeonだのGeForceだののシェーダがx86そのものなLarrabeeほどの柔軟性があるとは思えんが
361Socket774:2009/10/17(土) 11:49:14 ID:/yh5obMr
うんうん、柔軟性が大事だから
Nehalem−SandyBridge−IvyBridge−Haswell−ソフランS
使うことにするわ
362Socket774:2009/10/17(土) 17:03:34 ID:b1GwOcaa
シミュレーターがあるのに、GPUとしての性能も公開しないし、
HPC分野でよくある課題の処理能力も公開しない。
そういうものから逃げてるように見えて印象はよくないのう、今の所は
363Socket774:2009/10/17(土) 17:08:28 ID:zjj6bCSF
もうそういうところにしか希望が見出せないのかな?
今回のはコマーシャルペーパーではないよ。
それに医療向けは長年狙ってきた分野。
364,,・´∀`・,,)っ-○○○:2009/10/17(土) 17:24:22 ID:6Eq7iFe7
今回のは商業イベントではなくIEEEという権威ある学会だからね。
1年以上仕込んだ「研究論文」だ。
365Socket774:2009/10/17(土) 17:29:09 ID:b1GwOcaa
>341の内容はIntelの内輪以外が追試可能なのかな
不能だとしたらそれは学術論文とは言えなんだが
366,,・´∀`・,,)っ-○○○:2009/10/17(土) 17:39:04 ID:6Eq7iFe7
「僕の考えた最強のCPU」の性能評価系の論文はいくつか読んだことがあるが
シミュレータのソースが公開されてるものは見たことがない

まあ、圧縮アルゴリズムにしても、商品として売れる物をみすみす無償公開するとは思えんが。

367Socket774:2009/10/17(土) 17:39:56 ID:zjj6bCSF
電書鳩飛ばして聞いてみろよ。
368Socket774:2009/10/17(土) 17:41:55 ID:HmIEqDgp
601 :,,・´∀`・,,)っ-●◎○ [sage] :2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeのサンプルはDreamworksで評価されてるようだが
369,,・´∀`・,,)っ-○○○:2009/10/17(土) 17:42:38 ID:6Eq7iFe7
そうだよ。サンプル的なサイクルアキュレートシミュレータだよ。
370Socket774:2009/10/17(土) 17:55:06 ID:b1GwOcaa
今すぐには無理でもいずれ検証できればいいという基準で査読通してるのかね。
まあ査読者の編成にも営利企業の人間が多数いるだろうし
自分の側が投稿する時のことを考えたら
検証不能なpaperは通さないなんて厳格な態度は取れないのかもね
371,,・´∀`・,,)っ-○○○:2009/10/17(土) 17:55:19 ID:6Eq7iFe7
サンプル=物理的なダイとか浅はかな思い込みだな。
物理的なダイがないとソフト開発できないなんてのはまともなシミュレータが貰えない弱小ベンダーの詭弁

んで、LRB SDKっていわれるものは機密保持契約を結んだゲームエンジン屋やレンダラ屋に先行評価版が
提供されているのは2008年時点の話。

まあ例の「アレ」はちょっとライセンス緩いから俺でもアクセスできるわけだが
Core MAみたいなアウトオブオーダなCPUまで正確に所要サイクル吐き出すからびっくりする
372,,・´∀`・,,)っ-○○○:2009/10/17(土) 17:58:54 ID:6Eq7iFe7
>>370
NVIDIAの役員がスタンフォードの教授という立場利用してLarrabeeの悪口言うくらいだから始末に困る。

アメリカには科学研究費補助金みたいな制度がないから原則企業の都合で成り立ってる。
アメリカの学会に日本ほどのクリーンさはない。
373Socket774:2009/10/17(土) 17:59:46 ID:qJ54lz9o
ム板からきますた
NVIDIA終了記念パピコ
374Socket774:2009/10/17(土) 18:45:39 ID:hMO9u+9p
サンプルシリコンはよく聞くけど、サンプルシミュレータなんて一般的じゃないな
375Socket774:2009/10/17(土) 18:49:11 ID:1ssiCl8q
Larrabee?中止でしょ
376Socket774:2009/10/17(土) 18:54:16 ID:t9PSPMbn
今日発表のデータって出てる??
あっちはまだ16日だったりする???
377Socket774:2009/10/17(土) 19:02:56 ID:V7sQukyE
出てるけどインテル必死だなwwww
しか書いてない。
378,,・´∀`・,,)っ-○○○:2009/10/17(土) 19:03:06 ID:6Eq7iFe7
>>374
狭い了見ですな
379Socket774:2009/10/17(土) 19:09:44 ID:t9PSPMbn
>>377
なんじゃそりゃ〜!!
和訳でるなら見たいとこだな。
380Socket774:2009/10/17(土) 20:07:39 ID:/PDYkEpi
なまえを C'est la vieに変えちまえ〜
381Socket774:2009/10/17(土) 21:04:46 ID:D5brKARu
シミュレーターのベンチ結果ってハードウェアが理想通りの動作をした場合の値なんでしょ?
現在それが出来るサンプルハードウェアは存在するのですかね。
まあ、しないからシミュレーターなんでしょうけど。

なんだかNvidiaとIntelが「僕が考えた最強のプロセッサー」対決をしているだけにみえるのは気のせいかな。
何時になったら実機を使ったデモやベンチマークが出てくるんだろうか。
382,,・´∀`・,,)っ-○○○:2009/10/17(土) 21:06:59 ID:6Eq7iFe7
Intelのはキャッシュミスやページフォルトまでシミュレーションできるぞ
383Socket774:2009/10/17(土) 21:57:03 ID:Y1cDNSPU
完全にシミュレートできるなら、どの製品でもバグは無いんじゃないかな
だからシミュレートなんだよね
384,,・´∀`・,,)っ-○○○:2009/10/17(土) 22:15:42 ID:6Eq7iFe7
シミュレートを否定したらGPGPUの使い道が(ry
385Socket774:2009/10/17(土) 23:08:53 ID:5sBlP9Av
曲がりなりにもIDFでデモをしたのに性能評価は実測じゃなくシミュレートっていうのが残念な感じ
現状のサンプルじゃまともな評価も出来んってことでしょ
386,,・´∀`・,,)っ-○○○:2009/10/17(土) 23:24:57 ID:6Eq7iFe7
んあ?
圧縮アルゴリズムの開発から1週間や2週間で書けるレベルの論文だとでも思ってるのか?

というより常識的に考えれば論文はIDFより前に提出してる
まず査読があって、通ったものが大々的に発表される



そもそも今回の論文の意図する所はなんだと思う
圧縮フォーマットの動的展開は効率が悪いと思われてるが帯域をセーブする上で有用であることが示された。
これは、x86の複雑だが命令密度の高い命令セットの底力に対するアナグラムにもなっている。
387Socket774:2009/10/17(土) 23:26:15 ID:b1GwOcaa
日付から考えてIEEE VisWeek 2009 のプレゼンターの原稿締め切りは
IDFより前なんじゃないの
388Socket774:2009/10/17(土) 23:27:10 ID:iRbpjrqw
アナグラムって  あん時の匂い → アントニオ猪木
みたいなやつか?
389Socket774:2009/10/17(土) 23:30:15 ID:/PDYkEpi
アナロジー言いたかったちゃうん?
390,,・´∀`・,,)っ-○○○:2009/10/17(土) 23:31:25 ID:6Eq7iFe7
そうとも言う(キリッ
391Socket774:2009/10/17(土) 23:32:05 ID:Y1cDNSPU
>>384
えw
392,,・´∀`・,,)っ-○○○:2009/10/17(土) 23:33:44 ID:6Eq7iFe7
だってさ、HPCの用途ってシミュレーションばっかだぞ
393Socket774:2009/10/17(土) 23:43:15 ID:5sBlP9Av
ウェハが公開されたのが4月だから9月のデモがファーストシリコンってわけじゃないだろ
時間が無いと言うことはない

それでも実働チップが使えないんだからバグが多すぎたか
あるいは噂にあるように多少の設計変更が行われたか
少なくとも順調では無いように見えるね
394Socket774:2009/10/17(土) 23:43:56 ID:Y1cDNSPU
ハードウェアをシミュレートして、ベンチマークをシミュレートするか・・・w
395Socket774:2009/10/17(土) 23:46:14 ID:OIDRM4wX
Dreamworksとやらには大金払って評価してもらってるのか?
顧客がシミュレーターで評価とかやらんような気がする。
396,,・´∀`・,,)っ-○○○:2009/10/17(土) 23:46:23 ID:6Eq7iFe7
まあL2キャッシュのチューンなんかは最後まで解らんね
それでも多くとも±1割以内には誤差を抑えてくるのがプロだが

というか今回の結果は誤差を補正して覆せるレベルの差じゃないことくらいわかるだろう
397,,・´∀`・,,)っ-○○○:2009/10/17(土) 23:49:07 ID:6Eq7iFe7
>>395
もともとOpteronクラスタでCG作ってた会社だけどクソさ加減に失望してIntelに乗り換えた。
以降IntelはここのCG映画のスポンサーでエンジン開発の技術協力もしてる

398Socket774:2009/10/17(土) 23:52:14 ID:OIDRM4wX
>>397
なるほどデータセンター一棟、ビルワンフロア、開発人員さらに大金ぐらい出してるのか。
399,,・´∀`・,,)っ-○○○:2009/10/17(土) 23:54:09 ID:6Eq7iFe7
400,,・´∀`・,,)っ-○○○:2009/10/17(土) 23:59:06 ID:6Eq7iFe7
IntelはCore MAも含めてCPUのシミュレータを作ってる
てかVTuneの技術転用だからお手の物だが。
中の人に「Larrabeeスゲー」と言わしめたのも
そもそもIntelのシミュレータの精度の高さの実績があってこそのもの

つーか実物が出荷されるまでソフト開発が出来ないなんてのは
競合他社に遅れを取ることになるから
開発ツールとシミュレータの先行配布なんてのは親密なパートナーなら当たり前
401Socket774:2009/10/17(土) 23:59:44 ID:tSXH96B2
>>397
Pen4とかC2Dのころから?
402,,・´∀`・,,)っ-○○○:2009/10/18(日) 00:05:21 ID:ug3wQg4J
>>401
たしか45nmのHarpertownの頃。
レイトレはSIMD性能とキャッシュ容量がきくからね。
あの頃から大きく引き離してたでしょ。
403Socket774:2009/10/18(日) 00:06:54 ID:Y1cDNSPU
親密なパートナー・・・
今回特定のパートナーだけでなく、公の場にベンチ性能を出したのが全部ハードも含めシミュレートだった
404,,・´∀`・,,)っ-○○○:2009/10/18(日) 00:12:21 ID:ug3wQg4J
NVIDIAは粗雑な作りのモックアップを出すことで株価にどう影響するかの経営シミュレートが必要だな
405Socket774:2009/10/18(日) 00:13:34 ID:AZzDWBph
Intel 740みたいにならんことを祈るばかり(-人-) 
406Socket774:2009/10/18(日) 00:21:27 ID:noR9Po30
Larrabeeは単純なメニーコアとしても使えるんだろうし
FusionとかFermiはCellの二の舞になるかな
407,,・´∀`・,,)っ-○○○:2009/10/18(日) 00:25:27 ID:ug3wQg4J
Intelとてあんまり性能良いのを安く出してXeonの6コアとか8コアを注目しなくなったらそれはそれで
経営戦略ミスなわけだが。
408Socket774:2009/10/18(日) 00:32:22 ID:dF0SJZE2
>>406
そりゃ無理だわいまさらPen3クラスのコアとかw
しかもSIMDユニットに互換性無いだろ。
演算性能でfermi圧倒してGPU性能で僅差まで詰めないとポシャるがな。
409,,・´∀`・,,)っ-○○○:2009/10/18(日) 00:33:37 ID:ug3wQg4J
>そりゃ無理だわいまさらPen3クラスのコアとかw
はいダウト
410Socket774:2009/10/18(日) 00:35:15 ID:dF0SJZE2
>>409
pen4クラスでも同じコア増やしても効率が下がり続けるだけ。
LNBを含めて成功しないと意味なし。
411,,・´∀`・,,)っ-○○○:2009/10/18(日) 00:36:46 ID:ug3wQg4J
はい、妄想もう一つ入りました
412Socket774:2009/10/18(日) 00:37:49 ID:dF0SJZE2
じゃあpen3 500コアのCPU発売していてくださいね。
413,,・´∀`・,,)っ-○○○:2009/10/18(日) 00:42:28 ID:ug3wQg4J
初代「Pentium」のパイプラインが土台なんだがwww
わずか550万トランジスタで当時ウン百万のRISCマシンの性能に迫った傑作
414Socket774:2009/10/18(日) 00:43:09 ID:noR9Po30
個人的興味はエンコ一択
GPGPUやSpursは質が悪いから
intelは基本買わんことにしてるが
もし速度もワットパフォも二倍とか言われたらさすがに
買わざるを得んわ
415Socket774:2009/10/18(日) 00:43:39 ID:dF0SJZE2
>>413
ああそうだったねインオーダーだね。単なる勘違い。
416Socket774:2009/10/18(日) 00:44:53 ID:dF0SJZE2
CPUは3年前から3年後まで進化なし頭打ち。
2012年にDual GPU cardPCの割合が50%。
2015年 nvidia GPU は5000SPへ
さあどうなるか
417Socket774:2009/10/18(日) 00:45:48 ID:AZzDWBph
そんなあからさまに話題逸らさなくていいですよ(-人-)
418,,・´∀`・,,)っ-○○○:2009/10/18(日) 00:45:53 ID:ug3wQg4J
500mm²使ってもシェーダ部分の面積は1/3とかそんなん(←CUDAとして使えるのはあくまでこの部分)
これでピーク性能ならまだしも実効性能で勝とうなど甘い
419Socket774:2009/10/18(日) 00:47:19 ID:dF0SJZE2
>>418
ROPの部分ぐらいしか違いはないでしょ。
ROPはコア面積の1割程度っぽいが。
420,,・´∀`・,,)っ-○○○:2009/10/18(日) 00:48:13 ID:ug3wQg4J
失礼、550万はPentium Proだな
P54Cは310万

421,,・´∀`・,,)っ-○○○:2009/10/18(日) 00:50:58 ID:ug3wQg4J
>>419
GT200だが
http://www.anandtech.com/video/showdoc.aspx?i=3341&p=8


GPGPUとして使えないブロックが多すぎだろ
422Socket774:2009/10/18(日) 00:52:10 ID:dF0SJZE2
ビット演算もハードウェアで積んでるし
インテルが論文で出したようなことは既に解決済みのにほい。
423,,・´∀`・,,)っ-○○○:2009/10/18(日) 00:54:22 ID:ug3wQg4J
> ビット演算もハードウェアで積んでるし
AND NOT OR XORならG80時代からあったぞ馬鹿め
424Socket774:2009/10/18(日) 00:55:00 ID:dF0SJZE2
>>421
テクスチャユニットはララビもあるでしょ。
ララビもL2で埋め尽くされ点じゃないですか。
425,,・´∀`・,,)っ-○○○:2009/10/18(日) 00:57:50 ID:ug3wQg4J
L2は有用だろ。VRAMに何度も読んで書いてやるのはトラフィックと電力の無駄
特に汎用演算においてはな
426Socket774:2009/10/18(日) 01:05:51 ID:dF0SJZE2
スループットコンピューティングと逆の考えですな。
過去の遺産にトランジスタと大量に裂くのはどうなんですかな。


まあL2の話を除いてもGPUとして使う以上ROP以外はnvidiaとかわらんしょ。
427Socket774:2009/10/18(日) 01:10:16 ID:dF0SJZE2
>>423
マスクじゃなくてね追加されてるから調べてみてね。
428,,・´∀`・,,)っ-○○○:2009/10/18(日) 01:15:31 ID:ug3wQg4J
は?
グローバルメモリの帯域増加はピン増加とともに消費電力の増加に直結し性能向上の阻害要因になりつつあるから
ローカルメモリを増やして伝送コストを削減しするのが今のスループットコンピューティングのトレンドだぞ。
NVIDIA自身のトップが言ってるんだ。
しかし理想とは裏腹にFermiにいたってもVRAM帯域依存の時代遅れのアーキで頑張ってるわけだが。
GPUのしがらみで汎用コンピューティング性能向上が阻害されてるんだよ


それともx86デコーダのことか?
最近はx86のフォーマットは命令の密度が高いベターVLIWとして見直されてるのに
未だにクソだクソとわめき散らすアホがいる。
Larrabee用に更にアドレッシングモードを強化され命令密度を更に増している。
429,,・´∀`・,,)っ-○○○:2009/10/18(日) 01:17:01 ID:ug3wQg4J
>>427
まさか要素毎プレディケートのこと言ってるのか?



なんつーか、何でそんな今更・・・
430Socket774:2009/10/18(日) 01:17:24 ID:uLhRZ3D2
今までのスループットコンピューティングが、10のトランジスタで10の性能を目指しすぎたんだよ
10のトランジスタで5の性能、と妥協すれば用途が格段に広がるとIntelは考えた
431Socket774:2009/10/18(日) 01:17:38 ID:8n12R55c
Cellの逆襲がはじまr・・・・
432,,・´∀`・,,)っ-○○○:2009/10/18(日) 01:19:48 ID:ug3wQg4J
>>431
だんごやさんがわかもとぼいすで暴れるぞ
ぶるぁぁぁぁ
433Socket774:2009/10/18(日) 01:26:08 ID:dF0SJZE2
演算性能でfermi圧倒してGPU性能で僅差まで詰めないとポシャる。

あとは双方出てみないとわかんない。larrabeeが駄目っぽいのは何となくわかる。
434Socket774:2009/10/18(日) 01:27:08 ID:uLhRZ3D2
x86をまるごとフィーチャーする事で、将来L1L2キャッシュの容量・レイテンシ・帯域が変更できる
SIMDエンジンの速度・所要クロック数を改良できる
初代のPentiumパイプラインすら設計変更できてしまう
互換性の鬼、Intelらしい思想
435Socket774:2009/10/18(日) 01:28:09 ID:781gUhb1
>>431
逆襲って言うか、7コア以上で一番多数出荷してるのはCellでしょう。
GPUはまだアクセラレーターとしてしか機能させてもらってないから
GPUの方がもっと多コアに相当するとか言わないでね
436Socket774:2009/10/18(日) 01:28:13 ID:txVfGMJS
CellのLSが素晴らしかったかという事だな。
437,,・´∀`・,,)っ-○○○:2009/10/18(日) 01:29:40 ID:ug3wQg4J
Fermiが競争力を失うことだけはわかっている。
ただでさえGT200に失望したのにそれより更に輪をかけてクソになってる
438,,・´∀`・,,)っ-○○○:2009/10/18(日) 01:30:32 ID:ug3wQg4J
>>435
GT200はSM=1コアとして見ると30コアだぞ
439Socket774:2009/10/18(日) 01:31:56 ID:S1X3tlQb
メイヨー病院との共同論文か……

これを思い出すなw
>ttp://www-03.ibm.com/press/us/en/attachment/23251.wss?fileId=ATTACH_FILE2&fileName=cell-reg.pdf
440Socket774:2009/10/18(日) 01:32:35 ID:uLhRZ3D2
32コアのうち、最初の2コアをネハレンコアに差し替えてL3追加して新CPUできあがり
441,,・´∀`・,,)っ-○○○:2009/10/18(日) 01:32:40 ID:ug3wQg4J
>>435
CellはシングルコアPPC+ダイ組み込みのアクセラレータ8つ(あるいは1つ死亡)
C言語のtime関数すら使えないようなのを勝手にコアにカウントするなよ。

442Socket774:2009/10/18(日) 01:33:44 ID:781gUhb1
将来も絶対無理だと思うが、プロセッサ全数の可動実績統計が
取れたら面白いだろうな。 高速だが買った人に使い切ってもらえてない
CPUとか、遅いんだが酷使されてるCPUとかあるかもしれない
443,,・´∀`・,,)っ-○○○:2009/10/18(日) 01:35:01 ID:ug3wQg4J
Turbo Boostみたいな機能がありがたがられること自体、メニーコア路線のアンチテーゼ的だね
444Socket774:2009/10/18(日) 01:35:45 ID:lMGzz80e
CellのSPEは汎用に使うにはISA削りすぎ
GPUに使うにはSIMDがショート過ぎてトランジスタ効率悪過ぎじゃないか?
445Socket774:2009/10/18(日) 01:38:45 ID:mEEmMAm8
SPEを馬鹿にする奴はCELLを知った風になってるだけだ
SPEをメインに書(ry

俺も最初は信じられなかったさ……
446Socket774:2009/10/18(日) 01:45:44 ID:uLhRZ3D2
1命令を演算するのに、コードL1の帯域を4バイト消費する、という冷厳な事実
RISCいじってるといつも気になるこのムダさ
447Socket774:2009/10/18(日) 01:49:05 ID:NI9iQ+pi
SPEってRISC思想を貫き通し過ぎてアドレッシングとか滅茶苦茶弱いんだっけ?
コンパイラを意識してSIMDを4並列に留めたのに、やっぱりハンドコーディングじゃないと
まともな性能出ないとか聞いたけど、実際にいじってる人からするとこの評判は本当なのか?
448,,・´∀`・,,)っ-○○○:2009/10/18(日) 01:51:10 ID:ug3wQg4J
スカラ演算もどきをやったらAtom 1.6GHz(HT)>SPE2個(3.2GHz)なんてことも珍しくないよ

どうせSIMD特化のコアが大量にあってもやることはデータレベル並列向けの処理くらいしかないんだし
スカラ演算ユニットとよりワイドなSIMDユニットのっけたほうが実用的だとそこで悟った

演算目的ごとにレジスタの種別を分けないことや高クロック路線は
古典的なRISCの教科書どおりのアプローチだがやはり古典は古典だった。
流行らなくなったのは必ず理由がある。
SPEがやったのはバッドノウハウの再試行だったわけだ。
449Socket774:2009/10/18(日) 01:55:37 ID:+w65WwI/
450Socket774:2009/10/18(日) 02:07:52 ID:5y1gqY5d
>>341>>345 >>439>>449
「ちょい前のメインストリームx86プロセッサと比較してウン十倍速いお!」

名誉病院フラグktkr
451Socket774:2009/10/18(日) 02:16:34 ID:uEuM1INR
Larrabeeって1コアあたりL2分込で4000〜5000万トランジスタくらいある感じだけど
演算器の大半はベクトルユニット分なのか?
452,,・´∀`・,,)っ-○○○:2009/10/18(日) 02:24:44 ID:ug3wQg4J
そこまで大きくはない
まあ演算器で一番面積占めてるのはベクトル関係だろうな。

453Socket774:2009/10/18(日) 02:30:09 ID:dF0SJZE2
LSU半分になったとかいうけどLSU含めたL1&共有メモリまで等速になったのかも知れないな。
今までは3SMまとめで用意してあったのが1SMあたりに変わってるから。
まあとにかく出てみないとわからんな。
454Socket774:2009/10/18(日) 02:32:44 ID:dF0SJZE2
あと整数演算パイプが完全に分離されてるからやはり論文に書いてあったようなことは想定内の可能性は極大だ。
455,,・´∀`・,,)っ-○○○:2009/10/18(日) 02:39:40 ID:ug3wQg4J
Larrabeeだと各コア毎に上り下り512bit/clkのデータ読み書きが出来るL1があって
演算のほうも512bit LoadとStoreのdual issue可能

等速だろうと32SPあたり16WayのLSU1基の時点で既に競争力ない
456Socket774:2009/10/18(日) 02:43:20 ID:dF0SJZE2
512bitだったら同じじゃないか。
457,,・´∀`・,,)っ-○○○:2009/10/18(日) 02:50:00 ID:ug3wQg4J
同じなわけがないだろ
Fermiの場合2つの命令ストリームに供給しなきゃいけないのに。
458Socket774:2009/10/18(日) 02:54:49 ID:dF0SJZE2
んだな。チョット酒飲んでボケてた。
そこでシェアードメモリのかつようかと。

しかしLSU自体の性能はGT200と変わってない可能性があるということ。
459Socket774:2009/10/18(日) 02:58:11 ID:DviltBq3
なあ、素人質問で悪いがLarrabeeに、もしも、
CellのPPUに相当するような働きの
x86コアを1個くらい乗せたら1チップで完結してしまうのか?
460,,・´∀`・,,)っ-○○○:2009/10/18(日) 03:11:38 ID:ug3wQg4J
>>458
だからさー
シェアードメモリからレジスタにデータ移すのに必要なユニットなんだったっけ?
461Socket774:2009/10/18(日) 03:12:09 ID:+N/dmDWr
>>407
なるほどな、その視点があったか
Larrabeeはあまりにも速すぎた可能性がある(あった)と
戦略的に遅らされてるか、あるいは社内で潰し合いになってるのかもしれん
462Socket774:2009/10/18(日) 04:12:26 ID:NILOjX0R
>>385
>>341のpdfを読めばわかるが、この論文は2009年3月31日に書き上げられたものだぞ。
執筆期間は2008年10月〜2009年3月あたりだと推測されるからシリコンがあるわけがない。
463Socket774:2009/10/18(日) 04:22:25 ID:pxmideGl
TDP100W位のLarrabee(16コア 2GHz)をCPUソケットに差してWindowsを動かしたら、i7 920より快適になるのか?
WebブラウザやOffice(Word excel)、メディアプレーヤーとかはどうなるんだろう。
464Socket774:2009/10/18(日) 09:24:08 ID:UrCMrncY
>>460
それは謎だな、確かに。
なぜ16×2のSPに対してロードストアユニットが16wayしかないのか。
しかし逆に言えばシミュレーションの結果、
16wayで問題ないと判断されたのではないか?

例えば、レジスタで完結するサイクルもある。
各ワープはアウトオブオーダーに切り替えて実行されるのだから、
片方がロードストアユニットを使っている間は、
もう片方はレジスタで完結するワープに切り替えて実行するとか。
465,,・´∀`・,,)っ-○○○:2009/10/18(日) 19:05:57 ID:ug3wQg4J
L/S待ちのワープが溜まっていくだろ。
466,,・´∀`・,,)っ-○○○:2009/10/18(日) 19:33:40 ID:ug3wQg4J
SPARCの場合だとLoadの頻度は4命令に1回、Storeはその1/5くらいの割合だっけ
ただSPARCはアドレッシングモードが貧弱なので実質的には

GT300の場合は基本Scatter/Gather操作だから、1サイクルはあくまでベストケースで
同一の512ビットラインに収まってない場合は、最悪16サイクル分かかる(GT200までの仕様)


それとも、16基ってのは文字通り16基なんだろうか?
ものすごい帯域が得られるが。
467Socket774:2009/10/18(日) 19:33:41 ID:IAgXWbG3
俺も変だと思うが、問題ないからそうなってるんじゃないって事。
話にならんくらいパフォーマンスが落ちるなら、そんな設計しないだろう。
468,,・´∀`・,,)っ-○○○:2009/10/18(日) 19:41:11 ID:ug3wQg4J
CUDAの性能がどんなもんかは知ってるから
その辺改善してくるとは思えない。
まあGPUとしては同じ値をコピーして使い回すケースが多いから画像処理には十分なんだろうが

根本的にGPGPUのニーズに合わせて設計するって発想がないと思うんだ。
まあ、GPUとしてはそれでいいんだが。
469Socket774:2009/10/18(日) 19:48:07 ID:IAgXWbG3
今回はかなりORNLの要求通りに設計してる気がするのだが
倍精度にしろECCにしろ
470Socket774:2009/10/18(日) 19:52:57 ID:781gUhb1
ORNLと懇意なのかもしれないが、doubleやECCはHPCの本格的な
ユーザーなら誰でも要求する項目だな
471Socket774:2009/10/18(日) 19:56:37 ID:IAgXWbG3
そりゃ"Fermi"の名を偶然とは思うまい
472,,・´∀`・,,)っ-○○○:2009/10/18(日) 20:05:43 ID:ug3wQg4J
そりゃECCなしなんかはスパコン用としては論外だからね。
TeslaがCellに比べてクソ安かったのはその辺。
ECCサポートしたら容赦なくボるだろ。

それは機能の問題であって性能とは関係ない
というか、GT200は倍精度性能が低い分相対的にはロード・ストアの性能にゆとりが余裕があったわけで
その意味じゃ倍精度の実効性能の向上率は低く留まる可能性がある

LarrabeeでもScatter/Gatherはあるし64バイトラインに収まらない場合はやはり複数サイクル数はかかる
だからこそLoad/Storeはスレッド単位で基本毎サイクル発行出来るようになってるし、
キャッシュコントローラに発行してプリフェッチと同時にキャッシュ上で固めておいて貰うような
命令まで用意されてるわけだが
473Socket774:2009/10/19(月) 00:29:49 ID:p8VEjLZf
LarrabeeってECCつかないんじゃないの?
474,,・´∀`・,,)っ-○○○:2009/10/19(月) 00:35:45 ID:lG+f+kn0
未だに何コアで何GHzで出るかも把握してない奴の噂レベルではそうなってるね。
475Socket774:2009/10/19(月) 00:38:57 ID:p8VEjLZf
いやあ、実際、俺は何コアで何GHzかも知らないんだけど、そこんとこどうなの?
476Socket774:2009/10/19(月) 00:40:21 ID:WHENelbL
>>474
ECC版は用意されるらしいが形態は未だ不明だよな?
俺はLGA1567だと推測しているが
477,,・´∀`・,,)っ-○○○:2009/10/19(月) 00:40:58 ID:lG+f+kn0
なんでIntelから出るレポートのクロックが常に1GHzだと思う?
478Socket774:2009/10/19(月) 00:42:15 ID:DM2fqpf2
どうも思わない
479,,・´∀`・,,)っ-○○○:2009/10/19(月) 01:00:17 ID:lG+f+kn0
・中の人曰く「パイプラインはAtomより短い」

あと、Nehalemは面積当たりのトランジスタ数がPenrynのほぼ半分だから
Nehalemを物差しにしてトランジスタ数の予想するのは当てにならない。
SRAMや低クロック駆動部位はそれなりにトランジスタ密度は高くなる。
480Socket774:2009/10/19(月) 01:13:48 ID:CWnMOC2L
Intelジャスティン・ラトナーCTO来日会見
http://pc.watch.impress.co.jp/docs/news/20091016_322120.html
>●Larrabeeの性能データは明日土曜日の朝に公開
>なお、同氏よればIntelが米国のメイヨー病院と共同で開発したメディカル用
>のアプリケーションを利用したLarrabeeの性能データを、日本時間の 17日の
>朝に公開することを明らかにした。データはCore i7+NVIDIAのGeForce GTX
>280とLarrabeeとの比較データになっているそうで、初めてLarrabeeの性能
>データが公開されることになる。

これってどこで公開されているの?
481Socket774:2009/10/19(月) 01:15:46 ID:HfdgFfMr
>>341
482Socket774:2009/10/19(月) 01:21:31 ID:p8VEjLZf
>>479
じゃあ、あんまりクロックあがんないんだ。
2GHzくらいはいくもんだと思ってたよ。
483Socket774:2009/10/19(月) 01:44:22 ID:daKN0x1I
atomはバリバリの高クロックマシンじゃないの
Lrbは4GHzじゃ動かんくらいなもんだろ
じゃ16x2x2Ghzより8x2x4Ghzのほうが
いいんじゃねという言うのはないのかね
484Socket774:2009/10/19(月) 01:48:27 ID:agB8dYHD
昔の情報じゃ1.7-2.5GHzって流れてたけどな
2GHzは超えるんじゃねーの
485Socket774:2009/10/19(月) 01:57:50 ID:/D/6lE9g
ららびやふぇるみクラスのでっかいチップが2GHzでうごいたらあつくてしぬ
486Socket774:2009/10/19(月) 01:58:51 ID:CWnMOC2L

熱密度の問題じゃないか?
面積あたりの極所熱の話ね。
487,,・´∀`・,,)っ-○○○:2009/10/19(月) 02:03:42 ID:lG+f+kn0
>>483
18段パイプラインでクロック上がるような設計に見えるが
意外とクロックマージンがないのがAtomですよ
488,,・´∀`・,,)っ-○○○:2009/10/19(月) 02:08:11 ID:lG+f+kn0
ここまでやって2.385GHz
http://i4memory.com/f15/msi-wind-u100-meets-ln2-11829/#post100631

Atomは2GHzが事実上の上限でしょ
489Socket774:2009/10/19(月) 02:19:01 ID:n9svXwQN
結局、クロックは、NvidiaのSPとどっこいどっこいか、やや落ちるくらいか。
490Socket774:2009/10/19(月) 02:50:16 ID:IV8a3/xc
次期XboxにATIのGPUが引き続き採用という噂が上がってるけど
Larrabeeの売り込みに失敗したのかな

http://digimaga.net/2008/09/the-rumor-that-intel-begins-in-xbox-720.html
 噂によると、インテルはXbox 720に2009〜2010年に製品化される見通しの新しいGPU『Larrabee』を採用してもらうために、
マイクロソフトのご機嫌取りに必死だということだ。
491Socket774:2009/10/19(月) 02:52:20 ID:tQfCOpeq
LarrabeeがGPUを簡単に滅ぼしてしまっては
面白くないので、それはそれで良い
492Socket774:2009/10/19(月) 08:45:05 ID:ROrwZ7lC
んでもIntelなら、やろうと思えば必殺のプロセス技術で
競合を負かすまで大規模化高回転化してくるんじゃない?
一発目はハイエンドと決定してるから、
供給限界の300Wを超えなければ消費電力はあんまり気にしなくていいし。
493Socket774:2009/10/19(月) 11:55:27 ID:S7PjmKPV
現状で実機デモも出来ない完成度なのに無理だろ。
494Socket774:2009/10/19(月) 12:38:40 ID:VE93KYWI
イソテルはクソドライバーしか書けないからGPUは無理よ
495Socket774:2009/10/19(月) 12:40:10 ID:SxRujOWW
>>480
大人の事情で中止w
まあ察してやれ
496Socket774:2009/10/19(月) 12:56:32 ID:MihX92Du
>>490
MSと任天堂のATi組は次世代もATi使うよっていってたと思う
ララビーはもっぱらPS4搭載の噂だった
497Socket774:2009/10/19(月) 13:35:15 ID:CqzLgSH6
任天の次世代携帯機はTegraみたいだけど、据置はどうすんだろね。
498Socket774:2009/10/19(月) 14:09:34 ID:R5nzVCRN
枯れた技術使うからATIじゃないすか
499Socket774:2009/10/19(月) 15:28:29 ID:Z0d3nTly
Larrabeeみたいな初物ゲーム機に使ったらCellの二の舞だろ・・・
500Socket774:2009/10/19(月) 16:29:57 ID:7Ok7RBZG
なんかここインテルの広報みたいなのがいるね
501Socket774:2009/10/19(月) 17:34:33 ID:9AConIlX
AMDの広報は無差別で荒らし回ってるがね
502Socket774:2009/10/19(月) 19:24:15 ID:S7PjmKPV
intelの広報程でもない
503Socket774:2009/10/19(月) 19:55:22 ID:geajUA5T
引き続き「ぼくのかんがえたさいきょうのららびぃ」をお楽しみください。
504Socket774:2009/10/19(月) 21:16:26 ID:BCSNK0Zj
505Socket774:2009/10/19(月) 23:01:12 ID:Og5n40Dg
>>504
具体的なデータによる批判はfudとは言わない
fudは陰湿な宣伝のことを言う
506Socket774:2009/10/19(月) 23:03:13 ID:xlkJE3jW
偏向しまくりなのは確か
507Socket774:2009/10/20(火) 00:17:42 ID:NuDezeTV
ATIも本気でFermiにHD5870で勝てるとは思っていないだろう
HD4800で一定の信頼を得た今だからこそFUDが効く
508Socket774:2009/10/20(火) 01:37:41 ID:rdgAWPcm
それでもOpenCLなら、OpenCLなら何とかしてくれる。。。
509Socket774:2009/10/20(火) 01:41:49 ID:4mWXgtrr
その前にOpenCLの仕様がCUDA寄りなのをなんとかしないと
510,,・´∀`・,,)っ-○○○:2009/10/20(火) 01:46:52 ID:WF20KXbI
PaperDragonプラットフォームかっけー
511Socket774:2009/10/20(火) 03:51:56 ID:m8tF/wuU
larrabeeのことかw
512Socket774:2009/10/20(火) 03:56:13 ID:wxw7SbBF
Dragonと言えばAMD
513Socket774:2009/10/20(火) 04:06:28 ID:m8tF/wuU
5870で2.72笑(tflops)とか1600笑(sp)とかかw
5970で5.44笑(tflops)とか3200笑(sp)とかかw

うけるだろうなw
514Socket774:2009/10/20(火) 04:15:44 ID:F0HYLi5n
larrabeeはROP追加すればGPUとしてかなりマシになると思うんだが
そんな事は検討すらされてないのだろうか?
515Socket774:2009/10/20(火) 04:27:26 ID:m8tF/wuU
ROPってのはメモリへの出力装置に過ぎんが
516Socket774:2009/10/20(火) 04:36:26 ID:3z+r6Ts2
ポリゴンのラスタライズは?
517Socket774:2009/10/20(火) 04:56:55 ID:m8tF/wuU
理論パイプラインのVSとPSの間に位置する、いわゆるラスタライザユニットがそれだが

こいつだと上に2つ
ttp://www.4gamer.net/games/085/G008506/20091016074/images/block_F.gif

ラスタライザはいまのGPUにとって一番のネックになっているという
518Socket774:2009/10/20(火) 05:52:19 ID:/wwWR19P
固定ハードウェアってやつは、性能がボトルネックになったり大量に遊んだり融通きかん
テクスチャユニットも、各コアに有効な命令追加して外してくれ
519Socket774:2009/10/20(火) 05:56:22 ID:/wwWR19P
まぁ、コア何個か融通してボトルネックになってる固定ハードウェアを
エミュレートして手伝わせりゃ良いのか
520Socket774:2009/10/20(火) 06:17:26 ID:9P8PlTZf
インテルのシミュレーターが優秀すぎるが故に出せない罠にはまってるとみるw
521Socket774:2009/10/20(火) 07:00:45 ID:YVZ+5PTm
もう面倒だからエミュレーターをリリースすればいいんじゃね?
522Socket774:2009/10/20(火) 09:02:39 ID:9Qv3ng1E
>>518
コアに有効な命令追加したからあんだけ小さくなったんだろ
523Socket774:2009/10/20(火) 10:16:16 ID:mQCv35gX
ララビー牧場
524Socket774:2009/10/20(火) 10:29:29 ID:9Qv3ng1E
というか圧縮テクスチャ程度ならダイレクトにロード命令で取り出す機能がある。
逆になんで専用ハードウェアがあるのか謎
525Socket774:2009/10/20(火) 10:36:33 ID:9Qv3ng1E
あ・・・固定機能はテクスチャフェッチ専用かも
526Socket774:2009/10/20(火) 11:09:14 ID:Z+pSbbyF
527Socket774:2009/10/20(火) 16:38:48 ID:l8ucWtIn
あれ、Larabeeの性能データどうなったの?
528Socket774:2009/10/20(火) 16:42:32 ID:cQp1ePvf
過去ログ読まない奴って何なの?
529Socket774:2009/10/20(火) 22:06:10 ID:a5kZlAf4
>>528
俺も知りたいんだが、過去ログのどれさ?

全部みたが、性能データなど見当たらないんだが。
530Socket774:2009/10/20(火) 22:10:02 ID:RVm4iFa6
節穴
531Socket774:2009/10/21(水) 00:18:14 ID:fjxqaNAZ
larrabeeの先輩のCellさんの話があったよ。よく聞いておけよ!

http://pc.watch.impress.co.jp/docs/news/event/20091020_322898.html

>とはいえ、PS3のように「それでもSPEを使わざるを得ない」という追い込み
>方をすると、数年でSPE Programmingが普及し始めることもあるわけで、
>環境の作り方次第とも言える

ためになるな〜。偉いね〜。
532Socket774:2009/10/21(水) 01:28:15 ID:oF8lF193
そしてRadeonが天下を取るのであった。
533Socket774:2009/10/21(水) 01:48:10 ID:CdTnRCol
534,,・´∀`・,,)っ-○○○:2009/10/21(水) 02:02:15 ID:pXjOHmBL
>>533
そりゃIntelもAMDも将来的には自社CPUに統合されてディスクリート必要なくなりますよとか言われて
黙ってはいそうですかできるかいな。
それでしか食っていけないのに
535Socket774:2009/10/21(水) 04:52:05 ID:bciarCnU
>>526
ゲームごとにこれだけワークロードが被っているなら
トランジスタ効率の良い固定機能にハードウェア資源を割り振るべきだな
536Socket774:2009/10/21(水) 06:52:57 ID:+257CLMT
>>535
馬鹿乙〜
537Socket774:2009/10/21(水) 07:09:42 ID:ZDk44Sh2
40nm現行品と4年前の90nm世代とを比較

944 :214=884:2009/10/20(火) 21:46:36 ID:aIGOM8X3
>>928
アイドルとゆめりあ実行中のみだけど測ってみた。
ワットチェッカー読み。
構成は>>214

GT220 DDR2(玄人志向 GF-GT220-E512HD) >>884
アイドル時:55W
ゆめりあ時:91W
ゆめりあスコア:27000

7600GT(ELSA GRADIAC 776GT)
アイドル時:58W
ゆめりあ時:89W
ゆめりあスコア:24500
538Socket774:2009/10/21(水) 07:12:22 ID:Z3i57Pyp
ゆめりあで何が測れると思ってるんだか
539Socket774:2009/10/21(水) 07:24:59 ID:XSJho8bQ
Tropics v1.2

【設定】デフォルト+フルスクリーン
【備考】OC無し全部定格

【VGA】MSI NX7900GS-T2D256E-HD(Geforce7900GS 256MB
 【DirectX9.0】
 ・FPS:8.7
 ・Scores:220

【VGA】Leadtek WinFast GT220 1024MB DDR3 LP(Geforce GT220
 【DirectX9.0】
 ・FPS:26.4
 ・Scores:665
540,,・´∀`・,,)っ-○○○:2009/10/21(水) 07:38:35 ID:pXjOHmBL
>>538
勃起時のながさ
541Socket774:2009/10/21(水) 07:49:18 ID:+257CLMT
団子=HENTAI
テストに出ます
542Socket774:2009/10/21(水) 11:04:13 ID:m+72l9FM
テクスチャユニットって、DX11の新しいテクスチャ圧縮BC6・BC7とか、対応ちゃんとできてるのか?
543Socket774:2009/10/21(水) 11:58:29 ID:9jNFLX7g
norm,srgb,float16ならx86コアでハードレベルで対応してる。
必要なら1コアくらい展開用にまわしてパイプライン処理すればよいのでは。
544Socket774:2009/10/21(水) 21:16:28 ID:m+72l9FM
? それは不動小数点数圧縮テクスチャ展開してAFで補間してピクセル1個出力してLRBコアに渡す
ってとこまでできないと固定ユニットの意味なんにもないでしょ?
「展開」できなきゃゴミ
545,,・´∀`・,,)っ-○○○:2009/10/21(水) 21:24:33 ID:pXjOHmBL
「展開」機能はあるってば
546Socket774:2009/10/21(水) 21:45:00 ID:0PNRK4e+
話が噛み合ってなくてワロタ
547,,・´∀`・,,)っ-○○○:2009/10/21(水) 21:48:25 ID:pXjOHmBL
不動小数点を英訳するとFixed Precision
548,,・´∀`・,,)っ-○○○:2009/10/21(水) 21:51:06 ID:pXjOHmBL
fixed point orz
549Socket774:2009/10/21(水) 22:14:25 ID:m+72l9FM
すまん浮動小数点ねw HDR圧縮テクスチャちゃんと対応してるんなら、問題ないか
あと補間処理も、DX11では相当柔軟性が求められてるけど対応しきれてるんか
Radeonは補間処理を逆に固定ユニットからシェーダ処理に切り替えてるけども
550Socket774:2009/10/22(木) 10:17:45 ID:chCinYxS
bycubicだけあれば。
551,,・´∀`・,,)っ-○○○:2009/10/22(木) 22:42:20 ID:QfHQkvVn
Intelコンパイラがコード吐けばいいんだから、下手すりゃSPEC登録できるよな。
552,,・´∀`・,,)っ-○○○:2009/10/22(木) 22:54:23 ID:QfHQkvVn
普通のC/C++やFortranで書いたコードがそのまんま動いて、
自動ベクトル化コンパイラさえあればSIMD化まで自動でやってくれるのがLarrabee
GPGPUらしいプログラミング手法など必要なし。

片や、専用のプログラミング言語をこれから整備しようかとかいうレベルのハードあり。
しかも実効効率では前者優位っぽいぞと。

こうなればストリーミングプロセッサとしてみた場合勝負にならんレベルの差はあるな。
GPUとしてはまあ別だが。
553Socket774:2009/10/23(金) 03:41:57 ID:amFZOc2d
>Intelジャスティン・ラトナーCTO来日会見
http://pc.watch.impress.co.jp/docs/news/20091016_322120.html
>>●Larrabeeの性能データは明日土曜日の朝に公開
>>なお、同氏よればIntelが米国のメイヨー病院と共同で開発したメディカル用
>>のアプリケーションを利用したLarrabeeの性能データを、日本時間の 17日の
>>朝に公開することを明らかにした。データはCore i7+NVIDIAのGeForce GTX
>>280とLarrabeeとの比較データになっているそうで、初めてLarrabeeの性能
>>データが公開されることになる。
>これってどこで公開されているの?
この答えはどの発言なの?
554,,・´∀`・,,)っ-○○○:2009/10/23(金) 07:42:09 ID:Ue3qZdbi
文盲か
555Socket774:2009/10/23(金) 19:15:52 ID:amFZOc2d
>>553
そんな反応しなくてもいいんじゃね?性格
556Socket774:2009/10/23(金) 19:45:10 ID:EkdqFPZa
文豪か
557Socket774:2009/10/23(金) 20:23:21 ID:yqSHjrml
fermiの場合2サイクルで1WARPなんだな
てっきり1サイクルかと思ってた
558Socket774:2009/10/24(土) 06:42:20 ID:pemM3G0d

>Core i7+NVIDIAのGeForce GTX 280とLarrabeeとの比較データ
このデータて無いだろ、盲目はオマエだ>>554
559,,・´∀`・,,)っ-○○○:2009/10/24(土) 11:45:56 ID:/pRpwPyp
プッ
560Socket774:2009/10/24(土) 12:08:12 ID:eodc6NNt
数日前から粘着してる558がアホすぐる件について
561Socket774:2009/10/24(土) 12:33:57 ID:pemM3G0d
>>560>>559
スレ荒らすな
562Socket774:2009/10/24(土) 12:46:30 ID:zWzLR82M
Fermiはモックだけで比較結果すらない状態
563Socket774:2009/10/24(土) 12:56:45 ID:H3hCSfz9
564Socket774:2009/10/24(土) 13:02:56 ID:Nl8u6FHx
http://www.shader.jp/xoops/html/modules/wordpress/index.php?p=896

>Geeks3D.comからのネタですが,NVIDIAのFermiを使ったPhysXのデモのビデオというのがYouTubeにあるみたいですね.
>NVIDIA Fermi: PhysX Destruction Demo from GPU Technology Conference
>http://www.geeks3d.com/20091003/nvidia-fermi-physx-destruction-demo-from-gpu-technology-
565Socket774:2009/10/24(土) 13:06:14 ID:Nl8u6FHx
>“Fermi”は11月下旬に公開されるということだった。ただ、この予定は容易
>にずれうるものらしい。最初のサンプルは既にできており、重要顧客や
>アナリストにはお披露目しているという。

http://northwood.blog60.fc2.com/blog-entry-3183.html
566Socket774:2009/10/24(土) 13:30:20 ID:oiMNAGHc
NVIDIA「どうです?この流体シミュレーション。超リアルでしょう?」
ゲーム屋「カクカクじゃん。こんなの取り入れたらゲームになんないよ」
567Socket774:2009/10/24(土) 15:02:49 ID:jesrjDKY
リアルレンダリングとフェイク3Dが逆転する日って、いつなんだろ?
568Socket774:2009/10/24(土) 15:03:57 ID:UqLj/pyh
CGは全てフェイクだぞ
569Socket774:2009/10/24(土) 15:26:57 ID:7nSBsXJX
>>564
GPU Technology Conference のデモはモックアップしか用意できなかったうえ
デモ表示してるPC個体も非公開で全然信用されてない。
570,,・´∀`・,,)っ-○○○:2009/10/24(土) 17:28:32 ID:/pRpwPyp
モックしか出せないってのは
製造委託先にすら渡ってないってことだからね。

11月に出るって言ってる製品がだよ
ありえない
571Socket774:2009/10/24(土) 18:00:28 ID:eFEbHVaV
larrabeeのことか
572Socket774:2009/10/24(土) 18:11:10 ID:2zkG6XI0
IDF公開の青いボードはモックじゃないぜ?w
573Socket774:2009/10/24(土) 18:12:22 ID:+4GhHlk0
シリコン自体作り直しでしょ
574Socket774:2009/10/24(土) 18:15:49 ID:eFEbHVaV
>IDF公開の青いボードはモックじゃないぜ?w

その根拠は出力端子と補助電源端子が在ったからかw
575Socket774:2009/10/24(土) 18:19:01 ID:2zkG6XI0
え?じゃああのGulftownのデモ機は偽物ってこと?w
576Socket774:2009/10/24(土) 18:19:05 ID:eodc6NNt
そのレベルから疑い始めたらキリが無いだろ
N厨の言いがかりきめえな
577Socket774:2009/10/24(土) 18:20:58 ID:eFEbHVaV
なんせintelはモックデモが得意ですから
PenDをお忘れかw
578,,・´∀`・,,)っ-○○○:2009/10/24(土) 18:30:55 ID:/pRpwPyp
おいお前ら、天才NVIDIAさまが作ったTDP0Wの画期的なGPUを馬鹿にすんなよwww
579Socket774:2009/10/24(土) 18:31:56 ID:2zkG6XI0
PenDwwwお話になりませんねwwww
580Socket774:2009/10/24(土) 18:38:00 ID:eFEbHVaV
あれで本物のデモならしょぼ過ぎること林の如し
ちなみに

>Intelは4GHzクロックのPentium 4を,当初は今年の4Qに出すと言っていたのが,
>今年の7月には来年1Qに延期され,そして今回は延期ではなく中止と発表されました。
>クロックを上げる代わりに,内蔵キャッシュを1MBから2MBに増加したり,
>FSBにスピードを上げるなどの別の方法で性能を改善していくという方向の路線転換の一環であり,
>その先のPentium系のデュアルコアチップを既にテープアウトしたと,会見したIntelのプラットフォームのマーケティング部長が述べたと報道されています。

>面白いのは「デュアルコアチップを既にテープアウトした」という発言で,
>この裏を考えるとテープアウトはしたがウエファはまだ出来ていないということであり,
>つまり,9月のFall Developer's Forumのデモの時にはデュアルコアチップは無かったことを認めたも同然です。
>ということで,9月18日の話題で紹介したIntelのデモはモックアップだという見方を裏づけています。
581Socket774:2009/10/24(土) 18:39:57 ID:XHcr/Gi9
DX10の時はATiが半年遅れたけど、その時はどう言われていたんだろうか
582Socket774:2009/10/24(土) 18:46:57 ID:eFEbHVaV
R600はボロクソにいわれてたよ
なんせ馬鹿でかくて熱いくせに遅いんだから
メモコンGDDR4対応のクセにも64bit管理で前世代より粒度がでかくなった

一番のガンは無駄に帯域だけでかかったリングバスかな
583Socket774:2009/10/24(土) 18:52:16 ID:2zkG6XI0
>>580
ほおwなるほどwだからFermiはモックアップなのねw
584Socket774:2009/10/24(土) 18:55:09 ID:lDY/ah92
PenDのデモは2PのXeonで代替できるんじゃないの?
585Socket774:2009/10/24(土) 19:07:05 ID:eFEbHVaV
larrabeeモックのデモも単に在り物を動かしたに過ぎん
586,,・´∀`・,,)っ-○○○:2009/10/24(土) 19:13:50 ID:/pRpwPyp
           ∬
              |:|ID:eFEbHVaV
        ____|:|___
     ,イ´   ノ´    ヽ. `ヽ. 新しいバイトも入って
     {   ●  (__人__)  ●.}  Win7どころじゃ
      ゙'ゝ、    ` ⌒´   _ .,ノ  ないんだよね
     /   ̄ ̄ ̄ ̄ ̄ ̄ィヽ
     /             |
     |. ⌒\    ,.────.、 ギーコ ギーコ
     l \/ ̄\((| i' ̄ ̄ ̄`i | ).))
     l   uUUU二| |..|| ̄,',' ̄| | ̄ ̄ ̄ ̄ ̄.「_____
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄|_|~||  ~~~~|_|.  Fermi  .|
              ||_____      __|]
                    ┌!!_______!!.!
587Socket774:2009/10/24(土) 19:20:27 ID:eFEbHVaV
で?
どうしたよモックン
588Socket774:2009/10/24(土) 19:29:57 ID:2zkG6XI0
そうwあれはLarrabeeとET: QuakeWarsという在り物を使ってリアルタイムレイトレのデモをしたに過ぎんのよw
589Socket774:2009/10/24(土) 19:31:37 ID:eFEbHVaV
で、それがlarrabeeである根拠はw
ま、あの程度で限界ってのがlarrabeeの実力かw
590Socket774:2009/10/24(土) 19:33:33 ID:eFEbHVaV
てか、なんで目玉の演算デモは無しなん?
core i7処理のモックってバレルから?
591,,・´∀`・,,)っ-○○○:2009/10/24(土) 19:34:16 ID:/pRpwPyp
そうだよあの程度だよ。水面や金属表現があの程度だよ。
それ以外のテクスチャまで変質したらただの詐欺という。
592Socket774:2009/10/24(土) 19:34:22 ID:eodc6NNt
切断模型を展示してモックアップだと突っ込まれるのがNVIDIA
実機でデモをしてモックアップだと言いがかりを付けられるのがIntel
593Socket774:2009/10/24(土) 19:35:24 ID:7DVrGp+3
594Socket774:2009/10/24(土) 19:35:52 ID:zRMbmDXb
リングバスの製品は鬼門だね、Cell、R600、Larrabee……
595,,・´∀`・,,)っ-○○○:2009/10/24(土) 19:37:31 ID:/pRpwPyp
Xeon MP・・・
596Socket774:2009/10/24(土) 19:38:28 ID:eFEbHVaV
動きも無く非常に見栄えのする
良いデモだったなw
597,,・´∀`・,,)っ-○○○:2009/10/24(土) 19:39:16 ID:/pRpwPyp
通電しないビデオカードのことかー
598Socket774:2009/10/24(土) 19:40:53 ID:+4GhHlk0
あのデモは動きなさすぎだった
元がああいう場面だって言い訳は可能だが、
性能を見せるなら他のソース選べよって話
599,,・´∀`・,,)っ-○○○:2009/10/24(土) 19:41:58 ID:/pRpwPyp
あのレベルの水面表現がどんだけ大変か解ってないだろ
600Socket774:2009/10/24(土) 19:43:30 ID:+4GhHlk0
あの程度しか出来ないんだったらレイトレなんかやる意味ないわ
601Socket774:2009/10/24(土) 19:44:00 ID:eFEbHVaV
intelがlarrabee向けに作らせてるモノがあった筈なんだが
それの動画もintelのサイトで見た記憶がある
なんでそれじゃねーんだよって思ったわ
先ず
602,,・´∀`・,,)っ-○○○:2009/10/24(土) 19:45:39 ID:/pRpwPyp
>>600
帯域に任せて焼き込みテクスチャ貼るクライシス手法がいつまでも通用するならな
603Socket774:2009/10/24(土) 19:46:25 ID:eFEbHVaV
苦労を数えて奇を論ずる遊びに過ぎんって
604Socket774:2009/10/24(土) 19:49:34 ID:eodc6NNt
N厨はデバッグ終わってないシリコンで製品版と同等のパフォーマンスが出ると思っているのが痛い
605Socket774:2009/10/24(土) 19:52:45 ID:eFEbHVaV
淫厨は教祖様がすべて正しいと思っているのが面白い
606,,・´∀`・,,)っ-○○○:2009/10/24(土) 19:54:03 ID:/pRpwPyp
http://www.guru3d.com/news/intel-larrabee-larrabee-demo-surfaces/
最後のURL見れば解るが、"server"なんだよね。
はなからゲーム用じゃない。
607Socket774:2009/10/24(土) 19:56:03 ID:2zkG6XI0
NVはこれ以上敵を作らない方が良いよ?wただでさえ四面楚歌状態なのにw
608,,・´∀`・,,)っ-○○○:2009/10/24(土) 19:56:10 ID:/pRpwPyp
嘘も100度言えばFermiが早く出る!
609Socket774:2009/10/24(土) 19:59:51 ID:eFEbHVaV
嘘も100度言えばlarrabeeの実物が出てくる!
610Socket774:2009/10/24(土) 21:43:41 ID:1MP9pAZD
ララビは1コアでfermiの4倍のパフォーマンスが出るわけですね
OpenGLのエミュレーションでもati,nvidiaを楽々と抜きさってくれることを期待してます
流石に固定パイプラインでは勝てないでしょうが、これからのOpenGLは固定パイプライン廃止なんで
一層ららびに有利になるんでしょうね
611Socket774:2009/10/24(土) 21:51:39 ID:eFEbHVaV
つまり、ようやくDX10相当になったのねopengl
612,,・´∀`・,,)っ-○○○:2009/10/24(土) 22:14:05 ID:/pRpwPyp
OpenGLよりOpenRTだろう
613Socket774:2009/10/27(火) 05:07:29 ID:cxCLDmUf
レイトレーシングが一般的に成ればfermiがゴミになるのは眼に見えている。
614Socket774:2009/10/27(火) 17:52:13 ID:hE6Is9I7
Fermiやローンチ版Larrabeeが主戦力の時期は
まだレイトレーシングが一般的になる時期じゃない。
一般的になる時期になったらnvは(それまで生きていたらだが)たぶん
がらっと変えてくる。これまでもコロコロ変えてきた
615Socket774:2009/10/27(火) 18:02:00 ID:M2W6g1u8
レイトレーシングが一般的になった時、x86を持たないNVIDIAはPC市場から消える
これは約束された敗北であり確定した未来
616Socket774:2009/10/27(火) 21:53:03 ID:ClodaWOb
なんかレイトレに夢持ってる人が居るみたいだけど
ラジオシティを伴わない光線追跡したって大してリアルになんねーよ?
モデリングの問題だってあるし。

で、ラジオシティのエネルギー場計算はそれなりにパワー居るけど
計算しちまえばレイトレにも従来法にも適用は可能。
617,,・´∀`・,,)っ-○○○:2009/10/27(火) 22:07:13 ID:p0qmGqi2
リアルタイムでラジオは無いだろ・・・

むしろ現世代Larrabeeがすぐに可能になりそうなメソッドってA-Bufferじゃないの
618Socket774:2009/10/27(火) 22:47:47 ID:bWD4nPRt
なんだ、やっぱり落とし穴があるのか。
結局そんなうまい話はないんだな…。
619,,・´∀`・,,)っ-○○○:2009/10/27(火) 22:50:20 ID:p0qmGqi2
てかA-Bufferの為に作られたような構造だ
DirectXが邪魔
620Socket774:2009/10/28(水) 00:20:38 ID:38g4goGX
どのA-Bufferをいってるんか知らんけど、LucasFilm考案のやつなら
既存アルゴリズムの拡張だからそれこそLarrabeeである必要性は低いよ。
むしろピクセルシェーダの拡張だし。

必要な情報量が増えて転送量が上がる分、むしろLarrabeeには不利。

レイトレがLarrabeeに向くのはピクセル処理よりも交差判断の演算処理が
はるかに膨大になるっていう比較の問題であって、リアルな描画求めたら
結局オンラインレンダリングなんて夢物語に終わるし、まぁ微妙なところ。
無理にリアルタイムレンダリングに拘らないほうがいい。
621,,・´∀`・,,)っ-○○○:2009/10/28(水) 00:34:47 ID:y5ysAT1N
コア数増やすだけでスケーラビリティが得られるという点で将来性があるのでは?
Stencil Routed〜かな。
もちろんNVIDIAも論文書いてるし、そのうち実装を出してくると思ってる。

自社に有利なメソッドを選ぶことでの差別化も大事だが、業界全体がついてこないことには。
622,,・´∀`・,,)っ-○○○:2009/10/28(水) 00:49:32 ID:y5ysAT1N
バケモンチップでっちあげた企業が登場したんでこっちに転載しておく

100コアの汎用プロセッサ「TILE-Gx100」が登場 - 米Tilera
http://journal.mycom.co.jp/news/2009/10/27/011/?rt=na

TILE-Gx Processors Family
http://tilera.com/products/TILE-Gx.php
623Socket774:2009/10/28(水) 00:55:15 ID:6i0GCjY+
スレ違いだウンコ
624,,・´∀`・,,)っ-○○○:2009/10/28(水) 01:00:07 ID:y5ysAT1N
たとえば既存アーキテクチャでは、ROPから吐き出したピクセルデータを
ピクセルシェーダにダイレクトに渡せばいいものをVRAMに都度吐き出して
またそれをロードしてるわけで。

キャッシュ容量改善によるメモリ帯域消費の削減の余地はかなりある。
GDDR5でそれなりには帯域は確保するようだし多少キャッシュミスしても
トータルで帯域をセーブできれば十分元が取れるのでは。
625,,・´∀`・,,)っ-○○○:2009/10/28(水) 01:33:15 ID:y5ysAT1N
A-Bufferは最終工程までは並列処理に向くだけでなくて処理の順序関係すら依存性を排除できる。
Z-Bufferが1000人1001人脚なら、A-Bufferは1000人バラバラに走ってゴールテープ手前で
全員の足を結べば良いようなイメージね。そこまでの走り方は自由だ。

そこでだ、同時処理するスレッド数数を減らせばそれだけ1スレッドでキャッシュを有効活用できるよな?
スレッドがアクティブな間、キャッシュミスを減らすことが出来さえすればいい。

GeForceで1SMあたり32KBのShared Memoryがあっても、16ワープ動かせば
1ワープ当たり2KB程度の割当てしかない。
どのピクセルも同じように処理を進行させる必要があるからだ。
んで、絶対的に割り当てが少ないから、VRAMとGPUコアとの往復をちんたらデータ読み書きする羽目になる。

Larrabeeは1〜4スレッドで各L2断片は256KB。
キャッシュめいっぱい割り当てたまま連続処理して、キリが良いところで別のコンテクストに渡せばいい。

これでもまだA-BufferでLarrabeeがより有利になる理由が解らん奴は首吊って氏ねばいいと思う。
626Socket774:2009/10/28(水) 01:43:39 ID:uUesMLG2
でもA-Bufferだとメモリ食うんじゃねーの
627,,・´∀`・,,)っ-○○○:2009/10/28(水) 01:47:40 ID:y5ysAT1N
全体的には食うけど局所的には減らせる。
628Socket774:2009/10/28(水) 01:48:21 ID:Gti1b6Em
喰うメモリの量が予測できないのが辛そう。
溢れそうになったら途中で一旦合成して続ける?
629,,・´∀`・,,)っ-○○○:2009/10/28(水) 01:52:05 ID:y5ysAT1N
Vistaあたりでホスト側メモリにスワップできるようになったよね。
A-Bufferを見越しての改良だと思ってたが
630,,・´∀`・,,)っ-○○○:2009/10/28(水) 01:53:08 ID:y5ysAT1N
あと、64ビットメモリアドレッシングが必要な理由がこれ
631Socket774:2009/10/28(水) 01:55:44 ID:yCQKMqVt
だんごせんせー
小さすぎるキャッシュが結局メモリバンド食うってわかっててゲフォやラデのキャッシュ容量が大きくならないのは何でー?
632,,・´∀`・,,)っ-○○○:2009/10/28(水) 02:00:16 ID:y5ysAT1N
キャッシュはダイサイズ食うからだ。
というか低クロックの演算ユニット大量並列処理する分には焼け石に水。

多少SPの個数減らして高クロックで回転数あげるならキャッシュの意味も出てくる
(クロックが高くなるほど相対的にキャッシュのトランジスタ密度は高くなる)
633Socket774:2009/10/28(水) 02:06:51 ID:0h3tB861
コアの”座標”に意味があるような稼動を想定してるみたいだな

ttp://www.tgdaily.com/images/stories/article_images/tilera/tilera4.jpg
ttp://www.tgdaily.com/content/view/44417/135/
634Socket774:2009/10/28(水) 07:04:12 ID:38g4goGX
>>625
酷い勘違いをしているけど、別にZBufferだって最終工程まで並列処理できる。
透過処理を正しく行うには事前にポリンゴンをソートしておく必要がある(これはたいした負荷じゃない)のと、
それでもポリゴンが交差してしまった際に正しくない結果を招くというだけ。
これは何をしても解決しないし、A-BufferもZ-Bufferも並行処理度は変わらない。

A-Bufferはピクセル化と最終書き込みの際に透過処理用を情報をてんこ盛りで付加して
Z深度比較と同時に透過演算まで行う代物。これでポリゴン交差しても問題がなくなる。
つまりZ-Buffer法ではZ情報(ピクセルあたり32bitか64bit)を読み出せばすむだけの話が
A-Buffer法では輪郭マスクや透過度、さらには透過合成するために過去のピクセル情報まで
読み直さないといけない。

膨大なメモリを消費してでも透過描画を正しく行うのが A-Buffer の目的であって、
速度向上への寄与ないよ。

お得意のタイルレンダリングで局所的に扱えばキャッシュに収まる〜といつもの台詞が
帰ってきそうだけど、一度に扱えるタイルが激減するのは明らかでその分並列度が下がるね。

Larrabee擁護したいだけの素人が適当なこと言ってると恥かくよw

>>628
リアルタイムで処理するにはそういった割り切りが必要になってくるね。
ATIとLarrabeeあたりは区画で切ってきそうだけどNVIDIAはバス幅広げて力で解決してきそうw
635Socket774:2009/10/28(水) 07:17:10 ID:38g4goGX
あと、前に指摘したのにまだ理解してないみたいだけど、
通常のZ-Buffer(やA-Buffer)ではポリゴンはそのまま描き捨てればいいけど、
Larrabeeで使うタイルレンダリングでは区画が変わる毎に全てのポリゴンを再評価しないといけない。
過去の評価結果が再利用可能ではあるけど、キャッシュに乗り切らない場合はそれも足を引っ張るね。

キャッシュに頼る結果、性能を維持するにはシーンで扱えるポリゴン数が激減するのもLarrabeeの問題。

レイトレにするとNURBSやMetaBall使ってオブジェクト作れば、膨大な演算量がかかる
代わりにオブジェクトが消費するデータ量を減らすことが出来るので、そのへんも含めて
「相対的に」Larrabee向きっていうハナシ。
636,,・´∀`・,,)っ-○○○:2009/10/28(水) 08:30:40 ID:y5ysAT1N
>>634
> お得意のタイルレンダリングで局所的に扱えばキャッシュに収まる〜といつもの台詞が
> 帰ってきそうだけど、一度に扱えるタイルが激減するのは明らかでその分並列度が下がるね。

あのさー、たかだか32コア〜64コア動かすのに
ウン千スレッド必要ない設計なんだが。そこらのGPUみたいに。
637,,・´∀`・,,)っ-○○○:2009/10/28(水) 08:46:36 ID:y5ysAT1N
・メモリレイテンシを隠蔽するために大量のスレッドが動く設計になっている
・でも、キャッシュが効かないからVRAMのレイテンシが大きいんだよ。
・同時に動かすスレッドが常に大量にあるからキャッシュなんてききようがない
 (+ダイサイズの制約もあるから簡単には増やせない)

既存資産の同時に解決するアーキテクチャなんて考えようがないんだよ、GPU屋には。
Larrabeeはスレッド数を多くしないといけない制約がない

言っておくがキャッシュに載っかりきる必要なんてないんだよ、ポリンゴンくん
たとえばトラフィックを半分程度に削減できるなら、2倍のヘッドルームが出来るのと同じことになる
クリーンヒットなんて求められてない。

ポリンゴンくんはキャッシュに頼るとVRAMの帯域が大幅に削られたり、レイテンシが大幅に伸びたり
する妄想に囚われてるようだが、同じGDDR5(or XDR2)を使う限りそれはないだろう。

ポリンゴンくんはさ、ハードの特性を正しく理解した上で
相対的にどうなのかを判断しよう
638,,・´∀`・,,)っ-○○○:2009/10/28(水) 08:53:02 ID:y5ysAT1N
ぶっちゃけると、タイルレンダリングである必要すらない。
キャッシュはプライオリティが高いデータが残るという特性は変わらないからね。

どっちかというとLarrabeeの場合レジスタ間よりもL1キャッシュ間オペレーションのほうが
演算密度を稼げる変なルールがある。
639,,・´∀`・,,)っ-○○○:2009/10/28(水) 09:23:53 ID:y5ysAT1N
並列処理「しないといけない」スレッドも相対的に減る。
並列処理してキャッシュを取り合うくらいなら逐次処理したほうがマシと言うことも時としてある。

GT200ではCUDAでは16ワープ、GPUとしては最大32アクティブワープ動かせるようになっているが、
Larrabeeはコアあたり1〜4スレッドだ。むしろ、それ以上のアクティブスレッドは動かない。
大前提として同クラスのGPU程にはスレッド数が動かないし、
平均メモリレイテンシが遙かに小さいので動かす必要もない。

いまのところLarrabeeの方針は、メモリ帯域は減らすのではなく、確保しつつ、キャッシュによって得られる
一桁違いの広帯域と圧倒的な低レイテンシを有効活用することで更なる性能アップを目指すもので
外部帯域もRadeon程度には確保する。ただしGeForceほどには必要ない。
したがって

> 性能を維持するにはシーンで扱えるポリゴン数が激減する

という妄想が成立する道理もない。
640Socket774:2009/10/28(水) 09:43:54 ID:UPKEboLc
アクティブスレッドあたりのキャッシュを大幅に増やすことで実VRAM間平均データスループットが減るのを
どういうわけか設計上の帯域まで減るいう思いこみが蔓延っている。
S3を除く現行のGPUが帯域律速に近い状態だから無理もないか。
641Socket774:2009/10/28(水) 10:17:07 ID:dUyr2K4Y
http://hissi.org/read.php/jisaku/20090407/ZzdnZ3NSMVk.html

この馬鹿懲りずに来てるんだな。
642Socket774:2009/10/28(水) 11:57:29 ID:66pxLNlc
blogか何かににまとめてほしい。
643Socket774:2009/10/28(水) 12:01:21 ID:5ZCIquX/
団子さんはドメインを業者に取られたからモチベ下がってる
644Socket774:2009/10/28(水) 12:53:18 ID:dUyr2K4Y
A-bufferも相対的にはLarrabee向き。
なぜなら固定機能に縛られず全コアで並列実行出来るから。

ただ本当に向いてるのはirregular Z-bufferのほうだろうけど。
645Socket774:2009/10/28(水) 13:04:10 ID:4oZG04S/
A-bufferてもうRadeonがDirectComputeでやってるじゃん
646Socket774:2009/10/28(水) 13:08:44 ID:dUyr2K4Y
広義的にはMSAAはA-bufferの応用
647Socket774:2009/10/28(水) 13:16:12 ID:dUyr2K4Y
ttp://journal.mycom.co.jp/photo/column/graphics/008/images/003l.jpg
実際には次ステージへのデータフローもVRAMを経由してる。
データの半分でもオンダイで次のステージに送り込めれば
それだけでもトラフィックは減らせますぜ
648Socket774:2009/10/28(水) 13:50:16 ID:uUesMLG2
RADEONのShaderExportって何のためにあるの?
649Socket774:2009/10/28(水) 13:56:48 ID:dUyr2K4Y
>>648
XboxのXenosならeDRAMに出力して貯めておけるけど
RadeonはGeForce同様原則VRAMに流れちゃいますね
データ本体に関しては
650Socket774:2009/10/28(水) 14:40:01 ID:YBOyxClR
>一度に扱えるタイルが激減するのは明らかでその分並列度が下がるね
>たとえば24領域つかって 64x64サイズのタイルを表現した場合、 同時に扱えるフレーム領域は512x192程度でしかない
なんで1フレームにつき、Larrabeeの各コアは各タイルを1個だけしか処理しないんだよ、どんな糞実装だ
各タイルの処理時間も処理データ量もバラバラなのに…酷い固定観念だな
651Socket774:2009/10/28(水) 14:44:38 ID:YBOyxClR
A-bufferは、最後のブレンディング処理が来るまで、
吐き出した半透明ピクセルをキャッシュ外に逃がせるから良いね
キャッシュはZテストに集中できる
652Socket774:2009/10/28(水) 15:03:13 ID:dUyr2K4Y
>>650
こいつはLarrabee「だけは」キャッシュが全メモリ空間だと思い込んでる
池沼だから始末に困る。
何度指摘されても未だに学習できてない。

LarrabeeもVRAMにストリーム的にアクセスするのは今までと変わらない。
LarrabeeがRadeonやGeForceと違うのはコンテクストあたりの
ワークメモリの規模(数KBと数十〜百KB)とワークメモリのVRAMへの
退避復帰の回数の違い。要はピクセルライン単位かタイル単位かの違いだ。
CPUコアが1つのタイルを処理している間、処理の終わったタイルを
VRAMに流し、次のタイルの準備をしている。
つまり、アホみたいにメモリ帯域が必要なのは変わらないが、処理単位が
大きくなることで出し入れ回数が減り、結果帯域消費量が減るんだ。

当たり前だがオンキャッシュで済ますにはキャッシュ容量は256KB/coreでも
全然足りない。多いに越したことはないがLarrabeeでも十分ってことはない。
653Socket774:2009/10/28(水) 15:44:38 ID:lD/sRjv+
現場の意見 vs 願望の意見
654Socket774:2009/10/28(水) 16:11:38 ID:jMLxfx1/
必死チェッカーみたら団子1位じゃん。おめでとう
655Socket774:2009/10/28(水) 16:30:37 ID:dUyr2K4Y
同じことしか言ってないんだけどな
Larrabee関連のセッション真面目に聞いてたらわかる理屈なのに
656Socket774:2009/10/28(水) 16:49:47 ID:CJLCa4Z/
リアルタイムレンダリングよりDirectX11のパフォーマンスがどうなるか気になる。
それ次第で、二社を一気に抜く可能性あるんじゃない。
657Socket774:2009/10/28(水) 16:50:50 ID:CJLCa4Z/
リアルタイムレンダリング→リアルタイムレイトレーシング
658Socket774:2009/10/28(水) 19:58:11 ID:tZhG4JAz
○○○

これってウンコ?
659,,・´∀`・,,)っ-○○○:2009/10/29(木) 00:05:51 ID:uFX20jKt
グローバルメモリの長すぎるレイテンシを補うために
GPU屋は大量にスレッドを走らせることでサイクル数を埋め合わせ
CPU屋は低レイテンシのキャッシュでレジスタから溢れた作業変数を受け止めた。

>>648
アレはただのストアバッファだよ。データはメモリコントローラを通ってVRAMにストアされる
ステージ間で流れるのはコントロール用パケット。
「VRAMの○○番地にストアしたんでここから読んで処理しといてね」って情報かな。
660Socket774:2009/10/29(木) 00:20:00 ID:qBJkU6dP
旧XboxのCPUが土壇場でAMDからIntelになったようにまだチャンスはある
次期Xboxで採用されるように出血覚悟で売り込むんだな
661,,・´∀`・,,)っ-○○○:2009/10/29(木) 00:33:59 ID:uFX20jKt
ないだろうな。

Intelが先のLarrabeeの実装でやろうとしてることってWindows 7やLinuxのKVMのハイパーバイザ上で
動くゲストOSを走らせ、その上でホストOSに依存しないアプリケーションを動かすことだ。
662Socket774:2009/10/30(金) 16:04:52 ID:+lqwBPEV
,,・´∀`・,,)っ-○○○とかいうキチガイコテをNGにしたらスッキリした
663,,・´∀`・,,)っ-○○○:2009/10/30(金) 22:11:01 ID:Qwa7YnBV
 
664Socket774:2009/10/30(金) 22:13:47 ID:JyyqlR6E
>>663
おちゃめさん。
665Socket774:2009/10/30(金) 22:55:03 ID:uhFYpqdF
Larrabeeって iAPX432以来の失敗作だろ?
10年後くらいに研究成果が花開くかもしれないけど。
666,,・´∀`・,,)っ-○○○:2009/10/30(金) 23:12:30 ID:Qwa7YnBV
それはItaniumだろ。
x86を否定するものはx86に敗れるのが常。
Atomに次ぐ成功を担う、x86の他市場制圧の矛でありHPC市場の盾
667,,・´∀`・,,)っ-○○○:2009/10/30(金) 23:41:02 ID:Qwa7YnBV
矛と盾といえば

Fermiのアーキテクチャは方向性のまったく違うものを追い求めて「矛盾」したアーキテクチャになってるがな。
断言するがあんなものの性能はLarrabeeの足元にも及ばない。
積和算に対してL1のロード/ストアの帯域が狭すぎてHPCには使い物にならん。
OpenCL(笑)みたいな新言語が必要な時点でPG単価的にも不利。
668Socket774:2009/10/30(金) 23:44:29 ID:E8Q+PwcP
断言したなw その言葉忘れんなよ
669,,・´∀`・,,)っ-○○○:2009/10/30(金) 23:59:28 ID:Qwa7YnBV
http://journal.mycom.co.jp/special/2008/cuda/007.html


とまあ、この辺見ればわかるようにNVIDIAのシェーダは根本的にHPCでやるような
行列演算には不向きなんだよね。
ローカルメモリに対するロード・ストアのスループットが低すぎるから当たり前だ。

マトリクス演算ってグローバルメモリの帯域は比較的食わないんだが
キャッシュあるいはローカルメモリのスループットとか、同一値のブロードキャストを
如何に効率的に処理できるかが重要になる。

んで、シミュレーションしてみるにLarrabeeの命令セットはその手の行列演算がやたら強い。
1命令にロードとブロードキャストと積和算を畳み込めるような命令セット拡張は
x86のフォーマットと見事にマッチする。
これは間違いなくLINPACKモンスター。
670,,・´∀`・,,)っ-○○○:2009/10/31(土) 19:17:20 ID:i+EhVJVU
半可通には何やっても理解出来ないだろうがちょっと16x16行列同士の乗算のコード書いてみた。
http://www.dotup.org/uploda/www.dotup.org320005.txt.html

理論FLOPS値の8割以上は簡単に弾き出せる
vstoreは他のベクトル演算命令とペアリングできるから、もっと大きな行列だと、旨く組めば9割はいくかもな。

Larrabeeの効率が良すぎるかっていうと否、これがストリームプロセッサとして当たり前なのであって
Tesla(笑)なんかが話にならなすぎるわけだけどね。
671,,・´∀`・,,)っ-○○○:2009/11/01(日) 01:56:41 ID:mtXW/RVq
こっちにも貼っておくか。

LarrabeeのGather機構の実装にかかわる特許文書
http://www.freepatentsonline.com/20090172364.pdf
672Socket774:2009/11/01(日) 17:06:25 ID:bHyPUcZV
今Larrabee出たらnVidia死にそうだな
673Socket774:2009/11/01(日) 17:20:04 ID:KodRhKF7
で LarrabeeもGT300も一体いつになったら発表されるんだ
674Socket774:2009/11/01(日) 17:44:39 ID:BIZ2dPD5
↑馬鹿乙
675,,・´∀`・,,)っ-○○○:2009/11/03(火) 01:15:18 ID:b3VqoWan
http://www.nvidia.com/content/PDF/fermi_white_papers/NVIDIAFermiArchitectureWhitepaper.pdf

Fermiアークテクチャの白書抹消wwwwwww
676Socket774:2009/11/03(火) 13:25:10 ID:Wk2xk4p+
よそあおってる暇あったらさっさとLarrabeeだせや
677Socket774:2009/11/03(火) 15:44:12 ID:QpNIDtwi
無理言うなよwww
出来ないから煽って誤魔化してるんだから
678,,・´∀`・,,)っ-○○○:2009/11/03(火) 15:48:45 ID:b3VqoWan
Fermiのことですねわかります
679Socket774:2009/11/03(火) 15:55:31 ID:BiQQU6Fy
680Socket774:2009/11/03(火) 16:08:18 ID:t7eduXVR
レイトレ先こされたか
681Socket774:2009/11/03(火) 16:25:09 ID:kXNPWsBX
油逆サバ読みすぎだろwwwwww
682Socket774:2009/11/03(火) 16:25:49 ID:kXNPWsBX
誤爆しますた
683,,・´∀`・,,)っ-○○○:2009/11/03(火) 16:58:47 ID:b3VqoWan
>>679
なんか激しい誤解をしてるようだがその程度の静止画をレイトレで作る程度ならPentium 90MHzでも出来るぞ
684Socket774:2009/11/03(火) 17:15:25 ID:wdfXfADw
レイトレをリアルタイムで実際にデモして一番進んでるのはラデなんだけどな
685Socket774:2009/11/03(火) 17:22:37 ID:3tpxO526
あのデモ公開しないのかな?
686,,・´∀`・,,)っ-○○○:2009/11/03(火) 17:26:23 ID:b3VqoWan
http://www.golem.de/0808/61949.html

こんとき水面が動いてなかったこと考えればだいぶ進歩してるけどな
687,,・´∀`・,,)っ-○○○:2009/11/03(火) 22:01:46 ID:b3VqoWan
チャーリーデマ自演にこんな記事書かれれば絶望もするわな
遅れに遅れたLarrabeeですらB0までいってるのに

http://www.semiaccurate.com/2009/11/02/nvidia-finally-gets-fermi-a2-taped-out/
688Socket774:2009/11/03(火) 22:26:57 ID:Zx4GSbq9
Intelの場合デバッグがかなり早く終わったMeromがB2だったからB0はまだ最終シリコンじゃねーと思うが
まあでもメニーコア化でコア自体はかなりシンプルだからデバッグは楽なのかも知れん
ああでも開発リソースをどの程度割り振るかにもよるし、、、
要するになんとも言えん
689Socket774:2009/11/03(火) 23:20:55 ID:J9uXblLK
団子ってi752が発表されたときもこういうふうに期待しまくってたんだろうな
690,,・´∀`・,,)っ-○○○:2009/11/03(火) 23:27:50 ID:b3VqoWan
してねーよ
691,,・´∀`・,,)っ-○○○:2009/11/03(火) 23:30:05 ID:b3VqoWan
Fermiは積和算に対してLSUのスループットが低すぎるという、解決されてない明確なボトルネックがある。
倍精度ですら実効性能5割を切るFireStreamははなから問題になってない。
Larrabee以外選択肢にないんだよ。

単純明快な消去法だ。
692Socket774:2009/11/03(火) 23:32:46 ID:wdfXfADw
ピークが違うのに実行効率だけ比べても
693Socket774:2009/11/03(火) 23:37:40 ID:wt/n4k6l
Fermiの半端な共有L2キャッシュにNVIDIAの苦心が伺える
694,,・´∀`・,,)っ-○○○:2009/11/03(火) 23:38:10 ID:b3VqoWan
Larrabeeは32コアでFermiと同じ512SPだが?

もしFermiが実効性能50%程度ならLarrabee換算750MHzだね。
695,,・´∀`・,,)っ-○○○:2009/11/03(火) 23:39:06 ID:b3VqoWan
>>693
あれは苦しいね

L1合計:384KB
L2:768KB
696,,・´∀`・,,)っ-○○○:2009/11/04(水) 00:25:39 ID:4Ohrun5l
BLAS Performance見てみ
http://www.lunarc.lu.se/Documents/nvidia-workshop/files/presentation/50_Case_Studies.pdf

CPUに比べて圧倒的じゃないかって思っちゃうだろうけど
単精度ってピークの3割強程度しか出てないんですが。
まあ、SFUでの乗算が全く役に立たない上に、LSUがネックじゃこの程度だわな。

倍精度はほぼ額面通りの性能になってるが、これは倍精度ユニットが他のユニットに比べて
貧弱な分、相対的に他のオペレーションの供給が間に合ってるに過ぎない。


LarrabeeではSGEMM・DGEMMともに90%は弾き出せると見ている。
なぜなら乗算値のアドレス算出・ロード・ブロードキャスト・積和算を1命令で同時に行いながら、
スカラ側でキャッシュコントローラの操作やベクトルストアをいずれか1命令ペアにして
発行することができるからだ。

さて問題です。GEMMにおいて、32Wayの積和算ユニットに対し、同時に乗算値を供給するのに
ロードユニットは最低何Wayでなければいけないでしょうか?
これが解ればFermiのGPGPU性能に微塵も期待できなくなる
697Socket774:2009/11/04(水) 01:01:36 ID:ViDtV1c8
HD5870を買った俺は勝ち組ってことですね
698Socket774:2009/11/04(水) 10:28:43 ID:RhSxZUT4
カス以下です
699Socket774:2009/11/04(水) 12:40:01 ID:V0K/Gwjf
http://japan.cnet.com/blog/petaflops/2009/10/30/entry_27035208/

> 天河の詳細は不明であるが、IntelのCPUはNehalem-EPで、AMDのGPUは
> FireStream9270Sであろうと推定されている。また、システムの理論性能は
> FireStreamの性能によるものと推定されており、実行性能比が46.7%と
> いった目を見張るほどの低性能の原因もGPUに依存している事を端的に
> 示しているものと思える。
>
> 広い意味でのGPU方式とはいえ、Cell+OpteronのRoadrunnerは実行比率に
> 於いても75.9%とCPU機に引けを取らない性能を示しており、いわゆる、
> 技術力や知性を感じるが、50%を切るようでは、そもそも、その理論性能の
> 計算方式が誤っているとしか言い様が無いことになる。

ATIならずともNVIDIAにも共通の問題だなこれは。
700Socket774:2009/11/04(水) 13:10:42 ID:Jw6aV1fj
糞ブログ貼るなや
701Socket774:2009/11/04(水) 22:47:59 ID:ppUpbeiB
これはシミュレータじゃないよね?
ttp://blog.livedoor.jp/amd646464/archives/51447036.html
702,,・´∀`・,,)っ-○○○:2009/11/04(水) 22:55:33 ID:4Ohrun5l
中国とは言ってるけど台湾だな
文字通りのチップなんじゃないの?B0が出た頃に動きがあると思ってたが・・・


いよいよFermiやばくなってきたな。
703Socket774:2009/11/04(水) 22:57:34 ID:CGynSEyg
>>701
お偉いさんが直接売り込みをしにいった、という記事でそれ以上でも以下でもないぞ
704Socket774:2009/11/04(水) 22:58:30 ID:BuGXIJhQ
チップセットか何かにバンドルすると安くなるみたいだな
世に出るIntelマザーの数 = Larrabeeの数みたいな状況になると競争にならんだろうな
705Socket774:2009/11/04(水) 23:02:01 ID:TfWW0U45
ベンダの中の人だけど、紙っぺら見せられて
「凄いから採用しろ、売れるから」と連呼されて引いちゃった。
706,,・´∀`・,,)っ-○○○:2009/11/04(水) 23:03:21 ID:4Ohrun5l
日本にカードベンダなんてあったっけ?
707Socket774:2009/11/04(水) 23:03:45 ID:BuGXIJhQ
カノプー
708,,・´∀`・,,)っ-○○○:2009/11/04(水) 23:05:51 ID:4Ohrun5l
>>704
ミッドレンジ以下のIntel CPUの数=GMAの数に近い状況ってだけでも死ねる。
709Socket774:2009/11/04(水) 23:19:53 ID:F/2OBjDt
>>705
Larrabeeは知婦瀬戸に内蔵
ドライバが安定しだす発売1年後が本命だろjk
710Socket774:2009/11/04(水) 23:32:56 ID:29vUmbkt
CPUとオンダイにするんじゃないの?どんだけ微細化したらできるのか知らないけど
711Socket774:2009/11/04(水) 23:45:27 ID:fa7CT0pj
LarrabeeはHaswellに入る。
オレゴンチームも加わったし。
712,,・´∀`・,,)っ-○○○:2009/11/05(木) 00:02:27 ID:4Ohrun5l
LRBniはAVX(256ビットSIMD)立ち上げのために意図的に情報規制してる気がする。
特許文書見るとアウトオブオーダパイプラインでLRBniを実行するモデルが出てるんだけどね。

713Socket774:2009/11/06(金) 09:17:10 ID:Jkx+Kr9B
:::::::::::.: .:. . ∧_∧ . . . .: ::::::::
:::::::: :.: . . /彡ミ゛ヽ;)ヽ、. ::: : ::  >オレゴンチームも加わったし。
::::::: :.: . . / :::/:: ヽ、ヽ、i . .:: :.: ::  
 ̄ ̄ ̄(_,ノ  ̄ ̄ヽ、_ノ ̄
714イン厨 ◆0tc5JBFuqkkI :2009/11/06(金) 10:40:55 ID:itubXr6g
オレゴンチームはAMDの心強い味方だね
715Socket774:2009/11/06(金) 11:13:11 ID:ze0XxWcH
元々Larrabeeにはネトバのアーキテクトが関わっているのに。
716Socket774:2009/11/06(金) 13:07:39 ID:U1i38oKf
アム虫はNehalem-EPにボコられておいてまだオレゴン馬鹿にするのかwww
717Socket774:2009/11/06(金) 13:12:35 ID:FBnhbQfF
Core MAを流用した負け犬オレゴンが何だって?w
718Socket774:2009/11/06(金) 13:39:43 ID:ijYvU8H/
と意味不明な供述をしており
719Socket774:2009/11/06(金) 13:58:55 ID:nZ0KCbuO
オレゴンが開発したP6を流用した(ry
720Socket774:2009/11/07(土) 23:41:57 ID:LAUVLHP9
Larrabee搭載のボードって10万以内で買えるかな?
721Socket774:2009/11/08(日) 00:10:09 ID:1KrdRL+2
>>720
GPUとしてなら、3万くらい?HPC用とが主のボードだったらそれでは買えないだろう。
どっちに振ってくるかしだいじゃね?
722Socket774:2009/11/08(日) 00:22:33 ID:E3WDIh79
最初はExtream向けだから伝統の999ドルとか、GT300と同価格帯とか。そんな感じじゃないの。
メインストリーム向けが何時出るかはしらね。
723Socket774:2009/11/08(日) 01:42:36 ID:Ocm7jgv1
結局、GT300の実行性能が50%で、Larrabeeが90%とかの差が出ても、
価格差がそれ以上で逆転してたら、一般向けの選択肢はGT300しかないんだよな。

Larrabeeはあんまり一般向けで出しませんとかなると、Cellのボードみたいに
100万近いとかなりそうな気がしてな。

でも、larrabeeを5万前後で売るってなったら、本気でGT300を殺せるかもっていう
気はするな。
724Socket774:2009/11/08(日) 01:51:10 ID:LK2t8Fft
725Socket774:2009/11/08(日) 09:43:33 ID:CUNmVoNd
Larabeeが出る頃には他社のGPGPUも進歩しててi740の二の舞になりそう
726Socket774:2009/11/08(日) 10:37:10 ID:ONs+zHr/
ちゃんと製品化されればまだマシだが
ベイパーハードにならなきゃいいけどな
727,,・´∀`・,,)っ-○○○:2009/11/08(日) 11:23:55 ID:g0j+SMPB
>>725
コピペ君って馬鹿だな
728Socket774:2009/11/08(日) 13:18:54 ID:E3WDIh79
コピペだからな
729Socket774:2009/11/08(日) 17:47:32 ID:sgDqWIip
素人なんで、基本的なことかもしれないけど、
これって、メニイコアのCPUと何が違うの?
730Socket774:2009/11/08(日) 17:54:17 ID:1KrdRL+2
>>729
基本はメニーコアと同じもの。
OSを動かす必要がないから、シンプルコアですむ。シンプルということは、小さくなる。
だから、今のシリコン予算でたくさん乗る。で、何でかしらないが、現状のCPUよりピークが高速に。

ららびーはコアのベースがMMXペンティアム+新命令って言われてるみたいだから、
OSも動かそうと思えば動くかもしれないけどね。
まぁ、どっちかって言うとアクセラレータのタグイだと思うよ。
731Socket774:2009/11/08(日) 18:03:56 ID:1KrdRL+2
>>725
i740って当時の光源処理ちゃんとするから、ファイナルリアリティできれいにうつるんだぜ〜。
決して高速なボードではなかったが、技術的にはいいボードだった。
732Socket774:2009/11/08(日) 18:08:19 ID:sgDqWIip
これも基本的なことなのかもしれないけど、
Larrabeeを動かすには、
Larrabee専用のプログラムを書かなきゃいけないの?
733Socket774:2009/11/08(日) 18:14:27 ID:1KrdRL+2
>>732
あんまりよく知らないけど、
ららびーを見つけるコードとか入れないといけないと思う。
後は、インテルの開発環境にお任せすればある程度の性能はでるかもしれん。
基本はペンティアムだし、スレッドにまつわる不具合とか最適化とかの知識が役に立つ気がする。

これらは、団子の人がよく知ってるんじゃないかな??
734Socket774:2009/11/08(日) 18:20:56 ID:sgDqWIip
いろいろ質問ばかりで申し訳ないんだけど、
将来Larrabeeが出たとして、純粋にGPUボードとして使って、
例えば、今あるFPSのゲームCall of Duty4:MWなんかが何のパッチをいれることなく動くの?
735Socket774:2009/11/08(日) 18:24:09 ID:8oAkv/3I
あきらめろ
736Socket774:2009/11/08(日) 19:03:07 ID:1KrdRL+2
>>738
ららびーの何処が良いって言うと。未来さ。
これからの汎用性を重視した流れに乗るために誠意開発中。ってこと。

何世代か前の固定機能で実現される機能に対しては弱い。
ハードの汎用性と機能の性能は反比例すると思っている。
固定機能をつければ、性能が上がるが汎用性が減る。そんなイメージ。
737Socket774:2009/11/08(日) 19:42:15 ID:IGIvFcpR
>>734
DirectXに対応してれば可能なはず
738,,・´∀`・,,)っ-○○○:2009/11/08(日) 19:55:31 ID:g0j+SMPB
DLL遅延ロードのテクニック何重にも使わないといけないから
「ユニバーサルGPGPU」なアプリ作るのはめちゃ骨が折れるぞ
まあ一度仕組み作ってしまえばいいんだが
APIが変わる度に作り直しする羽目に・・・

739Socket774:2009/11/08(日) 20:25:15 ID:1KrdRL+2
>>738
昔の3Dマークみたいな感じか。
確かP3用のDLLとかCPU専用のコード持ったモジュールに分けてたみたいだったな。
ファイル名からの推測だけどね。。。
740Socket774:2009/11/09(月) 16:00:33 ID:v5Kv2U1F
http://pc.watch.impress.co.jp/docs/column/kaigai/20091109_327607.html
LarrabeeはSIMDとMIMDのバランス--Intel CTOが語る
741Socket774:2009/11/10(火) 12:39:17 ID:W4B/Jj/1
もうHD5800が出てるし来年にはHD6xxxが出るのにいつまでたっても発売されないLarabeeに望みをかけるインテル信者の脳味噌を疑うね
742Socket774:2009/11/10(火) 13:01:41 ID:9MrT2HHB
HPC分野ではRADEON(笑)なんて端から相手にされてない
743Socket774:2009/11/10(火) 13:05:28 ID:3f+uE2MY
>>742
そう思ってたんだが、中国人は何を考えているのか……
744Socket774:2009/11/10(火) 13:28:36 ID:9MrT2HHB
>>743
>>699だよな
韓国気象庁のCray機に実効コストパフォーマンスで大幅に負けてるし何考えてるんだか
http://japan.cnet.com/blog/petaflops/2009/10/02/entry_27034798/

745Socket774:2009/11/10(火) 15:28:01 ID:eQelWDrD
エラそうにHPC分野を語るやつがスパコン漫遊日記(笑)
746Socket774:2009/11/10(火) 15:52:31 ID:9MrT2HHB
能澤の指摘には理性的な反論ができないやつが多いな
747Socket774:2009/11/10(火) 15:53:39 ID:C/R++PkD
radeはいつになったらVLIWをやめるのかね?
748Socket774:2009/11/10(火) 16:04:04 ID:9MrT2HHB
額面2.7TFLOPS, 実効500GFLOPS程度でも威張れるうちは辞めないだろう
749Socket774:2009/11/10(火) 16:37:29 ID:eQelWDrD
>>746
来年の後半に入るシステムが今年のシステムの2倍のCPだとして何がおかしい。
LINPACKの性能は10年で1000倍だぞ。

そもそも天河のシステムが適切かどうかは天河で動くアプリケーション次第だ。
スパコンはLINPACKの順位争うために作るものじゃねーんだよ。
750Socket774:2009/11/10(火) 16:45:52 ID:9MrT2HHB
>LINPACKの性能は10年で1000倍だぞ。

今は20世紀じゃありませんよ?
GPUですら8800GTXが2年近くも最強を誇ってたような、そんな閉塞感漂う
今日この頃。
751Socket774:2009/11/10(火) 17:04:04 ID:9MrT2HHB
ついでに言うと2010年後半ということはNehalemかWestmere, AMDだと
Istanubulなんだよな。そんなにFLOPS単価変わるか?

ついでに言うとトランジスタ数割増加するだけでベクトル演算性能が
倍にブーストするようなAVX/FMAみたいなSIMD拡張のキャパビリティは
GPUはとっくの昔に使い果たしてる。あとはメモリ帯域枯渇で差を詰められるのみ。
752Socket774:2009/11/10(火) 17:51:04 ID:eQelWDrD
>>750
あきれた。現にトップのシステムは11年でTFLOPSからPFLOPSになったんだが。
スパコン漫遊日記(笑)は見られてもTop500本家のサイトは見られないんだろうか。
http://www.top500.org/list/1997/06/100
http://www.top500.org/list/2008/06/100

再来年には10PFLOPSを超えるシステムが予定されていて、2001年のトップが
7.2TFLOPSだった事を考えれば21世紀に入ってからも勢いは全く衰えていない。
753Socket774:2009/11/10(火) 17:56:31 ID:9MrT2HHB
呆れた。
石油が無尽蔵に沸いてくるとでも思ってるのだろうか?
その「トップ」の消費電力も調べてみるといいよ。
道理でエネルギー消費大国のアメリカしか残ってないわけだ。
754Socket774:2009/11/11(水) 01:03:42 ID:j2PgbXxL
>>753
コンピュータの物理的限界はまだまだ遥か先だぞ。お前が生きている間は心配ないw
755,,・´∀`・,,)っ-○○○:2009/11/11(水) 01:22:44 ID:4AjAynUS
プロセス開発の資金的限界でバッタバッタしてますけどね。
756Socket774:2009/11/11(水) 21:56:48 ID:mjo6UR1I
まあ、そこの所は当分Intelが頑張ってくれるでしょ。
苦労してASIC作っても数年で汎用プロセッサに抜かれる現状の終焉は
イコールx86からの解放なんだから。
757Socket774:2009/11/12(木) 00:46:12 ID:ujcvkhhi
物理的な限界よりもたいてい経済的限界の方が先だな。
今だって冷やせば5GHz、6GHzで動くものをコストのかかる冷却方法を
避けてるから3GHz程度でしか使ってないのだし
758,,・´∀`・,,)っ-○○○:2009/11/12(木) 00:52:38 ID:gjkqx3Og
近年のx86の傾向として、SIMD拡張ばっかりフォーカスされてるが
bsr, bsfみたいな命令がなにげに1サイクルで処理できるようになったり
地味にスカラ性能の底上げを続けてるんだよね。

昔数10サイクルかかってた命令が1サイクルになるような
そんな余地が残ってるから、どの陣営も軒並みクロック上昇に行き詰まっても
x86だけは演算速度が上がっていく。
かつてはパイプラインを乱すからとRISC信者から馬鹿にされてた命令の数々が
パフォーマンスの要になっていくのだから面白い。

x86のトレンドは固定機能の充実だ。WestmereのAES拡張命令しかり。
GPUと逆を行ってるな。
759Socket774:2009/11/12(木) 01:26:41 ID:MJctSeYD
AES拡張命令追加を知らなかった。なおさらNanoの存在意義がなくなるじゃないか。
760,,・´∀`・,,)っ-○○○:2009/11/12(木) 01:49:32 ID:gjkqx3Og
VIAのあれって専用コプロセッサに投げるんじゃなかったっけ。
WestmereのAESはSSE用のROMテーブルを拡張してソフト的に実行する。
Atomで使えたらARM対抗の意味でも美味しいんだけど。
761Socket774:2009/11/12(木) 02:07:50 ID:O0PyOIh1
Fermiも多くの改良が入ってるだろうから期待しているが、
Larrabeeも気になるんだよな。
非正規化数のハードウェア処理ってトランジスタ喰うのかな。

CUDAのプログラミングモデルは慣れたら分かりやすいから好きだが、
Ctはどうなんだろ。ゲームは速いのかLarrabee……?

手に入れたら自分用のエンコーダーでも書いてみたいね。
しかし、だんごさんの話は難しいんだが、x86は何で勉強すればいいのやら。
762Socket774:2009/11/12(木) 11:27:07 ID:ISABqOq3
拡張命令の拡充とCPU-GPU統合が進めば
GPGPU?そんなのもあったね
みたいになっていくんだろうなぁ・・・
763Socket774:2009/11/12(木) 15:07:47 ID:rzd4km3Z
サウンドボードとかNICもオンボで十分になっちゃったしね
764Socket774:2009/11/12(木) 15:20:12 ID:rzd4km3Z
Larabeeはi752の二の舞になる予感
765Socket774:2009/11/12(木) 17:43:30 ID:e0wbjpgM
なるほど統合化で成功するわけですね
766Socket774:2009/11/12(木) 19:53:40 ID:eUzk/MFR
Larabeeが出たときに、既存のゲームがそのままで動くかどうかについてソースある?
動いたとして、高速で動作する見込みあるの?
Larabee専用に特殊なプログラムが必要なら普及しない。それはPS3が既に、現実に実証した。
ゲームに厳密な3Dなど必要ない。スーパーコンピュータ用途?我々一般ユーザーには一切関係ない。
767Socket774:2009/11/12(木) 19:55:46 ID:zH5/dAQu
Larrabeeスタイルが流行るのは・・・5年後だ!
768Socket774:2009/11/12(木) 20:12:31 ID:BCCy5umP
>Larabeeが出たときに、既存のゲームがそのままで動くかどうかについてソースある?
さあ?

>動いたとして、高速で動作する見込みあるの?
さあ?

>Larabee専用に特殊なプログラムが必要なら普及しない。
馬鹿乙。

>ゲームに厳密な3Dなど必要ない。スーパーコンピュータ用途?我々一般ユーザーには一切関係ない。
ゲームの進化を否定するなら、GPUは別の用途を開拓しなきゃね。自家撞着乙。
769Socket774:2009/11/12(木) 21:03:18 ID:Jw6e/r4i
>>766
Larrabeeについては先ず、本当に発売されるかどうかを心配するべきだから。
そんなこと聞いてもまともに答えられる人はいないよ。
770Socket774:2009/11/12(木) 21:29:00 ID:ISABqOq3
自演乙。
しかしその程度じゃここを延焼させるのは無理だと思う
どっかのスレみたいに最強とか勝利とかいう意地の張り合いとは無縁だし。
771Socket774:2009/11/12(木) 21:44:18 ID:MJctSeYD
>>766
他のGPUに最適化されたゲームが高速に動作するかと言えばNoだ。だから帰れ。
ゲームしかしない厨房が一般ユーザー代表みたいなツラすんじゃねぇよ。
772Socket774:2009/11/12(木) 21:57:04 ID:ISABqOq3
一応、基礎の基礎として
強いて言うならディスプレイドライバ自体が各社のチップ向けの「特殊なプログラム」だね
それが為に「我々一般ユーザー」からは各種の癖をもったチップの動作が何がしかのパフォーマンスの高低程度の違いしか見えなくなる
GPUに関してそれに+して特殊なプログラムが必要かと言えばNOだと思うよ

他の用途に使うなら何がしかのアクセラレータソフトが用意されるかもしれないけど。
773Socket774:2009/11/12(木) 22:11:15 ID:eXGJoukr
ゲーム向けを否定するならNVIDIAのGT300系相手に粋がるの止めたら
有効活用できるアプリのあてもないハードを商品化するほどIntelも酔狂じゃないだろ
774Socket774:2009/11/12(木) 22:21:23 ID:4+F7GlpN
粋がってないよ。HPC分野では相手にならないだけよ。そしてHPC分野のパフォーマンスは後のゲーム生きてくるんだよ。
775Socket774:2009/11/12(木) 22:31:50 ID:gExf3Qqb
NV厨の思考は相変わらず支離滅裂だな
AMD厨以下だこいつら
776Socket774:2009/11/12(木) 22:32:04 ID:mvT5BbKe
CUDAってかなり普及してるイメージがあるけど、実際は対応ソフトは数えるほどしかないって言うw
殆どホビープログラマーの戯れに使われてるぐらいw
777Socket774:2009/11/12(木) 22:57:30 ID:ISABqOq3
なーんか変なのがまだ頑張ってるのかな

Larrabeeの面白い部分は全部がx86命令の走るプロセッサであること。
GPUとして使うならソフトウェア描画(笑)と言われても反論できないしそれがそのまま利点
GPGPUとして使う場合も同様。x86としての仕様の制約はもちろん受けるとしても
元がGPUのチップと比べれば遥かに汎用性に富む。無駄が出にくい。

そーいや昔書き換え可能なチップ使ったマルチメディアプロセッサなるものがあったねぇ・・・
778Socket774:2009/11/12(木) 23:04:43 ID:vlf3kVz7
ってかLarrabeeに否定的なのってNVIDIAくらいでしょ
779Socket774:2009/11/12(木) 23:07:26 ID:5cUSS3xQ
妄想乙
780Socket774:2009/11/12(木) 23:09:32 ID:vlf3kVz7
768Kぽっちのキャッシュでパフォーマンスが稼げるなら苦労はしねーわ
781,,・´∀`・,,)っ-○○○:2009/11/12(木) 23:15:54 ID:gjkqx3Og
> Larabee専用に特殊なプログラムが必要なら普及しない。それはPS3が既に、現実に実証した。
なんで「CUDA」とか「OpenCL」に置き換えてもそのまんま通用するようなこと言うの?

Larrabeeは普通のCPUのようにCで組める。
782,,・´∀`・,,)っ-○○○:2009/11/12(木) 23:16:35 ID:gjkqx3Og
>>777
いいIDだなISA
783Socket774:2009/11/12(木) 23:20:15 ID:5cUSS3xQ
>>782
不覚にもワロス
784Socket774:2009/11/12(木) 23:20:36 ID:M+87Np5Y
団子ってスルー耐性無いよな
785Socket774:2009/11/12(木) 23:21:00 ID:Q2HDuxM7
某おすすめMMOのプロデューサーもLarrabeeに興味を示してるみたいだな
786Socket774:2009/11/12(木) 23:22:10 ID:CPAlOd/6
じゃぁISAつながりでw
団子はx86に追加してほしいインストラクションって何かある?
スカラーでもAVX系でもいいよ。
自分はAMD SSE5のIMAC系のがやはり欲しい。あとビット加工色々。
787Socket774:2009/11/12(木) 23:26:43 ID:puFpaW2O
AMD discovers several Fusion mantras, disses Larrabee
http://www.tgdaily.com/hardware-features/44524-amd-discovers-several-fusion-mantras-disses-larrabee
「ララビーはダイサイズ大き過ぎ、脅威にならない」

Is Larrabee For the Rest of Us?
http://www.ddj.com/hpc-high-performance-computing/221601028
ララビーは誇大広告、神秘、論争に取り囲まれています。
多くのプログラマがプログラミングの難局に直面するでしょう。
788Socket774:2009/11/12(木) 23:31:19 ID:4+F7GlpN
なるほどNVIDIA GPUの現状ですね。
789Socket774:2009/11/12(木) 23:35:24 ID:CPAlOd/6
>>787
上はともかく、下の記事の要約をそう書くのは
お里が知れも程がある、てかGPGPUでRegExp
やれるもんならやってみろw
790,,・´∀`・,,)っ-○○○:2009/11/12(木) 23:36:07 ID:gjkqx3Og
・Assembler
・普通のC
・普通のC++
・普通のC++ & Threading Building Blocks
・Ct
・OpenCL
・Compute Shader

好きな言語・フレームワークで頑張れ

アセンブラは動的コンパイラなんて信用できない自力で性能を限界まで引き出したい人向けの最終手段であって
別にアプリ書きは意識する必要なんて無い。
必要に応じてゲームエンジン屋が対応すればいい話だし。


>>786
AMD XOPのIMACはイマイチなんだよな。何処で使えるの?
VPCMOVとかVPPERMは好き。
とにかくSIMD整数で4オペランドの融合演算命令はもっと欲しい。ビットローテート+加算とか、加算+加算とか。

あとFMA4のimm8が4ビット余ってるからブロードキャストのオプションが欲しい。
Larrabeeの fmadd231ps v1, v2, [rsi] {1to16} でロード・ブロードキャスト・積和を1サイクルでまとめて実行できるのは面白い。




でも俺的ブームはAjaxなんだよね
791,,・´∀`・,,)っ-○○○:2009/11/12(木) 23:43:28 ID:gjkqx3Og
文字列操作はそもそも横方向のオペレーションに対してOpenCLとかCUDAなんかは言語仕様上も不自由なんで
GPUには全く向いてない

Larrabeeを文字列に使うとして、内部UTF32で扱うデータベースではそれなりに使えるかもしれないね。
CtにはサーチやリダクションのAPIがあるし。

792Socket774:2009/11/12(木) 23:49:53 ID:ujcvkhhi
>>787
x86である利点とLRBniの利点を同時に生かすことは難しいみたいだね。

x86であることを最大限生かす、既存のアルゴリズムやバイナリ利用では
LRBniは全然活躍せずLarrabeeの潜在能力の大半は遊ぶ。LRBniを最大限
生かそうとしたらアルゴリズムをラディカルに見直さなければならず、
既存のx86資産に出番はない。
793Socket774:2009/11/12(木) 23:52:25 ID:ujcvkhhi
訂正 バイナリ利用 → ソース利用
794,,・´∀`・,,)っ-○○○:2009/11/12(木) 23:54:53 ID:gjkqx3Og
>>792
何も理解してないみたいだな。
少なくとも高機能なメモリ演算機能付きのロードとブロードキャストと積和算をプレディケートつけて1命令で実行するのに
x86のようなパイプライン化されたCISCである必要はある。
795Socket774:2009/11/13(金) 00:02:41 ID:ylMv4C36
RadeやGefoなんかのGPUとLarrabeeは
ただのパートのおばちゃんとインテリジェントなパートのおばちゃんぐらいの違いがある
796,,・´∀`・,,)っ-○○○:2009/11/13(金) 00:03:47 ID:gjkqx3Og
Fermiはよく訓練されたパートのおばちゃんくらい?
797Socket774:2009/11/13(金) 00:08:01 ID:fMK+yZ9Z
じゃあ68000系の終盤の奴でもいいのかな? パイプライン化されてるらしいけど。
RP2見たときSuperH版ララビーできないかな、と思ったけどあれはRISCだからダメかね。
和製GPGPUの夢は叶わないか。
798Socket774:2009/11/13(金) 00:13:54 ID:1mzFjSO7
>>790
ついに団子もトータルフットボールに目覚めたか
799Socket774:2009/11/13(金) 00:17:01 ID:UbYLRIYt
マニアックだな。イングランドやスペインならわかるが。
800Socket774:2009/11/13(金) 00:19:09 ID:4APSLWus
【2ちゃんねる10週年】神秘の「乳,,・´∀`・,,)っ-○○○」の秘密とは?
http://pc11.2ch.net/test/read.cgi/jisaku/9240911011/
801Socket774:2009/11/13(金) 00:19:12 ID:1mzFjSO7
オランダがマニアックとかアリエン
802,,・´∀`・,,)っ-○○○:2009/11/13(金) 00:41:29 ID:TwafIZZ/
Larrabeeとは話がそれるが

Atomの開発者コミュニティサイト
http://appdeveloper.intel.com/en-us/contest/contest-entry?id=199

Atom限定でApp Storeみたいなサイト立ち上げる気らしいな。
OSはWindowsとMoblin対応
803Socket774:2009/11/13(金) 02:41:01 ID:m52nILxf
後藤がAtom何十個も使ったLarrabeeもやろうと思えば出来るとか言ってたが、
Bobcat何十個も使ったAMD Larrabeeもやろうと思えば出来るのかな?
804Socket774:2009/11/13(金) 02:50:25 ID:wEg1hWRd
もうちょっとシンプルなコアの方がいいだろう
805Socket774:2009/11/13(金) 08:39:52 ID:mScuLNJc
Bobcatは無理。
in-order使ってるしダイサイズでかすぎ。
806Socket774:2009/11/13(金) 11:32:38 ID:fMK+yZ9Z
>>805
http://pc.watch.impress.co.jp/docs/column/kaigai/20091112_328392.html
その点は大丈夫! BobcatはOut-of-Orderだから。in-orderじゃないから。
807Socket774:2009/11/13(金) 22:15:50 ID:mScuLNJc
やべ、素で間違ったw
けど32nmプロセスで現行メーンストリーム半分サイズってことはCPUコアだけで25mm2以上だろう?
全然話にならない。シンプルコアにout-of-orderって時点でもうアウト。
808Socket774:2009/11/13(金) 22:28:20 ID:fMK+yZ9Z
BOBCATはあり得ないにしても昔のCPUをプロセス1世代ごとにクロック何割増し、っていう単純計算をしていくと、
1GHz〜2GHzに達するものは結構ある。AMD版ララビーを作れないとは思わない。

んなことするならなんのためにAtiを買ったのか、と。
809Socket774:2009/11/13(金) 22:32:12 ID:3QEHNsiP
将来的にAMD版Larrabeeが必ず出ると思うが
十中八九Larrabeeが市場を拓くまで出てこない
810,,・´∀`・,,)っ-○○○:2009/11/14(土) 00:28:15 ID:8rfW0ww8
暇だからブロックダイアグラム書いてみた
https://cacoo.com/diagrams/KeccJpwpIUqEA6DS
811,,・´∀`・,,)っ-○○○:2009/11/14(土) 00:30:43 ID:8rfW0ww8
キャッシュ周りがgdgdだな
812Socket774:2009/11/14(土) 02:46:05 ID:92ftGpIR
>>807
Ontarioは40nm
813Socket774:2009/11/14(土) 03:20:55 ID:0mOzxaqI
>>807,812
プロセス世代ごとに限られたトランジスタ数で沢山積めるのは、って事なら
ダイサイズ比較よりトランジスタ数で比較した方がいいのではないかね。
814Socket774:2009/11/17(火) 13:20:24 ID:15NgLx8q
今日Fermi発表されたね
815Socket774:2009/11/17(火) 17:16:01 ID:3tmbKmJu
理論スループット1.26TFLOPSとか相手にならんだろ。
Larrabeeの32core版が1GHzでしかまわらなくても実効性能で勝てる範囲。
816Socket774:2009/11/18(水) 02:05:55 ID:nEWQ2AiR
世界の半導体業界TOP20


米国:
インテル TI クアルコム AMD  フリースケール・セミコンダクター ブロードコム マイクロン NVIDIA Marvell アナログ・デバイセズ

日本:
東芝 ルネサス テクノロジー ソニー NEC パナソニック シャープ エルピーダメモリ ローム 富士通

韓国:
サムスン電子 ハイニックス

それ以外:
STマイクロエレクトロニクス(伊・仏・スイスの合弁) インフィニオン(ドイツ) NXPセミコンダクターズ(オランダ) MediaTek(台湾)


世界的には3カ国に半導体企業の分布が偏っている。
ここから考えたら業界最大手のIntelに対抗するのは誰がやるにしても大変だぞ〜・・・・。
AMDは財務が超ヤバくて、もはや単独で生き残るのが難しく見えてきている。
だからこそ、身売り噂がある。候補はNVIDIA、IBM、Samsungの3社らしい。
だか、しかし、たとえAMDが韓国・中国の企業になったとしても絶対にAMDを潰してはいけない。

もしもAMDが潰れるとIntelがシェアと価格の両面でハイスコアを叩き出すようになる。
817Socket774:2009/11/18(水) 02:50:58 ID:aDNDILPO
VIA…
818,,・´∀`・,,)っ-○○○:2009/11/18(水) 02:53:21 ID:r93Gw0lQ
Intelを今後苦しめるのはARMだと思うが、逆に低価格向けという棲み分けがARMを苦しめることになると思う。
マスク作成のコストだって世代を重ねるごとに上がってるし、そうなると面積単価の高いほうが相対的に有利になる
819Socket774:2009/11/18(水) 02:53:22 ID:Puto/hVn
身売りとか出たのGFの更に前だろ馬鹿じゃねーの
820Socket774:2009/11/18(水) 03:12:24 ID:nEWQ2AiR

AMDの株価は、ネイティブクアッドコアPhenomの失敗で非常に安くなっています。
AMDがATIを買収した金額で、AMDもATIも買えてしまう状況にあります。

現在、AMDに資金を提供しているのは「ムバダラ開発公社」「ATIC」というアラブ首長国連邦の政府系投資会社で、
バックにいるUAEとしては豊富なキャッシュを元手に半導体産業を中近東に立ち上げようとしている。
目的は石油依存経済からの脱却のため。
この一環としてAMDの価値を判断したんだろう。政府系投資会社は豊富な石油や天然ガスによる収入や貿易黒字等による外貨準備高などで
投資資金を調達するが、情報公開をマトモにやっていないのが欠点で、運営実態は非常に不透明。
http://eetimes.jp/news/3486
http://eetimes.jp/article/20643
http://d.hatena.ne.jp/dubai_investment/20080601/1212333615
http://dobizdubai.blogspot.com/2008_06_01_archive.html
http://www.energyjl.com/2008_folder/October/08new1014_1.html
http://www.uaeinteract.com/japanese/business/
http://www.dso.ae/



インテルに対抗しようとしたら出資する側もそれなりの組織になってくる。
821Socket774:2009/11/18(水) 18:30:49 ID:BqCqn+kz
822Socket774:2009/11/18(水) 20:12:10 ID:dvEuMSn3
441 名前:名称未設定[sage] 投稿日:2009/11/18(水) 18:52:34 ID:EopSiN2r0
信頼度低めの日本語訳
ttp://www.heise.de/newsticker/meldung/SC09-Intel-demonstriert-Larrabee-mit-ueber-1-Teraflops-862305.html
SC09でシングルカードのLarrabeeがSGEMMで1TFoverというデモが行われた。現行最速のTesla C1060は320GF。
1TFのデモは試作品のOCによって行われた。(多分2006年の80コアと同じ手法)
OCしない場合は理論性能712GFでSGEMMは417GF?

堅固な情報統制の行われていたLarrabeeだが、「遅延は無かった(by ラトナー)」。
GPGPUはCPUとのデータのやり取りがボトルネック。
IntelはQPIでCPUとLarrabeeを直結しメモリ空間を共有(M-Y-O)するモデルを出す。

Nehalem-EX 'も' 2010年前半に出す。HPC向けに6コアの高クロック版を出す。
823Socket774:2009/11/18(水) 20:16:40 ID:PEHftHnx
>GPGPUはCPUとのデータのやり取りがボトルネック。
結局どんなカード出してもそこだなww
824Socket774:2009/11/18(水) 20:49:10 ID:/vI1oujJ
>GPGPUはCPUとのデータのやり取りがボトルネック。
やはりHaswellでLarrabee統合するIntel大勝利ということか
825Socket774:2009/11/19(木) 01:14:49 ID:g+VFmgPH
で いつでるんだよ 買いたくても買えないだろ
あと1年くらい285でいいや
826Socket774:2009/11/20(金) 09:50:07 ID:EZ+MSw47
ttp://www.hardware-infos.com/news.php?news=3308
この記事も読むと、通常417GFlopsで、たまに最大値で712GFlopsがでたって感じなんだけど。
OCして出た1006GFlopsも最大値らしいけど。
SGEMMって数値417〜712GFlopsみたいに変動するようなもの?
それともたまにキャッシュに上手くヒットして跳ね上がっているだけ?
827,,・´∀`・,,)っ-○○○:2009/11/20(金) 10:02:00 ID:OfG4YBQO
変わるよ。
ただソフト側はチューニング不足だと思う。
828Socket774:2009/11/20(金) 10:57:07 ID:C1KDBq6T
通常417GFlops/理論上800GFlopsでも大したもんだよ。
半導体規模が上がってくる段階でGPGPUは完全に脱落する。
829Socket774:2009/11/20(金) 12:21:32 ID:Q2hNirbp
4.7TFLOPSのGPUが買える時代に417GFLOPSとなw
830Socket774:2009/11/20(金) 14:24:00 ID:7qiryw4n
全部のALUがフル稼働かつFP積和算だけを実行した場合というありえない
条件での最大理論値を引き合いに出してもねぇ
同じ条件ならその4.7TFLOPS(キリッ のカードは実効300GFも出ないと思うんだ。
ある意味で前世代での実績があるし。

演算ユニットあたりのメモリ帯域の狭さ、キャッシュメモリの少なさ、
ホスト間転送帯域・・・これら全てボトルネック要因。
831Socket774:2009/11/20(金) 14:29:25 ID:7qiryw4n
ちなみにNVIDIAもAMDもHPC向けにデュアルGPUカードを出した実績がないし
出してもホスト間帯域命のGPGPUでは役に立たない。

通信帯域がネックになって性能がスケールしないからな。
グラフィックとは勝手が違うんだ。アホ。
832Socket774:2009/11/20(金) 15:03:34 ID:Q2hNirbp
はぁ・・・実績ですか
既にTOP500で5位、電力性能で4位につけてるだがねぇw
しかも前世代の4000シリーズでw
ララ?ゲフォ?そんなのどこにあるのですか?w
そいつらが出てくる頃には単体で10TFLOPS超のHD6000シリーズにフルボッコされてるよw
833Socket774:2009/11/20(金) 15:36:28 ID:7qiryw4n
じゃあ実績をみてみようか。

順位がわかるなら算数くらいはわかるだろ?
http://www.top500.org/system/performance/10186
CPU分の性能を差し引かずに計算しても

563,100GFLOPS/2560枚 ≒ 219GFLOPS/枚

ACML-GPUじゃSGEMM(単精度)でもせいぜい倍精度の2倍の
440GFLOPS程度が関の山。

デュアルカードはスケールしないしそもそもRadeonそのものが効率が悪い。
これが現実。

10TF?
ありえないw妄想もほどほどに。
834Socket774:2009/11/20(金) 15:38:19 ID:EZ+MSw47
天河のGPU部分の性能って実際どれくらいなんだろうね。
ttp://www.geocities.jp/andosprocinfo/wadai09/20091114.htm
にある構成の推測が正しかったら、LINPACKの数字の半分近くは
CPU部分でたたき出してるような気がするんだけど。
835Socket774:2009/11/20(金) 15:58:47 ID:7qiryw4n
>>834
いい線いってるね。
HarpertownやNehalemオンリーのクラスタが90%超えを達成してるし
GPUのドライバタイム分を差し引いてざっと概算しても200TF程度はCPU側で稼いでると見られる。

メモリ帯域は演算ユニットあたりでみると相対的に世代を重ねるごとに狭くなっている。
スレッドあたりのスクラッチパッドメモリが少なすぎる。
理論性能だけが先走りして実効性能がついていかないのも道理だ。
836Socket774:2009/11/20(金) 16:30:10 ID:00uZYiY0
CPU側が200ちょっとだとGPU一つあたり140GFlops程度?
チューニングでどのくらい改善出来んのさコレ
837Socket774:2009/11/20(金) 17:12:15 ID:7qiryw4n
>>836
4870単体のAMD公式のチューニング済みの実効値がこんなもの。
SGEMM - 300 GFLOPS
DGEMM - 137 GFLOPS

X2のデータは見つからなかった。
575/750MHzにクロックダウンすると105GFLOPS/s
単純計算でデュアルGPUだから210GFLOPS/sくらいは目指せそうだが
PCIeがネックかもしれんね。

LarrabeeのSIMDはfloat×16またはdouble×8のフラット構成なので、
DGEMMのスループットはSGEMMのちょうど半分程度。
そんなに悪くないね。
838Socket774:2009/11/20(金) 17:20:10 ID:5S9T64DO
あのアーキで単体10Tとか出そうとしたらカードが爆発するよw
839Socket774:2009/11/20(金) 17:35:17 ID:/GAhXL3t
HD6xxxはアーキ変えるんじゃなかったか
840Socket774:2009/11/20(金) 17:42:36 ID:e4J+eHaQ
なぜ実行性能が悪いのにHD4870X2は2560枚も使われてんの?
841Socket774:2009/11/20(金) 17:46:02 ID:Ec2SYhTq
Project X

Radeon HD4870のピーク値を目指した者達
842Socket774:2009/11/20(金) 17:46:59 ID:EZ+MSw47
効率悪いけど、1枚100〜200GFlopsならXeonやOpteron使うより性能上だからじゃないの?
あと安かったんじゃないだろうか。
843Socket774:2009/11/20(金) 18:26:40 ID:7qiryw4n
あと1枚あたりの性能が倍精度に関しては、それでもCellやTesla C1060のピークを超えるし
FireStreamじゃなくて4870X2なのもまあ安いからだろうな。
開発費が異常に高い気がするが業者がボってる感が否めない。

Intelが本気を出すと怖いってことは確かだ
844Socket774:2009/11/20(金) 23:58:49 ID:Cp11ytIR
ID:7qiryw4nは、典型的なラデ信者だな
flopsでしか判断できない脳みそが痛々しい
845,,・´∀`・,,)っ-○○○:2009/11/21(土) 00:57:23 ID:9TZ5jYVD
FLOPSはパワーだ!
正義だ!

だが特定条件でしか動かないような浮動小数ユニットなんて理論値に入れるな紛らわしい。

LoadとSwizzleを並列動作させて出せるFLOPS数だけを理論値とせよ。
846Socket774:2009/11/21(土) 01:07:42 ID:thfPDx/4
ならベンチマークを作り直せ
847Socket774:2009/11/21(土) 03:12:52 ID:n8wKGSNY
現行のベンチマークでも性能出て無いだろwwww
848Socket774:2009/11/21(土) 08:20:57 ID:vYqwQs1a
>>826
これ何コア?
849Socket774:2009/11/21(土) 09:16:20 ID:LWzlnfKD
Larrabee(16コアと仮定)
●レジスタ
1コアで512-bit× 128本
16コア 32bit換算で、合計32,768本
●L1キャッシュ 1コア 32KB + 32KB
1024KB
●L2キャッシュ 1コア 256KB
 4096KB

Fermi
http://pc.watch.impress.co.jp/img/pcw/docs/326/442/kaigai11.jpg

HD5870
●レジスタ
非公開
●L1キャッシュ 800KB
32KB + 8KB * 20
●L2キャッシュ 512KB
 128KB * 4

Larrabeeはレジスタの本数は少ないが、L2キャッシュは圧倒的に多いな
HD5870はなぜかレジスタ非公開何かまずいのかね公開すると
850Socket774:2009/11/21(土) 09:47:54 ID:n8wKGSNY
TSMCは40nmから引き続き32nmでもトラブってるらしい
LRB勝利フラグがどんどん立っていくな
ttp://www.semiaccurate.com./2009/11/20/tsmc-rumored-have-killed-their-32nm-node/
851Socket774:2009/11/21(土) 09:54:36 ID:4qXobJiX
IBMが主張してるように32nmクラスになるとHigh-kが必須って事だったのかな
TSMCはHigh-k採用は28nmからだし
852,,・´∀`・,,)っ-○○○:2009/11/21(土) 11:49:30 ID:9TZ5jYVD
>>849
ちなみに先日デモされたLarrabeeは24コアだってよ
32コアの8コア無効版と思われる。
853Socket774:2009/11/21(土) 17:16:29 ID:n8wKGSNY
それ記者の妄想
32コアで750MHzだった可能性もあるわな
なんせESの動作クロックだし
854,,・´∀`・,,)っ-○○○:2009/11/21(土) 17:27:12 ID:9TZ5jYVD
まあそうだな。
855Socket774:2009/11/21(土) 18:52:06 ID:vYqwQs1a
だから417GFlopsは何コアでクロックかもわからないよね
実行効率も推し量るようがないな
856Socket774:2009/11/21(土) 20:01:38 ID:XAzMJ9Uk
Larrabee遅いな
このままずるずる遅れてAVXでいいんじゃねという流れになりそう
857Socket774:2009/11/21(土) 20:12:28 ID:p3tdg2wd
AVXの先にあるものなのに・・・
858Socket774:2009/11/21(土) 20:29:40 ID:d0VgIhZL
そのサイトで5月に書かれてた32コア2GHzは出ないかも知れないな
Fermiのクロックが20%下がったから
859Socket774:2009/11/21(土) 20:38:12 ID:QRKzZawn
キャッシュはまあわかるがレジスタって何さ
spとかFPUとかその中身のことなのか?
860Socket774:2009/11/21(土) 20:41:03 ID:p3tdg2wd
レジスタはレジスタさ
861Socket774:2009/11/22(日) 00:29:06 ID:c5yKE2Wb
Larrabeeはソフトウェアパイプラインにするとこによって
例えば、固定機能のROPが忙しいときには固定だと誰も助けに来ないし
逆に、暇なときは他の忙しい処理の助けにいかない

つまり、負荷分散できないから効率が悪い
と言う説明を聞いてなるほど!と思ったんだがだったらなぜLarrabeeはテクスチャは固定なんだと・・・
862,,・´∀`・,,)っ-○○○:2009/11/22(日) 00:38:24 ID:Htnio03U
例によってシミュレーションで検討の結果でしょ。
テクスチャユニットは利用頻度が高いから固定的にリソース割り当てた方がいいって考えたのでは?

とはいっても最低限の数しかないし、テクスチャの量が多い場合は
必要に応じてコア側でソフト処理する必要がありそうな。
863Socket774:2009/11/22(日) 00:54:38 ID:exRSVgyX
負荷分散で効率を謳うなら、徹底してテクスチャもソフトウェアでやって欲しかったね
まあ、それでもライバルGPUよりも全然先進的だけど

この業界は、進化が速いからね
油断していると、すぐに対応されてしまう
864Socket774:2009/11/22(日) 00:55:25 ID:+J13NvsS
負荷分散で効率を謳うなら、徹底してテクスチャもソフトウェアでやって欲しかったね
まあ、それでもライバルGPUよりも全然先進的だけど

この業界は、進化が速いからね
油断していると、すぐに対応されてしまう
865Socket774:2009/11/22(日) 01:02:52 ID:bwZPg29m
大事なこと?
866Socket774:2009/11/22(日) 01:23:53 ID:2DY63vva
>>861
>Why use fixed function texture logic?
>・Texture filtering needs specialized data access to unaligned 2x2 blocks of pixels
>・Filtering is optimized for 8-bit color values
>・Code would take 12x longer for filtering or 40x longer if texture decompression is required

要するに多くのコアをテクスチャの処理に食われてしまい
かえって負荷分散のメリットを削ぐことになるから
867Socket774:2009/11/22(日) 01:25:39 ID:2DY63vva
ちなみに例のシミュレーターでは専用のテクスチャユニットは実装されてない(全ての処理をx86コアでやっている)ので
1GHzという低いクロック数も相まって、製品版は更に性能が上がる余地があると言える
868Socket774:2009/11/22(日) 01:41:46 ID:exRSVgyX
つまり、負荷分散って担当のパイプラインで重い処理があると
他のパイプラインを担当する人間が自分の仕事を投げ出して
助けにいくから全体の効率が落ちるって事だね

なんとなく、負荷分散の仕組みが分かったよ
869,,・´∀`・,,)っ-○○○:2009/11/22(日) 02:02:17 ID:Htnio03U
>>867
例の名誉病院の件?
あれは可逆圧縮を売りにしてるわけで、不可逆圧縮画像のデコードが出来てもあまり役に立たないような。
870Socket774:2009/11/22(日) 05:17:27 ID:x6S2Vc78
871Socket774:2009/11/22(日) 09:20:38 ID:ztnJVAc0
固定機能=3Dゲーム用途アクセラレーター 

既存GPUでも、Larrabeeみたいなソフトウェアもできるよ 
SPのみで実行して、固定機能は経由しなければいいだけ 

例えば、レイトレとかはラスタライズじゃないから固定機能は経由しない 
まあ、インテル信者だからLarrabeeは絶対買うけどね 
872,,・´∀`・,,)っ-○○○:2009/11/22(日) 11:12:02 ID:Htnio03U
レイトレでもテクスチャは使うだろ?
873Socket774:2009/11/22(日) 11:45:09 ID:ztnJVAc0
レイトレでもテクスチャ使うよ 
そして、Larrabeeもそのテクスチャ使う 
874Socket774:2009/11/22(日) 11:47:55 ID:gPgF01GI
テクスチャの読み込みは固定機能じゃないのかと
875Socket774:2009/11/22(日) 12:32:27 ID:ztnJVAc0
きちんと入力しないと、実行できない出来そこないのコンピュータみたいな 
流れになってきたな 

テクスチャは、固定機能だがLarrabeeもテクスチャは固定機能だろ 
つまり、既存GPUがLarrabeeみたいなソフトウェア処理をするために 
テクスチャが固定機能かどうかなんてまったく関係ない 
876Socket774:2009/11/22(日) 15:36:34 ID:gPgF01GI
きちんと入力しても、実行できない出来そこないのコンピュータみたいなレスだな。

レイトレは固定機能使わないって発言に対する突っ込みなのにララビーみたいな
ソフト処理がどうのこうのとかずれてんだよ。
877Socket774:2009/11/22(日) 17:19:04 ID:gGriCWhq
グラフィックスなんてもうどうでもいいんだよ
だってもう遊ぶゲームが無いんだから、PCゲーにはw
コンシューマーからの残飯でベンチは60fps以上で空回りw
PCで出しても売上げ比率10パー以下w(例MW2
テクスチャとかどうでもいいのw
878Socket774:2009/11/22(日) 17:26:28 ID:e7o5l+TD
まぁPCでゲーム遊んでるヤシがヌビの凋落を喜ぶなんて自傷行為以外のなにものでもない罠
連中が技術支援与えて底上げしてたんだから
879Socket774:2009/11/22(日) 17:50:55 ID:ae1knjPI
>>877
紙芝居のエロゲも全然衰えないし
ツクール製RPGでも名作は50時間とか普通に遊べるからなあ
グラフィックスのクオリティだけじゃもう押し切れないっぽい
880Socket774:2009/11/22(日) 17:58:18 ID:r4Q4DoyF
スクエアっていう反面教師がいるだろ
あと人によってはMGS4も

グラがいいことに越した事は無いがそっちの比重ばっかになりゃゲームはつまらなくなる
KOFとかゴミグラだったが人気はでたろう
881Socket774:2009/11/22(日) 18:27:35 ID:gkErZw0o
×フォトリアルは全てのゲームに不要
○フォトリアルは一部のゲームにしか必要じゃない
882Socket774:2009/11/22(日) 23:08:38 ID:s7aFD853
>>880
日本にしかない気がするプリレンダリング3DゲームではGPUは
動画再生支援に必要。
よってGPUのパワーは3Dゲームにはとても重要。

ん?
883Socket774:2009/11/22(日) 23:17:13 ID:qe+EbEeD
>>879
ファミコンエミュで遊んだら結構面白かったってのと同じか。
884Socket774:2009/11/23(月) 06:49:56 ID:qcXHIkVH
グラから音楽まで全部フリー素材だがelonaが相当面白いよwww
オブリが好きなら絶対ハマルはず
885Socket774:2009/11/23(月) 08:59:02 ID:wTfHoFM+
キャッシュコヒーレンシの縛りがあると
どうしてもスケーリングの足かせになると思うんだけど大丈夫なんだろうか。
45nや32nでよくても更にその先のトランジスタを活かせるのかどうか。
886Socket774:2009/11/23(月) 09:01:36 ID:srrKjRXu
Intelは3Dトーラスまで検討してたが
まあリングバスなうちは余裕と見ていいだろ
887,,・´∀`・,,)っ-○○○:2009/11/23(月) 11:23:48 ID:nT9DryEJ
>>885
コヒーレンシの縛りなんてmovnt*の登場時点で破壊されてますが

L1キャッシュすっとばしてロードとか出来ますよ普通に
888Socket774:2009/11/23(月) 13:06:14 ID:wTfHoFM+
>>887
それキャッシュ使ってないって事で
それ多用して性能でんの?
タイルレンダと合わなくない?
889,,・´∀`・,,)っ-○○○:2009/11/23(月) 14:46:27 ID:nT9DryEJ
L2にあるデータをL1に確保せずに読み出すときにも使えるよ。
共有データをL1に確保さえしなければスヌープは必要ない。

あと他にgatherpfd/scatterpfd命令ってのがあってだな


890,,・´∀`・,,)っ-○○○:2009/11/23(月) 15:06:21 ID:nT9DryEJ
1キャッシュライン=ベクトルレジスタ1本分

方策としては
・そのレジスタに確保するまで別のレジスタだけで読んでおく
・スレッド切替して別のスレッドを実行する

読み込んだ後は各スレッドローカルで使ってるアドレス領域に格納して再利用することもできる。


SSE4.1に類似命令があるだろ
http://gpu.fixstars.com/index.php/WriteCombine%E3%83%A1%E3%83%A2%E3%83%AA%E3%82%A2%E3%82%AF%E3%82%BB%E3%82%B9%E3%82%92%E9%AB%98%E9%80%9F%E5%8C%96%E3%81%99%E3%82%8B
891Socket774:2009/11/23(月) 18:25:48 ID:ePuUMmJU
Larrabeeは、スーパーコンピュータ用途がメインって認識でOKですよね?
892Socket774:2009/11/23(月) 18:32:44 ID:srrKjRXu
正解じゃない
893Socket774:2009/11/23(月) 18:39:38 ID:ePuUMmJU
では、間違っているっていうこと?」
894Socket774:2009/11/23(月) 18:44:16 ID:CQy3M83n
メニーコア構想の具現化の一つ
895Socket774:2009/11/24(火) 15:57:45 ID:OHQyeGHS
Cellのパクリなんて言われてますが?

342 名前: 集気ビン(コネチカット州)[sage] 投稿日:2009/11/24(火) 12:22:49.92 ID:Ar1dyVcR
昔はCellの事をバカにして笑い物にしてたIntelが
「やっぱりCellの方向性が正しかったかも、テヘッ///」とか言って露骨にパクってきてるし
すごい議論されててメインストリームになりつつあるし
やはり巨人IBMの先見性がすごいというか、クタラギもすごい人だと思うよ。

379 名前: 鑿(山形県)[] 投稿日:2009/11/24(火) 15:21:25.64 ID:cnLIpv5I
>>342
LarrabeeのどこがCellに似てんだよ
ニワカもほどほどにな

383 名前: ビーカー(関西地方)[sage] 投稿日:2009/11/24(火) 15:41:09.99 ID:oEkrjBen
>379
Cellの論文見てからCoreシリーズの開発が始まったけど、すぐ行き詰ってLarrabeeになった。
似てないじゃんなく特許回避しながらARMアーキでCellの再現をしただけだろう?
その代償がコア数増加・消費電力・周波数を犠牲にするハメになっちゃった
Larrabeeの設計自体はかなり良い物なんだけど

387 名前: るつぼ(富山県)[sage] 投稿日:2009/11/24(火) 15:48:21.73 ID:UDNWPfFk
>>379
似てる部分は結構あるよ
ISAはx86だけどコア自体はシンプルなベクタプロセッサでSPEと似てる
キャッシュ機構もSPEのLSのように最大性能を発揮できるようLSのようなスクラッチパッドモードがある
(キャッシュ機構のままだと数個のコアしか連動できずメニーコアのLarrabeeにとって効率が悪く適さない)

違いも多いけど今のところCellに最も近い設計思想と言えるのがLarrabee

IBM「なんかゲハ界隈でアンチソニーがCell撤退って騒いでるけど撤退しねーよ。カス。」
ttp://tsushima.2ch.net/test/read.cgi/news/1259015555/387
896Socket774:2009/11/24(火) 16:22:16 ID:fGs7S9Ly
はっきり言ってニュー速のスレなんかどうでもいい
897Socket774:2009/11/24(火) 17:03:48 ID:RQdqsZRS
ゲハニートのCell起源説には呆れるが

> 似てないじゃんなく特許回避しながらARMアーキでCellの再現をしただけだろう?

いつから
 A R M 
になったんだwww

> キャッシュ機構もSPEのLSのように最大性能を発揮できるようLSのようなスクラッチパッドモードがある

FermiのL1と勘違いしてるようだがスクラッチパッド「モード」なんてない。
prefetchとコヒーレント無視のwrite-throughの専用命令なら
Pentium IIIから存在しているが、あくまでそれの延長の技術として
スヌープの回避方法が提供されている。

こいつら最高にアホ
898Socket774:2009/11/24(火) 17:34:29 ID:jYE8VafB
よその板の低レベルな喧嘩をいちいち持ち込んでくんなよ…
899Socket774:2009/11/24(火) 17:43:57 ID:7n+zc8OS
ララビーはキャンセルなの?
900Socket774:2009/11/24(火) 17:54:11 ID:1ayzPV/z
フェルミーはキャンセルされそうだね
901Socket774:2009/11/24(火) 18:22:23 ID:dPj4zyY9
このスレとかIntel次世代スレとか、木どころか葉脈見て森見ないようなやつばっかだな
902,,・´∀`・,,)っ-○○○:2009/11/24(火) 22:11:54 ID:hPX1Nh9Y
BYTE
WORD
DWORD
QWORD
DQWORD/XMMWORD
YMMWORD
???
903Socket774:2009/11/24(火) 22:22:53 ID:sOTYc8Q2
904Socket774:2009/11/24(火) 23:04:06 ID:nOQx4sqY
このスレ的にGPUとしLRBは期待できないでおk?
905Socket774:2009/11/24(火) 23:05:55 ID:1ayzPV/z
グラボはラデ音でも買えばいいと思うよ by Intel
906Socket774:2009/11/24(火) 23:12:37 ID:gXXLGqDd
了解。手ごろなHD5850買ってくる。
907Socket774:2009/11/24(火) 23:14:59 ID:nOQx4sqY
なんでテクスチャユニットついてるん?
908Socket774:2009/11/24(火) 23:17:52 ID:ELEBIXpN
>>907
普及させるために仮面かぶってるからさ。
909Socket774:2009/11/24(火) 23:22:45 ID:nOQx4sqY
なんでタイリングするん?
910,,・´∀`・,,)っ-○○○:2009/11/24(火) 23:29:27 ID:hPX1Nh9Y
VRAMの帯域消費量を節約するため。

ピクセルライン単位でちびちび転送して処理するからあのデータが足りないとかいって
帯域をひたすら浪費する。
ある程度の大きさずつキャッシュに確保して纏めて処理したほうがトラフィック削減できる。

ああ、PowerVRがどうとか言ってるのはアホなんで構う必要なし。
そんな帯域狭いわけがないだろ。
911Socket774:2009/11/24(火) 23:29:41 ID:ELEBIXpN
>>909
過去のDXとかとの互換性であったほうがいいのかなぁ??
タイリングアーキテクチャはDxではキャンセルされてしまったので、グライドみたいな立ち位置じゃね?
912,,・´∀`・,,)っ-○○○:2009/11/24(火) 23:41:34 ID:hPX1Nh9Y
VRAM転送だけで何十Wも消費するので、キャッシュを旨く使って消費電力を抑えれば
その分の余剰TDPキャパの枠内でコアをオーバークロックすることができる

なんて実装が登場するかもしれないね。


913Socket774:2009/11/25(水) 00:06:42 ID:wpIpnjnJ
タイリングレンダで発生するシェーダ間の中間データはどこに置くん?
914,,・´∀`・,,)っ-○○○:2009/11/25(水) 00:16:31 ID:XnXiDy9n
運が良ければそのままL2キャッシュにそのまま保持。
Cellじゃないんだからバケツリレーする必要なんてないよ。

ストリーム処理の粒度は粗くなり、今までのGPUでは絶え間なくなく流れてた
VRAMのフローは途切れ途切れになる。
いや、それがIntelの目論見なんだけど。

段階的にタイルに移行し、ゆくゆくはCPUコアと統合し、L3キャッシュでバッファリングすることで
より狭い帯域のメモリで動かせるようになったり、CPU間と高速にデータやりとりしたりってことが
できるようになる。



GPUは帯域食いのイメージがあるが、実は意外と食わないってのはあまり知られてない事実。
演算ユニット単位で見るとメモリ帯域はものすごく狭い。
要するにデータの局所性はCPUと比べてものすごく高い。
局所性があるならキャッシュは有効だ。
十分なキャッシュ容量を与えないからこそ無駄にトラフィックが浪費されるわけで。
915Socket774:2009/11/25(水) 02:07:44 ID:zXg+k36V
GPUっていうかリアルタイム3Dグラフィックスは、もっと帯域食わない方法が沢山あるという事だな
ハードワイヤード実装でレンダリングパイプラインが固定され続けて15年が経った、と
俺たち末端のプログラマはそのハードの仕組みに従うしかないからなー
916Socket774:2009/11/25(水) 02:22:55 ID:wpIpnjnJ
>>914
> 運が良ければそのままL2キャッシュにそのまま保持。
なんでそんな望み薄いことにかけるん?
テッセレータ死んでしもたん?
917Socket774:2009/11/25(水) 07:16:35 ID:jDb1580z
キャッシュ内タイルレンダで帯域ハッピーなんて
とてもじゃないがLarrabee世代で実現できるような話じゃない。
後プロセス3世代くらい進めば物になるのかもしれんが。
918,,・´∀`・,,)っ-○○○:2009/11/25(水) 08:10:36 ID:XnXiDy9n
>>916
なんで「賭け」?
あったらあったでトラフィック削れるし、無いなら無いでかまわんのだよ。
キャッシュにないなら、メモリからとってくればいいじゃない。
そこは従来のGPUと変わらん。
ロードして必要データがキャッシュにある別の部位を処理するタスクに切り替えて間を繋ぐ。
そこも従来のGPUとかわらんし、むしろ条件は良い。

だが大丈夫、その程度で望み薄いとか言ったら、10分の1以下のL2キャッシュ容量しかないGeForceやRadeonは
「絶望的にありえない」から。

なぜ運任せになるかって、OSが入るから。カーネルタイムで処理が遮られるし、場合によってキャッシュが流される。
しかし全部のコアでカーネルが動くわけじゃない。
そこを避けさえすれば、明示的にコントロールすることすら可能だ。


あとFermiも含めテッセレータはソフト実装だから安心しろ。
FermiではCUDAで実装するんじゃね?
ソフト実装ではHull Shaderステージと内部処理レベルで統合してしまってもかまわんのだよ。
むしろそっちのほうが好都合だろう。
919,,・´∀`・,,)っ-○○○:2009/11/25(水) 08:19:40 ID:XnXiDy9n
>>917
俺が言ってることを復唱しなくても十分だよ。行間読めない人?

>ゆくゆくはCPUコアと統合し、
が1世代の話に見えるか?


いずれにせよストリーム処理には変わりないが、きわめて高確率で処理対象の近傍のデータが
キャッシュに載ってるからメモリまで取りに行く頻度は激減する。
920Socket774:2009/11/25(水) 08:51:26 ID:Ef07keRK
で、一世代目はいつ出るの?
921Socket774:2009/11/25(水) 09:13:41 ID:qLJteFOD
早かれ遅かれ来年の中頃
922Socket774:2009/11/25(水) 09:25:44 ID:ntSsR84y
なにげに楽しみだったんだけど、結構遅いんだな。
923Socket774:2009/11/25(水) 11:08:07 ID:30IufTra
http://www.ddj.com/architect/221601028
http://domino.research.ibm.com/comm/research_people.nsf/pages/scarpazza.pubs.html/$FILE/2009-11-10-ddj-larrabee.pdf

IBMワトソン研究所の中の人のLarrabee解説。
非数値演算分野、たとえば正規表現マッチングでも使い物になるという
研究成果のお話だそうだ。

なにより重要なのはIBMスパコンがLarrabeeを採用する可能性が開けてきたこと。
この研究者はCellに関する論文をいくつも手がけている。
924Socket774:2009/11/25(水) 11:56:18 ID:DwMNJha2
その論文のことじゃないが、
論文て肯定的な時だけ出すんじゃないぞ。±どちらでも書く。
これはこのように駄目でした、でも業績一つ稼げるんだから
925Socket774:2009/11/25(水) 12:04:41 ID:DwMNJha2
こういう人達は素人fanboyみたいに、知らないまま否定する、ということは
しない。必ず検討する。そして検討に時間を費やした以上は
その労力を自分のキャリア・業績としてカウントされる形で残そうとする。
検討したということと、採用へ傾いたということとはほとんど独立している。
926Socket774:2009/11/25(水) 12:22:47 ID:qLJteFOD
その言い分だと、彼に研究すらされてない
TeslaやFireStreamは検討にすら値しないってことだけどな
927Socket774:2009/11/25(水) 12:29:50 ID:30IufTra
>>924
君が思ってる以上に米国の企業研究所は利益性に関してシビアだぞ。
なんで他社の製品の有用性を誇示し、自社製品のCellの商売上
不利益になりかねないレポートをIBMの名前で書かせる必要がある?

IBMが給料を出して研究者にLarrabeeの応用法を示させたことが
何を意味するのか、いくら鈍感でもわからないわけがないだろう。
928Socket774:2009/11/25(水) 13:15:19 ID:DwMNJha2
>>927
IntelはLarabeeがx86であることを大きな柱として宣伝してるけど
>923 には既存の資産ではだめで新たに書き下ろさないと性能を
発揮させられないという意味の事が書かれている。
それなのに>927の目には、Intelの主張全肯定の”有用性の誇示”にみえるのか?
929Socket774:2009/11/25(水) 14:06:02 ID:30IufTra
>>927
> IntelはLarabeeがx86であることを大きな柱として宣伝してるけど

それはx86は互換性くらいしかメリットが無いと思い込みたいお前の感想だろう。
[x86] [compatibility]でくまなく検索してみればわかるが
氏は一っ言も言ってない。

> 既存の資産ではだめで新たに書き下ろさないと性能を
> 発揮させられない

そんなのはCellは無論のこと歴代POWERアーキも通ってきた道で
ネガキャンには成りえない。
930Socket774:2009/11/25(水) 14:38:44 ID:qLJteFOD
>>923を読んでわかった真実:

928は>>923を読解していない
931Socket774:2009/11/25(水) 15:41:51 ID:30IufTra
↓これは自分自身のことを言ってたんだね

> 素人fanboyみたいに、知らないまま否定する
932Socket774:2009/11/25(水) 21:52:18 ID:sNlazQoU
テッセレータって結局分割自体より
増大後の頂点処理のほうが重かったりする
933Socket774:2009/11/25(水) 22:41:45 ID:96O39zqu
IBMがXeonサーバーばんばん売ってる間はインテル様もヨイショしないとな
Larrabeeお願いしますだぁって
934,,・´∀`・,,)っ-○○○:2009/11/25(水) 22:53:09 ID:XnXiDy9n
滑らかな曲線描くために頂点を増やすとかやんなくてもソフト実装されるラスタオペレーション側で
補完したほうがよっぽど処理は軽いと思うんだがね。
とか燃料投下してみる
935,,・´∀`・,,)っ-○○○:2009/11/25(水) 23:05:37 ID:XnXiDy9n
>>923のは普通にブックマークに入れてたわ。

Is Larrabee For the Rest of Us?
- Larrabeeは置き去りにされた人々にとって救世主になりうるか?

使い古された言い回しだが("the computer for the rest of us"って昔の末筋凸腫の売り文句)
高スループット指向のプロセッサが数値計算に特化したものばかり幅をきかす昨今
今回実装を紹介する正規表現エンジンのような非数値計算用途においても実用に耐えうる
プロセッサが求められてるってのが同氏の論点。

どっちかというと貶されてるのはGPGPU。Cellもそうかもしれないね。

IBMは競合他社の技術であっても、気に入ったものがあれが食いつかずにはいられない。
Sunに散々噛みつかれながらもJavaに肩入れしていったけど
そういう社風だからこそJVM-JITとかEclipseみたいな傑作が生みだされたわけで。
936,,・´∀`・,,)っ-○○○:2009/11/25(水) 23:33:20 ID:XnXiDy9n
そもそもIBMは半導体製造業である前にソリューション屋だから
ソニー東芝の3馬鹿連合の腐れ縁引きずって商機を逃すような馬鹿な真似はしない。
937Socket774:2009/11/26(木) 00:08:55 ID:Cr5sHBSq
>>918
> >>916
> なんで「賭け」?
> あったらあったでトラフィック削れるし、無いなら無いでかまわんのだよ。
> キャッシュにないなら、メモリからとってくればいいじゃない。
> そこは従来のGPUと変わらん。

従来のGPUのグラフィクスはストリーム処理だから、そこでメモリにアクセスすることはないでしょ。
GPUの中をぐるぐる回るんだよ。

一方Larrabeeはタイルレンダのためそれができない。
VRAMに一時バッファを設けないといけない。
例えばテッセレーションする場合、分割しうる最大頂点数分バッファ確保しないといけない。
でそれが終わってタイルレンダ始めるときにL2に頂点が残ってる可能性なんて考えるだけ無駄。

Larrabeeでタイルを使うのは>>910のような積極的な理由でなく、
そうしないといわゆるROPの処理(特にZCull)で性能が出ないから仕方なくという面が
強いと思うな。

団子さんもGPUとしはLarrabeeに期待してないでしょ?
938,,・´∀`・,,)っ-○○○:2009/11/26(木) 00:13:46 ID:Y7m0S63w
>従来のGPUのグラフィクスはストリーム処理だから、そこでメモリにアクセスすることはないでしょ。
>GPUの中をぐるぐる回るんだよ。

はぁ〜?
939,,・´∀`・,,)っ-○○○:2009/11/26(木) 00:15:30 ID:Y7m0S63w
Larrabeeに批判的なひとって
Larrabeeに対する理解どころか
GPUの構造に対する理解も無いんですね
940,,・´∀`・,,)っ-○○○:2009/11/26(木) 00:21:49 ID:Y7m0S63w
メモリ(VRAM)はGPUの「外」にあります。カード上には溶接されてますけどね。

残念なことに、GPUの「中」に全部データ置いておけるほどFLIP-FLOP回路無いんですよ
941Socket774:2009/11/26(木) 00:22:02 ID:Cr5sHBSq
>>938
> >従来のGPUのグラフィクスはストリーム処理だから、そこでメモリにアクセスすることはないでしょ。
> >GPUの中をぐるぐる回るんだよ。
>
> はぁ〜?

あ団子さんいたw
テクスチャとかのことでなく>>913のことね。
だいたい従来のGPUはメモリに置き場所確保しないから置きようがないよ。
942,,・´∀`・,,)っ-○○○:2009/11/26(木) 00:39:40 ID:Y7m0S63w
たとえばXbox360はVRAMの帯域狭い代わりに12MBのeDRAMがあって
ROPから吐き出されたラスタ出力データは(以下略
943,,・´∀`・,,)っ-○○○:2009/11/26(木) 00:48:38 ID:Y7m0S63w
>分割しうる最大頂点数分バッファ確保しないといけない。
ちなみにこれは換言するならば、キャッシュ上にバッファの断片を確保できる分だけの頂点単位で
分割処理すればキャッシュミスなしでステージ間を繋ぐことができるってことね
944Socket774:2009/11/26(木) 01:06:40 ID:Cr5sHBSq
>>942
それがLarrabeeとどう関係あるの?
360のタイリングはPredicated Tilingというやり方で最大4分割までと決まってる。
でプリミティブ単位でどのタイルに含まれるかを2bitのtagで残しておく。
LarrabeeのタイリングはPowerVRと同じなので360とは違う。

>>943
Larrabee専用にそう作れば可能だろうね。
でもピクセルシェーダを何回も回さないといけないので結局効率が落ちそうだよ。
945,,・´∀`・,,)っ-○○○:2009/11/26(木) 01:07:23 ID:Y7m0S63w
>LarrabeeのタイリングはPowerVRと同じ
基地外キター

946Socket774:2009/11/26(木) 01:08:53 ID:Cr5sHBSq
そりゃ全く同じじゃないけどさ、
そこは言葉のあやってことで許してよ。
947,,・´∀`・,,)っ-○○○:2009/11/26(木) 01:23:19 ID:Y7m0S63w
あ、ちなみにL2にヒットするようにスケジューリングして動かすってのはLarrabee側の
タスクスケジューラの仕事であって、「専用」に組む必要は無いっしょ。
高級言語ランタイムで提供されるAPIで遣り繰りだけならね。


だが敢えてDirectXなどクソ食らえと言っておく。
音楽配信におけるApple、検索エンジンにおけるGoogleがそうであるように
猫も杓子もMSに主導権持たせる必要など無い。
948Socket774:2009/11/26(木) 01:36:51 ID:Cr5sHBSq
しまった2bitじゃなくて4bitだった。

>>947
DX11は結構長く使われそうな雰囲気。
レイトレ時代は早くてその後だろなー。
949Socket774:2009/11/26(木) 01:38:44 ID:qJQYxatM
>>947
クソ言う暇があったら自分で作れや
950,,・´∀`・,,)っ-○○○:2009/11/26(木) 01:51:30 ID:Y7m0S63w
コンシューマ優先のうちは、Xbox独り勝ちにでもならない限りは
どのみちクロスプラットフォームのミドルウェアで対応することになるからね。
柵の多いDirectXに囚われず自由にカスタムエンジン書きたい酔狂なエンジン屋さんがいるかぎり
ソフトウェアレンダラはそれなりに使われることになるでしょうよ

ちなみにEPICはLarrabeeべた褒め
951,,・´∀`・,,)っ-○○○:2009/11/26(木) 02:04:03 ID:Y7m0S63w
因みに言うとEPICってFPSのデファクトスタンダードたる杏里あるエンジン作ってる所ね。
いまはIntelとガチ癒着状態。だからこそRTRTのデモがQuake Warsなわけで。

>>948
> レイトレ時代は早くてその後だろなー。
どのみちUE4はレイトレベースになるわけ無いから。
だがLarrabeeで本領発揮するエンジンになるのはほぼ確定。
952Socket774:2009/11/26(木) 02:36:32 ID:PN0R5pd0
> 360のタイリングはPredicated Tilingというやり方で最大4分割までと決まってる。
> でプリミティブ単位でどのタイルに含まれるかを2bitのtagで残しておく。
tagを8bitにすりゃ、Predicated Tilingは最大256分割できるってこったろ?
んで、各タイルを別コア別スレッドでバラバラに担当する
PowerVRだって次世代の奴はそんな感じの処理になってるでしょ、噂のPSP2の4コア版とかさ
953Socket774:2009/11/26(木) 02:42:52 ID:PN0R5pd0
あぁ、tagはタイルまたがるのか、んじゃ256bitねw
今までの3D描画って、頂点情報をケチりすぎだよ
954Socket774:2009/11/26(木) 06:20:07 ID:MCZHFaAT
Intel Larrabee to surprise with performance, launch in 1H 2010? - Bright Side Of News*
ttp://www.brightsideofnews.com/news/2009/11/25/intel-larrabee-to-surprise-with-performance2c-launch-in-1h-2010.aspx
955Socket774:2009/11/26(木) 06:35:09 ID:lE1PI2D4
URLだけでFUDだとわかる
956Socket774:2009/11/26(木) 11:30:54 ID:sU+BbSs7
>>948
ちなみに今のゲーム業界ではマルチ開発が前提だからDXは大した支配力無い。
そもそもDXを直に叩いてゲーム作るデベロッパーなんて今時殆どいない。
ミドルウェア屋がゲームAPIの実権を掌握してる。
それでなくともデフォルトの左手系ではなくOpenGLと同じ右手系での利用が常態化してる。

そもそもIntelがLarrabeeをゲームGPUとして売り込むことに強気なのは、
DirectX(MS)のヒエラルキに縛られないフルプログラマブルGPUとして、
Tim Sweeney率いるEpic Gamesらの強い支持が得られてるからに他ならん。
DirectXやOpenGLは最初からレガシーAPIという位置づけ。

Epicは急進的で、C++やCUDAで全てのGPUパイプラインを実装できるように
すべきだと主張している。FermiもHPC市場を追いかけてるように見えて
実はEpicに合わせてプログラマブル化を進めている。

無論、Epicの連中にDirectXやOpenGLは死滅するなんていわれてMSは機嫌よくない。
GPGPU環境のより進んだGeForceをDirectX世代でRadeonの下位に位置づけることで
GeForceのほうが「世代遅れ」だとミスリードするに至ってる。
PS3のミドルウェアですらソフトウェア実装されてるテッセレータを
今更固定機能なんて時代錯誤もはなはだしいが。
957Socket774:2009/11/26(木) 12:41:40 ID:j54scJPX
>>954
Teslaはぶっ潰せる目処が立ったんだろうな
958Socket774:2009/11/26(木) 12:44:49 ID:HZufnNHz
ミドルウェアやさんってMSほど分け隔てなく(実質はともかく建前上は)
GPUメーカーに配慮するかな?
DXがしかとされるようになったらミドルウェアやさんが気に入った
1、2社以外はスルーされるようになるんじゃないか。
今でさえ乏しいGPUハードの種類がもっと絞られそう
959Socket774:2009/11/26(木) 12:51:13 ID:nKsRvtaU
MSとべったりのAMDはどうなってしまうのやら
960Socket774:2009/11/26(木) 12:58:08 ID:sU+BbSs7
Unreal Engine 3は360重視でPS3は残念なことになってるからね。
(わかりやすいところで言うとPS3版ラストレムナント開発凍結)

360は元々256MBしか積まない予定だったがTimがゴネて512MBになった。
CPUとGPUのメモリ共用が理想で、その次の世代はCPU機能を持ったGPU
(あるいはその逆)を前提にエンジンを作ろうとしてた。
EpicにとってCPUとGPUを分け隔てるDirectXは邪魔で邪魔でしょうがない。

ソニーがPS4にLarrabeeを検討したのはCellの置き換えっていうよりは
Epicの機嫌をとりたいから。
CPUにCell、GPUにLarrabee(あるいはFermi)という構成をとる
可能性はあるが、どれを選んでもCellのSPEをもてあますので
悩ましいところでしょうな。
961Socket774:2009/11/26(木) 13:07:51 ID:xfommyfh
でもお高いんでしょう?
962Socket774:2009/11/26(木) 15:09:58 ID:IzeF88yN
Epicのドル箱タイトルであるGears of War3を次世代機で出すといってるんだから
パブリッシャーのMSとベッタリついていくしか無いだろうに
Tim Sweeneyのララビマンセーは、要するに360の次世代機にLarrabee積めよという一種の要請だろ
963Socket774:2009/11/26(木) 16:48:16 ID:kd5Pa1Ni
さらなる次世代では、GPUはららびーが共通で、CPUがぱわーシリーズの特注って構図になりえるのかねぇ。
さらに、いんてるが、ららびー採用してくれたら、カスタムさんでーぶりっじを特価で!とかいったりするんだろうか。
964Socket774:2009/11/26(木) 17:42:36 ID:sU+BbSs7
PC版の次期UEでDirectX, CUDA(Fermi), LRBni のマルチバックエンド対応
ってのが落としどころになりそう。
PS4, Xbox3は2012年ごろと言われてるし、Larrabeeのローンチに際し
なんらかのタイトルを用意してるとすればそれが最初で最後の
プレゼンの機会になりそうだね。
965Socket774:2009/11/26(木) 17:52:07 ID:oh++9WhP
おいおいw何しれっとFermi入れてんだw
966Socket774:2009/11/26(木) 18:05:41 ID:zXd9r/pq
DXCSでプログラム書けばFermiでも動くんだからCUDA使う意味がわからない
967Socket774:2009/11/26(木) 18:29:53 ID:oh++9WhP
Larrabeeは従来のGPUに比べて大きく変わってるから次世代エンジンの改革が生きてくるが
Fermiは既存のDXパイプライン処理の方が効率がよい
968Socket774:2009/11/26(木) 19:46:53 ID:sU+BbSs7
PhysX・・・
969Socket774:2009/11/26(木) 21:21:37 ID:cgpBtAkP
>>967
?
970,,・´∀`・,,)っ-○○○:2009/11/26(木) 22:20:49 ID:Y7m0S63w
そういえばCompute Shader上で動く物理エンジンってあったっけ?

一応HavokはOpenCL対応のあらゆるプラットフォームに移植されるが
UT3とかで使ってるPhysXのほうは・・・
なんなのかねNVIDIAの懐の狭さは
971,,・´∀`・,,)っ-○○○:2009/11/26(木) 22:45:48 ID:Y7m0S63w
なにやら香ばしい話になってるなぁ

PLAYSTATION 4はPOWER7採用
http://ps3clan.nl/2009/11/sony-kiest-voor-ibm-power7-cpu-playstation-4/
972Socket774:2009/11/26(木) 22:50:29 ID:HpYiJ7iZ
GPUにEvergreen世代で勝ちも負けも無いPS4完成
973Socket774:2009/11/26(木) 22:59:52 ID:/2sLxjxo
Larrabee採用よりもリアリティあるな
974,,・´∀`・,,)っ-○○○:2009/11/26(木) 23:04:10 ID:Y7m0S63w
> TBDR based PowerVR 6

なにこれ
975Socket774:2009/11/26(木) 23:05:36 ID:7OPHqTfk
>>970
Compute Shader対応はまだじゃないかな。
SM5.0前提にせんと使い物にならなないから、
結局DX11対応ハードの普及がボトルネックに
なるんじゃないかと思う。
976Socket774:2009/11/27(金) 00:24:02 ID:cmGdpQP7
>>971
『僕が考えた最強ゲーム機PS4はこうだ!!』
977Socket774:2009/11/27(金) 00:58:55 ID:oGP++eDz
>>976
久多良木さんのいた頃は、実際にそうだったんだからな。
僕(社長)の考えた最強ゲーム機。
恐ろしい会社だ。
978Socket774:2009/11/27(金) 01:48:12 ID:mTACslvt
>>974
Tile Based Deferred Rendering Based PowerVR 6
くどい言い方だw
979Socket774:2009/11/27(金) 05:11:28 ID:Txi5KG5o
PS4がPower7ってことは次期箱もPower7かのう
どっちもクロック限界が見えてるPower5のカスタムチップから互換性持ったまま性能向上しようとしたらそれしかなさそうだし
980Socket774:2009/11/27(金) 09:41:52 ID:uc0tFE/G
>>957
HPC版XeonMP(Nehalem-EX 6C)はLarrabeeをDMIリンクするための母艦だと思うんだ。
CPUコアだけならWestmere-EPの方が価格性能比で勝るだろうし。
FLOPS/$の安売りはしないってことだな
981Socket774:2009/11/27(金) 12:15:18 ID:4FdJofhT
larrabee動かすのにxeonが要るのか?おれが見た図ではlarrabeeが互いに4つリンクされてた
982Socket774:2009/11/27(金) 13:00:03 ID:uc0tFE/G
あれは凍結。
てかDMIじゃなくてQPIか。

ハードウェアを仮想化して論理的に1チップ1コンピュータで動かすモデルになるとか。
アプリからはホストとゲストは別マシンで、高速なネットワークに繋がれてるように見える。
グラボ版と同じプログラミングモデルがとれる。
983Socket774:2009/11/27(金) 13:30:05 ID:D7mBF9pc
>>982
>>822に書いてあるけど、QPI版の計画はまだ生きているようだよ。
984Socket774:2009/11/27(金) 13:46:51 ID:rY5hVohY
改めて読んだが日本語訳は信頼度低いな。
M-Y-Oだから共有仮想メモリモデルって訳するのが妥当。

新しい概念と見せかけて現行のGPGPU-ホスト間の接続モデルと変わらん。
985Socket774
ぬび厨は知ったかでものを言うから困る