GPGPU#3

>>607
whitepaper読み終わった。すごすぎる。
Using this elegant model of dual-issue, Fermi achieves near peak hardware performance.
の一文が頭に残っている。早く使いたいです。
CUDAの問題点を調査してゼロから設計したんだな。
後藤さんのレポートもこれをもとにしたようで合わせて読むとわかりやすい。

613 ：デフォルトの名無しさん：2009/10/01(木) 21:18:44

4.8TF確定だな
すげーなNVidia

614 ：デフォルトの名無しさん：2009/10/01(木) 21:20:41

いや、fpなら1.5tflops辺りだよ
ただし、実行効率が某A社とは段違いなだけで

615 ：デフォルトの名無しさん：2009/10/01(木) 21:26:31

intは4.8T確定？

616 ：デフォルトの名無しさん：2009/10/01(木) 21:27:06

ちがうだろ

617 ：デフォルトの名無しさん：2009/10/01(木) 21:32:52

AMD終わりだなこりゃ

618 ：デフォルトの名無しさん：2009/10/01(木) 21:34:49

自作PC板ではR800の登場でGTX300追悼とか言われてんのに
こっちでは全然評価が違うんだねぇ

619 ：デフォルトの名無しさん：2009/10/01(木) 21:43:24

ECCも使えないものを、なんで評価できよう

620 ：デフォルトの名無しさん：2009/10/01(木) 21:43:44

>>618
自作板はもんもんとかいうホモ集団が
幅利かせてるし。バカVIPPER出入りしてるし
理解できないんだろ

621 ：デフォルトの名無しさん：2009/10/01(木) 21:56:03

自作板住人は開発者とイコールではないからな。

622 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/01(木) 21:59:28

A社のは、x, y, z, w tの5つのユニットで一組のALUを構成するVLIWで
それが16個連なって超並列SIMDプロセッサを構成してる。

x, y, z, wは座標軸で、3Dでも実質3軸分しか稼働しない。4軸目はたまに使う程度。5軸目は稀に使う程度。
2D処理に落とし込むと遊びが増える。使って1～2Way。
VLIW-SIMDは実効性能は低いけど演算ユニットを高密度で搭載できるから
トランジスタ数あたりのFLOPSを大きく稼ぐことができる。

でもそれを引き出すためのスケジューリングは骨が折れる。
結局の所ATIのやってることはPentium 4の空回りGHｚと似たようなモン。

NやIntelはフラットなSIMDで、X, Y, Z成分を分解して別々のベクトルに再パッキング（AoS-SoA変換）して
並列処理する。
だから3次元より2次元のほうが相対的に得意だったりするし、動的なスケジューリングがやりやすいから
演算ユニットの利用効率を高めることができる。
カタログスペックより実効効率にフォーカスしている

623 ：デフォルトの名無しさん：2009/10/01(木) 22:05:31

NV謹製のGPGPUベンチでGeForce負けてるんだが

624 ：デフォルトの名無しさん：2009/10/01(木) 22:09:25

また低効率自慢したいのかatiは
頭が幼稚だから、何でもベンチに見えるようだし

625 ：デフォルトの名無しさん：2009/10/01(木) 22:11:27

ATIは実際のスペックじゃ
450GFもでないぞ

626 ：デフォルトの名無しさん：2009/10/01(木) 22:13:26

ベンチはIntelとNvの十八番なのに
次は体感でも語ってくれるのかな

627 ：デフォルトの名無しさん：2009/10/01(木) 22:17:17

ヤクルトが特大ヤクルトになっても
胸焼けするだけ

628 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/01(木) 22:21:52

いまだにVLIWが夢のアーキテクチャだと思ってる人いるのね
Intelが2度も大失敗してるのに

ダイナミックスケジューラを積まない代わりにその分だけ演算ユニットを大量に積むことで
性能を引き出すアプローチ。演算ユニットの分だけ性能が出るわけではない。
実効性能を高める機構を省いた分を演算ユニットの物量でカバーしてるだけ。

Efficeonは10基の演算ユニットを持ち最大8命令を同時発行できたが
実効性能は額面最大スループットが半分以下のPentium Mの足下にも及ばなかった。

629 ：デフォルトの名無しさん：2009/10/01(木) 22:31:35

次期CPUをVLIW互換でやるといって
AMDはアホだろｗ

630 ：デフォルトの名無しさん：2009/10/01(木) 22:33:20

>>628
すごいあほな質問だけど、Atiってスケジュラーなしでどうやって制御するの？

Nvidia Cudaばかり使ってるとなんだか感覚かずれる。

631 ：デフォルトの名無しさん：2009/10/01(木) 22:55:17

CPUとしてみるとVLIWは微妙だけど、アクセラレータとしては決して悪くはないだろ

632 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/01(木) 23:05:25

>>630
Radeonは複数命令列をインターリーブして流し込む単純な機構しか備えてない。
CellのPPEやAtomがやってるFGMT、あれだ。
Efficeonは自分自身で中間コード（x86コード）をネイティブコードにコンパイルできたが。

動的スケジューリングの代わりになる機能があるとすれば、それはCPUでVLIWを動的に生成するだけにすぎない。
もちろんEfficeonやJavaみたいなフィードバックコンパイルは出来ない。

じゃあLarrabeeは動的スケジューリングができるのかっていうと、もちろんソフト的にやる。
x86を使ってね。
いや、もちろんGPUとは意味が違う。Larrabeeそのものがx86プロセッサだから
自分自身でダイナミックコンパイラ・VMを動かすことができる。

633 ：デフォルトの名無しさん：2009/10/01(木) 23:18:00

LarrabeeもGT300もいつでるんだよ・・・
もう煽るの飽きてきたよ・・・

634 ：デフォルトの名無しさん：2009/10/01(木) 23:21:16

Geforce 4.8TF
Larrabee 6.2TF

635 ：デフォルトの名無しさん：2009/10/01(木) 23:24:38

多くのアプリけしょんで問題になる
デバイスメモリと共有メモリ間の転送や
カーネルの立ち上げ（全体の同期）とかは
この新しいアーキテクチャで問題が解決されるの？

636 ：,,・´∀｀・,,）っ-○○○：2009/10/01(木) 23:58:52

>>663
力抜けよ

ディスクリート版が何時でようが3～4年後にはHaswellの１構成要素だ。
GMAが売れる分だけは売れる。
シェアを狙うのに性能で勝負する必要なんて最初からないのさ。
MMXやSSEが普及したのと同様の原理で、LarrabeeのISAは浸透していく。

逆にx86を持たないがゆえに性能でしか勝負できないNVIDIAは必死だけどさ。
Larrabee側はGPUらしい固定機能ハードは積んでないからゲーム用に別のディスクリートGPU積んで
Larrabeeは物理演算プロセッサとして使ってもいいんだぜ。
そしたら共存できるじゃん。
でも、なんだかんだで「Celeronにも載ってるハードウェア」となれば費用対効果は最強だから
ゲームGPUとしてのニーズすらソフト開発者がこぞって流れる可能性はあるがな。

637 ：デフォルトの名無しさん：2009/10/02(金) 01:20:05

一ヶ月ほど前に東工大のTSUBAME2.0が単精度6PFLOPS倍精度3PFLOPS目指すけどGPUを使うって言ってたのはちゃんと宛てがあったんだな

638 ：デフォルトの名無しさん：2009/10/02(金) 01:41:08

東工大の学食は安くて旨かったなあ

639 ：デフォルトの名無しさん：2009/10/02(金) 01:50:35

つーかベンチ以外に使ってやれよ

640 ：デフォルトの名無しさん：2009/10/02(金) 02:04:35

>>636
２世代ほど交代したらIntel CPUにLarrabeeが統合されるから最強だよな　＞シェア的に
Larrabee自体がSSEに変わる命令セットの実装例だから統合するのは予定路線。

641 ：デフォルトの名無しさん：2009/10/02(金) 02:55:37

>>637
東工大はGT200でワットパフォーマンスの検証してたけど
Gt300はそれを超えてくるからな

642 ：デフォルトの名無しさん：2009/10/02(金) 03:29:18

実世界で本当にCUDAコンピューティングの時代が幕を開けそうだな

643 ：デフォルトの名無しさん：2009/10/02(金) 04:57:34

なんか賞取ったらしい
GPU Technology Conference Blog - NVIDIA
ttp://blogs.nvidia.com/gtc/2009/10/ladies-and-gentlemen-we-have-a-winner.html
Foota WWW Service
ttp://www.futatsugi.net/

644 ：デフォルトの名無しさん：2009/10/02(金) 05:45:54

GT300Fermi
http://www.4gamer.net/games/099/G009929/20090930012/
http://pc.watch.impress.co.jp/docs/column/kaigai/20091001_318463.html

645 ：デフォルトの名無しさん：2009/10/02(金) 06:06:08

http://nukkorosu.80code.com/img/nukkorosu11421.jpg

646 ：デフォルトの名無しさん：2009/10/02(金) 06:46:25

なにげにintのパフォーマンスに興味津々

647 ：デフォルトの名無しさん：2009/10/02(金) 06:49:44

ttp://www.youtube.com/watch?v=r17UOMZJbGs
Next Generation GPU Fluids

648 ：デフォルトの名無しさん：2009/10/02(金) 15:47:14

http://pc.watch.impress.co.jp/docs/news/event/20091001_318660.html
　気になるスケジュールだが、現在はシリコンがあがってきた段階で、通常、このままのペースで進めば数カ月のうちに市場に登場するHang氏は語っている。
まずはTesla製品がリリースされ、その後にGeForceやQuadroといったグラフィックス製品が登場する見込みだ。

現在はシリコンがあがってきた段階
現在はシリコンがあがってきた段階
現在はシリコンがあがってきた段階

ｗｗｗｗｗｗｗｗｗｗｗｗ

649 ：デフォルトの名無しさん：2009/10/02(金) 15:54:23

Nvidia fakes Fermi boards at GPU Technology Conference
http://www.semiaccurate.com./2009/10/01/nvidia-fakes-fermi-boards-gtc/
The board has wood screws crudely driven through it. The vents on the end plate are blocked.
The DVI connector is not soldered to anything, The SLI connectors are somewhat covered by a heat shield.
The 8-pin power connector is connected to nothing. The 6-pin connector is connected to the PCB with glue, not pins and solder.
The board is crudely chopped off with power tools. The 8-pin connector that should be there is not.
The 6-pin connector that should be there is cut. The mounting holes are too close to the edge.
There are also likely many more flaws, but this should be enough to prove a point.

In the end, what you have here is a faked Fermi board. Jen-Hsun held up a scam card.
If you watch the video here, he says, "This puppy here, is Fermi". Bullshit.

In the end, what you have here is a faked Fermi board. Jen-Hsun held up a scam card.
In the end, what you have here is a faked Fermi board. Jen-Hsun held up a scam card.
In the end, what you have here is a faked Fermi board. Jen-Hsun held up a scam card.

ｗｗｗｗｗｗｗｗｗｗｗｗ

650 ：デフォルトの名無しさん：2009/10/02(金) 17:15:14

必死の活動ごくろうさん
でも、出るのがたとえ1年遅れても
ATIが追いつくには4-5年掛かりますから

それだけ差のある構造なんだよ

演算に関しちゃATIは、何処からも全く期待されていないし

651 ：デフォルトの名無しさん：2009/10/02(金) 17:20:09

ま、パクればすぐか
得意のw

652 ：デフォルトの名無しさん：2009/10/02(金) 17:45:27

板はそれを通して木ネジを生のままで動かさせます。エンドプレートの上の通気は妨げられます。
DVIコネクタは何にもはんだ付けされないで、SLIコネクタは熱シールドでいくらか覆われています。
8ピンのパワーコネクタは何にも接続されません。 6ピンのコネクタはピンとはんだではなく、接着剤でPCBに接続されます。
板は電動工具で生のままで切り離されます。そこにあるはずである8ピンのコネクタは、そうではありません。
そこにあるはずである6ピンのコネクタは、切られます。取付け穴があまりに縁の近くにあります。
おそらくもずっと多くの欠点がありますが、これは、主張の正しいことを示すために十分であるべきです。
結局、あなたがここに持っているものは、見せかけられたフェルミ委員会です。ジェン-Hsunは詐欺のカードを上げました。
あなたがここでビデオを監視するなら、「ここのこの子犬はフェルミです。」と、彼は言います。ナンセンス。

653 ：デフォルトの名無しさん：2009/10/02(金) 17:48:19

せめて機械翻訳を参考に意訳する位の事はしたら？

654 ：デフォルトの名無しさん：2009/10/02(金) 17:57:27

そんなことできるのはエスパーくらいだろｗ

655 ：デフォルトの名無しさん：2009/10/02(金) 18:10:30

ぱくったところでAMDに開発環境やサポートの期待なんて出来るわけもない

656 ：デフォルトの名無しさん：2009/10/02(金) 18:38:49

fermi自体は粒度大きくして実効効率落としているだろ。

657 ：デフォルトの名無しさん：2009/10/02(金) 18:44:39

ｗ

658 ：デフォルトの名無しさん：2009/10/02(金) 19:00:28

理論ベクタ長を変えずに物理ベクタを増やしたら
演算に要するサイクルは？

659 ：デフォルトの名無しさん：2009/10/02(金) 19:25:30

Warp内で32のままなら32CudaCoreで処理するには1cycleってことか
分岐粒度は変わらないが、サイクルは縮むわけだ

Intel larrabeeが理論16の物理16で1cycle

ATI r600-rv870が理論64の物理16で4cycle

660 ：デフォルトの名無しさん：2009/10/02(金) 19:42:56

L1増量でサイクル稼がなくても良くなったのか？
あ、リードオンリーじゃなくなったんだっけか

CPU-GPU間転送もバックグラウンドで可能とか

661 ：デフォルトの名無しさん：2009/10/02(金) 19:58:58

カーネルプログラムのマルチスレッドも可能

662 ：デフォルトの名無しさん：2009/10/02(金) 20:10:48

偽物ボードワロタｗｗｗ

663 ：デフォルトの名無しさん：2009/10/02(金) 20:23:04

スクラッチパッドでなくてマジでキャッシュなんか？
だとしたら、ずいぶん無駄なことをしてるように思うが。

664 ：デフォルトの名無しさん：2009/10/02(金) 20:31:53

どっちでも処理内容次第で無駄はでるんじゃない。
システム、というか、デバイスの外から見た平均的な
スループットが重要なわけで、限定条件下での処理速度はどうでもいい。

665 ：デフォルトの名無しさん：2009/10/02(金) 20:37:46

つまりATIは問題外

666 ：デフォルトの名無しさん：2009/10/02(金) 20:38:29

64kb　Configurable　L1

667 ：デフォルトの名無しさん：2009/10/02(金) 20:40:33

4cycleで走るスレッド数

gt200 : 30
cypress : 20
fermi : 64

668 ：デフォルトの名無しさん：2009/10/02(金) 20:56:03

そういやGT200やFermiが600MHz台で4800や5800が1GHzに達せんばかりのクロックである事を考えると、
Pen4とCoreの対比とダブるな。
AMDはこれから苦しくなる？

669 ：デフォルトの名無しさん：2009/10/02(金) 21:00:08

Geforceはシェーダーが1GHzオーバーで動いてるだろ
まあそこは先進的で、ポジティブな部分だが

670 ：デフォルトの名無しさん：2009/10/02(金) 21:13:25

int,fp並列可能なfermiは命令数でもcypressを上回るな(4cycle)
cypress : 20*5=100
fermi : 16*2*4=128

あと、実際には演算パートのクロックは2倍程度違うしな

671 ：デフォルトの名無しさん：2009/10/02(金) 21:45:46

ATI換算だとGT300は6.1TFだってな

672 ：デフォルトの名無しさん：2009/10/03(土) 11:37:58

>>668
糞ビスタのせいで買い控えされてたＰＣが
７の発売と同時に更新される。
超性能ではなくとも、年末に製品をそろえたラデが一人勝ちする。
その後はまた買い控えが始まるので、そのころ出すゲフォは苦しくなる。
収入がなくなれば開発は進まなくなる。

年がら年中苦しいＡＭＤは変わらず。

673 ：デフォルトの名無しさん：2009/10/03(土) 11:58:13

>>671
どうやって計算したらそうなるの？
SFUの演算を20倍するとか？

674 ：デフォルトの名無しさん：2009/10/03(土) 16:22:11

>>672
TSUBAME2.0とかの大量納入の話が無かったらnVidia積んでたよな

675 ：デフォルトの名無しさん：2009/10/03(土) 16:53:36

将来的に一番苦しいのはNVIDIAだろう
インテルのララビーとＡＭＤのラデに挟撃され、
さらに、将来はＣＰＵにＧＰＵコアが取り込まれる予定
インテルはチップの動作デモを行った
ＧＰＵなんてGeForce9600あたりで、ほとんどのゲームが出来るんだし
ミドルレンジ以下のＧＰＵは売れなくなる可能性だってある
ＨＰＣ分野で見ても、ララビーやセルに勝てるのか微妙だし

676 ：デフォルトの名無しさん：2009/10/03(土) 17:15:37

一番どうでもいいのはAMDだからw
CPUもGPUも取りえが無い

677 ：デフォルトの名無しさん：2009/10/03(土) 17:32:27

正直RV870を見て、AMDへの興味はゼロになりました。

678 ：デフォルトの名無しさん：2009/10/03(土) 18:08:32

おなじく

679 ：デフォルトの名無しさん：2009/10/03(土) 18:17:17

>>677
RV870のおかげで
GT300は250ドル以下だぞ

680 ：デフォルトの名無しさん：2009/10/03(土) 18:18:35

なんで潰れる潰れないの話になるんだろ。
投資家の方ですか？

681 ：デフォルトの名無しさん：2009/10/03(土) 18:27:14

>>679
無理
あんなものじゃ到底無理

682 ：デフォルトの名無しさん：2009/10/03(土) 19:07:11

>>679をCPUで置き換えてみよう
Phenomのおかげで
Corei7は250ドル以下だぞ

683 ：デフォルトの名無しさん：2009/10/03(土) 19:36:02

あほかGT300を＄250っていくらなんでも貧民向けに出すからといってそんな値段でだすと倒産するわ
ベンチとってEvergreenや自社旧製品と比べてあとは歩留まりやダイサイズを加味した値段でおそらくごく少数が出回るだけだろうね
すごいすごいと言われても結局はミドル以下に弾を出せないと意味ないけどね

684 ：デフォルトの名無しさん：2009/10/03(土) 19:37:44

Intel上級研究員「AMDにつぶれてもらっては(司法省との絡みで)困る」

685 ：デフォルトの名無しさん：2009/10/03(土) 19:40:14

なんか必死すぎてウザイ

686 ：デフォルトの名無しさん：2009/10/03(土) 21:28:07

AMDはインテルを超えるマルチコア技術を持っているし、先行きは暗くない
対してNVIDIAは将来売る製品がない
どっちがやばいのかは明白

大体、GT300発売は来年夏ぐらいだろ
そのころにはAMDのラデオンの新作がハイエンドからミドルレンジ、ローレンジまで
展開しているし、ララビーも製品化されている可能性もある

さらに後１年以内には、AMDもインテルもGPUをCPU内部に統合した製品を出すだろう
一般人どころか平均的な性能で満足する大部分のゲーマーだって、性能的にはこれで十分なんだよね

NVIDIAはもう終わりだよ

687 ：デフォルトの名無しさん：2009/10/03(土) 21:29:52

自作板でやってもらえませんか

688 ：デフォルトの名無しさん：2009/10/03(土) 21:31:55

＞AMDはインテルを超えるマルチコア技術を持っているし

＞AMDはインテルを超えるマルチコア技術を持っているし

＞AMDはインテルを超えるマルチコア技術を持っているし

増量ですねｗ

689 ：デフォルトの名無しさん：2009/10/03(土) 21:38:04

NVIDIAが唯一先行しているのがGPGPU
しかし、GPGPU分野もインテルのララビーから激しく追い上げられるし
対して金になる分野にも思えない
消費電力だってCellに完敗
GPGPU向けに無駄な改良をしてしまったためにGPUとしても不恰好で
AMDの製品群に追い詰められつつあるNVIDIA

もう完全につんでいます

690 ：デフォルトの名無しさん：2009/10/03(土) 21:41:42

>>689
GPGPUの成長予測だとあと5年もすれば
10億ドル市場になるっていわれているけどね

691 ：デフォルトの名無しさん：2009/10/03(土) 21:45:15

5年後の市場がそうでも、そこへの投資が早すぎてGPU市場がおざなりになったらVoodooの二の舞になるぞ
IT産業で5年ってシェアがひっくり返るには十分過ぎる時間だからな

692 ：デフォルトの名無しさん：2009/10/03(土) 21:46:05

>>690
CPUにGPUコアが封入された時点でゲームセット
わざわざグラフィックのために何万円も出してGPUを買う時代が終焉する

ゲーマーだって、大部分はミドルレンジクラスのGPUでゲームをやってるんだよ？
実際には、GPUに金なんてかけなくないの
安くてゲームがそれなりの性能で切るんならそれで我慢する

だいたいGPGPU分野ではキラーアプリが存在しない
だれがGPGPU向けの製品を買うの？

693 ：デフォルトの名無しさん：2009/10/03(土) 21:46:57

GPGPUのキラーアプリはソフトウェアレンダラー

694 ：デフォルトの名無しさん：2009/10/03(土) 21:49:12

何か的外れなこと言ってる奴がいるね
ララビーはいまだ実用化にいたらず苦戦中でしょ
GPUとしての性能がGeforceやRadeonには勝てず、
将来的にも当分は勝負にならない
Cellなんか個人のPC用途では、土俵が違うし

695 ：デフォルトの名無しさん：2009/10/03(土) 21:59:21

>>694
ララビーは既にサンプルが主要メーカに配られてる
製品化は近いと考えられる
性能はトップの製品に劣るとみられているけど、メインストリームでは
NVIDIAやAMDの脅威になりうるし、ここを奪われたら致命傷になる

Cellは個人用ＰＣでは使われないが、現状ではGPGPUだってそれは同じこと

696 ：,,・´∀｀・,,）っ-○○○：2009/10/03(土) 22:00:46

「GP」GPUのスレで的外れなことを言ってるね

697 ：,,・´∀｀・,,）っ-○○○：2009/10/03(土) 22:02:06

おっと
>>694

698 ：デフォルトの名無しさん：2009/10/03(土) 22:04:03

>>694
実機デモやったばかりだろ…

699 ：デフォルトの名無しさん：2009/10/03(土) 22:04:30

でかくて消費電力も馬鹿食い、それでいて性能も微妙に劣る
それがララビー

700 ：デフォルトの名無しさん：2009/10/03(土) 22:06:57

何か勘違いしているようだけどAMDなんか元々注目されていないから
むしろRV870とGT300の発表を以って終了致しましただから
Larrabeeが争ってるのはGT300だから
現実と妄想の壁は厚いのよ

701 ：デフォルトの名無しさん：2009/10/03(土) 22:08:57

今日もハリボテ信者が発狂してるなｗｗｗｗ

702 ：デフォルトの名無しさん：2009/10/03(土) 22:11:26

勝負とか言ってるけどGT300じゃLarrabeeに勝てないよ

703 ：デフォルトの名無しさん：2009/10/03(土) 22:16:21

Larrabeeは2012年に
今のノート用のCorei7をシュリンクしたものを最低64個
搭載するけどね

普通に特定用途なら16TFぐらい余裕

704 ：デフォルトの名無しさん：2009/10/03(土) 22:19:45

じゃあ2012年になったらLarrabeeがどうとか言い出せよw

705 ：デフォルトの名無しさん：2009/10/03(土) 22:26:08

NVIDIAがかわいそう過ぎる
GPGPUを意識しすぎてGTX300なんて作ろうとしちゃってさ
得意のグラフィック用のGPUを作っていれば、滅びることのなかったのに

GTX300が出る来年夏ごろまでには、グラフィックス市場はAMDが制しているだろうね

NVIDIAはハイエンド専業メーカとして生き残るしか道はないのかな
売り上げは今の１０分の１ぐらいになるだろうけど

706 ：デフォルトの名無しさん：2009/10/03(土) 22:28:12

おまいらいいかげん自作板カエレ
人に迷惑掛けるなと幼稚園でおそわっただろ？

707 ：デフォルトの名無しさん：2009/10/03(土) 22:32:07

ClearSpeedの呪い

708 ：デフォルトの名無しさん：2009/10/03(土) 22:36:25

ATiの戦略って、
そこそこのコアをマルチチップ構成にして
ミドルからハイエンドをサポートするって感じかな？
個人的には悪くないと思うなぁ。
つーか、GPUにC++サポートとかそういうリッチな機能必要？
FORTRANやHLSL程度が走ればいいんじゃないの？

709 ：,,・´∀｀・,,）っ-○○○：2009/10/03(土) 22:37:24

オンボードのシェアばかり拡大していくのが市場の宿命です。
いつまでもゲームはディスクリートGPUの需要を引っ張らない。

ゲームってさ、ハイエンド前提で作るんじゃなくて、普及価格帯のGPUを
Larrabeeはディスクリート版だけではなく、GMA後継としてPC用GPUとして
最底辺の性能をもって、かつCeleron, Pentium DCのチップの隣に混載という
無敵の最高普及レンジに君臨するわけよ。

どうなるかわかるだろ？
PCゲームソフトメーカーは自分たちのタイトルのグラフィックパフォーマンスの
最低性能の底上げとして、いやでもLarrabeeに特化した最適化をやらざるを得なくなるわけ。
いやでも使いこなせるようになるわけ。
GPUとしての性能が低いってのも有る意味確信犯だよ。

GMAを抜いたPCゲーム市場なんて縮小するばかりでジリ貧でしかないからな。
GPUがでかくなってもソフトメーカーは儲からない。

だからこそNVIDIAはDirectXの最新API対応なんぞに見切りをつけ
ごく小数の商用ソフトメーカーに支援をして架空のGPGPUブームをでっちあげ、
ニーズを補填しようとしてるわけ。
ただゲームソフト市場が今後使えない市場という認識だけはあるらしいが
もう尻に火が付いてるから動かざるを得ない。
NVIDIAですらGPGPUをやるのに前向きな理由なんてないんだよ。

しかしまあそのGPGPUという市場すら、CPU側のSIMD性能が向上して
GPGPUでやるのが馬鹿馬鹿しいって雰囲気になったら終息に向かう。
もしSandy Bridgeで1コアあたりのSIMD性能が3倍程度になるなら、
GPGPUでの相対的な性能向上効果は1/3になるってことだからな。

710 ：デフォルトの名無しさん：2009/10/03(土) 22:40:07

行くも地獄、戻るも地獄のNvidia…

711 ：デフォルトの名無しさん：2009/10/03(土) 22:43:38

3dfxの呪い　Voodooの呪い

712 ：デフォルトの名無しさん：2009/10/03(土) 22:48:55

GPUって
FPSでHeadShotして「ｨﾔｯﾎｳ!」言ってる層しか買わないもんだと思ってました

713 ：デフォルトの名無しさん：2009/10/03(土) 22:49:06

アホか
今のゲーム業界はIntel GMAなんてまるで無視してるじゃん

714 ：,,・´∀｀・,,）っ-○○○：2009/10/03(土) 22:51:28

もう既にGMAでも動くライトなゲームのほうがマーケット大きいけど？

715 ：デフォルトの名無しさん：2009/10/03(土) 22:52:40

LarrabeeがGMAの後継か、ｲﾝﾃﾙの貪欲さがよくわかるね

716 ：デフォルトの名無しさん：2009/10/03(土) 22:59:07

くやしかったの？

717 ：,,・´∀｀・,,）っ-○○○：2009/10/03(土) 23:00:17

自分自身が既にPC用GPUの50パーセントのシェア持ってるんだ。
そりゃ置き換えるだろう。

NVIDIAはNVIDIAで
まだエンドユーザーはDX9で遊んでるのに、
DX11とか立ち上げるのはゲームソフトメーカーいじめだ
とかわけのわからないことを言ってるし

718 ：デフォルトの名無しさん：2009/10/03(土) 23:02:34

>>714
なにそれ？
具体的なゲームの名前挙げてみてよ
聞いたことないんだけど
Geforceの～～以上とかそういうのが時期を経て
GMAでも動かせるようになってきただけだd路

719 ：デフォルトの名無しさん：2009/10/03(土) 23:04:58

>>717
Nvidiaにとって
DX11はチューニング難しいからな
かなり苦慮してるし

720 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/03(土) 23:07:47

続々生まれてる韓流（笑）基本無料オンラインゲームは昔からGMA程度で動くが。

721 ：デフォルトの名無しさん：2009/10/03(土) 23:08:22

>>715
それ、失敗の呪文にしか聞こえないんだがｗ

722 ：デフォルトの名無しさん：2009/10/03(土) 23:11:32

>>720
有名どころのリネージュ2とかThe Tower of AIONとかは
GeforceやRadeonでしか動かなかったけど

723 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/03(土) 23:11:32

http://www.4gamer.net/games/036/G003691/20090227016/

ディスクリートGPUを買ってやるゲームが成長性のある市場だなんて
誰も思ってないよ。

724 ：デフォルトの名無しさん：2009/10/03(土) 23:15:18

そもそもM$様も@pple様もIntel様も
AMDの糞野郎ですら

ゲーム市場は毎年200億円ずつ市場規模が縮小していって
価値のない分野として見捨てはじめてるんだよ

725 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/03(土) 23:18:05

リネージュ2あたりはNVIDIAが支援したタイトルの典型なんですが
NVIDIAはCUDAに肩入れした分ゲームソフト向けの支援は渋ってるから
今後そういうタイトルは減るばかりだよ。

まあこの辺見ろよ。GMAでも動くクラスのゲームは成長してる。
http://eir.eol.co.jp/EIR/View.aspx?template=ir_material&sid=2451&code=3812

726 ：デフォルトの名無しさん：2009/10/03(土) 23:18:28

売り上げの３分の１を占めるチップセット市場で、インテルとＡＭＤに締め出しを暮らし
死亡が確定

ＧＰＵ自体もハイエンドの一部ユーザーにしか見向きがされなくなりつつあり

ＧＰＧＰＵもＣＰＵのマルチコア化、ＳＩＭＤ命令の強化で微妙になりつつある

ＮＶＩＤＩＡはこれから先どうするんだろうね

727 ：デフォルトの名無しさん：2009/10/03(土) 23:28:12

お前ら至急葬儀会場にお戻りやがれｗ

728 ：デフォルトの名無しさん：2009/10/03(土) 23:29:18

ゲロビディアはチップセット事業の
撤退で来年以降200億円近く損失が発生する

GPUでどうにかして補填しないと後が無い状況になる
資金調達やばいし

729 ：デフォルトの名無しさん：2009/10/03(土) 23:30:04

つまりSandyやFusionが今後のトレンドになるのは確定的に明らか

730 ：デフォルトの名無しさん：2009/10/03(土) 23:39:55

AMDちゃんとFusionsしたい

731 ：デフォルトの名無しさん：2009/10/03(土) 23:45:28

来年の事を云うと鬼が笑う、ってな。
とりあえずGPGPUスレの人間としては、現状ではまだ市場に存在しないLarrabeeや動く実装を提供しないAMDではなく
NVIDIAを使うしかない。
メーカーの先行き予測論争なら板違いだから、まとめて自作PC板にでも行ってくれ。

732 ：デフォルトの名無しさん：2009/10/03(土) 23:50:30

>>731
>来年の事を云うと鬼が笑う、ってな。
まぁそれはいいけどｗGPGPUで資金調達失敗しているという
事実はどうするんですかね？評価下がるかもって予測あるし

動くものだけを追いかけていると、良い成果は得られないよ

733 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/03(土) 23:52:32

まあ潰しのきかない技術に見切りつけたいって人はいるんじゃないかと。
鳴る物いりで登場したCellのスレは今お葬式モードだし。
あそこの英語プログラミングマニュアルが出たときの盛況っぷり知ってるからな

俺は現世代飽きてSandy Bridgeのシミュレータで遊んでるような人種だからな

734 ：デフォルトの名無しさん：2009/10/03(土) 23:54:18

>>733
おもしろそーだな
俺もまぜてくれよ

735 ：デフォルトの名無しさん：2009/10/03(土) 23:56:30

良い成果とはこのスレに転がってるどうでもいい御託のことか？

736 ：デフォルトの名無しさん：2009/10/03(土) 23:58:16

>>755
まさかCorei7のシングルスレッドとCUDAを比較し、CUDAが有利と
頭に蛆がわいてるレベルの論文の方が有用だと言いたいのか？

737 ：デフォルトの名無しさん：2009/10/04(日) 00:08:43

さあ、>>755に期待がかかります。

738 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/04(日) 00:09:59

>>736
多くの大学の研究室は貧乏なんだぜ
NVIDIAはGPGPUの宣伝のためなら端金に糸目は付けない
Intelは黙ってても売れる製品の販促なんてやらないが

739 ：デフォルトの名無しさん：2009/10/04(日) 00:49:40

>>731
Brook+とCALは実装あるだろ

740 ：デフォルトの名無しさん：2009/10/04(日) 01:38:57

GPGPU自体の将来性も怪しいけどな
CPUがメニーコア化したらすぐに終わるんだが
ソフトウェアの対応がないから、一般向けでは
最大で４コア以上は、提供しなさそうな感じだし
HPC研究者的には、なんとも先の読めない面倒な状況だよね

741 ：デフォルトの名無しさん：2009/10/04(日) 01:45:35

目にーコアかしてもCPUじゃぱふぃーが悪いかん。
今現在でも4コアいじょいら年じゃね除隊

742 ：デフォルトの名無しさん：2009/10/04(日) 01:50:34

>>741
後藤さんのインテル技術者へのインタビューでも４コア以上は提供しないっぽいことを
インテルの技術者がいってるしね
代わりに、GPUコアの搭載とチップ面積の小型化を選択したようだ

743 ：デフォルトの名無しさん：2009/10/04(日) 02:13:30

GPU Technology Conferenceに行ってきたが、かなりひどかったね。
CPUとの比較はほどんどが、シングルコア。かたやTeslaときたもんだ。
NVIDIAもこんな発表させるなよと思うが、そういう発表も無いよりましだから仕方が無いか。
まあ多くのケースでTeslaの方が速いのだが、マルチコアとだとインパクトが下がるしなあ。でもCPU使うならせめてOpenMPくらいは使えよと思う。

744 ：デフォルトの名無しさん：2009/10/04(日) 03:12:54

>>731
来年のこととはGT300のことですねｗｗｗ

745 ：デフォルトの名無しさん：2009/10/04(日) 03:29:49

>>731
現状ではNVIDIAのCUDAを使うのがベストなのは分かるが
性能を出すための勉強を今してもGT300が出ると無駄になる
かもしれないと考えると、やる気がなくなるよな

並列アルゴリズムの勉強を一生懸命したほうがよさそうだ

746 ：デフォルトの名無しさん：2009/10/04(日) 03:54:26

現在、Larrabeeに備えて何を勉強しておけばいいの？

747 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/04(日) 04:00:15

Larrabeeを汎用演算に使うって要するにx86ベースのCPUをそのまんまCPUとして使うってことだからな

【組み込み関数派】
*mmintrin.hで書いたSSEプログラムをLarrabee Prototype Libraryに移植

【高級言語派】
Ctを予習しておく

【OpenCL派】
とりあえずCUDAでもなんでも使っとけ

【アセンブラ派】
だんご食べる？

生産性とパフォーマンスのバランス的に美味しいのはCtじゃないかと思う。

748 ：デフォルトの名無しさん：2009/10/04(日) 04:50:37

Ctはインテル特化の技術
つぶしを効かしたいならOpenCL

749 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/04(日) 05:38:43

CtはLarrabeeに限らずx86 CPU用のSIMD/マルチコアを包括するフレームワークだ。
SSEからAVX, Larrabeeおよび今後のIntel SIMD拡張命令及びマルチコアに対応するコードを透過的に記述出来る。
Cコンテナに対する演算の記法がC++のテンプレートそのものなのである意味で再利用性はある。

かたやOpenCLは事実上のGPU専用言語。
普通のCPUでも動くコードが書けるってのはメリットに見せかけて、再帰すら書けなかったり、
Cと比べて制約が多い。
CPUでだけ使う場合に既製のコードをOpenCLに移植するメリットが基本的に無い。

潰しがきくのはどっちかは明らかだと思うが。

750 ：デフォルトの名無しさん：2009/10/04(日) 07:52:55

NV自体CPUとの連携が重要と言っているのに
CPUどうするのかというプランが具体的に明らかに
されていない点が一番危ないな。
結局CPU内蔵する方向に行くしかないのに。
ARMでいくのかね。

751 ：デフォルトの名無しさん：2009/10/04(日) 08:08:01

CADソフトやBlenderなどはGeforceじゃなきゃ話にならんよ
一部のゲームもな
結局互換性で勝つ

752 ：デフォルトの名無しさん：2009/10/04(日) 08:54:47

>>749
CUDAとかでCPUコードを書くのはデバッグのためでしょ。
>CPUでだけ使う場合に既製のコードをOpenCLに移植するメリットが基本的に無い。
何を自明なことを

753 ：デフォルトの名無しさん：2009/10/04(日) 09:32:45

＞OpenCLは帰起さえ書けない

じゃ団子が帰起を使えるようにいろいろ改良したOpenCL+を作れば良いんだ

754 ：デフォルトの名無しさん：2009/10/04(日) 09:34:30

あ
× 帰起
○ 再帰

755 ：デフォルトの名無しさん：2009/10/04(日) 10:06:24

OpenCLで再起実装できないでしょ
Applesも現時点のいずれのアーキテクチャ
でも不可能だって諦めてるし

756 ：デフォルトの名無しさん：2009/10/04(日) 10:06:29

と言うかopenCLを走らせるようなマシンで再帰使うのって効率的にどうよ？
そもそもGPUでまともに再帰使えるんか？

757 ：デフォルトの名無しさん：2009/10/04(日) 10:08:30

>>733
> 鳴る物いりで登場したCellのスレは今お葬式モードだし。
Cellスレどこよ？見つからないんだが。

758 ：デフォルトの名無しさん：2009/10/04(日) 10:14:03

CELL
http://pc12.2ch.net/test/read.cgi/tech/1249915266/
なんでみつからないのかがわからない

759 ：デフォルトの名無しさん：2009/10/04(日) 10:41:28

OpenCL自体が劣化CUDAだろ

760 ：デフォルトの名無しさん：2009/10/04(日) 11:06:10

CUDAはNV製品に特化して作られた言語
OpenCLはそれをベースに、汎用的にどのGPUでもそれなりに動いてくれるように作られた言語
そりゃ、後者が機能で前者に劣るのは当然

761 ：デフォルトの名無しさん：2009/10/04(日) 11:18:55

性能出るようにOpenCLを作り直せばいいじゃん

762 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/04(日) 11:33:50

>>756
無理

ワープ単位で命令ポインタが同じ方向にしか動かせないから
似非スカラを辞めない限り無理
言語レベルで分岐があればネイティブコードレベルではプレディケートで両方のパスを実行

とろくさいこと山の如し

LarrabeeはベクトルをC++的なあのベクトルとして扱ってるからいざとなればスカラに落とし込むことで
再帰を表現可能。
もちろんその時同じハードウェアスレッド内の要素は並列処理じゃなくて逐次処理になる。

extactps rcx, xmm0, 0
call procN
extactps rcx, xmm0, 1
call procN
extactps rcx, xmm0, 2
call procN
extactps rcx, xmm0, 3
call procN

763 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/04(日) 11:34:55

↑はSSEの4並列処理の場合
スカラに落とし込むときのイメージとしてはこんな感じね

764 ：デフォルトの名無しさん：2009/10/04(日) 11:39:32

末尾再帰をループにするくらいじゃね。
文法上再帰を許しても、ループに出来ない場合
コンパイル時にエラーが出るとか。

765 ：デフォルトの名無しさん：2009/10/04(日) 11:47:45

RadeonはR600以降で32段までの関数呼び出しが可能

766 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/04(日) 11:48:02

ループの場合って、ハード的にはそれぞれ終端に達した要素からプレディケートレジスタのビットを落としていって
最終的に0になったときに全部一緒に抜けるんだよな

767 ：デフォルトの名無しさん：2009/10/04(日) 18:17:12

Larrabeeなんて2年以上選択肢からは外れるのは確定的なんだから
今Larrabeeの話しなんかしててもしょうがない
現状ではnVidia一択
今後AMDやIntelが良くなればそのときに買い換えればよい
グラボなんて別に高くないし、取り替えられるのだから

768 ：デフォルトの名無しさん：2009/10/04(日) 18:19:56

いいね
金持ちは

769 ：デフォルトの名無しさん：2009/10/04(日) 18:40:28

>>767
Larrabeeはハードを140ドル未満で投入してくるぞ

770 ：デフォルトの名無しさん：2009/10/04(日) 18:48:53

>>768
じゃあ、貧乏人だったらLarrabeeを今買うか？
そんなの不可能だろう？
貧乏人であってもLarrabeeなんて不毛な話だよ

771 ：デフォルトの名無しさん：2009/10/04(日) 18:50:03

>>769
いやだからそれは2年後に考えればいいということだろ。

将来性とか考えずに今現在の時点で費用対効果を考えればnVidia一択であると>>767は言ってるんだから。

772 ：デフォルトの名無しさん：2009/10/04(日) 19:04:07

>>771
>>769の主張だと足並み揃う2年後でよくねって思うけど
NVidiaがドカタ言語に仕上げてくれるなら今から取り組む価値はあるけど

だんごと一緒にLarrabeeのシミュレータで遊んでいたほうが
有意義だと思う

773 ：デフォルトの名無しさん：2009/10/04(日) 19:06:54

larrabeeがIGPに組まれれば
他社製品は意味をなくす

774 ：デフォルトの名無しさん：2009/10/04(日) 19:14:07

larrabeeなんて今の段階では商品になるかどうかすら危うい
シミュレータで遊ぶにしても2年は長い

775 ：デフォルトの名無しさん：2009/10/04(日) 19:20:46

NVidiaしか選択肢がないと言ってる人間多いけど
実際GT300って今年中に出るの？

776 ：デフォルトの名無しさん：2009/10/04(日) 19:36:36

>>775
多分来年の春ごろ
夏ごろになる可能性もある
それまではAMDがグラボ市場の覇者

そして、再来年の春にはGPU搭載CPUが発売され
ゲーマーがGPUを購入する時代が終焉する

今のGPUはGPGPU用のアクセラレーターとしての価値しかなくなる

ちなみに、NVは売り上げの３分の１を占めるチップセット市場からも
撤退を余儀なくされている

数年以内にNVはまともの売れる製品がなくなる
さよなら、NV

　　　　　　,,,
(　ﾟдﾟ)つ┃

777 ：デフォルトの名無しさん：2009/10/04(日) 19:45:15

鬱陶しいから帰れ

778 ：デフォルトの名無しさん：2009/10/04(日) 19:49:40

どうせintelが残るだけ

779 ：デフォルトの名無しさん：2009/10/04(日) 20:10:25

今は性能でAMDが優位といってもGPGPUに限れば開発環境などの関係で、
実質的にnVidiaしか選択肢ないんだよ
悲しいことに

780 ：デフォルトの名無しさん：2009/10/04(日) 20:38:04

性能で優位なんて初耳

781 ：デフォルトの名無しさん：2009/10/04(日) 20:40:07

デベロッパーが扱いづらい今のRadeonをCPUに統合しても何もいいことないんじゃない？
平行で新設計のGPUでもつくってんのかね？AMDは

782 ：デフォルトの名無しさん：2009/10/04(日) 20:47:27

fusionでcpuと一体化する分、さらに単純なアレイプロセッサ化していくんじゃねぇの？

783 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/04(日) 21:01:17

半精度・単精度変換命令をCPU側に実装する分GPU側の回路削られそうだな

784 ：デフォルトの名無しさん：2009/10/04(日) 21:09:17

そんな回路ゴミみたいなものだろ。
bit切り出しと単純な例外処理だけじゃない。

785 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/04(日) 21:19:02

そうか。Larrabeeがコア毎に持ってるけどそんな密度じゃないのね。
Intelがやる理由はキャッシュ容量・メインVRAM帯域の節約のためらしいが。

786 ：デフォルトの名無しさん：2009/10/04(日) 21:21:52

このスレでさえGPGPUの未来について希望的な観測がないのかよ

787 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/04(日) 21:24:18

なんせ逆神Fixstars様がついておられるからな

788 ：デフォルトの名無しさん：2009/10/04(日) 21:26:28

N社はモックアップをESだと言っちゃう悲惨な状況だからねえ
Larrabeeでさえデモやってるのに

789 ：デフォルトの名無しさん：2009/10/04(日) 21:31:01

OpenGLとかDirectXはLarrabeeでも使えるんですか？

790 ：デフォルトの名無しさん：2009/10/04(日) 21:35:24

何でも使えるだろソフトなんだから
それこそglideとかHEIDIもやろうと思えば

791 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/04(日) 21:36:53

LarrabeeにとってはGPUはアプリケーションだからな

PCSX2のGSエミュとかやらせたらフレームレートと再現度両立できそうだって
開発者が言ってたりする

792 ：デフォルトの名無しさん：2009/10/04(日) 23:48:14

あれ、だんごって一時期はララビ批判してなかったっけ
しばらくこの板来てなかったから記憶が定かでないが

793 ：デフォルトの名無しさん：2009/10/04(日) 23:53:28

>>792
俺が改心させてやった

794 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/04(日) 23:57:13

してねーよ

批判してるのは先見性の無い奴だけ

方向性は正しいだろ
まあAMDがBulldozerをあっさりAVX互換化したくらいだし
FusionがLRBni互換になっても何ら不思議じゃない

795 ：デフォルトの名無しさん：2009/10/05(月) 00:11:09

団子は一流のセールスマンになれる
転職をおすすめしとく

796 ：デフォルトの名無しさん：2009/10/05(月) 00:12:30

団子って、何歳？
まだ20代だったらお友達になって欲しい。

797 ：,,・´∀｀・,,）っ-○○○：2009/10/05(月) 00:16:29

俺顧客サポートの仕事やってるけど

798 ：デフォルトの名無しさん：2009/10/05(月) 00:17:05

先見性があっても出なかった製品なんぞいくらでもある
SEDとか

799 ：デフォルトの名無しさん：2009/10/05(月) 00:19:07

また出会い厨かよ

800 ：デフォルトの名無しさん：2009/10/05(月) 00:23:45

>>798
で？

801 ：,,・´∀｀・,,）っ-○○○：2009/10/05(月) 00:24:36

技術要因だけで市場を制することはできん。

ゲーム業界には、前世代で圧倒的な勝利を飾ったのに後継機種で会社傾けるほどの大赤字
なんて例もあるからね。
ただIntelはマーケティングを含めて隙がなさ過ぎる。

Intelは22nmが順調に微細化できれば2～4コア＋Larrabee 8コアくらいの統合チップ出してくるだろうよ

802 ：デフォルトの名無しさん：2009/10/05(月) 00:31:06

MACヲタってどうなったの？

803 ：デフォルトの名無しさん：2009/10/05(月) 00:32:09

それなら普通に10～12コアのCPUを出すほうがよくね？
で、いつものゴミオンボつけて売り出す
情弱向けに誇大広告うてば勝手に売れてく
いつものパターン

804 ：デフォルトの名無しさん：2009/10/05(月) 00:32:18

>>802
獲物のアム厨がレッドブックに載ったので名無しに戻ったらしい

805 ：デフォルトの名無しさん：2009/10/05(月) 00:37:19

>>804
なんじゃそりゃ。
Cellとともに滅びたのかと思ってた。

806 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/05(月) 00:39:31

>>803
そのゴミオンボの後継がLarrabeeなんだが。
SIMD以外はシンプルにしないと10～12コアなんて載らないよ。
8コアくらいでも22nmになれば70～80mm²になる。
これは32nmのSandy Bridgeに載るGPUと同程度。

807 ：デフォルトの名無しさん：2009/10/05(月) 03:54:15

オンボ用にカットした物なんて性能低いじゃん
そんなものは今までGPUだった分のトランジスタも活用できる程度でしかない
TSMCも1年遅れ程度になってきたからあまり優位に立てないのもあるが
CPUはもう限界だしそんなに速くなくてもGPU(Larrabee)があるし…とIntel自身が白状している
Larrabeeは全方位アクセラレーターだ

808 ：デフォルトの名無しさん：2009/10/05(月) 04:18:11

日本語でおｋ

809 ：デフォルトの名無しさん：2009/10/05(月) 05:28:04

設計良くてもTSMCがどうにかならん事にはなあ。
外注受けてるとこでここより技術が上なのはGFしかないし。

810 ：デフォルトの名無しさん：2009/10/05(月) 05:38:04

GFが上とかｗｗｗ

811 ：デフォルトの名無しさん：2009/10/05(月) 21:31:04

SOIにしろ、金だけ払ってIBMに丸投げしてるだけなんだけどな

812 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/05(月) 22:48:51

>>807
その上でだ。
Larrabeeは8コアあればNVIDIA換算で128SPくらいだよな。

813 ：デフォルトの名無しさん：2009/10/05(月) 23:26:44

2009年9月18日 (金)
PixeluxとAMD、Digital Molecular Matterエンジン向けのOpenCLアクセラレーションを開発
ttp://khronos.jp/news/2009/09/pixeluxamddigit.html

PixeluxはAMDと共同で、Digital Molecular Matterエンジン向けのOpenCLアクセラレーションを開発しています。
Pixeluxはルーカス・フィルムで特殊効果制作に使用された Digital Molecular Matterエンジンを開発しています。

ってことはクローズに数千ドルの融資を獲得したから
オープンにしてレッドオーシャンで戦う必要はないんだな

814 ：デフォルトの名無しさん：2009/10/05(月) 23:34:06

intel Ctのプレゼンで16コアとか25コアが出てくるんですが
あれいつの話になるんですかね？

815 ：デフォルトの名無しさん：2009/10/05(月) 23:35:43

出てくるときに３２コアといううわさもある

816 ：デフォルトの名無しさん：2009/10/05(月) 23:37:05

ドイツでラトナーが32コア2GHzと明かしたな

817 ：デフォルトの名無しさん：2009/10/05(月) 23:37:32

>>815
来年ならデモ機レベルで64コア出せるって言ってるよ

818 ：デフォルトの名無しさん：2009/10/06(火) 00:06:20

ディスクリートの方はその位で出すでしょ
「GPUとして」GTX280レベルを出すならその位要る

819 ：デフォルトの名無しさん：2009/10/06(火) 00:10:04

脳内ソース来ました

820 ：デフォルトの名無しさん：2009/10/06(火) 01:28:50

例えNVより効率悪くても、プロセス技術に物言わせて超高回転化でカバー可能だからきついな

821 ：デフォルトの名無しさん：2009/10/06(火) 08:08:21

>>820
同意。
俺もCPUの論争で散々言ったが、Intelはプロセス技術にもの言わせてるだけだよな。

団子がPPCのヘタレっぷりとVLIWのItaniumを槍玉に挙げてx86最強とか、
未だにRISCだのCISCだのニュースの記事を鵜呑みにしたような事を言っているのを聞くと、
それは違うんじゃないかと言いたくなる。

822 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/06(火) 08:50:47

PPC G4が【同クロック】のAtomに負けてもそう思うか？

823 ：デフォルトの名無しさん：2009/10/06(火) 08:52:39

はいはい負け惜しみ負け惜しみ

824 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/06(火) 09:13:29

少なくともAtomに関してはSoC製造をTSMCに委託できるように契約してるし
キツキツにチューンしてるわけではないようだが。

デコーダ側が2命令/clkなのにLoad + 演算 + Storeを同時発行できるのは
少なくともRISCみたいな2～4バイト固定のフォーマットじゃ出来ない芸当だ。

あと、Itaniumは例外視すべきじゃないよ。最強のプロセス技術をもってしてアレなんだろ？
逃げるのはただの詭弁でしかない。

825 ：デフォルトの名無しさん：2009/10/06(火) 11:33:37

未だにRISC信者いるのがきもい
整数演算性能に関していえばRISC ISAは前世紀に事実上死んでる
当時のSPECint見てみればわかるが、所詮はキャッシュメモリの容量で
性能稼いでただけのハリボテということが露見している

---------------------------------------
Model Name: TDZ300
CPU: 200MHz Pentium Pro Processor
FPU: Integrated
Number of CPU(s): 1
Primary Cache: 8KBI+8KBD / Secondary Cache: 256KB(I+D)

SPECint95 8.04 / SPECint_base95 8.04 ※95年12月登録
http://www.spec.org/cpu95/results/res9512/p040.html

Model Name: RS/6000 43P-140
CPU: 200 MHz PowerPC 604e
FPU: Integrated
Number of CPU(s): 1
Primary Cache: 32KBI+32KBD on chip / Secondary Cache: 1MB(I+D) off chip

SPECint95 7.79 / SPECint_base95 6.99 ※97年4月登録
http://www.spec.org/cpu95/results/res97q2/cpu95-970414-01779.html
----------------------------------------

浮動小数だけはレジスタ本数とオペランド数ないと性能稼げないから
スタック形式のx87は圧倒的に不利だったが（その点でLarrabeeには死角はない）
整数性能に関して言えばIntelの対RISC性能はP5で肉縛しP6で追い越し
NetBurstで大きく引き離した

826 ：デフォルトの名無しさん：2009/10/06(火) 11:36:13

肉薄orz

827 ：デフォルトの名無しさん：2009/10/06(火) 11:44:30

インテルのはいつも都合いい数値しか出さないからなぁ。
実効性能ではPPCのが上でしょ。

828 ：デフォルトの名無しさん：2009/10/06(火) 11:47:05

829 ：デフォルトの名無しさん：2009/10/06(火) 12:39:19

ここGPGPUスレだから
Larrabeeすら関係無いIntel賛美は他でやれ

830 ：デフォルトの名無しさん：2009/10/06(火) 12:44:57

>>827
中立な数字出したら完全敗北なのが>>825なんだが。
AppleのIntel移行すら未だに認められない糞マカ乙

831 ：デフォルトの名無しさん：2009/10/06(火) 12:58:38

RISCは命令セットを単純にしてクロック上げやすくすることで
結果性能向上をはかるもので、命令あたりの演算の密度は犠牲にしてる。

同クロック・同命令発行数なら、CISCに性能で勝てるわけがないだろ。
ついでにいうとGPUも命令あたりの演算処理単位からいえば一種のCISCだ。

832 ：デフォルトの名無しさん：2009/10/06(火) 12:59:21

だってさ

833 ：デフォルトの名無しさん：2009/10/06(火) 13:25:05

x86の命令でなんか演算密度高い命令とかあったっけ？

834 ：デフォルトの名無しさん：2009/10/06(火) 13:41:28

主記憶がレジスタと同じ応答性とスループットになればRISCが勝つよ

835 ：デフォルトの名無しさん：2009/10/06(火) 13:47:08

>>833
ぶっちゃけメモリアドレスをオペランドにとれる命令全部。
ベースアドレス＋インデックス×スケール＋即値によるアドレスの算出と
ロード操作を1命令に含めることができる。
同じ命令内のオペレーション間で依存関係が決まってるから
スケジューリングもしやすい。
んで、アドレス演算のルールに特化した特殊な演算ユニット（AGU）で
解決することで性能向上を図ってる。

RISCだとアドレスの算出すら整数命令で、汎用の整数ユニットを使って
計算することになるから、そこで大きな性能差が生じる。

836 ：デフォルトの名無しさん：2009/10/06(火) 14:03:52

x86の強力なアドレッシングモードはLarrabeeのパワーの源と言ってみる
事実GeForceはワープ内の要素ごとに独立にメモリアドレス計算やってたり、
メモリ周りの命令に関してはかなり効率悪いし

fermiのSPは浮動小数と整数が2並列発行できるようにして
浮動小数演算をやりつつアドレス計算もできるようになってるが
それまでのGT200まで整数と浮動小数は排他動作だったから
読み書き対象のアドレス計算のたびに浮動小数演算の発行が止まってたわけで
実効性能を下げる要因になってた。

837 ：デフォルトの名無しさん：2009/10/06(火) 18:25:32

>>827
この板にもベンチマークとかシミュレーターの意義がわからない馬鹿が居たんだな

838 ：デフォルトの名無しさん：2009/10/06(火) 19:18:53

>>836
じゃfermiで解決だね

839 ：デフォルトの名無しさん：2009/10/06(火) 19:34:30

>>838
全然解決してねー。

サイクルあたり2命令しか発行できないのに
アドレス生成だけに1命令分取られるだけでも大きなロス

Larrabeeのほうは、アドレス生成つきロードを伴うマスクつき積和算と
スカラ命令あるいはストア操作を同時にデコード・発行できる。
つまり1クロックあたりの実効オペレーション数で水をあけられる可能性がある。

840 ：デフォルトの名無しさん：2009/10/06(火) 21:03:42

?
int,fpって並列可能なんだよね？
2つのIU使って16spに命令出すの?
fermiって

841 ：デフォルトの名無しさん：2009/10/06(火) 21:37:24

>>835
で、そんなアドレッシングがどれだけ使われるわけよ？

842 ：デフォルトの名無しさん：2009/10/06(火) 22:01:35

おまえらGPGPUのネタがないからって自作板化するなよ

843 ：デフォルトの名無しさん：2009/10/06(火) 22:04:16

>>839
GPUの場合、メインになる大規模配列へのアクセスなんかだとアドレス計算なんかは
コードで明示しなくてもハードで自動でやるんでなかったっけ？

844 ：デフォルトの名無しさん：2009/10/06(火) 22:05:11

俺821だけどさ、RISCなんか微塵も擁護してないわけよ。

PPC含めていろんなアーキを触るのは楽しいけれど、
x86が現実的に俺が金を出せる中では最強だと思っているわけよ。

でもRISCとかCISCじゃないでしょ？と言いたかったんだ。
現にAVXではデコーダが軽くなるように変更してるでしょ？
今までの実装に負けを認めてるわけよ。

でもそれはRISCに負けたわけじゃないし、CISCが勝っているわけでもない。
Intelは今まで割と酷いアーキだったと思うんだけど……分かんないかなあ。

845 ：デフォルトの名無しさん：2009/10/06(火) 22:14:32

捨ててまた拾うなんてこの世界じゃ常識なのに
負けを認めただの何だの
典型的なIntelアンチですね

846 ：デフォルトの名無しさん：2009/10/06(火) 22:33:49

11月25日GT300発売決定しました

847 ：デフォルトの名無しさん：2009/10/06(火) 22:37:38

>>843
ソースレベルと機械語レベルを混同してる

848 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/06(火) 22:57:22

>>844
なにが勝って何が負けたの？

x87もMMXもSSEも潰さずに新たなSIMD命令を追加出来るのはまさに可変フォーマットたるCISCのメリットだろ
命令長の縛りで好きにOperand空間を拡張したりできないのがRISCだよ。

360のCPUなんか、SIMDレジスタを128本に拡張した分、4オペランド命令や1バイト単位の操作命令が
削られてたりする。

それから君はAVXを根本的に理解していない。

849 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/06(火) 23:40:41

まあ俺に言わせればABCDの4レジスタの時代から1バイト、もう1バイトと継ぎ接ぎしていった
伝統的CISCアーキテクチャの新たな1ページですよAVXにしてもLRBniにしても
可変アドレッシングモードがある限りx86はどこまでもCISCだ。
add eax, ecxみたいな1バイト命令がたとえば4バイト固定に変わりますか？なりません。

850 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/06(火) 23:58:37

>>841
どっかのプログラムをテキトーに逆アセンブラかけてみろ。アホみたいに使われてる。
AMDのCPUがALUとは別個にAGUを3つも装備しちゃうくらい使われてる

あとついでにいうと32ビットとか64ビットとかの即値を命令ストリームからダイレクトに供給できることも
パフォーマンス要因として大きい。

どっかの情けないCPUには32ビットレジスタに16ビットずつにわけて即値ロードする命令があったりするけど
パーシャルライトのレイテンシで氏ねる。
メモリ空間が広がるほど、即値のビット幅に対する要求がシビアになる。

CellのSPUなんて直接アドレッシングできるメモリが物理的に256KBしかないから即値フィールドが16ビットもあれば
左に２ビットあればロード命令の即値フィールドとしては十分だが、
特化型じゃない普通のCPUでは4GB以上に対してアドレッシングするわけで。
論理メモリ空間が広がるほどRISCは使えなくなる。

8バイト固定長のRISCにすればいいだろって？
氏ねばいいと思うよｗ

851 ：デフォルトの名無しさん：2009/10/07(水) 00:11:52

結局、CISCの利点のおかげで儲かったおかげで、プロセスルールに投資できて、
それがIntelの優位性をより伸ばした。そんな説がありえるのか？

852 ：デフォルトの名無しさん：2009/10/07(水) 00:18:50

>>851
Fab商法がうまくいったからだろ
アーキテクチャ云々より
Fab1個丸ごと単一商品の生産工場っていう
資金回収能力が凶悪過ぎる方法実現できているだけ

853 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/07(水) 00:21:52

コード資産の継承って点で可変フォーマットであることに助けられてきたのは確かだね。
ステート切替によって複数の命令セットのフォーマットを混在できるARMはCISCに分類する学者さんもいるし

ハイエンドRISCが死に絶えるなか公共事業で生きながらえてるIBMのPOWERですら
BCDアクセラレーションや8バイト命令モードなど既にRISCのポリシーから逸脱してる

854 ：デフォルトの名無しさん：2009/10/07(水) 00:33:05

強い者が勝つのではない、勝った者が強いのだ

855 ：デフォルトの名無しさん：2009/10/07(水) 00:55:59

なるほど、勝ったものが強いか・・ん？

856 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/07(水) 00:56:30

ARMがSHやMIPSを凌ぐほどになったのは2バイト形式のThumb命令入れた当たりからだよ

それはそうとNVIDIAの経営相当厳しそうだな

857 ：デフォルトの名無しさん：2009/10/07(水) 01:17:00

ジレンマがあるよね
現状はNVIDIAしかないし、将来はNVIDIAきつそうだと言っても
AMDに乗り換えてもすぐIntelの天下になる可能性もあるし
かといって、今Intelは製品がないから乗り換えようがない

858 ：デフォルトの名無しさん：2009/10/07(水) 01:42:00

そう言えば、昔Itaniumなんてのもあったね
LarrabeeもItaniumの匂いがするなw

859 ：,,・´∀｀・,,）っ-○○○：2009/10/07(水) 01:44:20

俺に言わせればFermiのほうがItaniumっぽいけどな

860 ：デフォルトの名無しさん：2009/10/07(水) 03:02:03

面白いのはItaniumを倒したのはXeonなんだよなｗ
勝ったXeon軍の首領もEMCに行っちゃったし

861 ：デフォルトの名無しさん：2009/10/07(水) 03:04:05

というかそもそもItaniumは失敗したと言うより
Itaniumが狙った市場が消滅した。ってのが正しいんだが・・・
そもそもx86サーバーとかの市場は、元々Xeonの管轄だったわけで・・・
x86サーバーの市場が、そのままかつてSparkやPPCやAlphaがあった市場を喰った。
それだけのこと。

862 ：デフォルトの名無しさん：2009/10/07(水) 03:07:56

なるほどNVIDIAは自爆街道まっしぐらと

863 ：デフォルトの名無しさん：2009/10/07(水) 03:18:06

ま、AMDは最初から蚊帳の外だがｗ

864 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/07(水) 03:18:52

>>860
Xeon以前にNehalemが出るまでIntel史上最大の脅威と言わしめたOpteronが遠因だろ
あれの存在があったからこそ、苦戦を強いられながらもXeonを64ビット対応せざるを得なかった。

IA-64 vs x86-64(AMD64)で雑誌の特集組まれてたくらいだし

x86の有用性を自社以外が示してしまったのは皮肉だよな。

毒を食らわば皿までとはよくいったもので、OpteronはIntelの何かに火を付けてしまったようだ
全プロセッサ市場x86化計画の始まりだよ。

XScale捨ててAtom、結果大成功。
GPUもこのノリでx86化したいらしい。

865 ：デフォルトの名無しさん：2009/10/07(水) 04:05:27

Larrabeeがx86なのは統合を成功させるための手段であって目的ではない

866 ：デフォルトの名無しさん：2009/10/07(水) 05:20:18

>>864
話うまっ

867 ：デフォルトの名無しさん：2009/10/07(水) 06:01:32

demo x86布教運動してたゲルシンガーが居なくなっちゃったね

868 ：デフォルトの名無しさん：2009/10/07(水) 07:14:34

最近のオレゴンチームがアレだったからなぁ。
不要論でちゃって、組織統合と同時に退職させられたのかな。

869 ：デフォルトの名無しさん：2009/10/07(水) 08:05:40

え？Nehalem-EPで絶好調だったよ
企業のIT予算減ってるとか言われてたのにモバイルよりサーバーのが回復してた
まあクビって感じじゃないよな

870 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/07(水) 08:16:52

破格の条件で抜擢されたっていわれてるけど

871 ：デフォルトの名無しさん：2009/10/07(水) 08:23:11

AtomってPen4より遅いんでしょ？

872 ：デフォルトの名無しさん：2009/10/07(水) 12:55:29

トランジスタ規模相応の性能。
てか性能よかったら棲み分けにならない。

873 ：デフォルトの名無しさん：2009/10/07(水) 19:25:09

fumeFX??提携？買収？
ttp://www.4gamer.net/games/099/G009929/20091001065/SS/009.jpg

874 ：デフォルトの名無しさん：2009/10/07(水) 20:59:23

プログラム板のこのスレに何人のプログラマーがいるのか疑問だ
言ってることがITmedia並みで笑える

875 ：デフォルトの名無しさん：2009/10/07(水) 21:13:55

単純な疑問なんだがATIの場合分岐粒度って64 "pixel"で
nvidiaの場合って32個の"32bitデータ"？(8pixel相当?)

876 ：デフォルトの名無しさん：2009/10/07(水) 21:33:11

Intelは16wideで1cycle : 32bitの16個
nvidiaは8spで4cycle or 32spで1cycle : 32bitの32個
ATIは16shader(16*5=80sp)で4cycle : 64pixel(32bitの256・・・)

877 ：デフォルトの名無しさん：2009/10/07(水) 21:45:51

526 名前：Socket774[sage] 投稿日：2009/10/07(水) 14:11:06 ID:jGgZ/LK7
>>496の大雑把な内容
Nvidia kills GTX285, GTX275, GTX260, abandons the mid and high end market
Full on retreat, can't compete with ATI
ttp://www.semiaccurate.com/2009/10/06/nvidia-kills-gtx285-gtx275-gtx260-abandons-mid-and-high-end-market/

285は既にEOL、260は11or12月にEOL、275は2週間以内にEOL、295も終わりそう。
ハイエンド、ミドルレンジから脱落する。
Fermiの派生モデルはテープアウトすらしていないので、少なくとも2Qは掛かる。
Fermiはダイサイズあたりの性能が低く派生モデルを作ってもフルラインナップで価格競争力で劣る。
ハンダの欠陥問題、G212の失敗、G214の大失敗、G215の遅延、G216とG218の壊れたGDDR5コントローラ。
救世主となるチップはない、プランBはない、全て失敗した。
赤字販売を続けるか、撤退して少ない赤字を出すかしかない。
資金が尽きる前に開発の問題を修正し競争力のある製品を出せるかが問題。
1月にはローエンドからも脱落する。
Nvidiaは全てのパートナーから憎まれており助けてくれるパートナーはいない。
Nvidiaに必要なのは経営陣の総入れ替えだが、その出て行くべき奴らは株主なので起こりそうもない。
ゲームオーバー。
ジェンセンは年俸1ドルでも貰い過ぎである。

878 ：デフォルトの名無しさん：2009/10/07(水) 21:52:52

Intelは16wideで1cycle : 4pixel
nvidiaは8spで4cycle or 32spで1cycle : 8pixel
ATIは16shader(16*5=80sp)で4cycle : 64pixel

879 ：デフォルトの名無しさん：2009/10/07(水) 21:53:03

http://www.z-z-z.jp/BLOG/log/eid450.html

NVIDIAのFERMIコアベースの製品が出てくるのは早くて今から三ヶ月後、
高確率で半年後といわれています(半導体業界関係者の意見)
NVIDIAとしては、今回の発表は、株価対策、あるいはユーザーへの
サービスを兼ねての「やってます」アピールだったといえます。

880 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/07(水) 21:54:23

>>878
はぁ？

881 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/07(水) 22:04:23

α値があろうがなかろうが5Way ALUで1ピクセルずつしか割り当てられないのがRadeon
R, G, Bで別のベクトルに再パッキングして並列処理できるのがLarrabeeとGT

たとえばLarrabeeはRGBなら 16/3 pixelな

882 ：デフォルトの名無しさん：2009/10/07(水) 22:38:00

>>881
> α値があろうがなかろうが5Way ALUで1ピクセルずつしか割り当てられないのがRadeon
4ピクセル割り当てられますが？

883 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/07(水) 22:42:40

グレースケール乙

884 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/07(水) 22:44:25

4サイクルで4ピクセルとか言うなよ

885 ：デフォルトの名無しさん：2009/10/07(水) 22:47:38

>>881
アルファを出力しないでどうやってブレンディングするんだよ。
ブレンディングが行われるのはプログラマブルシェーダの後段だぞ。
Larrabee : 4pixelであってる。
あとグレースケールってのはFetch4というかGatherのことを言ってるんだろうが、
あれは読み込みであって出力が4つ同時に出来る訳じゃないぞ。
グラフィックス用途の場合大抵シャドウマッピングでソフトシャドウやるときに都合がいいってだけの機能だ。

>>882
どうやって？MRTとか冗談言い出すんじゃないだろうな？

886 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/07(水) 23:30:27

だから分岐粒度の話だろ。
RGBだろうがRGBAだろうがSoAに変換して処理するんだから16並列だ

887 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/07(水) 23:39:43

まさか RGBA RGBA RGBA RGBA で4ピクセル処理するとか思ってないよな？
VPUは水平加算もなければ、128ビット単位×4でマスク実行するためのビットマスク生成命令も存在しない。
Larrabee Prototype Libraryを読み直してこい

888 ：デフォルトの名無しさん：2009/10/08(木) 00:10:50

>>887
失礼。粒度に関してはこちらの勘違いだった。
ただGeForceはチャンネル毎にスレッド立ててるってソースが見つからなかったんだけど何か知らないか？

889 ：デフォルトの名無しさん：2009/10/08(木) 00:14:27

>>850
なんか即値最強みたいに言ってるが、浮動小数点数のロードも命令に埋め込むつもりか？

890 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/08(木) 00:27:14

おいおいトンデモ意見が出たな
ロードアドレス算出用のディスプレースメントって「即値」以外のなんなの？
リニアなメモリ空間アドレッシングするのに4バイトくらいないと実質的に使い物にならん。
変量がそんなに必要ないときは1バイトdispモード、そのものが必要ないならdispなしモードでいいし

あーSSE4には汎用整数レジスタにXMMレジスタの浮動小数値を転送する命令（あるいはその逆）が
あったりするけどあれって何のためにあるかわかるよね？
まあLarrabeeとは話がそれるが。

891 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/08(木) 00:31:42

ロードユニットが忙しいときにしたいときに、単精度の定数を汎用レジスタ上に即値モードで転送して
movdとかinsertpsで挿入とかよくやるテクニックじゃん

892 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/08(木) 00:32:23

ロードユニットが忙しいときにロード命令節約したいときに、ね

893 ：デフォルトの名無しさん：2009/10/08(木) 00:34:22

せめて小分けにして書くな

894 ：デフォルトの名無しさん：2009/10/08(木) 00:43:03

団子が忙しいときに推敲命令節約したいときに、ね

895 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/08(木) 00:44:41

俺は頭で考えてレスなどしない

896 ：デフォルトの名無しさん：2009/10/08(木) 00:45:59

餓鬼ですね。

897 ：,,・´∀｀・,,）っ-○○○：2009/10/08(木) 00:48:35

無我の境地というのだよ

898 ：デフォルトの名無しさん：2009/10/08(木) 00:56:25

僕らのアイドルダンゴリオン

899 ：デフォルトの名無しさん：2009/10/08(木) 06:01:02

atiの分岐粒度がデカ過ぎるのは判った

900 ：デフォルトの名無しさん：2009/10/08(木) 07:39:45

で、Larrabeeはいつ出るのかね？

901 ：デフォルトの名無しさん：2009/10/08(木) 09:16:44

5年後くらいにCellの6割くらいの性能で。

902 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/08(木) 09:21:05

Sandy Bridgeの4コアが200GFLOPSオーバーだから意味ねーよ。

Haswell世代だとやはりCPU4コアだけで300～400GFLOPS

903 ：デフォルトの名無しさん：2009/10/08(木) 09:32:24

コンシューマで画処理以外の何に使うのかなぁ？

904 ：デフォルトの名無しさん：2009/10/08(木) 09:45:15

粒度的にはレイトレ向き

905 ：デフォルトの名無しさん：2009/10/08(木) 10:07:42

レイトレのデモができる段階なんだから一年以内には出るだろ
その点GT300なんてハリボテ模型だからな。
量産できないアーキなんてペーパーアーキもいいところだ。

906 ：デフォルトの名無しさん：2009/10/08(木) 10:15:19

レイトレも画処理だろう。。

907 ：デフォルトの名無しさん：2009/10/08(木) 10:18:33

>>900
ハリボテ展示する会社の製品よりは早いだろうなｗｗｗ

908 ：デフォルトの名無しさん：2009/10/08(木) 13:42:09

http://www.4gamer.net/games/098/G009883/20091007054/
Larrabeeは計画破棄が濃厚だね。

Larrabee計画の顔役ともいえるPatrick P. Gelsinger（パット・ゲルシンガー）上級副社長が，
IDF 2009の直前にIntelを退職するという“事件”もあったが，
業界内にはLarrabeeについて，後ろ向きな情報が飛び交っている。
「IntelがLarrabee計画を中止する」といったものまで含まれていたほど。
「Gelsinger氏とともに，主要エンジニアもIntelを去った」という情報もある。

909 ：デフォルトの名無しさん：2009/10/08(木) 14:26:31

>>833
たとえばここの
http://www.ddj.com/architect/217200602?pgno=5

vcmpgtpi k2, v3, [rsi+Edge1TrivialRejectCornerValues4x4+rcx*4]{1to16}
っていう命令は何やってるかっていうと
(1) ベースポインタ(rsi)にメンバのオフセット定数(Edge1TrivialRejectCornerValues4x4)
　　を加算、さらにインデックス値(rcx)を４倍して加算
(2) 得られたアドレスに対して32ビット値にロード
(3) さらにその値をSIMDテンポラルレジスタの16要素にブロードキャスト
(4) その値と、ベクトルレジスタ(v3)の各要素のほうが大きいかどうかを比較し、
それぞれの要素の真偽値をマスクレジスタ(k2)に格納

こんな複雑な操作をLarrabeeでは1命令でしかもパイプラインで1サイクルのスループットで実行できる。
AGU -> LDU -> PERM -> VPU のパイプライン実行だ。
同じような操作を疑似RISC ISAで書くと6命令とかかかるわけ。
shl $offset, $idx, 2
addi $offset, $offset, Edge1TrivialRejectCornerValues4x4
lqa $vtemp, $addr, $offset
rotqby $vtemp, $vtemp, $addr
shufb $vtemp, $vtemp, $vtemp, $ptn
cmpgti $k2, $v3, $vtemp

SPUの命令セットに似てる？気のせい気のせい。
同じ操作を1サイクルのスループットでこなすには6命令同時発行できないといけない。
6命令なんて、POWER6+ですらやってない。
デコーダから実行ユニットまで少ないトランジスタ数で実装できるRISCは
トランジスタリソースの限られた組み込み向けとしては今でも有効だが
数千万～数億トランジスタが当たり前となった今となっては
パフォーマンスを追及する向きじゃない。Cellもぶっちゃけ効率悪いし。

910 ：デフォルトの名無しさん：2009/10/08(木) 16:52:48

>>908
Larrabee楽しみにしてたのに。GPUとして売ろうとしたのは時期尚早だったのかな。

911 ：デフォルトの名無しさん：2009/10/08(木) 17:51:21

自演つまらん

912 ：デフォルトの名無しさん：2009/10/08(木) 18:42:57

団子は言っていること無茶苦茶だな。
NVのATIに対する利点は再パックしなくても
効率があまり落ちないところにあるのに。

ATIの場合スカラ演算で少ない命令の場合に
1つ分ではALUの無駄が多すぎるが、
命令が多い、スカラを4つパックして入力するなど工夫をする事で
処理命令数を増やせば、5とはいわずとも平均3-4命令は埋まる。
ここまで出来れば素の演算性能で上回る事例も多い。

まあ、レジスタのxyzwをいい感じで指定して、
バンクコンフリクトを排除する必要もあるから
かなり面倒ではある。

ILの仕様が糞で、どのバンクを使うかを明示しなきゃならんから
コンパイラが最適化する余地が無いしね。

913 ：デフォルトの名無しさん：2009/10/08(木) 18:53:38

で、ここまでしたうえなら、扱う粒度が大きくなるから
データ毎に処理が分かれるような対象では
効率が下がりますねという話になる。
ただ、この辺は演算規模が大きい場合には殆ど問題にならない。
CPUで出来る程度の演算負荷の少ない処理を
GPUで代替しようとするときにはかなり大きな問題になる。

914 ：デフォルトの名無しさん：2009/10/08(木) 19:47:57

>>912
高級言語レベルの話とネイティブマシン語レベルの話を混同するなよ
CUDAはgather/scatterをラップしてるだけにすぎない。
32WayのSIMT(SIMD)でX, Y, Zをどれでも等しく操作するってのは
要するにロード・ストアの度にAoS/SoAの変換をやってるから。

Larrabee C++ APIはラップせずにSIMDをSIMDとして直接見せてるだけ。
ピクセル毎のプレディケートさえ必要なければ文字通り再パックしないまま
つまりRGBA RGBA RGBA RGBAの構造のまま効率的に処理する方法も
提供されてる。32ビット4要素毎にSwizzleする命令もあるし。
OpenCL経由の場合はGatherがデフォだろうが。

915 ：デフォルトの名無しさん：2009/10/08(木) 19:55:32

>>912
> 処理命令数を増やせば、5とはいわずとも平均3-4命令は埋まる。
固定機能再現するだけでも2-3な訳だが。
> ILの仕様が糞で、どのバンクを使うかを明示しなきゃならんから
ATI ILでどれだけxだのyだの指定してもISAにしたときは無視されるぞ。

916 ：デフォルトの名無しさん：2009/10/08(木) 19:59:11

C/C++からネイティブコード触れるのはLarrabeeの特権だな

917 ：デフォルトの名無しさん：2009/10/08(木) 20:01:14

ｐｐｐ

918 ：デフォルトの名無しさん：2009/10/08(木) 20:25:05

＞固定機能再現するだけでも2-3な訳だが。

固定機能のエミュに終始するならDX9使ったらって話
それでも2/5-3/5、64pixel中何pixelに適応になって、shaderが何個空転するのか

919 ：デフォルトの名無しさん：2009/10/08(木) 20:45:30

>>918
それがどうしたの？DX9使っても結局ドライバのなかで同じシェーダが生成されるんだぞ。
効率低いことに変わりはない。

920 ：デフォルトの名無しさん：2009/10/08(木) 21:03:38

?
DX10以降でDX9以前の固定機能相当の処理はshaderでの置き換えが必須だが
de9でDX9以前の固定機能使うんならshader自体使う必要がないわけだが

921 ：デフォルトの名無しさん：2009/10/08(木) 21:54:51

話がかみ合わないなぁ

922 ：デフォルトの名無しさん：2009/10/09(金) 00:04:09

つまり、Larrabeeは出るのかね？出ないのかね？

923 ：デフォルトの名無しさん：2009/10/09(金) 00:07:07

つまり、地球は丸いのかね？平たいのかね？

924 ：デフォルトの名無しさん：2009/10/09(金) 00:46:22

海の水はどうしてですか？

925 ：,,・´∀｀・,,）っ-○○○：2009/10/09(金) 01:02:45

>>912
ﾊﾞｰｶ

926 ：デフォルトの名無しさん：2009/10/09(金) 01:23:05

うわ
>>912可哀想ｗｗｗ

927 ：デフォルトの名無しさん：2009/10/09(金) 14:52:48

http://gpu.fixstars.com/index.php/Fermi%E6%A6%82%E8%A6%81#.E3.82.B7.E3.82.A7.E3.82.A2.E3.83.89.E3.83.A1.E3.83.A2.E3.83.AA.E3.81.AE.E5.A2.97.E9.87.8F.E3.81.A8L1.E3.82.AD.E3.83.A3.E3.83.83.E3.82.B7.E3.83.A5.E3.81.AE.E6.90.AD.E8.BC.89

フィクスタ社員なにやってんだよｗｗｗｗ

928 ：デフォルトの名無しさん：2009/10/09(金) 15:58:09

> ECCがサポートされました。宇宙線が多い日も安心して使えます。

これか？

929 ：デフォルトの名無しさん：2009/10/09(金) 18:10:45

>>915
doubleでxyとzwのペアじゃないと
加算をペアリングしてくれないぞ。

930 ：デフォルトの名無しさん：2009/10/09(金) 21:28:38

FermiはShared Memoryとキャッシュで切り替えられるのが良いね。
Cellのようにキャッシュがないとデータ転送が面倒だし、かと言ってx86の様に全てキャッシュだと最適化が面倒になるし。
ただ、キャッシュの方式が気になるところ。あと欲を言えば、もっとサイズが大きければいいのだが。

931 ：デフォルトの名無しさん：2009/10/09(金) 21:45:33

>>930
Larrabeeは普通にコヒーレント無視でロードストアできるオプションあるがな

スカラ風の命令セットに見せかけるためにネイティヴのSIMDすら抽象化されてて
直接触れないCUDAで最適化も糞もない

932 ：デフォルトの名無しさん：2009/10/09(金) 22:22:17

>>929
それは仕様にそう書いてあるから。そして趣旨がずれてる。
ATI ILでxyで倍精度加算を書いてもISAではzwで加算されたりする。

933 ：デフォルトの名無しさん：2009/10/09(金) 23:04:59

LarrabeeのTDPって300Wなのかよ。
縛熱だな。Fermiどころじゃないじゃん。

934 ：デフォルトの名無しさん：2009/10/09(金) 23:07:39

そりゃ電源ピンのところでぶった切られてて物理的に電源供給できないFermi（模型）は0Wだからな。

935 ：デフォルトの名無しさん：2009/10/09(金) 23:24:09

また脳内ソースで書き込む時間が始まるお…

936 ：デフォルトの名無しさん：2009/10/09(金) 23:25:49

http://www.techpowerup.com/64974/Intel_Larrabee_Capable_of_2_TFLOPs.html

937 ：デフォルトの名無しさん：2009/10/09(金) 23:37:36

Larrabee頓挫の危機

938 ：デフォルトの名無しさん：2009/10/09(金) 23:52:08

危機ってことにしないと都合が悪いんだなゲホ厨は
512SP止まりじゃクロックあたりのピークFLOPS数すらLarrabeeに並ばれるからな

939 ：デフォルトの名無しさん：2009/10/09(金) 23:55:06

Sunday, July 6 2008

940 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/10(土) 01:48:21

Cellの32コア版もSPARCも計画後退してるし
明らかに性能出ない設計の上、模型しかできてないFermi

遅れに遅れたLarrabee、なぜか競合製品までことごとく頓挫して命拾いしてるよなー

941 ：デフォルトの名無しさん：2009/10/10(土) 02:08:40

みんな注力している領域なのに、これだけ苦労してて、ひょっとしてこの道は
間違っているんじゃないだろうかとふと思うよね。

結局、半導体メーカーの都合で作っちゃっているからこうなっているのかな。

でも、生みの苦しみであって、なにか大きな変革が本当に起きることだってあるとは思って、
個人的に期待しているんだけど。

942 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/10(土) 02:34:52

トップ500システムのメインプロセッサの地位をXeonをもって8割がた制圧しちゃったIntelにとっては、
今はHPC分野は攻める市場じゃなくて守る市場。
Larrabeeなんて必要ないんだよ。攻めてくる競合製品がなければな。

じゃあ無意味なのかっていうとそうでもなくて
ただ、未完成ながらも実働デモをして競合他社にプレッシャーを与え続けてるだけでも十分効果はあると思うのです。

当然ながらRV770を倍増して毛が生えただけのGPUを投入したATIは競争には加わっていない
GPUとしては優秀だがGPGPU的なマーケットにはことごとく相性が悪い。

943 ：デフォルトの名無しさん：2009/10/10(土) 02:48:18

>>941
ほんとそう思うよ。
結局超並列の計算が果たしてどれだけ必要なのか疑問に思ってきた。
周りを見渡しても必要用とされているのはほとんど研究用用途ぐらいしかないし、それだと金にならない。
結局今までのスパコンの市場を食っただけで拡大していないのではないか？と思ったりする。
ちょっと前なら金融工学のシミュレーションが伸びてきたりしていたけど、今の金融危機でそういうのも、
余り受けていないようだし。半導体のシミュレーションとかだったら今のFPGAに置き換えられるかもしれないけど、
そうなると大規模なシミュレーションをするために新しいCPUやGPUを開発する→以下ループになって手段が目的かするような気がする。

何か身近なもので大きなイノベーションでもあればいいんだけど。

944 ：デフォルトの名無しさん：2009/10/10(土) 02:52:08

Sonyの久多良木は失敗し、
Intelのゲルシンガは失脚し、
Nvidiaのフアンは久多良木以上に暴走している。

一方、AppleのジョブズはCellを否定し、Intel化で成功し、
任天堂の岩田は高性能はいらないと入力デバイスの進化で大成功を収め、
AMDは純GPU路線で、順調にシェアを伸ばしている。

ストリームコンピューティングの将来は一体…。

945 ：デフォルトの名無しさん：2009/10/10(土) 03:04:03

>>942
ずいぶん弱気になったねw
今まで散々「出す出す詐欺だろ」とか「Itaniumの二の舞だろ」
「どうせ性能では勝てないんだし、中止だろ」みたいに言われても
先見性がないとか、GMAで絶対勝つるとか何とか言ってたのに
結局「未完成でもいいんです。発売しなくてもいいんです。
プレッシャーを与えるだけで良いんです」ってかw

946 ：デフォルトの名無しさん：2009/10/10(土) 03:05:06

結局、先見性があったのは団子ではなく、「どうせ出ないだろ」と
言ってた連中のほうだったなw

947 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/10(土) 03:21:05

馬鹿だな
守るべき市場だからこそ壁役が必要なんだよ
敵がいないのに出してどうする。Xeonと共食いじゃ利益にならんぜよ。

Fermiが出てきたとして倍精度600GFLOPS程度だぜ。しかもまだ模型しか作れてない。
肩すかしにも程がある。
それどころかNVIDIA自体が倒産しそうな勢い。

結局倍精度1TFLOPSなんて必要なかった。とんだ肩すかしだろ。

Intelは用意周到ゆえに肩すかしを喰らいまくってるからな。
「Phenom II-FX」を警戒してXeonと同じLGA1366をデスクトップに含めて投入したのに
フラグシップですら最低レンジの920にすら及ばぬ性能じゃな。
噛ませ犬はCore 2 Quadでも十分だった。

なんにせよ費用対効果ってのものがある。

948 ：デフォルトの名無しさん：2009/10/10(土) 03:24:25

Skulltrailとかもあったな～

949 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/10(土) 03:28:06

ワンチップ倍精度1TFLOPSを実現するのに

Larrabeeは予定通りのスペックのものを2GHz動作で出せばよい。
4GHzのCellだと64コア必要。まだ32コアすら出てきてない。
Fermiなら768SP版が必要だ。しかしそれ以前の問題だ。
SPARC？あばばばば

こんな状況だぜ。
結果として及ばぬ性能どころか大幅に勝ちすぎたわけだ。
現時点で他の陣営は量産にほど遠い。

950 ：デフォルトの名無しさん：2009/10/10(土) 05:24:38

この分野では団子さんの言うとおり、インテルが一番有利だね。
なんだかんだでＸｅｏｎのクラスタを沢山くめばいいわけだがら。

何ＧＦｌｏｐｓとか、何ＴFlopsとか言っても、実際そこまで出せるのって
結局レジスタにのった場合でしょ。
ＣＰＵの速さはもうほどほどにして、インテルもメモリの方に投資して、
メモリアクセス数cycleとかのＤＲＡＭを開発したらいいのに。

1TFlopsでメモリのレイテンシが400～800cycleよりも、
256GFlopsでメモリレイテンシが10cycleだったら、実アプリにおいてはは後者の方が上何じゃない?

951 ：デフォルトの名無しさん：2009/10/10(土) 05:47:15

ワンチップ倍精度1TFLOPSを実現するのに

Fermiは予定通りのスペックのものを2GHz動作で出せばよい。

952 ：デフォルトの名無しさん：2009/10/10(土) 06:02:52

(注)
larrabeeって言い張ってた、あのショボイレイトレquakeもはたして実機なのか
既存のCPUでの動作なのか、非常に疑わしい

ゲルシンガーが居なくなって立ち消えになるんじゃないかと思われる

AMDはどうでもいいｗ

953 ：デフォルトの名無しさん：2009/10/10(土) 06:11:45

日本語で

954 ：デフォルトの名無しさん：2009/10/10(土) 06:17:08

larrabeeも張りぼて
AMDはカス

でOK

955 ：デフォルトの名無しさん：2009/10/10(土) 06:30:30

私はゲロ大好きです

でOK

956 ：デフォルトの名無しさん：2009/10/10(土) 06:55:28

いいえ、カスが大嫌いなだけです

でOK

957 ：デフォルトの名無しさん：2009/10/10(土) 07:12:23

ま、あの画質で
あの程度の動き
あの程度のカクカクっぷりだと
corei7あたりでも出来そう

958 ：デフォルトの名無しさん：2009/10/10(土) 07:24:00

> Larrabeeは予定通りのスペックのものを2GHz動作で出せばよい。
これ、予定通りに出せたとしても理論値でしかなく、実効値は3～4割にしかならんでしょ？
どうせインテルだし。

959 ：デフォルトの名無しさん：2009/10/10(土) 09:07:00

ｒｖ８７０は実行５％くらいだがな

960 ：デフォルトの名無しさん：2009/10/10(土) 09:11:43

リアルタイムレイトレーシングだっけ
すでにAMDがデモ公開してたような

961 ：デフォルトの名無しさん：2009/10/10(土) 09:40:09

レイやトライアングルが少なければCPUでも出来る
問題は

962 ：デフォルトの名無しさん：2009/10/10(土) 09:43:12

AMDは映画製作会社とかと共同で
ライブラリつくりまくってるからな

公には一切公開できない成果たくさんあるよ

963 ：デフォルトの名無しさん：2009/10/10(土) 10:12:25

GPGPUの分野ではnVidiaがだめでもAMDが出てくるのは確実だし、
ライバルがだめそうだからLarrabeeを出さないとか言ってるのは
理屈が破綻してるな

964 ：デフォルトの名無しさん：2009/10/10(土) 10:40:53

これに関してはAMDはintelの犬だろ

965 ：デフォルトの名無しさん：2009/10/10(土) 10:58:05

>>960
AMDのGPU部門トップ，Rick Bergman氏が語る「1～10年後のグラフィックステクノロジー」
http://www.4gamer.net/games/045/G004578/20081001053/

966 ：デフォルトの名無しさん：2009/10/10(土) 11:35:06

>>964
お前AMDをディスってんの？
どう考えても犬とかアリエン・ロッベンだろ

誇り高きコバンザメだよ

967 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/10(土) 11:57:43

ローカルなL2断片（256KB）に載っかる部分までなら上り計64KB/clkの帯域が得られるとのことなので
そこでスカラ命令側でベースアドレス/インデックス更新とループカウントしつつ
SIMD命令側では3rdオペランドはノンテンポラルモードでのメモリアドレッシングにす
これで実効効率も9割以上は堅い。

ちなみにFermiはロード・ストアユニットを2アクティブワープで共用という、致命的なパフォーマンス阻害要因がある。
レジスタ間でこね回す演算でないとどうやっても性能が出ない。
積和算をやりながらだと残り1命令しか発行出来ないって仕様も致命的。

FermiはRISCライクなんだよね

968 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/10(土) 12:01:07

>>951
シュリンク率考えればあり得ないな。

GF9800GTX+が1.8GHzとか、SPが128基程度でメモリ帯域も狭かったりとTDPに余裕があったからこそだろ
NVIDIAは40nmでまだ製品を投入してない。

969 ：デフォルトの名無しさん：2009/10/10(土) 15:17:53

ダンゴや
また自作板で万人に解らん
API使ったネタ話すの自粛するんだ

970 ：デフォルトの名無しさん：2009/10/10(土) 16:38:29

わかんなくても「ﾍｰそんな事も出来るんだ」程度に楽しんでるから別に団子はそのまんまでいいよ
金払うに値する次のトリッパーを期待しつつ待つ

971 ：デフォルトの名無しさん：2009/10/10(土) 21:47:35

アプリのGPU化が進むと、インテルもAMDもCPUの存在価値がなくなるから、
基本的にやる気ないだろ。
NVIDIAには頑張ってもらいたいな。
もうCPUはOSが動けば十分なのでAtomクラスで十分ｗ

972 ：デフォルトの名無しさん：2009/10/10(土) 22:07:44

>>971
>CPUの存在価値がなくなるから、
とてもGPGPUスレ住民の意見とは思えん
AtomクラスでいいならGPGPU系技術も必要なかろう

973 ：,,・´∀｀・,,）っ-○○○：2009/10/10(土) 22:12:43

そこまでなるとCPUとGPUは同じダイで充分だよな。
x86命令を解釈するGPUアーキテクチャでも作らないとな。
統合プロセッサのコードネームは「Haswell」ってのはどうだろう？

>>971身の程を知れﾊﾞｰｶ

974 ：デフォルトの名無しさん：2009/10/11(日) 00:53:47

CPUの速度向上が遅くなったからこそのGPGPUだというのに

975 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/11(日) 00:58:07

ところが、GPGPUで賄えるような演算ほどSIMD・マルチコア化での速度向上率も高いんだよね。

976 ：デフォルトの名無しさん：2009/10/11(日) 05:13:18

素人目には、CPUの方がとか、GPUの方がとかじゃなくて、
CPUもGPUも両方活用すると
演算スピードが鬼速になると思ってしまうんだが、そうじゃないの？

977 ：デフォルトの名無しさん：2009/10/11(日) 06:00:10

>>975
まあ、GPUはスーパーメニーコアプロセッサーとでも表現できるものだからね
SIMD化はもちろん、マルチコア化でどんどん差を縮められる

ただ、サーバー用途以外の一般デスクトップでは、
４コアを超えるマルチコア化の予定がキャンセルされてるけどね

まして、ノートだと２コアのままで当分は行くらしい

978 ：デフォルトの名無しさん：2009/10/11(日) 08:51:58

CPUへの統合化が進んでからが本番田世なぁ
今はメーカーによって作りがまちまちやし手法も微妙に違うからいまいち手が出しにくい

979 ：デフォルトの名無しさん：2009/10/11(日) 09:13:30

>>976
GPUは処理を並列してこそ意味があるわけで、
そのために大量のデータをGPUに転送しておかないと
いけない。
ただPCI-Expのバス帯域が狭くて転送コストが
馬鹿みたいに高い。
だから同時にCPU+GPUというのは理想だけど難しい。

980 ：デフォルトの名無しさん：2009/10/11(日) 09:32:15

だから、コンシューマで、
画像処理以外何に使うのかがよくわからない。

981 ：,,・´∀｀・,,）っ-○○○：2009/10/11(日) 10:33:11

GPU動かすのにCPU時間も使うんだよ。

982 ： ◆0uxK91AxII ：2009/10/11(日) 15:11:23

素人目には、GPGPUは使い途が無さ杉る。
まだやっていたのかっていう印象。

983 ：,,・´∀｀・,,）っ-○○○ ◆??? ：2009/10/11(日) 15:23:00

NVIDIA曰くCUDAユーザー人口は世界6万人とかいうレベルだからな
水増ししてるだろうからもっと少ないと思うが

984 ：デフォルトの名無しさん：2009/10/11(日) 16:05:46

あなたもその一人じゃん

985 ：デフォルトの名無しさん：2009/10/11(日) 16:38:27

だんご of 6万か・・・
すげぇな。

986 ：デフォルトの名無しさん：2009/10/11(日) 16:50:51

>>983
それってCUDA関係の資料ダウソした
人数ってだけだから信じるなよｗ

987 ：デフォルトの名無しさん：2009/10/11(日) 17:05:02

じゃ、6万未満ってことか

988 ：デフォルトの名無しさん：2009/10/11(日) 17:14:12

ここはアンチスレか。

989 ：デフォルトの名無しさん：2009/10/11(日) 17:53:33

全世界で6万？
なんというかまぁ可愛らしい数字だな

990 ：デフォルトの名無しさん：2009/10/11(日) 18:14:46

俺5000人位かと思ってた

991 ：,,・´∀｀・,,）っ-○○○：2009/10/11(日) 18:30:51

まあなんというか
NVIDIAもこんな不確かなものに命運かけなきゃいけないんだからな

992 ：デフォルトの名無しさん：2009/10/11(日) 18:35:04

そう？

993 ：デフォルトの名無しさん：2009/10/11(日) 18:41:47

個人的にはSIMDすらも使い用途が無いと感じる。
SIMDを駆使すれば、1Tflopsですよ～っていわれても
画像処理など特定の用途じゃなければ、自然にC++のソースに
組み込むのは難しいし、
(例えば、SoAをAoSにしたり、プリフェチを埋め込んだり、
C++のソース的には不自然だよなこーいうの)
結局組み込めないのなら、無駄なスペックと感じる。

994 ：デフォルトの名無しさん：2009/10/11(日) 18:46:12

特定の用途には有効なんだろ。何屁理屈こねてるんだよ。

995 ：デフォルトの名無しさん：2009/10/11(日) 18:51:59

>>994
例えば、そのリソースを使って
1.5倍速のFPUが作れるならそっちの方がいい。
作れればの話しだけど。
結局、4並列、8並列すれば、カタログスペックもx4、x8するけど
俺のアプリはx1のままだ。

996 ：デフォルトの名無しさん：2009/10/11(日) 18:57:31

どうやら知能が低いらしい

997 ：デフォルトの名無しさん：2009/10/11(日) 18:58:41

CPUは高性能
プログラムを組む奴が低知能

どうにもならんわなｗ

998 ：デフォルトの名無しさん：2009/10/11(日) 18:59:36

つーか、CPUにSIMD必要？
SIMDが発揮出来るような用途は、必ずGPUとかち合うし、必ずGPUに負けるっしょ。
つまり、GPUが載ってるPCじゃ、CPUのSIMDなんて使われず終いじゃん。
結局、カタログスペックの為のセールス的意味しかないと断言。

999 ：デフォルトの名無しさん：2009/10/11(日) 19:01:55

>>996-997
いや、考えてもみろよ。
例えば、AoSでどうやって組むんだよ。OOPのクラスと真っ向からかち合うよ？
おかしくね？C++プログラマに、OOPと衝突するような組み方要求する機能って。

1000 ：,,・´∀｀・,,）っ-○○○：2009/10/11(日) 19:02:42

外部プロセッサじゃデータ転送のレイテンシもスループットも話にならない。

1001 ：１００１：Over 1000 Thread

このスレッドは１０００を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。