そうです簡単に作れるんです、あんなもん。
兄貴は「Phenomは業界を震撼させるもの。」としか言ってないね。日本人なら読めるよねコレ
兄貴「Phenomは業界を震撼させるもの(消費電力的な意味で)」
兄貴が言ったとしても別にかまわんけどね 実際には作ろうと思えばいつでも作れるんだろうし 単にマーケティング的な理由で作らなかっただけで Intelがニコイチなら、うちはネイティブデュアル、クアッドということでね で、8コア以上はダイサイズ的に無理があるけど競争上必要だから、 今回採用しているだけ こんなことは、小学生でも理解できることだけど、 ニコイチデュアルやクアッドに騙されてきた淫厨には無理みたいだな
Phenom発売当時の周囲の反応 「えー?まじで?」 「これがネイティブ?」 …確かに震撼させてくれたようだ
AMD儲のいつもの流れ Aという技術がプロセッサ業界等で採用され始める(業界のトレンド) →視野が狭いので知りもしない オタ「Aという技術が他で採用されているす。AMDもいずれ採用するんじゃないすかね」 →うざい。そんなわけないだろ インテルがA技術の採用を発表する(インテル儲にとってトレンド) →これだからインテルはw AMDがA技術の採用を検討し始める →これからはAの時代だ!(ここがAMD儲のいうトレンド) もっと広い世界に目を向けるべきだと思うす
どうやら外国人の方がいらっしゃるようで
Are you“ネイティブ”?
998 :Socket774 :2009/04/26(日) 10:10:07 ID:ds80/nT7
桁違いの馬鹿
1000 :MACオタ>998 さん :2009/04/26(日) 10:26:55 ID:H+1rk+x7
>>998 記憶薄弱だからといって『桁違いの馬鹿』呼ばわりはひど過ぎるかと(笑)
>>998 はMACオタのことを指していると思うのだけど違うの?
心の平静を保てないIntel儲がまた荒らしに来てるな。 Magny-Cours がデモされたくらいで騒がないで欲しい。
Athlon64やPhenomはPC向けのCPUアーキテクチャの未来を示してくれた いいプロセッサだと感心したけどな。 Athlon64でマルチプロセッサも考慮してメモコン内蔵、クロスバスイッチ、HTの採用。 Athlon64 X2でそれが正しかったことを証明。 Phenomでは、クアッドコア以上を想定してL3の内蔵とネイティブクアッド。 コア自体の性能も若干アップしていて、C2に多少劣る性能まで向上。 まあ、π焼き含むキャッシュベンチマークだけが命の淫厨や情報弱者には、 理解の範疇外なのも無理はない。
多少の思想の違いがあれど、行き着く所向かう先は同じ。 メモコン内蔵、L3キャッシュ、キャッシュリソースの共有化。 何れも今日出たばかりの技術じゃなく、とうの昔から存在していたし、 お互いずっと前から開発を進めていただろう。
>>11 この手の「AMD」を「Intel」に変えたら通じる煽りって、面白味がないよね。
それってなんか面白いの? 24core乗っけて正方形にしろってか?
見ちゃ駄目っ
上に重ねたら正方形になるんじゃね?
なるほど!折り目を付けて〜どーん!倍増だー!
>>18 IntelはAMDがPhenom出さなかったら、確実にC2Dを引き伸ばしていただろうから、
C2Qは今頃の登場で、Nehalemなんかいつになっていたかと思う。
Intelは確かに色々と研究はしていて、もちネタはたくさんあるけど、
いざ実用化に関しては、対抗製品がないとやる気がない。
AMDはそこに目をつけて、いち早く新しいアーキテクチャを取り入れて製品化している。
CPUパッケージが長方形は合理的だよね。
素朴な疑問だがどんなソケットになるんだ?
cpu 2つ分そのままじゃない会 HTでパッケージ内の接続はあるだろうけど
いやいや事実は小説より奇なりと申しますし AMDのMCMは究極の手抜き
何この自演
うわぁw
36 :
MACオタ :2009/04/27(月) 00:07:57 ID:yuRUEY7Y
G34をはじめとする次世代ソケットプラットフォーム以降はAMDチップセットのみがサポートされる
クローズドプラットフォーム化されるとbetanewsが伝えています。
http://www.betanews.com/article/1240526705 ---------------
"For 2010 moving forward, the solutions coming out from AMD will be AMD and on
AMD at this time," stated server business unit vice president Pat Patla. "We don't
expect to see new chipsets from Nvidia or Broadcom for server implementations in
2010. But they will continue to support all existing platforms moving forward through 2010."
---------------
Pat Patlaの語る通り、現行プラットフォームは2010迄延命されそうとのこと。
ん NVIDIA死亡のお知らせ?
>>36 まだライセンス供与されていないってだけの話か。
とりあえず遅らせて、AMD純正製品を先に出そうって魂胆だろうなw
なんという糞な商売 まともなチップセットを出してくれるなら構わんけどな
>>40 このスレにインテルの悪口書かれても困る。
前スレの最後で究極の低脳のあるべき姿を自慢気に披露したキモコテ ここでも発奮大暴走
NVIDIAオワタw
一時的には収益が好転するだろうが、AMDプロセッサ市場自体が不活性化してしまう。 蛇が自分の尻尾喰うようなものだわな。 とはいえ、今までもAMD+nVidiaでどれくらい数が出てたのか疑問だな。 ServerWorksならともかく、サーバでnVidiaはあんまり買う気しないぞ。そうでもない?
>>44 NVIDIAのサーバーは結構あると思うぞ。ServerWorksは後発。
個人的には普通にライセンス供与すると思うけどな。
AMDのチップセットが出たあとで。
>この謎ブロックの正体はまだわからないが PCI-Eじゃないか
MCMでCPU同士を繋ぐ時に使う部分だったり。 最初みたときは、個人的にはキャッシュでIntelのように、 C6ステイトまで可能になるんじゃないかと思ったりも…。
Istanbulってそんなにでかくならないと思っていたけど、ずいぶん大きくなるんだね。 来年は1ダイで8コアも出るっぽいし、8コア版はどれくらいの大きさになるんだろう。
来年じゃない、再来年だorz 32nmだから、異常にでかくなるはずないな。
さらに8コアはBull
G34は1974pinらしいな
つか俺は知らなかったがG34の寸法図、10ヶ月前に既出じゃないか
G34のpin数が1974なのも、横長なのも前々の情報だな。
"Socket C32"が情報的に新しそうにみえるけど、
過去に"G3"って名前で話は出ていた物と同じだろうね。
まぁ。すでに出ている情報を理解していたら、
>>30 みたいな発言はないね。
調べず発言するってのは、無知を晒すだけで恥ずかしいですね。
>>54 なるほど、G3MXを使わないG3がC32になったってことか。
>>47 メモリのセルアレイっぽいですから、スヌープフィルタでは?
http://www.theinquirer.net/inquirer/news/107/1051107/amd-core-istanbul ----------------
Probe Filter is the AMD name for a snoop filter, and what it does it to limit the number
of times the CPU has to wait while a remote core returns cache data. This cache-induced
latency is what killed the 8S Opteron market, the latency really hammered that machine.
----------------
57 :
MACオタ :2009/04/27(月) 20:57:13 ID:yuRUEY7Y
厚顔無恥っていうか睾丸鞭っていうか
Istanbulが前倒ししたからマニクールも前倒しとかは無いのかね
ペニス先生すごく・・・大きいです
>>60 プラットフォーム側の開発や安定化もあるから、
無理に前倒しはしないんじゃね?
>>54 彼は宗教者だから邪教の知識を獲得しすぎて
功徳を失って位階が下がることを避けているんだよ
>>60 実は今年のQ4に投入なんて話もあるけどな
従来と同じ来年前半と考えても1四半期分は早まってるんじゃないかねえ
66 :
MACオタ :2009/04/28(火) 03:16:30 ID:0nWC5vbA
いくらなんでもありえないだろ。電力的にもシリコンコスト的にも。
韓国のほう見たら、登場予定のデュアルコアじゃなくて、Kumaが4コア化できたって記事のような。 INQの記事はKumaが4コア化できて、Callistoもできればいいなってニュアンスなのか、 KumaとCallistoを勘違いしてるのかは、よくわからんけど、 Callistoが4コア化できたという事実はまだない模様。
以上、日本語を読めない韓国通のMACオタでした〜
シンゴー!
MACオタは英語もできないんだろ。妄想しか語ってないしな。 そもそも「登場前」の製品が「大人気」で繋がるわけがねぇw
どんだけ馬鹿にされようと全く意に介さないのが カナー症候群な雑音 >4でようやくようやく事実を認識出来て 直後の串暴れとかあまりにもキモ過ぎる にもかかわらず今ではもう何事も無かったかのように いつも通りの低脳発言
「そいつわ私のニセモノす」
規模で劣るAMDが、サーバとデスクトップで設計から分断して さらにスケールを小さくするのは下策のような気が。
>>74 それぞれに向いたダイを作りつつ設計リソースが肥大しないようにしたくて
設計にモジュール構想を取り入れたのだろう。デスクトップとサバで
ダイは違っても共通モジュールが多くなるように。
問題は構想通りに効率化ができるのかどうか
CPUコアは共通じゃないかな。 コア数や所謂アンコアの部分で差別化を図ると。 どんどん余るトランジスタの使い方が腕の見せ所になりそう。 内蔵GPUに割くとディスクリートの市場が奪われそうで AMD的には辛くなるのかね、 内蔵GPUがディスクリートと協調して動けるようになるまでは。
CPUコアばかりなのが鯖向けで それを少なくし空いたところにGPU入れるのがDT用になるかと思う 「鯖は整数演算ばかり」ってのを聞いたことがあるけど BullはCPUとGPUでそういう区分けがされそう
元々2011年には、コンシューマ向けのメインはGPU統合のAPUになってるし、 鯖とデスクトップのダイは分かれることが前提にもうなってたんじゃないかな。
>>76 AMDプラットフォームに限れば、780G登場でローエンドGPU市場はとっくの昔に消滅している。
ローエンドのGPUは今じゃIntel向けでしかない。
>>77 鯖とHPCはまた別だと思うんだけど、このAMDの路線は、
HPCで優位を取れた過去数年の路線を捨てて、
安鯖狙いに行くってことなのかなー。
HPCつったらFireStreamじゃん HPCが具体的にどういう処理なのか またGPUコアがどういう構成になるのか知らんけど DT向け以上にGPUばっかりなプロセッサ作っておk じゃないの? K10の改良点なんてSSE以外はGPUと対になる為のCPUらしさの追求であって HPC・単純なデータ処理?と無関係な方向な感じだし
>>64 的確だw
まあ調べる気がはなから無いってのは正解
DP(Gainestown)のハイエンドへの対抗策だとすればそれなりに強力だが、MP(Nehalem-EX)に対しては微妙だな
おっと時期的にはWestmereとガチンコか ああ、必死だな
>>82-83 「調べる来もない」。無知がよく使う言い訳ですね。
素直に「知らなかった」って言えばいいのに。
ごめんね。知る気すらないんだ。 ネイティブ6コアのWestmereに45nmで対抗しなきゃならんとなればそりゃ12コアにでもやるわな まあTDP縛りのためにクロックは落とさざるを得ないだろうが
>>85 またも無知の言い訳が来ましたw 「知る気がない」!
コレは高レベルですよw 小中学生がやる言い訳ですもんw
大人では絶対にやらな発言なのに、それを平然とやっちゃう!
凄い! あこがれる!
うん、だからごめんね。 構うあなたも団子レベルです。
そんなことよりあちこちで暴れてるげふぉ患者を眺めてるんだけど もう最高に面白い
ATIは2010年中ごろまでOpenCLに対応できないとか云々
>>87 >構うあなたも団子レベルです。
お前みたいな言い訳野郎に同一視されてもw
気持ち悪いから二度と来ないで。
ららびーがGPGPU潰しちゃってくださいよ NVがどうでるかも興味あるし
>>91 らら様も最終的にはCPUに統合される事前提じゃね?
おっと団子はNVIDIAフリークだったか
Mach64の時代からATI派ですよ。 CUDA触るためだけにGeForceです。
CUDAとOpenCL どっちが扱いやすいんだ?
「CellのCより楽」だと思って使えば地獄を見るって点で見れば同レベル
>>96 CUDAの方が、NVIDIAの方がソフトを先発で出している。
CellのCは地獄よりたいへんなのか
>>92 自演か? 誰がどうみても、
白団子の敗けだろw
団子かMACヲタかあぼーんしてるから判らんが、相手すんなよ。
CUDAは「ハードウェアの違いが見えないように書ける」 (でもハードウェアの違いを意識しないと効率良く書けないのは今までと同じ) OpenCLは「ハードウェアが違っても、統一された同じスタイルで書ける」 (ハードウェア個々にあわせて書かないといけないのは今までと同じ) どうしたってmultithreadingは地獄です。救いの手なんぞどこからも来やしません。 だからこそ、シングルスレッドの性能向上がもうどうにもならなくなるまでは ハイエンドと一部の酔狂を除いて誰も並列コンピューティングに手を出していなかった。
マルチスレッド化が地獄(?)....困難なのはハードウェアの構造を深く理解する必要があるからではない つまりハードウェアの構造を深く理解しなければ性能が出ないという状況はそもそも(ry
一行で書ける話だろ 「TLPやDLPのない分野で、アムダールの法則と戦うために人月コストはかけられないし、かける価値がない」 でもとりあえずGPGPUは無事軌道に乗ったし、暖かく見守っていきましょう 汎用CPU・メインストリームx86プロセッサに対して、1/10000くらいの高度だけどww
GT300が400〜500mm^2級ならNVはいろんな意味で始まりそう
>>106 その場合、性能はGT200の数割増し程度になる
(GT300がGT200のDX11対応程度の改良の場合)
GT200の40nm時の推定サイズは380mm2
65nm(580mm2)→55nm(480mm2、2割弱減)→40nm(380mm2、2割弱減)
その計算は45nmの時では。 ハーフノードならさらに倍率2割弱ドン
あまり小さくしたらメモリと512bitで接続できんぞ GDDR5にしてバス幅狭くすればカバーできるかもしれんが・・・ それにはRumbusとのライセンス問題を解決しないとな つか今まで全くライセンス料払ってないから、GDDR5を使えるようにするには 過去の未払い分をまとめて請求されるかもしれん
不況によるPC需要の落ち込みでファブが空いた分を埋めるために ダイサイズの大きい6コア45nmCPUをデスクトップに投入してくれんかのう
>つか今まで全くライセンス料払ってないから え?そうなの?AMDって年に1回はラムバスとライセンス更新しましたって ニュース出てるけど・・
>>110 コア増えた分クロック下がるから
1コアのパフォーマンスが(も)要求されるデスクトップだと需要ないんじゃね。
払って無いのはNVIDIA 巨額の請求されてどうなるか楽しみ
nVIDIAがGDDR5使ってないのはそういうわけだったのか… 今の経営状況でラムバスに大金払う余裕とかあるのかね
ややこしい話しとるな
ライセンスで喰ってる会社は、角を矯めて牛を殺すような真似はしないだろ。
ライセンスで食っている会社だったら、普通に巨額請求だろ。 NVIDIAがライセンス未払いで潰れても、 あの会社なら別の会社が買い取るだろう。 ちゃんとライセンス料金を払う会社が…さ。 そのまま無くなっても、入ってこなかった収入なだけだし。
nVidiaの話か
DX11じゃメモリのランダムアクセスがサポートされるんで メモリ関係に変更がある ATIの場合はSFUにload,storeユニットがつきそうだ
Appleが独自設計のプロセッサ開発中とか 製造をGLOBALFOUNDRIESで取れれば面白い事になりそうだ
なんで?
AMDの製造能力は、現状ではX86CPU市場で必要とされる量の2割しか作れない さて、CPUの原材料費は数百円 数千〜数万で売られているCPUの価格の残りの部分は、設備費、開発費、人件費、販促費などなどの固定費 そしてCPU1個あたりに必要な固定費は、生産量が増えた分だけ減少する つまり、2倍作れば固定費は半分近くで済むようになり、CPUを安く作れるようになるし、値段据え置きなら利益が大きくなる ところが半導体工場の追加はとんでもない費用が掛かるから簡単には踏み切れない だからAMDは現在の生産量の中で戦うしかなかった
ところが、APPLEのCPUを作れるなら工場の追加に踏み切れる つまり、AMDは生産量を引き上げる余力が出来る そして生産量を引き上げられると言う事は製品を安くすることが出来、販売数を伸ばす事が出来る また、ラインに余力が出ればそれに高付加価値帯以外の製品も可能になるしね ちなみに、これを地で行ってるのがRadeonだね 安価に設定してシェアを奪い、量を出せるようになることで値下げ分以上に製造コストを引き下げ利益を積み増す CPUでこれを出来ないのは、AMDのCPUのような高度な物を受託できるFabは無いからで GFが大きな生産能力を得れば、CPUでも同じ事が出来る
×2割しか作れない ○2割しか売れない 独禁違反Intelのせいでファブ1つ塩漬けする羽目になってたはず
>>123 2割って何年前の知識だよw 5-6年前か?
現状保有していたFabがフル稼働していたら、
65nmの時点でシェア5割占有できましたが?
45nmや32nmになったらもっととれたろうけどね。
ま。K8以降がアレだったので稼働率は推して知るべし。
>>123 ,124
Apple独自CPUったって、iphone用とかいうオチだろ。
そんなの台湾人にでも作らせておけ、っていう結論になるよ。
Fabのキャパを埋めるために巨大ダイを作り始めたんだよな しかしK7の頃と比べるとダイサイズはでかくなったなぁ
>>126 ペーパープランでは到達してる予定だが実際は一度もそんな製造能力を獲得した事は無かったような
>>127 そういう落ちもありそうだが、市場は人事集めの内容から見てもう少し高度な物だと予想しているね
個人的には携帯ゲーム機(iPhoneのゲーム機能強化版)/据え置きゲーム機あたりじゃないかって気がする
OpenCLとかもその布石かもね
>>129 ペーパープランも何も、Fab36/38は実際にドレスデンに存在するんだが?
ただ、造るモノが無くていので、折角作ったFab38はほとんど稼働していないらしいがw
「本気で稼働できない」という点では確かに「ペーパープラン」だな。
ゲーム機というか、iMacやMac miniに(新)iPhoneアプリ用チップを 積むとかならありそうな気がする。音楽、映像で成功した商売を ゲームでもやろうとするなら、ゲームがApple製品の中で iPhoneでしか動かない状態ってのはAppleが目指す商売の あり方ではないような
そういやATIの技術者(?)がappleに移ったらしいが なんか関係案の金
何故AMDユーザーは在日朝鮮人ばかりなのか?
http://pc11.2ch.net/test/read.cgi/jisaku/1241132726/ > 1 名前:Socket774[] 投稿日:2009/05/01(金) 08:05:26 ID:RTzvTTOp
> CPUはもろにインテルのパクリ、GPUもnVIDIAの劣化コピー…
>
> 「日本人はブランドに弱い!」
> 「日本人は鎖国的!!」
>
> …などと、日本の国民性を批判するAMDユーザーの家が矢鱈と
> キムチ臭い理由がようやく判明しますた。
>
> そんな企業体質が、在日朝鮮人の方々に良くマッチしているのですねww
>
> 支那チョンに幅広く受け入れられるパクリ企業・AMDは、何時まで
> 他者製品の劣化コピーに勤しみ続けるのか?
>
> こんな不良外人・AMDユーザーは何時まで存在を許されるのか??
↑のスレは、やっぱりAMDユーザーの真理を突いてるな。
反シオニズムだからAMD選んでるだけだけど
自分の使用目的に応じた性能と価格で選んだら結果的にAMDが 多くなっていた、ってだけだな。 道具なんだから、それ以外の理由なんて要らない。
そもそもX86の互換CPUを作ってる企業はもともとIntelの直接・間接の求めで始まったんだろ いくつものコンピューターのプラットフォームがひしめき合っていた中からPCが勝ち抜けたのは 他社に互換CPUを作らせてオープンなプラットフォームを構築できたから
>>133 ID同じワロタw 陰厨はマジで必死すぎるなw
ATIのshaderは次あたりで SFUにload,storeユニットがついて普通のCPUっぽく変更されそうな気がする 全体的にはぱっと見PPUっぽくなりそうだ キャッシュはどうすんのかな
>>139 ATIのコンパクトなダイで性能を稼ぎ出す技術がCPUのダイ設計に生かされる日は来るのだろうか
>ATIのコンパクトなダイで性能を稼ぎ出す技術 ふとおもったけど、コレに転換したのってAMDとの統合後だよな。 それまでは巨大ダイ路線。恐竜的進化を突き進んでいて、 袋小路に入るところだったはず。 そして、AMDが将来的にCPUにGPUを統合させるためもあって、 コンパクト路線に転換させたはず。
32nm世代でCPUに4770並みのが混載されるようになるならワクワクするな コアはもう4個で十分だから、空いたスペースには強烈なアクセラレーターを載せて欲しい でもって、単体ビデオカードが別に刺されている場合はそれはそのままアクセラレーターとして使われ 単体ビデオカードが刺されていない場合はアクセラレーターが簡易なGPUとして動作する感じでね
>>145 禿同
Llanoだったっけ?
単体ビデオカードとCrossFireなんかもできるといいかも。
演算パワーを詰め込むのはいいがメモリバンド幅はどうすんだ
わかった何とかする
CPUコアは1個か2個か全部そればっかりかでいいだろう
CPUがSOIでなければ混載の夢も広がるんだけどねえ。 バルクから移行したんだから、どっかの時点でバルクに逆移行も出来るんじゃないの?
>>144 違うよ
もともとのATI路線だよ
R600の時点でこれ以上巨大なダイにするつもりがないのと
ハイエンドは複数ダイになる旨を明言してる
AMDの介入なんて皆無
R800世代もATI時代の長期プランのまま
はいはい
ま、結果的にnvidiaを追い詰めることができたよね
買収と取り込みしか出来ないAMDが 技術的介入なんて出来るわけない
もうNVIDIAの話はよそうぜ 悲しくなってくる
その上のデモもすげぇな
あと、GPUの場合にわざと正面に影が出るような位置にし しわを目立たなくしてるな
>>157 でもGPUじゃないんだよな
仮に3.2GHzのPhenom2でも51.2gflops程度
それにすら劣るのはつらいな
OpenCLに期待かけて結局R700世代では使い物にはならんのか
R800も同じか・・?
キモ電波
現実逃避ですか 4870の自称1.2tflopsも屁呑む51.2gflopsに劣るという現実から
3Dゲームは現状GPU性能が不足することが多いことも把握できない気持ち悪い知的障害者
OpenCLなら処理をCPU⇔GPU間でシームレスに委譲しあえるってデモだね と言うか、CPUとGPUで演算能力が余っている方が物理演算の処理を負担出来ると言う OpenCLの特徴を見せるデモなのに、描画負荷の掛かってるGPUが物理演算まで処理しちゃったら OpenCLのデモじゃなくてHavokのデモになっちゃうよ
つーかリンク先に >「ゲームでは,GPUに高い負荷がかかる一方,CPUの負荷は低くなる局面もある。 >そういうとき,CPUに物理シミュレーションを任せることで,CPUとGPUをバランスよく使えるのが,OpenCLの強み」 ってあるのに ちょっとでも長文だと読んだ文章次から次へと忘却の彼方へと押しやってしまうほどに著しく低い知能
たかだか51.2gflops程度の負荷すら苦になる程度の物じゃ 元から使い物になどならない そもそも、このデモの描画のどのへんに たかいGPU負荷がかかるよ?
>OpenCLのデモじゃなくてHavokのデモになっちゃうよ その通り CPU専任の方が速い
知能が昆虫未満だったりすると 付加をポリゴン数でなくポリゴンキャラの人数で計ったりするんだろうなあ 皆!卓越した知的障害者であるID:Rosnf6Ggにレスを読んで貰おうと思ったら 10文字以上は書いちゃ駄目だぞ!
Havok Clothは2年以上前のデモだよ 今のGPUなら負荷でも何でも無い 今そのデモを持ち出した理由はOpenCLの特徴を見せるためでしょ
>>168 4gamerの説明聞いてたか?
ATIロゴのないそいつはCPU動作だ
>>172 題名にGPUって書いてあるけど違うの?
>>174 相手にすんなよ
それまででも知的障害丸出しなのに新たに
> 4gamerの説明聞いてたか?
とかもう気持ち悪過ぎるだろ
>171が説明してるんだからそっち読め
悪いかわいそうな人か
INTELとAMDのHavok vs nvidiaのPhysX INTEL様がいるから心強い
>>168 のは3月27日のGDC09でのGPUによるデモ
180 :
Socket774 :2009/05/02(土) 15:08:46 ID:TyjLE0OI
認めたくないものだな つらすぎる現実というものは
OpenCLのhavokが遅いからって悲しまないでね Physxも58gflopsのPPUと312gflopsの9600GTでようやく同等だから まぁ、もともと物理処理はストリーミングプロセッサ向きじゃないだよ 1tflopsのGPUならば物理処理もCPUよりだんぜん高速という先入観が我々の中にあるが そんな物は幻想であるという裏づけのデモだな ATIはnvよりひどいが
未だに某スレで通報されたことに怯えているんだな 名無しで暴れたからって逮捕の可能性が0になるわけでも知能が少しでも改善されるわけでもないのに
まだ理解してないのか そのデモはCPU動作だと
今のHavokの親会社ってどこか知ってるよな? そういうことだ。
OpenCLのGPUで動作の場合は4Gamerや
>>175 のように"ATI"ロゴが付くの
で、明確にGPUで動いてるって分かるのはこの二つしかないんだよ
つまり25体GPUで動かせるんなら、たかだか3体のデモでこんなにモッサリしたり
CPUにワザワザ切り替えて動かす必要はないの
4Gamer動画のGPU=>CPUの切り替えによる
動きの軽さに気がつかないほど鈍感なんですか
更に言うなら、GPUの方が速ければ橋のデモのほうに真っ先に使ってるよ
これもOpenCLのデモという事で行われているのだから
CPU,GPU,DSPで同じコードが使えるのがOpenCLの強みである
なぜ、GPUでデモをしなかったか
遅いからさ
>>188 知的障害者に通じるわけないっつーの
そもそもあのポリゴンと動きでどれだけの負荷が掛かるのか判らないんだし
物理演算専用にCPUとGPUをそれぞれ用意して勝負させるとかでないと何の比較にもならない
知的障害者に構うだけ丸っきり時間の無駄
せめて観察日誌くらいにしておくべき
連休ですねぇ
ちなみに統合shaderとは言うがnv,ati共にVS裂くshaderは nvなら1クラスタ、atiのR700世代なら1アレイに固定されています。
>>189 橋のデモに使われたHavok DestructionはOpenCLに対応して無いよ
じゃ、ただのhavokデモか? なんでAMDがやる必要があるのかね
197 :
Socket774 :2009/05/02(土) 16:49:08 ID:TyjLE0OI
見栄えのするデモがないんだよ ミスリードの為だろ 裏を返せばGPUは実用不可って事だ
なるほど、つまりCloth(しかも1体)程度しか動かせないほど遅いんだな
>ただ,ちょっと気になったのは,「Core i7-965 Extreme Editon/3.20GHz」に >「ATI Radeon HD 4870 X2」を組み合わせたデモ機で動作していた機関車と橋 >梁のデモ――掲載したIntelブースでのムービーがそれだ――が,爆発の瞬間 >にカクっと止まって,コマ送りのようになっていたこと。撮影禁止のセッションで >行われたデモだと,滑らかに動いていたのだが……。 CPUで処理しきれなかったのかね
その筆者の意図として ”ATI Radeon HD 4870 X2”だから爆発の瞬間にカクっと止まって,コマ送りのようになっていたこと。 にしようとしてるわね
>>196 のソース
Havok Clothデモの画面の横にVISUAL ADRENALINEロゴが見えます
紛れもなくIntelブース
203 :
Socket774 :2009/05/02(土) 17:22:19 ID:TyjLE0OI
GPGPUはまさに ATI先生の次回作にご期待下さい だろ
>185 の筆者は GPGPU-Accelerated とはっきり書いているな それを訂正させに乗り込む勇気がないなら Rosnf6Gg の負けvizworldの筆者の勝ち
205 :
Socket774 :2009/05/02(土) 17:29:58 ID:TyjLE0OI
その筆者が、アンポンタンなだけだな お前のようにw
206 :
Socket774 :2009/05/02(土) 18:15:19 ID:TyjLE0OI
Larrbee 1core≧4870か
知的障害者が絡むと 「ソースをどう解釈するか」「ソースが正しいか否か」「ソースがあるかどうか」から途端に 「ソースにある文字をちゃんと読めるか」という途轍もなく低いレベルにまで落ちてしまう そしてここは知的障害者(例の串師)の庭だとつくづく思う
おまえら今日はこのスレで暴れてるのか
40nm製品を先に出されたことによるストレス?
いくつレスを連ねたところで、直接ツッコミを入れに行く勇気がないのなら 今日はこれくらいにしておいてやる、と捨て台詞を残しながら 逃げていくやられ役よりも低レベル
211 :
Socket774 :2009/05/02(土) 19:30:40 ID:TyjLE0OI
なんだこの必死さは
>>202 てか、もろにHavok Clothデモじゃ右上に
intel.comってあるし
ヘーヴォックは基本CPU処理でGPUによるアクセラレートも可能と、最初からフルGPU処理なNVIDIA PhysXと違うって事なんだね? そしてヘーヴォックは「軽い」所を売りにしてるんだね? 個人的視点だがヘーヴォックはNVIDIA PhysXよりも長く生き残ると思うね。
HavokはGeForceを含めて全てのGPUをサポートする気だろう 元々PPUを売るためのPhysXとは方針が違う罠
サポートしたところで結局使うのはCPU or Larrabeeじゃ内科医 現世代じゃパフォーマンスが低すぎる DX11世代で改善するかね、はたして
知的障害者はこの前 某もっさりスレの立て始めがPhenom登場以降などと言って時系列を再び歪め出したとこなので 今回もおそらく2年前のデモで最新のGPUが使われていると信じて疑わないのだろう まあこんな推測しなくてもそれ以外の部分だけでも恐ろしく馬鹿なんだけど
218 :
Socket774 :2009/05/02(土) 20:12:58 ID:TyjLE0OI
2年前にOpenCLがあったのかよw
まだ続いてるのかwあのスレはw
早い話手元で動くデモさっさと出せば済む話 それやらなきゃGPUかCPUかぐちぐち言われてもしょうがない
知的障害者はHavok Cloth=OpenCLでNehalem=Larrbeeだとも信じ込んでいる悪寒 毎度のことながら激しく気持ち悪いです
223 :
Socket774 :2009/05/02(土) 20:41:40 ID:TyjLE0OI
(笑) ダメだこいつ 何も分かってないよ
225 :
Socket774 :2009/05/02(土) 20:47:02 ID:TyjLE0OI
CPUのなw
226 :
Socket774 :2009/05/02(土) 21:05:34 ID:R7Ug85/1
Havok Clothは2年前のプログラム
GPUで処理してたら駄目なのかよ(´・ω・`)つ
>>185
何で今日はこんなに盛り上がっているんだ? しかも雑音っぽいのが混じってるし…… 雑音が騒いでいるって事は、何かintelの脅威になるような出来事があった?
>>228 IntelのCPU路線がちょっと微妙になりつつある。
231 :
Socket774 :2009/05/02(土) 21:39:40 ID:TyjLE0OI
エライ人には、それがわからんのです
知的障害者って以前もっさりスレで グラフィック処理をHDDでやるとか断言してたが やはり今回もCPUとGPUが物理演算だけの勝負が出来てると思ってるんだろうか? 相変わらず気持ち悪い
233 :
Socket774 :2009/05/02(土) 22:01:08 ID:TyjLE0OI
お前にはかなわないよ(笑)
>>229 なんか微妙になる要素があった?
AMDはIstanbulやMagny-Coursが前倒しになりそう、がそんなに影響するかな?
intelのCPUは特に問題無さそうだし、あるとするならLarrabeeのダイサイズ位で
特に微妙って事は無さそうだけど……
236 :
Socket774 :2009/05/02(土) 23:29:41 ID:R7Ug85/1
PhenomUで動かせるのが3体までだから、29日のデモでは3体なんだろ そうで無いならHabokの所有者であるIntelがIntelのCPUで25体のデモを行う
記事を読めばわかるが、29日のデモって、GPU処理を CPUで一時的に肩代わりさせるってのが主旨じゃねぇの? 現在では"CPU"と"GPU"とでは処理方法が基本的に全く違うのだから、 "CPU"の処理を"GPU"ではほとんど肩代わりできないし、 その逆の"GPU"の処理も"CPU"ではほとんど肩代わりできない。 でも、GPUがカツカツの時且つ、CPUが空いているときに、 GPU処理の一部を一部でもGPUで処理させる事ができるってのが 29日の"Havok"のデモだろ? 変な話だが"Hybrid SLI"をCPUでやっているみたいなもんだろ。 さらに実用になるのは「今」ではなくて…。
デモ機の構成判らんけどもしラデ使ってるんなら これはFirestreamとの差別化で 物理演算に超重要な倍精度を封印してるってことだから まああんなもんだろう 知的障害者の陰が消えて気持ち悪くなくなったところでマジレス
布のシミュレーション程度の物理演算で倍精度使う奴は馬鹿です
つーかラデで倍精度解禁されてることも知らないんだね。かわいそうに。
>>237 コプロだかAPUだか知らんが
メインプロセッサに処理押し付けてどうするよ
しかも肝心のGPUのパフォーマンス自体がCPUに遠く及ばない
そんな程度のものなら最初からGPUなどあてにしない
OpenCL GPUでまともに動いてたのは1体のみ(3体はすでにモッサリ)
OpenCL GPUでは3体
native CPUは少なくとも25体を動かしている
GPUの負荷を軽減するために
わざわざパフォーマンスが落ちるOpenCLを用いて
負荷をCPUに押し付けるかね
こんなんじゃ、いつまでも技術でもの域を脱しない
Havok FXの二の舞だ
× OpenCL GPUでは3体 ○ OpenCL CPUでは3体
結局GPUは使い物にならないんだな
本当お前は何時まで経ってもアフォーだな
あの程度で描画負荷とか(笑)
249 :
Socket774 :2009/05/03(日) 09:25:15 ID:MYoSLgJu
4GamerのドレスのデモのときCPUは負荷の掛かる仕事してないだろ 裏でエンコでもしてたんなら別だけどね それならCPUに負担させるのが合理的だな
250 :
Socket774 :2009/05/03(日) 09:42:53 ID:MYoSLgJu
ちなみに2000体デモでは48702枚刺して1枚を描画に、 もう一枚をAIに割り振ってたな
"ID:s/6jM9j3"の無能さがわかるスレですね。
252 :
Socket774 :2009/05/03(日) 10:11:41 ID:B6o8YXkF
出た! 勝利宣言!
254 :
MACオタ :2009/05/03(日) 11:51:59 ID:0zq6Tpag
Mercury Researchの市場調査結果の速報版で、今年第1四半期のAMDのシェアが前期より
4%も回復したとのこと。
経営陣が刷新?されてから良いニュースが続いているようです。
http://www.eetimes.com/news/semi/showArticle.jhtml?articleID=217201229 ------------------
AMD had 20.9 percent of PC processor sales in the quarter, up from 17 percent in the
fourth quarter of 2008, according to Mercury. Intel's share declined from 82.1 percent in
the fourth quarter to 78.2 percent in the first three months of 2009.
------------------
ネットブックの躍進が止まったのが主な要因となっているようですが、今後はどうなりますか。
255 :
MACオタ :2009/05/03(日) 12:26:40 ID:0zq6Tpag
AMDがAVX ISAに追従するらしいとのこと。
http://support.amd.com/us/Processor_TechDocs/43479.pdf -----------------
The XOP and CVT16 instructions utilize a new three-byte XOP prefix preceding
the opcode byte. This prefix replaces the use of the 0F, 66, F2 and F3 prefix bytes
and the REX prefix and encodes additional information as well. The FMA4 instructions
utilize the new AVX VEX prefix which provides similar encoding capabilities.
-----------------
問題はIntelは4引数のFMA命令を止めて、梯子を外された形になってしまった…ということですが。
ヒント:mmmmm = 3 早かれ遅かれIntelは4オペランド版FMAをサポートするだろうな
>>256 あなたの崇拝するAgner Fog氏はそういう認識は持っていないようですね。
Intelを強く批判していますよ。
http://aceshardware.freeforums.org/intel-avx-kills-amd-sse5-t538-90.html#10803 ------------------
It seems that AMD are the nice guys in this case. They have made great sacrifices
by dropping their SSE5/DREX coding scheme and replacing it with Intel's scheme for
the sake of compatibility. And then Intel have blown it all by changing their specs
once again. Arghhhhh!!!!!!
------------------
AVXに追随するなんて当たり前の展開だな。 追随しないと予想した奴なんてほぼ皆無じゃねーの?
現実にはVEXのOpcode空間がAMDに割り当てられた。Agnerの心配はご無用だったんだよ。
仲裁もなにも、Intelの中の人は【最初から】、AVXに使えるmmmmmフィールドは「3ビット」って言ってたんだよね。
http://pc.watch.impress.co.jp/docs/2008/0407/kaigai434.htm > 「5バイトバージョンの2つ目のペイロードはフルではない。将来の拡張のために3ビットが残されている。
> 3bitsあれば、1,000以上の新命令を加えることができる。新しいフィーチャ、新しいレジスタ、新しいベクタ長。
> ほとんどなんでも加えることができる」(Valentine氏)。
mmmmmフィールドが5ビットあるのに、3ビットしか使わない理由って、一つしかないだろ。
んで、結局こうなんだろう。
0-7 : Intel AVX
8-15 : AMD用
16- Larrabee New Instructions
んで、4オペランドFMAはmmmmm = 3だからIntelの領域と推測できる
俺は「VEXエンコーディング版SSE5」の存在は去年くらいから予見してたよ。
>>253 それはCPUデモだと分かりきってるから
すまん、推測も何も最初から3は0F 3A 空間のエイリアスだわ。 第3版までに載ってた仕様と全く同じだ
ドキュメント番号見てたら気づいたんだけど AMD64 Technology 128-Bit SSE5 Instruction Set がそのまんまXOPに変わったんだな。 SSE5は事実上の廃止か ひょっとしてさ、Bulldozerが遅延した理由って・・・ なにより、SSE5用に書き溜めてたコードが無駄になったんだがwwww わざわざレジスタ待避回数の削減とか苦労してやったのにwww
264 :
Socket774 :2009/05/03(日) 14:09:35 ID:B6o8YXkF
SSE5(笑)
あの4gamerのデモはGPUで処理してることを「わかりやすく」するためにATIロゴを表示させただけじゃ・・・
んで
>>185 ではGDC2009で公開されたAMD GPUで走らせたもの
ただこれだけのことなんだけどなぁ
だから前に言ったじゃない SSE5は最初からAVX実装をする為の方便だって AMDはSSE5のおかげで、AVX分のライセンス料が(どの程度かわからないが)浮いたわけだ
FMA4はIntelが廃止した4オペランドFMAと同じオペコードだったり ほかの命令はC4hではなく、8Fhから始まる3バイトVEXに なっているが、8FhはすでにPOP r/m と言う命令に割り当てられて いるのは問題ないのだろうか? SSE5にあった PTEST ROUND??に相当する命令がないし (元々はSSE4.1の命令だから、AVXをフルサポートすれば問題ないが)
>>267 実際、AVXフルサポートが前提だと思ってるが。
わざわざ命令フォーマットを大幅に改訂してAVXに合わせたのにサポートできない理由がない。
> なっているが、8FhはすでにPOP r/m と言う命令に割り当てられて
> いるのは問題ないのだろうか?
IntelがLES/LDSとの競合回避したのと同じ理屈だよ。ただし、modフィールドではなくregフィールドで迂回してる。
POP命令のModRM.regフィールドは常に0でなければならない。
ここが0以外だと無効命令になる。
regフィールドの一番上のビットはXOP.Bに割り当て、あとの2ビットのうち01 10 11のときにXOP、
00ならPOPあるいは無効命令と解釈するようにすればいい。
それで、mmmmmは8以上でないといけないって制限があるわけだ。
でもAMD独自の命令を加えるのには十分な空間はある罠。
4オペランドFMAはAMD独自空間ではなくIntelの領域に割り当ててるわけだが
POPCOUNTの前例があるし、Intelが別のOpcodeを割り当てることはないと言えるのでは?
どんな交渉が行われてるかは知る由もないが。
VGA統合とのを前提にしたSSE5と、 CPU処理の効率化を前提したAVXとでは違う。 SSE5も普通に搭載するだろ。
まだ言ってるのか。 純粋にGPUとのやりとりに使えそうな命令って元々FP16-32変換命令くらいだぞ。
>168 >244 がCPUだとしたら >185だけではなく 山のような数のページが間違っていることになるな
>>271 お前だけが記事を理解できていないことは理解した。
275 :
Socket774 :2009/05/03(日) 16:55:40 ID:MYoSLgJu
>>243 が正しい事を言ってるぞ
× OpenCL GPUでは3体
○ OpenCL CPUでは3体
CPUだと3体までしか動かせんから、あのデモは3体なんだな
大体に、低クロックで何百並列のSIMDで性能稼いでるGPUが万能なわけがないだろう。 全部のエレメントに同じ命令を発行するからSIMDなわけで より自由な動きを表現するには1つの命令ストリームが抱える演算エレメントを減らすしかない。 チップ当たりのデコーダ(コア)数を増やすってことだな。つまり。 CPUの視点で見ればGTX280は30コア、4870はたかだかクアッドコアでしかない。
>>276 4870の800SPが、80SP-10クラスタあるから10コアかと思ったんだけど違うのか
4コアってどういう計算でなるの?
すまん4コアは2900XTだな 10コアで正解
>>278 GTX280とかSP倍速になってるけど、HD4870よりどれくらい実行値高いの?
280 :
Socket774 :2009/05/03(日) 17:45:05 ID:MYoSLgJu
だから物理演算とか群集処理とかに的を絞ってるんだな
>>272 それはCPU
しかもOpenCLじゃない
>>273 その通り
>>275 そうAMDが無理やり作った"OpenCLのCPU"だから
3体で限界なんだろう
>>280 GPU(ストリーミングプロセッサ)は物理演算に向かないと、今はnvidiaのAGEIAの中の人が言ってました
廃止された命令があった COMPxxはVCMPxxと等価だから廃止されたと推測できるが PERMxxには、最新のAVX/FMAの仕様では等価な命令がない AMDは古いAVX/FMAの仕様を基にXOP/FMA4を策定したのか? そもそも、AMDはFMAが3オペランドになったことを知っているの だろうか?
>>282 知ってるから「FMA4」なんでしょ。
IntelのAVXマニュアルと被る命令は基本的に載せてないはず。
つーか、SSE4AのpopcntがSSE4.2のそれと同じだったように
IntelとAMDって命令セット拡張のすりあわせに関しては内通してると思ってるんだが。
おそらくIntelはデコーダの実装のご都合でimm8をレジスタとして解釈する命令を削ったんだと思う。
デコーダ改良の目処が立ったら4オペランドFMA追加するでしょ。
(タイミングとしてはHaswellあたりか?)
まあ、軌道修正が出来る段階でFMAまでの命令セットを全て公開したのはIntelの懐の広さだろ。 もしSSE5のままBulldozer出してからIntelがAVXを発表してたらどんな鬼畜だよって感じだが。 AMDはIntel互換のSIMD命令のスケールメリット生かしつつ+αの独自命令で差別化ってのが 基本戦略だから、AVXをアナウンスした時点で、完全独自のSIMD命令を普及させる気は更々無いでしょ
AMD64のような糞拡張を受け入れねばならなくなる可能性を限りなく0にしておきたかったんだろう 知れば知るほどに汚い拡張だからなー ホント嫌になる
すまん、あれMS主導だろ。 同じくMS主導でXbox 360のVMX128がAMD64のREXの拡張方法そっくり。 とってつけたようなレジスタ拡張とか。
今日はなんか色々沸いてるな いや賑わってるのか
>>286 まあ、Intelの懐が深いというのは正直違和感がw
それもMSの調停じゃないか?
x86のSIMD命令周りが汚いのはオレゴンのネトバチームのせいだと思う。 デコードしづらいほどトレースキャッシュ有利だからな。
今回の対応でGNUな人々の苦労を壮大に棒に振ったのがAMDだよ。 命令セットの改変は早い段階でアナウンスしておくべきだった。
>>285 どのあたりが糞なのでしょうか?(´Д`;)
いいじゃん どうせSS5の最適化なんかオカシカッタシ
「ID:s/6jM9j3」は一人で結局何が妄想したかったんだ?
なに? まだATIのGPUが遅いって現実を認められないの?
まだあのソースの内容読んでないの?
まだ、アフォー記事に縋り付きたいか nvidiaのphysxはnativeのCUDAを使っても312gflopsの9600GTで58gflopsのPPUとようやく同等 汎用処理についてG80系統はR600系統に比べかなりましなほうだが、それでもオーバーヘッドはでかい OpenCLのオーバーヘッド、ATI GPU自体のオーバヘッド これらを考えれば、物理演算でCPUより劣るなんてのは何の不思議も無い てか、480gflopsの4670で35.2gflopsのchromeに負けんなよ
flops云々じゃなくてGDC 2009で公開された動画は紛れもなくGPUで実行したもの ↑を嘘だという記事があれば貼ってね
ID:s/6jM9j3 = ID:qIlq4WZp はやっぱりNVIDIA儲か。 やっぱり儲は場違いの場所で勘違い議論を展開するから、 気持ち悪いったら仕方がないな。 デモの意味も湾曲して受け取り妄想しているのをみると、 「お前の頭の性能悪くて、こちらが心配になります」って感じだ。
逝っちゃった人には理で解いても無駄。
デモ機の構成とかモデルのポリゴン数だとか タイミングをズラせた他は全部に同じ動作させてどのくらいパワー食うのかとか そういう情報が無く比較も糞も無い感じだから これはもうGPGP化やCPUとGPUの連携等技術の躍進を喜ぶか知的障害者を笑う以外にあまり意味が無いよな
このスレはあれか? 真実を語ると、叩かれなきゃいけないのか?
>>303 (笑)
仮にその通りだとして、なんで29日のデモは
また、モッサリに戻ってるんだね?
29日に日本にはとどかなかったてか?
AMDの通信手段は伝書鳩なのか?
初期段階でもなんでもなく、モッサリdemoが
AMDの行ったOpenCL GPU,CPUのものだ
4gamerにあがってる29日動画で
モッサリなのはすべて分かること
真実を語れば、叩かれない。 妄想を語れば、叩かれる。
そもそもこのスレで話題にすることなのか・・・
310 :
Socket774 :2009/05/04(月) 13:28:06 ID:6rfn+a7a
AMD信者の真実とは、都合の良いことだけ 都合の悪いことは、すべて嘘 キモイんだよ お前ら
GPU処理の一部をCPUに渡すってデモなのに、 必死で「GPU性能プププー」って暴れる既知外さん。 GPUでの処理に関してはよいモノはスルー。 悪いモノだけしかみない典型的な既知外脳。
一部じゃないよ完全に切り替えだよ CPU,GPUの並列で物理処理させてるわけじゃない CPUに切り替えたらGPUなんて使わない 遅いし
なにげにGIまでやってるんだよね。 布のシミュレーション程度ならGeForceのCUDAのデモにもあるしGPUで出来るとは思うが 大域照明には容量のレイトレース・キャッシュが必要 それ以前にリアルタイムデモかどうか疑わしい。 Havokってオフラインレンダラ用の物理エンジンも手がけてるだろ。
ある程度の容量の、ね
>>312 はいはい。オレもこの頃Geforceに新製品が出ないには残念に思うけど、
他スレまで来て必死扱いて荒らすのはどうかと思うぜ?
お、今度はnv信者扱いか
G80系統もR600系統に比べて粒度が小さくて、走るスレッドが多いので
多少はマシという程度の話
>>314 なんちゃってGIは幾らでも
まあ、床面に人体モデルを反転してアルファブレンドしただけに見えなくもない
非常に自演臭漂うスッドレですね
ただのHDRじゃないかい R300でやってたじゃん
日本語読めない馬鹿は黙れ
あー勘違いしてた 「GPUで物理演算と描画処理」→完全に切り替え→「CPUで物理演算と描画処理」 ではなく 「GPUで物理演算(HDDで描画処理)」→(GPUとCPUを)完全に切り替え→「CPUで物理演算(依然としてHDDで描画処理)」 こういうことか うっかり現実世界の常識で判断してた
アムド キモ過ぎ
で、「ID:qIlq4WZp」は何が言いたいんだ? RADEONは糞ですって事か?
うんうん いくらハイエンドのNVIDIAでもげふぉ9600GTじゃカスみたいな性能しかないから 物理演算と画像処理の両立は難しいよね
記事を読めないのか読みたくないだけなのか ただGPUで実行しましたよっていう動画なのになんでここまでズルズルと
329 :
Socket774 :2009/05/04(月) 16:31:05 ID:x+0zzs+v
25体デモはHavok自身の公開で、Havok自身がAMDのGPU上で処理とアナウンスしてる Intel系の会社がデマ流したりするかね
(笑) そうだねぇ そう思ってすごせれば幸せだよね おれも29日のデモ見るまではGPU動作だろうと思ってたよ 29日のあれを見ても、そう思えるほど鈍感じゃなかったんだよ おれは
331 :
Socket774 :2009/05/04(月) 16:38:27 ID:x+0zzs+v
つまりIntelならやりかねんってことか?
>>329 オンライン処理とは言ってないからプリレンダなんじゃないの?
333 :
Socket774 :2009/05/04(月) 16:45:01 ID:x+0zzs+v
>>332 『標準的なPC上で7000ポリゴンのダンサー25体が60FPSで・・・』
とあるしリアルタイムじゃないかな
でもOpenCL対応版とは書かれていないから旧来の通常版のHavok Clothじゃないかな
334 :
Socket774 :2009/05/04(月) 16:50:46 ID:x+0zzs+v
とは言っても4870を複数枚刺して出力用以外は全部演算に割り振ってたりはしそうだね ところで、OpenCLは複数のCPUやGPGPUなどを同時に動作させられるんじゃなかったっけ?
先日からの議論は結局なんなの? 誰か分かり易く産業で解説してくれ。
>>336 「Radeonはお先真っ暗、GPUとしてもLarrabeeに負けるだろう」って淫厨の妄想披露大会
ララビーのラの字も出てないが?w
339 :
Socket774 :2009/05/04(月) 19:34:04 ID:x+0zzs+v
>>335 Havok自身が25体のデモをAMDのGPUで処理したってアナウンスしてるがこれはどういうこと?
やれやれ・・・
・GPU処理をCPUでも一時的にまかなえる。 ・APUになったら、統合されたGPUコアも演算に使えるよ。 あのデモは、コレを示したデモでしょ?
やれやれ・・
よそでやれカス
>>337 LarrabeeじゃなくてLarrbee 1core
>>283 --------------
(タイミングとしてはHaswellあたりか?)
--------------
解説をIntel次世代スレッドに書いておきました。Intel AVXに関するこれ以上の議論は
場違いっぽいので、あちらにて。
347 :
MACオタ :2009/05/05(火) 22:53:06 ID:q7/3GqkF
GFのCEO Doug Groseが欧州で開かれた会見で、現況を語ったとのこと。
http://www.theinquirer.net/inquirer/news/1052016/globalfoundries-ready-business-ceo ---------------
The self-proclaimed "leading edge digital foundry" is known to be currently
floundering for customers but according to Grose, 12-14 customers are already
"potentially" ready to sign on the dotted line."We're well versed in SOI" and have
"the resources ready. " he said.
---------------
まだAMD以外の顧客は掴まえ切れていないようですが、頑張っている様で…
せめて自社GPUくらい作れればね
GT300が来年まででないって…GPGPUどころじゃねぇな
うぜぇ…いくらリンクを示したところで、 「信じたくない」奴が認めるわけがねーだろ。
>>350 まだそんなアフォー投稿にすがりついてんのw
キモイよアム虫
おまいも英語が読めたらいいんだけどなぁ
まああれだ GDC09の後しばらくの間、Havokの公式HPのHavokClothのページで公開されてたんだよ QuickTimeの動画もね もう終了しちゃったから確認のしようが無いけどね
>>355 それをみたところで「CPUとGPUの切り替えデモだな」程度にしか思えないが?
そこからGPUの性能やCPUの性能なんて全く推し量れません。考えることが可能だとしたら、
「CPUでGPUの処理をさせるのは大変なので、わざわざ人を減らしてデモした?」
ぐらいか? GDC2009のIntelデモでも別にCPUだけで処理していたわけでもないし、
今回のデモだと「あぁ。切り替えできるんだ。すげぇ!」ぐらいでしか…。
鈍感というのは、ある意味幸せだね
だれか直接兄貴のイベント行った人いないか〜
>>361 はいはい。もうわかったから。お前は頑張ったよ。うん。
でもここは「AMD次世代CPUスレ」だから。
>>357 説明文は時間が経てば
Internet archive で引けるようになるんじゃないかな
364 :
282 :2009/05/07(木) 04:31:28 ID:6N1Q2Djj
4オペランドFMAでどれくらいスループットが上がるのか、 団子じゃないが定量的に語るべきだな。 Intelは、デコーダに割くトランジスタが割にあわないから翻意したんじゃないのか。
ていうか、そんな時代ってあったのか?
Chekib Akrout:Freescale Semiconductor
Nigel Dessau:Sun Microsystems(?)He joined AMD in March 2008 Emilio Ghilardi:HP(?)Ghilardi, who joined AMD in 2008 AMD????
知的障害者が新たなネタで舞い戻りました
当然知ってると思うけど Rick Bergman:ATI Bergman came to AMD via the acquisition of ATI in October 2006. He joined ATI in January 2001, from S3 Graphics, a division of SonicBlue Inc., where he served as chief operating officer. 生粋のGPU屋
CPUを捨てた?
Dirk Meyerは生粋のCPU屋だけどねえ Chekib AkroutはIBM、Freescaleと渡ってきてるし
「CPUを捨てた」とか。電波を飛ばしまくる頭にカビが沸いている奴がいるな。 AMDのロードマップをみれば、CPUとGPU部門の統合なんて必然だろうに。
また変わるんじゃないの AVX,SSE5のゴタゴタで
統合をCPU部門とGPU部門のどちらの主導で行うか、という違いだね。 CPUの方が圧倒的に規模が大きいが、いまうまく回っているのはGPUの方だ。 しかしこれは水と油を合わせるような挑戦だね。設計サイクルから製造から 何から何まで違う。
APUでCPUとGPUの統合を目指しているからね。 主導権を握っているのは当然CPU部門でしょう。 NVIDIAもCPUを造る。造らないと言っている中で、 予想以上の電波を連レスで飛ばしまくる奴がいるとは、 なんか逆に可哀想に思えてくる。
統合の際に今までのと設計が大きく変わる可能性があるのはGPU 注意が要るのもGPU
主導権を握ってたRandy Allenは退社 Rick BergmanはATI なんで今頃こんな話が出てくるのか 新規開発にまわす金が無く、旧ATI路線をそのまま使用 そしてATI時代のネタが切れて CPU,GPU別々に金を出す余裕が無いので一本化 phenomeでこけたCPU部門の担当を事実上解雇 いまから一本化していつモノが出来るのか ブルドーザーは本当に新アーキテクチャなのか (そいやdec路線に戻ったとか、前に出なかったかな)
>>364 あるよ。VPERMPSって。マニュアルよく読んで。
VPERMIL2PSとPERMPSは元々細かいところで違いがなかった。
PERMPSの方はimm8の値によってPIとかの定数をロードできる。
どっちかというとimm8指定版のパックドバイトシフト命令が消えてるのが気になった。
これはAVXどころかSSE*に元々無かった
383 :
MACオタ :2009/05/07(木) 21:55:08 ID:stcC2GUY
AMD生抜きだったRandy Allenが切られましたね。
自社開発に失敗しては技術を買ってくるという繰り返しだったAMDの場合、『生抜き=優秀』
ということにはならないのですが…
まだ見られるRandy Allenの紹介をAMDサイトより。
http://www.amd.com/us-en/Corporate/AboutAMD/0,,51_52_570_15089,00.html -------------------
Randy Allen: Senior Vice President, Computing Solutions
Randy Allen is senior vice president, Computing Solutions Group, AMD. Reporting to
President and COO Dirk Meyer, Allen is responsible for the development and management
of AMD’s broad and growing portfolio of consumer and commercial microprocessor
solutions and platforms.
Previously, Allen served as Corporate Vice President and General Manager for AMD’s
Server and Workstation Business. In this role, Randy led AMD’s server business’
financial performance, business planning, silicon and platform planning, product management,
and brand management. Prior to that, Allen was AMD’s vice president for Design
Engineering where he was responsible for the silicon design engineering of AMD’s
microprocessor and chipset products.
Allen joined AMD in 1984, and during his more than twenty-year career with the company,
he has led several teams, including the implementation team of the AMD Athlon^(TM)
microprocessor and the design team for the AMD Opteron^(TM) and AMD Athlon^(TM)
64 microprocessor and associated chipsets.
Previous to AMD, Allen worked as a design engineer at Hewlett-Packard, where he
worked for the HP3000 Business Computer development team.
Allen earned a master’s degree in electrical engineering from Stanford University and
a bachelor’s degree in electrical engineering from the University of Texas at Austin.
-------------------
すでにネタ切れなN社がありますが
いや、VPPERMの所にこう書かれてるだけで、この他に説明がないね
> Related Instructions
> VPSHUFHW, VPSHUFD, VPSHUFLW, VPSHUFW, VPERMPS, VPERMPD
AVXのVPERMILPSは1つのソースレジスタのみをシャッフルする奴なので別モノ。
っつーか、VPERMIL2PS相当ならVPPERMで実質できるけど。
気づいたところでは、SSE4AのVEX or XOPエンコーディング版もないし、
これから加筆されていくんじゃない?
>>365 Bulldozer以降の方策は、3本の命令デコーダ上手く活用して内部命令数を稼ぎたいから。
浮動小数FMAだけに留まらず整数乗算+整数加算までフュージョンしてる。
1命令で加算と乗算を一緒に出来てしかもレジスタ非破壊なら1命令で実質2オペレーション分供給できることになる。
2命令あるいは256ビット命令で4オペレーション分。
そんな命令がいっぱいあるから、それだけで4オペランド化する方が効率が良い。
32バイト/clkの命令帯域があるので多少1命令が長くなってもネックにならないだけのキャパがある。
逆にIntelはCore MAでデコーダ4本になったので、そこまで必死になってない。
むしろ命令長を短く抑えて1コアあたりの電力効率をあげようとしてるように思える。
まあアーキテクチャの特性の違いだろうね。
俺は同クロックならピーク性能はAMDのほうが高くなると見てるが。
>>381 そういう電波ってどうやったら出せるの? 教えて!
SSE5 p.195 PPERM > Related Instructions > PSHUFHW, PSHUFD, PSHUFLW, PSHUFW, PERMPS, PERMPD XOP/FMA/CVT16 p.223 VPPERM > Related Instructions > VPSHUFHW, VPSHUFD, VPSHUFLW, VPSHUFW, VPERMPS, VPERMPD VPSHUFWという命令はないから、命令の 先頭にVを付けただけのような気がする
事実を語ると電波扱い キモイよアムド
事実は最初の2行だけで、残りは単なる想像。
製品部門と技術部門の違いはなんだ? アーキテクチャの定義なんていう初期の作業は技術部門が 色んなアイデアを出した上で決めていきそうな感じがするが
AMDがどんな会社なのか分かってれば 簡単に分かること
それに今回のって たんに”larrabee互換はじめました”だろ
モロに知能障害
>>387 そこだけは気になった。まあCellは実質vperm/shufb(バイトシャッフル命令)だけでやってるし
AltiVecのvpermと同仕様の命令が一つあれば十分と言えなくもないのだが。
395 :
364 :2009/05/08(金) 08:10:23 ID:yZU2wQm3
AVXみたいな128bit x2 ではなく256bitの実装をするために 先送りにしたとかだったらいいな
AMD独自規格なんて無駄なことに金を費やす余裕はないし 20%程度のシェアじゃサードのサポートも怪しい intel規格に追従すればとりあえず無駄にはならない 余計な金は使わなくて済む 堅実路線だね
ID:WC8wZ+f+はAMDにイチャモンつけたいだけ
そう考えるのは ガキだからだろ
>>396 は事実じゃないの?
シェアが20%の会社よりシェアが80%の会社を基準にソフト開発した方がいいでしょ。
サポートが決まって良かったけど、 これからの本当の問題はその実行速度のような。
>>399 問題はそこじゃない。
仮想化支援なんてIntelとAMDでまったく命令に互換性ないし。
対応するところはする。
旧SSE5は既存SSEの延長の技術。
一方AVXはSSEを完全に置き換え、SSEを廃れさせる技術。
これをMSも支持した時点でSSEが廃れるのは確定した。
これから新規に独自命令積むなら、SSEの上じゃなくてAVXの上にのっかったほうがいい。
XOPが市場の20%なのは変わらんよ。
AVXは使えるんじゃないの
AMDが欲しいけど、今のAVXにない命令を追加したのXOP等だしな。 intelはintelでAVXを拡張していくだろうし。 理論上はAVXの命令フォーマットの方が、性能出る可能性が高いようだし、 従来型のSSE5で行くより、ここは一旦intelの路線に乗った方が良いと考えたんだろう。
いったんていうか 3dnow!よろしく切り捨てるんじゃないかな
CPUとGPUの統合をやめるわけではないけどね
>>405 そういやAMDの最新CPUって3Dnow!非対応なんだっけ?
SocketAの頃は未だ対応してた筈だが。
Phenom IIでも3dnowext 3dnowフラグ立ってるから使えるのでは? まさか64ビットで使おうってわけじゃあるまい?
対応を抹消しないといけないから厄介なんだよ。
仮想化支援は、 CPUの仮想化機能を使うソフト自体が多くないから、 SSEほど互換性が問題にならないのかなぁ。
Intelの最新命令・AMD独自命令を追いかけてるデベロッパーもそんなには多くないよ。 DirectXが内部的に使ってるから間接的には多くの人が恩恵をうけてるだろうけどね。 AMDはGPUとの命令セット統合のためにSIMDの命令長を伸ばしていく方針だったし プリフィクスを追加することでしか拡張ができないSSE(5含む)よりも、 1024ビット程度までスケールする余地があるAVXのほうが都合が良かったのでは。 数年先の実装でGPUにアクセスする命令がLarrabee互換になったとしても誰も驚かない感じだな。
気が付いたらAMDもIntelのCPU作ってたりして。
>>406 部門統合が遅いよな。もっと早い時期に統合すべきだった。
だから初代Fusionである"Swift"がグダグダになったりするんだよ。
>>415 Swiftがキャンセルになったのは、くっ付けただけだと予想したより性能が低かっただけ
部門統合が今頃になったのは、45nmのCPUと40nmのGPUを軌道に乗せるまでは、
統合するための調整や事務処理が開発の足かせになるからだろう。
知的障害者は「息をするが如く」をも根に持っていたのです
そろそろうざったくてしょうがないレベルに入ってきたな。
激しい被害妄想の為、常に心に余裕が持てないマイノリティーには 正論すらウザく感じるのですね。 極々常識的な内容のレスしかしていないのに・・・
AMD使いはチョンだぁなんだと騒いでるアンタに正論云々とか
相手にするから浮かれるんだろ。それとも自覚でもあるのか?
キチガイはさっさとNGリストへw
425 :
MACオタ :2009/05/09(土) 20:57:48 ID:pzhWRKtk
>>347 の会見のレポートと思しき記事がTechReportより。
http://techreport.com/articles.x/16881 プレゼンの写真にあるように、GF的にはLSI logic, Infineon, SONY, NXP (旧Philips), Freescale, ST Micro,
Samsungは既に終わっており、TI, 東芝, 富士通も後に続くと考えている様で。
赤丸がつけられた、Infineon, SONY, Freescale, 東芝は"Confirmation intention to go asset lite for Logic"
と注釈がありますが、要するに現在交渉中の有望顧客ということなのでしょう。
富士通は45nmで打ち止めってニュースが最近あった気が
GFは絶賛営業活動中ってところか。 安定顧客がつかめるといいね。
プロセスは問題ないだろうから頑張って欲しいね 当分の間は顧客がIPを持ち込むことになるんだろうか
430 :
MACオタ :2009/05/12(火) 22:50:54 ID:K+1AjzCB
>>254 に引き続きIDCのx86プロセッサの市場調査結果がでました。
http://www.eetimes.com/news/semi/showArticle.jhtml?articleID=217400331 ------------------
But Intel's unit market share of PC processors declined to 77.3 percent in the
first quarter, down 4.7 percent from the previous quarter, IDC said. Advanced
Micro Devices Inc. grew its unit market share by 4.6 percent to achieve 22.3
of the market in the first quarter, IDC said.
------------------
4.6%のシェア回復で、やっと低価格路線が報われてきた様です。
Intelに関しては、ネットブックの市場縮小でatomの在庫が山と積みあがっているとのこと。
市場シェアの内訳は、下記の通り(増減は4Q08比)。
- Desktop: Intel 70.0%, AMD, 29.8%
- Mobile: Intel 84.3% (-4.7%), AMD 15.0% (+4.7%)
- Server: 89.3% (+1.2%), AMD 10.7% (-1.2%)
サーバーのシェアが厳しいね 6コア投入でどこまで取り戻せるか
>>431 第1四半期の結果ということはXeon 55xxの成績は勘定に入っていませんから、今後更に
サーバーの市場シェアは悪化しそうです。
性能に見合った価格で売ればネットブックの市場はもっと広がるよ。 intelもノート製造メーカーもちょっと色を乗せたがるからそんな事になるんだ。 ざまぁとしか言いようがない。
Nehalemの約4ヶ月不在にもかかわらずシェアは下がったか やっぱベンチの結果と不況が相当効いたみたいだな
>>430 つーかネットブックがちょっとブームになったからって
Atom作りすぎだろw
Core2Soloにも劣る性能しかないのにいつまでも景気よく
売れるわけないわ。
サーバーが1%下がったのは厳しいな。 そして、ノートが増えるのはわかるんだが…。 デスクトップでも30%近くあるのな…。
なんでMobileで増やせたんだ?
>>437 HPとか大手OEMがYukonプラットフォーム製品を売ってくれました。
intelがCULVで対抗するのも納得のシェアへの影響だな。
>>440 同じくSempron 140の情報をHKEPCより。
http://www.hkepc.com/2909 - Codename: Sagas
- 2.7GHz@45W
- 1MB L2
- Single core
- HT 3
- DDR2/DDR3 support
- 3Q09リリース予定
>>437 690Mの性能がそこそこよかったからじゃね?
TurionX2も安いしな。
>>438 おいオタ、Yukon採用してるのって日本じゃHP dv2ぐらいしか
ないんだが海外はそんなに出てるのかい?
>>444 先日の第1四半期会計報告で特に言及してましたから、影響が大きかったのでは?
http://seekingalpha.com/article/132172-advanced-micro-devices-inc-q1-2009-earnings-call-transcript?page=-1 ------------------
You mentioned CULV and an interesting topic, you know, really we view that as a
response to our Yukon offering, which as you know is exploiting an opportunity in
the marketplace to bring PC performance at an affordable price to ultra thin notebooks.
And you know we’re happy with the momentum that we have with HP and we’re
happy with the design win momentum that we have around Congo. So hopefully
I answered those two questions and you said you had a follow up.
------------------
やっぱり安いのは強いってことじゃね Intelも必死になるくらい
>>448 そりゃ確かにYukonだがライトウェイトモバイルノートじゃないと
俺には意味ないんだわ。インテルのクソオンボは却下だし。
>>448 日本のパソコンのデザインがいかに時代遅れか痛感させられるな……
HPやBenqが日本発か。 そもそもHPもBenqも外資だし、もうNECや東芝、富士通なんかの国内の企業には YukonとかのAMDの小型ノートは期待できないということか。
NECは一応TurionX2のノートがある。シャープとかも探せば あると思う。
>>440 "Regor"の1コア殺しかと。Regorが真っ二つに割れる設計だったら別だが。
>>452-452 シャープには色々と期待したんだが、出したのが"PC-NJ70A"だもんな。
機能としては色々とついていて面白いかもしれないが、本音を言ってしまえば、
1.5kgって半端な重量とATOMって半端なCPU性能で無駄な物をつけんなと。
なんか動きが鈍重な「全部入り携帯」のPC版としての印象しかうけん。
そして軽くてシンプルな機体として、MSIがC2DのULV搭載を10万程度で出すし、
いままで得意だった小型ノートという分類でも「日本は終わった」と思った。
Regorは尻じゃないだろ
L2-1MBかぁ。 でもRegorってL2-512KBって出てた気がするんだが。
>>455 どれも噂の域を出ないっていうか
表記ミスなんてよくあること
x86 CPUでも問題ないが、きっと違うだろうな。
VenusはSPARC64だよ。
まあ富士通って時点で他にないだろ。 SPARCネットブックとか出るわけないよね。 富士通が頑張って開発してもあんまり商売にならんから端から見てて悲しい。
またfmtownsが出るの?
>>461 なんかすごいな。誰かAM3で出してくれ
Sandy Bridgeと大差ない構造って・・・これはすごいことなのか?
昔ってほど昔でもないがSparcのノートあったな うんこだったらしいけど
>>461 バリアブレードとかセクタキャッシュとかいくつかの仕様が非常に面白い
>>468 思うんだが、CPUダイにアレコレ汎用じゃない演算コアを統合するよりも、CPUダイには
チップセットを統合していって、汎用じゃない演算には昔のコプロみたいにソケットを
使って追加する形の方が良さそうな気が。
基本的なx86の処理のみCPUで行って、javaとかエンコとか用途に応じたコプロを追加
する形にすれば、メーカー製PCのラインナップに役立ちそうだし。
面白そうではあるが 結局コストという壁にぶつかって廃れるだけだな
コスト以外にもスペースという点でも不利かも ATXにそんなコプロ置くスペースって残ってたっけ?(PCI(ex)あたりを削ればスペース開くかな?) 冷却の観点から言うと、CPUとGPUは統合してくれた方が静かに冷やせる。
>>469 外部コプロじゃ転送ペナルティでCPUとコプロの混在コードなどでは性能がでない、
コプロに丸投げできる処理しかできない。
昔のMBとか見ると、今の10倍くらいチップが載ってたから、ただ積むだけならスペースくらい なんとでもなりそうだけど、今だと思い処理させるチップにはばかでかいヒートシンクが ついちゃうからなあ
>469 トレンザって名前でこんな事言ってた様な気がする。
ネイティブな6コアをHT3でMCMか。 HT3ってHT3.0かな。3.1はどこへ逝ったんだろ。
>>478 790GXと790FXで対応している。NVIDIAでは3.0までしかまだない。
>>479 チップセットにしか使わないのかな。
MCMのもHT3.1にしたらよさそうな気もするけど
消費電力がアレなことになるんだろうか。
HT3としか書いてないから、3.0か3.1かはまだ伏せている、だといいんだけど 登場時期とプラットホーム一新とを併せて考えれば、おそらくHTは3.1なんだろうけど……
HT3.1は「PhenomII+HT3.1対応チップセット+DDR3」でしか本領発揮できない。
しかも帯域が増えた恩恵があるのは、現在はCF、オンボードVGAなどでしか…。
簡単に言えば、HT3.1に対応&恩恵を受けられる環境はまだレア物って事った。
HT3.1で強化された省電力機能なんて、ノート向けが出なければ…ねぇ。
確かコア電圧が可変があったような…。
ちなみに、鯖用だったらHTの帯域が増えることによって性能は上がるけど、
実は"Opteron"さん。ほとんどがHT1.1/2.0までしか対応していない。
CPU自体がHT3.1対応より上に対応するCPUはでていなかったりもする。
そもそもで対応チップセット自体が今年の後半って話。
その世代で"Opteron"さんはようやく本領発揮できたりする。
あと、ぶっちゃけ。HT3.1/3.0の差はチップセットが対応してくれるかどうかだけ。
>>480-481 なんというか…なんでその知識でこのスレに来ているの? 私より酷いじゃないか。
>>482 >HT3.1/3.0の差はチップセットが対応してくれるかどうかだけ。
コア間の接続の話なのに何故チップセット?
コア間の接続はオンチップファブリックじゃろ
>>483 調べたらわかることをgdgd言っている奴は何なの?
次世代CPUスレは無知のお方への教育スレじゃないぜ?
Magny-Coursのダイ間の接続がHT3.0か3.1かは調べたら分かるんだ へー
>>485 じゃぁ、調べるからどんな感じで調べるのかくらい教えてくれよ。
>>475 で出てる12コアCPUは6コアずつをHT3で接続してる図に見えるんだが
どう調べればいいのかな。
つまり現在のDT用途での対応状況を調べれば 未来の鯖用途での対応状況が判るというわけです
489 :
MACオタ :2009/05/16(土) 12:41:01 ID:1dwWUrwO
HT3.0と3.1の違いですが、動作クロック (=帯域)が上がっただけで大きな違いはありません。
http://www.hypertransport.org/default.cfm?page=HyperTransportSpecifications31 -------------------
HyperTransport 3.0 Features Plus:
・2.8 GHz, 3.0GHz and 3.2 GHz Clock Rates
- 51.2 GB/s Max Aggregate Bandwidth (32-bit)
- 25.6 GB/s (204.8 Gb/s) Max Bandwidth per Unidirectional HT Link (32-bit)
- 6.4 GT/s (3.2 GHz x 2 DDR) per Lane
-------------------
つまり、HTのクロック(またはコアクロックとのバス比)が公開されれば、容易に判断できる
ということになります。
ダイ間のHTってCPUチップセット間のHTに、そんなに密接だったのか。
> Each die in Magny-Cours MCM should have four HT3.1 connections.
>>475 の記事って、記者がMCMだから、多分こうじゃねってことを書いた内容だから、
あんまりこれで盛り上がってもしょうがないんじゃないかと。
あと、記者自身は、G34だとダイ間接続はパッケージ上で有利だから、
HT3.1以上の速度で繋がる可能性もあると考えているっぽい。
ダイ間接続のHTにチップセットの対応云々がそこまで関係あるとは思わなかったな。
>>494 勘違いしているみたいだけど、ダイ間の接続と、
チップセットの接続は関係ないよ。
M/Bのつくりには関係するだろうけど。
HTは違う速度のリンクでも混在できる規格だし。
ダイ間の接続は、3.0か3.1かよりも、2本繋いでいるのをどうやって 使いこなすのかが気になる。役割を違えて担当に専念させるのか 同等の扱いで負荷分散させるのか。同等だとしたら独立して 振舞えるのか同期した動作しか出来ないのか
双方向ってだけで1本
>>497 >475の図はbsnのライターの勘違いなのか?
そう断定できる理由は何だ
(4-1)+2だとするとG34ではHyperTransportが6本あることになるから
IstanbulのHTって何本
(4-1)+2=5
あれ、イスタンブールってL3ねえの?
あ、あったあった。すまん。
Sao Pauloがどうなったのかは知らんが、これはHTが4本になるはずだったんだが もとはこれのMCMがMagny Coursだったはずなんで (4-2)*2=4 CPU間接続には2本でも不思議じゃない
HTの本数って現状では有効化されていないだけで、4本前提だったと記憶しているけど…… 今は3本だけど、それってソケットFの制約じゃなかった? だからMagny-CoursのHTは4本であってるはず 2つのIstanbulをHT2本で繋いでる、で間違いない
記事にあるように、個々のダイはHTは4本。2本はダイ内部でお互いを接続している。 んで、外部に出ているのは4本が正しいとおもう。何故かはお互いのメモコンがあるので、 内部で一本しかHTが接続されていないと、それだけでボトルネックになっちゃうから。 MCMでオンチップされる"Magny-Cours"は、内部でデータのやりとりのほかに、 他のコアからメモリのデータへもアクセスしなければならない。 HTで1本だと、相互のデータやりとりのついでに、メモリデータのやりとりだと、 帯域が圧迫されて、それだけでカツカツになって性能も出ないだろうね。 そんなわけで、折角HTがあまっているんだし、相互に2本ずつ繋ぐだろ。
なんで同じ事二度書いているの? 推敲しないの? バカなの?
そーですね
CPUキャッシュが統合されてないと 他コアの意味が薄れるんじゃ……
>>511 MCMのことを指してるんだとしたらそれは不可能。シングルダイでは
歩留まりがお話にならないからMCMにした。よってキャッシュの統合
は不可能。そのためにチップの基板上でHT接続している。
513 :
MACオタ :2009/05/17(日) 18:15:56 ID:JmRnghsg
IC Insightの2009Q1の半導体企業ランキングが出ましたが、AMDは12位->9位と
Top10に復帰しました。
http://www.eetimes.com/news/semi/showArticle.jhtml?articleID=217500234 ただし、少々注釈つき。
---------------------
Advanced Micro Devices Inc. (AMD) slipped into the top 10 in the first quarter,
moving up three spots. But IC Insights noted that AMD is among the few IC
makers that expects second quarter sales to be worse than the first quarter
and questioned whether it could remain in the top 10.
---------------------
日本勢では、悪い悪いといわれつつも東芝 5位->3位とか、SONY 9位->7位とか。
日本勢を悪い悪いと言うやつは朝鮮人とユダヤ人とその手先(池田信夫やcnet blogの痛い人や一部の2ちゃんねら)だけだよ
東芝嫌いはかなりいるとおもうぞw
松下幸之助は偉大だと思う
半月遅いね。 ルーマーサイト巡回して推敲するのに時間かかったのか? この情報に興味を示す連中にとっては既に周知の事実すぎて まったく役に立たなすぎる。
早く知ったからって自慢するようなことじゃないぞw それに後藤は他にも記事書いてるからな 最新ニュースばかり追いかけてたら古いネタが腐る
整数命令の効率向上が壁に突き当たってる以上、ベクタ演算で 高速化するしかないってわけか。残念だ。
demakasejan信者は言うことが違うな
大文字じゃないと伝わりにくいぞ
524 :
MACオタ :2009/05/18(月) 00:33:15 ID:Rm73IXwv
基本的に後藤氏が引っ張ってきた特許は、Sun Niagaraのように複数コアで実行ユニット を共有する構成の様です。 この解釈はちょっと違う様な… ------------------ 単純な例では、2命令発行のCPUコアを2つクラスタ化して、最大4命令/スレッド 発行を可能にするといった実装が挙げられる。 ------------------
誤答に技術語らせるなんて根本的に間違ってるな 安藤さん連れてこい
Cluster-based Multi-threadingを思い出すでがんす
AMDの整数パイプラインはリザベーションステーションが3ペアのALU/AGUで独立なモデルをとってる。 まあ、あとは言いたいこと解るよな?
柔軟にする分の割り当ての手間と充填率向上の差し引きが問題?
529 :
MACオタ :2009/05/18(月) 00:42:27 ID:Rm73IXwv
IntelのμOpsスケジューラは集中型。 Nehalemは言わずもがな。 Atomでもデコード済みの命令をいったんキューに溜めてからディスパッチすることで 無駄なくリソースを割り当てている。 AMDがSMTを導入しないのはRSが分散型だから効率が良くないってのが大きいと思ってたが それに適した形に変えるんだろうな
昔の記事
http://www.extremetech.com/article2/0,2845,1826658,00.asp AMD is also eyeing "cluster based multithreading," a technology
specifically designed for large enterprise clusters. The technology
would allow other microprocessors to share specific blocks on
the chip, such as the floating-point unit. Designing this technology
in will cost an additional 50 percent in die resources, but yield
an additional 80 percent improvement in performance, Moore said.
532 :
MACオタ :2009/05/18(月) 00:52:57 ID:Rm73IXwv
だからくそ低性能なんだろ
案の定火病起こしたなwww おもれー
言わせて貰うが「ALUとAGUのペア」なんてx86特有のもんだ POWERの命令フォーマットなんてなーーーーーーーーーーーーーーーーーーーーんの参考にもならないので お引き取り下さい。
後出し団子の負け
ご覧の通り、命令キューに対してFXU(整数演算ユニット)とLSU (ロード/ストアユニット)が 一組になっています。 オフセットやインクリメント付アドレシングがISAに含まれている以上、x86だろうがPPCだろうが 似たような構成になるのも不思議なことでは無いかと。
頭悪いねー x86は命令セットレベルでメモリ上のアドレスをオペランドにできる。 ロードオペレーションと論理算術演算を融合したままでスケジューリングすることができる POWERのアドレッシング機能なんてある意味でCOMET II以下ですよ。 ポイントは、K7から続いてる「AGU」はロードストアユニットそのものではないことだな LSUは共有されている
>>534 POWER6+しょぼすぎワロタw
Nehalem速すぎワロタw
どっちが正しい反応なんだろう
POWER6なんてオレゴン去った連中が作ったんじゃないかと思うくらいの駄作だな
そのうちBulldozerとSandyBridgeの考察でも書いてくれ、楽しみにしてる
半月遅いね。 ルーマーサイト巡回して推敲するのに時間かかったのか? この情報に興味を示す連中にとっては既に周知の事実すぎて まったく役に立たなすぎる。
早く知ったからって自慢するようなことじゃないぞw それに後藤は・・・(ry
低脳コテは無駄に争うのが半月遅いね。
半月前からペニシュくんは火病おこしてますから 誤答にまでスーパーセット言われちゃいましたよ
後藤ちゃんの記事を読んで気付いたけど、 AMDもようやくSMT採用なんだねぇ。 流石に採用しなければ、性能競争に負けるけどさ。 「ようやく」って感じだね。…あと2年あるけど。
SMTのようなものじゃないの?
後藤記事でも、SMTとは違うって書いてあるじゃない。 SMTだと、OOOの非効率性やメモリ待ちで空いているCPUのりソースを使う工夫だけど、 AMDの場合は、共有部分もあるけど、スレッドごとに専用のパイプラインを用意するようだから、 SMTほどトランジスタ効率は良くない模様。
>>553 "SMT"って同時マルチスレッディング 。"Simultaneous Multithreading"でしょ?
一個のプロセッサが同時に数個のスレッドを処理できる機能の総称でしょ?
しかも後藤は
> IntelのSMT(Simultaneous Multithreading)と較べると、必要とするトランジスタ数は多いが、
> マルチスレッド性能もより高くなる。比較的シンプルな制御で、高いマルチスレッド性能と
> 高いシングルスレッド性能を効率よく両立できると見られる。
って書いているじゃない。あと、SMTとHTTを脳内で混在してないか?
Intelは自社CPU内部に実装したSMTに"Hyper-Threading Technology"って
名前をマーケティング上つけただけだぞ?
>>554 なるほど、同時ならSMTっていうなら、AMDのもそうなるのかな?
ただ本来のSMTの目的よりかは効率悪そうだけど。
効率ばっか考えてるとAtomになっちゃうからな
そっか SMTであることに違いないのか
>>555 後藤さんの推測ガン無視ですか。
しかも「本来のSMTの目的」ってなんだよw
「本来のSMTの目的」が何かを教えてくれよ。
「SMT」に「目的」も糞もないだろ。
マルチスレッディング化することが目的じゃなくて、CPUの空きリソースを活用する目的のために、 マルチスレッディングを手段として使ってるだけなんだから。 AMDも性能向上とトランジスタ増のバランスの良いところを見切って実装するだろうから、 トランジスタ効率が悪いと決め付けたのは、ちょっと短絡過ぎたとは思うが。
SMTとSMT支援ハードウェアは切り離して把握しないとだめだろ
AVXのレジスタの実装について頓珍漢なこと言ってる誤答の予想は当てにしない方が良い
凄い馬鹿が普通の馬鹿を笑う
↑以上、ものすごい馬鹿の一言でした。
馬鹿って行った奴が馬鹿なんだよ
じゃあ二度言ったお前はアレだな
馬鹿ってのは例えば 自分の見つけたソースは丸写し出来るのに 他人に急に出されたものは理解出来ずプリフェッチプリフェッチ言い出すような奴のことだよ
つまりお前だな
くそわろたw
>>566 僕が幼稚園の時にその返しが出来ればもっと明るい幼稚園時代が過ごせただろうに・・・
>561 は取り消しな、忘れてくれ
Bulldozerも最初に出てくるのはションボリな性能なんだろうなー。(それでも買うけど) IIでやっとまともに。
"Bulldozer"は面白いんじゃね? Phenom初代が失敗したのもTLBもあったけど、 製造プロセスが残念だったのが大きいし。 そこさえ失敗しなければ、なかなかのモノになると思うが。
どのCPUもシュリンク後に最適なサイズと性能になるように開発するから、 登場時のプロセスでは微妙なのはいつもの事。
だろう だろう だろう 面白いスレだな。
ウルトラマン だろう〜
くだらねぇwww
>>576 次世代CPUスレだもん。出ていない製品なんだし推測でしか語れないよw
もし、決めつけで語ったらそいつは単なる電波野郎だ!
あるいは中の人のリークか……まずありえないけど
あまい、あま過ぎる
わかったからちゃんと記事読めよ
スピードワゴンを思い出したのは俺だけじゃないはず(`・ω・´)
こいつはくせえッー!ゲロ以下のにおいがプンプンするぜッーーーーッ!!
GFは…な。しょうがない。顧客がいないんだもん。
>CEOの見通しは、AMDとアブダビの政府系投資部門による合弁会社、グローバル・ファウンドリーズを除いたもので、それを合わせれば黒字にはならないだろう、と説明した。 ( ゚д゚)・・・・・ ( ゚д゚ )
こっちみんな
連結決算しないで黒字とか、どうなの…?
「コア事業が」黒字の見通し。連結とは書いてないのがみそ。
>>581 Z-RAMの次はT-RAMか
早いとこ製品化しておくれ
Z-RAMとかT-RAMでSSDみたいなの作れないのかなぁ。
Tって何かと思ったら Thyristor なのか サイリスタの綴りなんて知らなんだ
またMeyerの法螺か
第2四半期に黒字化するんじゃなかったのかよ
現実はどうかというと
>>513 みたいなこと書かれる始末
596 :
Socket774 :2009/05/20(水) 07:14:22 ID:JSPDl0wB
簡単に言うと、x86用のソフトウェア資産が生かせる Cell プロセッサのようなもの。 で説明ができるよね。AMDのもIntelのも。
Cellはヘテロコアが持つローカルストアに専用プログラムを流し込んで 使うものだから「Cellのようなもの」ではぜんぜんないと思うぞ。
6コアそろそろかな?
600 :
Socket774 :2009/05/20(水) 14:10:23 ID:i6x2PvvL
次世代CPUとやらはそのヘテロコアなんじゃないの?
Cellの場合は1ダイにMCMを並べたような構造だから同じとは 言い切れないかと。つかCellの仕組みわかってるのか?
すもももももももものうちってやつさ
wikipedia の情報程度ぐらいなら。 設計、パッケージングいろんな点から見られるから例えは不適当だったかもしれないけれど。
cellの場合、別コアがあるっていうより、別の小さなパソコンが入ってるって感じだからな
せめてマイコンと言ってくれ。 My ComputerでなくMicro Controllerの方ね。
マイコンつったらスターコントロール2だろ
石原良純だろ
なんじゃそりゃあ
マイコンはROM BASIC搭載じゃなきゃやだ。
保守
バルクプロセスは32nからなんだから当たり前なのだが。
>>613 TSMCの40nmで作ってるんだから当たり前。そのせいで
歩留まりもよろしくないようで供給不足だが。
fusionまだかよ
sandraだとAthlon neoのmulti media intがやけに速くなってるが なんか変わったのかな
SandoraがCPUを正しく認識するようになったんじゃね?
【COMPUTEX 2009レポート】
2009年後半にはAMD以外の企業からの半導体製造受託を開始
〜GLOBALFOUNDRIESインタビュー
http://pc.watch.impress.co.jp/docs/news/event/20090602_212100.html Fab2には3つのモジュール、つまり製造施設が3つ用意され、それぞれで異なったプロセスルールなどの製造も可能になる。
同社はこのHPで、GPUを製造することも視野に入れている。同氏は、「AMDはすでにFusionの計画を明らかにしている。
そうした製品はこのHPで製造されることになるだろう」という。
さらに、消費電力が重視される半導体向けにはLP(Low Power)と呼ばれるプロセスルールが投入される。
LPは45nmおよびそのゲート長改良版となる40nmプロセスルールで製造される予定で、High-Kメタルゲートの技術が採用される。
今年の後半には、AMDのグラフィックスチップ製造を受託できるように働きかけを続けている
縦軸が%という罠
車に例えれば加速した後にスタートダッシュする奴
「新プロセスの導入開始時期はIntelより遅いんだが 導入から出荷開始に至るまでに要する時間はIntelよりもスムーズだ」
時系列が狂っている
>>627 > 時系列が狂っている
おまえの言ってる事はさっぱりわからん。
立ち上がりがはやい は 立ち上がりのペースがはやい と 立ち上がった時期がはやい と、両方に使えるけど 文脈でどちらかハッキリしてるだろ
単に立ち上がるラインの傾きが急(短時間で安定化)ということを 言いたいだけなんと違うのか?
新しいプロセスをハイエンドで高く売ってぼろ儲け 古いプロセスの在庫は悠々処分 Intelが一人で美味しいとこを持って行ってるといういつもの話ですね
>>621 このグラフの話ならば、横軸が時間。縦軸が割合。
立ち上がり時期はIntelに比べて一年遅いが、
35nmの製造割合が50%を突破するのは一四半期とかからない。
…そりゃそうだろう! CPUでシェア50%を狙えたはずなのに、
造るモノもなく、塩漬けされていた工場の生産ラインをフル操業したら、
そんぐらい一気にいくだろうw フル操業できたら!
45nmのOpteron/PhenomII系も製品としてはそんなに悪くはないけど、
対抗メーカー製品と比べたら、分が悪いわけで製造数は増えないだろうしw
>>631 AMDというかGFもようやくそれができるようになるみたいです…。
2012にNY工場が動き出したら、三世代つくれるようになるみたいだし。
馬鹿が居るな
AMDというよりGFの商売が安定化してくれるほうが重要だな。 そうすればAMDも安定した生産委託ができそうだし。
塩漬けされた工場は何故か無料で最新プロセスに自動更新
意味不明。ひょっとして煽っているつもりなんだろうか?
某ホモに目を付けられたスレなんて その知的障害を笑うくらいしかやること無くなる
Istanbulでちょっとはプレミア付いてASP上がるのかね。
http://xtreview.com/addcomment-id-9040-view-New-AMD-processors.html * Opteron 8435 (2.6 GHz) - > $2649;
* Opteron 8431 (2.4 GHz) - > $2149;
* Opteron 2435 (2.6 GHz) - > $989;
* Opteron 2431 (2.4 GHz) - > $698;
* Opteron 2427 (2.2 GHz) - > $455.
* Opteron 1389 (2.9 GHz, 75 W) - > $269;
* Opteron 1385 (2.7 GHz, 75 W) - > $229;
* Opteron 1381 (2.5 GHz, 75 W) - > $189.
メモリたくさん積みたいんだけど早くクアッドチャネルのCPU 出してくれ。現時点ではi7しか選択肢がない。それでも24GB止まり。
AMDも、もうちょっと速くhigh-kに移ってればな…
定格じゃ引けを取ってないんだし十分戦えてるだろ
High-kを導入しても、確実に消費電力が下がるわけでもないだろう…。
下がらない理由はないけどな。 だからAMDも32nmでHKMGは導入決定事項だし。
>>643 そうなんだけど、CoreMAと比較しても
よりはっきりした差が出たはずで
ケチ付けられる事も無かったのでは?
という意味で。
導入しようかといって簡単にできるものじゃないだろ Intelでさえ手間取ってたのにAMDなんかが簡単にできるとは思えないし。 ただでさえ65nmの出来が良くなかったんだから時間をかけてられなかったんだろ
プロセス技術は追いついてきたけれど、今後ブルドーザー以降は、AVXやSSE5などの 命令セットでシングルスレッドの性能を、今までのペースよりも上げていく 予定になっているから、今後のAMDの展開は心配だなあ。 命令セットはSSEからずっとIntelに追従、AVXも結局採用することになり ブルドーザーも2年ほど先延ばし。AMDは命令セットを普及させるのが、独自では かなり苦手だから、今後もIntelの追従ばかりして、追っかける展開にならなければいいんだが。
別におっかける展開になっても困らないような。 アプリの方がIntel命令セットばかり使うんだし そこそこの性能が出るようにしてもらわないと困る。
従来の酸化絶縁膜では遅かれ早かれ駄目だというのは 皆わかっていたんだろうけど 導入でintelに先を越されたのはかやはり痛いんじゃないかな 素材や技術の最適化で先行されるのだから 少なくともintelが確立している22nmプロセスまでは AMDが上回る可能性はないだろうね ハード的な部分でこの通りなら もともと負けてるソフト部分と合わせて ますます差が広がりそうな感じ
AMDの45nmはIntelと比べても数値的には遜色ない リーク電流の面でも
>>653 勘違いだったか、ごめん
22nmではとりあえず設計してるってだけかな?
リソ技術は22nmまでとりあえずArF液侵で
それから先が大変と・・・
プロセスの微細化技術が行き詰まってAMDもintelも
今までのやり方が通用しなくなったら
CPUのハード的な進化は別の方向にシフトするんだろうけど
今のところ分かってるのはマルチコア→チップセット統合→DRAMスタッキング
さらに先にゲート構造の変更、素材の変更と結構色々やれることあるな
微細化技術伸びなくなってもCPUの進歩は続きそうだね
>>644 確実に下がる。ゲート絶縁膜からのリークを減らすには有効。
リークを減らすために絶縁膜を厚くすると、その分電圧をかけ
なきゃならないんで、厚みを持たせつつ電圧を下げる二律背反
を実現するのがHigh-K。
>>651 ソフトが負けてる?というのが意味不明。
互換性のある命令セットでソフトで負けるとか矛盾してるぞ。
とはいえ、同一のアーキテクチャでもないので、インテル向け最適化されたものだと AMDでは不利になるのも事実
SSE以外の最適化で変わるはせいぜい2〜3%なんで 事実上ないのと同じ。 SSEの性能だけはインテルが強いけど事実上エンコのみ。 市場としては極めてニッチだな。
という夢を見たのですね。
たとえばなんちゃって4コアでもいいように、むりやる処理ゆがめてるから Phenom系やi7が期待ほどの性能でないってのは有名な話だよな もっとも、これはインテル自身も被害こうむってるんだがw
>>658 ・SSEの最適化の恩恵を受けるソフトはせいぜい2〜3%
・SSEの最適化で上がるパフォーマンスはせいぜい2〜3%
2パターンに解釈できるけど、前者なら同意
ちょっと待ってくれ 動画のエンコってニッチなのか?ビデオよりエロゲの方が人気なのか?
人数的には少ない層が方向性を左右してしまう、ということも起きる事はある
>>661 両方はずれ。読解力ないな。
SSE「以外の」最適化で変わってもせいぜい2〜3%と
書いてあるだろ?
でもさ、今回のCorei7だってサーバーなどのXeon向けは、場合によっては 3倍近くPhenom系より性能いいベンチもあるし、命令セットで追従が遅れると 一部でもかなり不利にならないかな?AMDもそれ以外の方法で性能UPをする つもりはあまり無いようだから。
例えば、HTをQPIの6.4GT/s相当に引き上げたり、DDR3で3chや4chにしたりするとか
HTT(笑)が有効な場合だけでしょ。
命令セットはバカに出来ないからねぇ。 Intelの全部コピって独自に自分のところの命令セット追加してくれればいいよ。
>>665 三倍近い差が出るのは「コア数の数」と「メモリ帯域」が問題になるベンチ。
逆にi7は hihg-k にも関わらず 特にロード時に驚くほど場苦熱になるのは、 何故なんだろう QPIが倍の速度、トリプルチャンネル の差だけとは思えないが
そりゃサブストレートに直接漏れる電流は無対策だからな。 そこを対策したのがSOIってこと。インテルとAMDでちょうと真逆の 対策になっている。
High-Kで製造され、SSE4.1に対応しているC2Qと、High-K未導入でSSE3までしか対応しないPhenomIIが、 消費電力で多少劣るとはいえ、数多のベンチマークで総合的にはほとんど差がないんだよな。
消費電力で多少じゃなく、かなりだろう。
はいはい
あれ?ここアンチスレだっけ?
Q9650辺りまで来ると、消費電力も記事によって勝ち負け両方有る 程度の差だった気がするけど。
アンチスレっていうか、次世代スレに出入りする人間が 現状を認識できてないと辛いだけじゃね? 劣勢な時は特に
現実を認識出来ない奴は知的障害者とかホモとか呼ばれていて 頻繁にコテを付けたり外したりしている
>>672 その上ベンチの多くはシェアの多いIntel系に最適化されていることが多い…。
実はPhenom系は化け物なんだよな。
Phantom系?
Phenom系っていっても初代Phenomは速くはないと思う 65nmの失敗もあって悲惨だったじゃん
整数演算が今の2倍くらいありゃね
>>681 初代Phenomも速いと思うが。
PhenomUとクロックあたりの処理能力は大差ないんだぜ?
そのクロックが上がらなかったのが惜しいよねえ Athlon64ごとコケてたとこみると、設計よりプロセスの問題なんだろうけど
SPECだとCPUに合わせてコンパイルしているから、 最適化した場合の性能の伸び自体負けているんじゃないの?
コア数だとIstanbulで6コアになってるのに、2.6GHzのIstanbulが2.53GHzのXeonに SPECのスコアで負けるのは、メモリ帯域だけのせい?
Core2とIntelってどっちがつおい?
>>685 コンパイラ自体、Intelの性能を発揮させる競争に注力されている。
AMD使用時に他社コンパイラより優れているって宣伝するより
Intel使用時に他社コンパイラより優れているって宣伝した方が売れる
今のCPUはコンパイラは必須なのに、自社CPUのためのコンパイラを自社で用意できないってのが AMDの駄目なところだと思うけど。 PGIと組んだからその辺補ったと思ってたけど、PGIだと駄目なの?
CPUベンダの作った処理系なんざベンチ以外で使いたくないってのが本音なので 自社のコンパイラ持たないというのはある意味顧客本位かと。
>>687 がどの結果を見てしゃべっているのかわからない…。
>>693 おまいさん…その比較で…いや。何でもない。
Nehalem Xeonは…何でもない。
むしろOpteronをほめてやれよ。その結果なら。
AMDはこういう信者さんに支えられています これからもよろしくね!
3チャンネル+論理8コア+ループ特化のくせに あんま差がつかないんだな
結構頑張ってるねぇ。 でも、もう少ししたらNehalem-EXがやってきて 物理8コア論理16コアになって、差をつけられるんだろうな・・・。
AMDは好きだしphenomUはコストパフォーマンス良いと思うが 現状認識は大切だよね ネイティブクアッドのメリットってサーバーだと意味ないし クライアントでもソフトが対応しないといけない そういうソフト開発するなりさせるなりして優位性を出そうともしない まあそこまで余裕がないんだろうけど
>>698 ソフト関連が弱いのは痛いやね。その金もないし。
Intelさん。モバイル系で"ウィンドリバー"ってソフト会社を買収したけど、
そういう記事をみていると、正直、AMDがIntelに追いつけるとは思えん。
余程の大連合でも組まない限り、行き先は厳しいだろうな…。
「連合を組む」といった意味では、GFのスピンアウトは正解だったとおもうけどさ。
方向性でIntelを追う必要は全く無い 中途半端な1,2種類のコアを並べたてるだけのIntelに対し AMDはCPUとGPUで役割を明確にする それが今後どう転ぶかでベンチの勝ち負けも変わる K8も初期はネトバに負けてた(当時の記事を見るとそうらしい)のにも関わらず 両社惰性のまま進んで最後はK8が圧勝している
行き先 先行き
情勢的にどうだったかはよくわからんけど K8初期では実性能でまだネトバが上だったよ
だからコンパイラごときじゃ数%しか違わないって。
あとWindRiverは非インテルの組み込みメインの会社だよ。 ここが参入したからって現状に大差はない。せいぜいAtom用の コンパイラが若干高性能になるくらいだ。
WindRiver Compiler(diab)の品質はあまりよくないけど……。
>>704 ,705
実際どのくらいの差がつくかなんて分からないけど
何もやってない、あるいは、やる力が無いのかもしれない
AMDが不利なことには変わらないでしょ
はっきりと性能で上回れなければ大きく
シェアを奪うなんて夢物語にすぎない
現状維持でいいというならかまわないけど
今はGPU統合に全力を注いでいるのは分かるが
これにしたって結局intelが先行する
AMDにしても最初は統合するのが精一杯で
性能向上まで持っていけるかは怪しい
intelに対抗する企業がなくなるのは自作市場に
とって大きなマイナスだから
AMDには何とか頑張って欲しいね
ネイティブクアッドコアという意味では、インテルもi7で真似して似たような構造に してきたわけだから、今度はそれに最適化したベンチやゲームが出てきたら 結果として AMD もウマーになるんじゃないの?
なんか必死にFUD流してるのがいるな。
とりあえずメーカ問わず最適化なんてたかがしれてる。 最適化オプションの変更ごときで10%も変わったらチートかイカサマ といっていい。アルゴリズムにまさる改良なし。
apacheだと400%高速化したとか聞いた事が。
>>707 つOpen64
私も
>>707 に同意だな。確かに短期的にみたら上向きだけど、
長期的にみたらIntelの優位はそう簡単には揺るがない。
その記事だと書いていないが、一番美味しい鯖市場だと微減じゃなかった?
>>709 の言うとおりにIntelの妨害さえなければ、
もう少しだけ余裕があったかもしれないが、それも大した優位にはならなかったかも。
なによりもPen4が失敗したときに"何故か存在していた"Core系の性能にはびびった。
アレが本当に「モバイル向きの性能」だったら、もう少し何とかなったかもしれないが…。
あと、実際にソフトウェア開発能力は重要。
NVIDIAもCUDAにかまかけて、この頃まともなチップは出していないが、
その"CUDA"の採用幅をみれば、今後もGPUの優位は揺るがない可能性がある。
例えばAdobeと共同でFlash再生にCUDAで再生支援をつけるって話があるが、
それが実現するといくらGPUチップ単体で性能がよいチップよりも、性能は悪いが、
ソフトウェア的に対応しているチップの方が滑らかに対応できる可能性がある。
「自作板的にはあんまり関係ない話だ」という事もあるかもしれないけれど、
"YouTube"などの動画再生サイトのほとんどが"Flash"経由で再生している事実もあり、
今後も"HD画質で動画配信"などが増えてくれば、対応している方が優位に決まっているし。
CPUの面でもAMDがコンパイラなどのソフトウェアに力を入れていたら、
64bit拡張やOS、ソフトの対応の面でももっと優位な位置に立てたかもしれない。
なんつーか。いまは重荷だったFabを切り離したので、今後はソフトウェアの面を、
他社の力を借りてでもその部門を強化すべき時期。ガンガレ。AMD!
>>709 IC Insightsは半導体業界全体の第2四半期の製品出荷が直前期と比較して16〜20%伸びると予測しているわけだが
そんな中でAMDは業績が更に落ち込むと予測された数少ない企業の一つです(笑)
Atom在庫いぱーい(´・ω・`)
8:1で規模が劣る側がディスカウントで勝負してるんだから あまり利益にはならんだろう。 Intelより高い値段で売れるチップを設計せんと。
8:1なのか。 Intelに比べたらAMDなんて1/10以下だと思ってたよ。
722 :
Socket774 :2009/06/13(土) 18:10:14 ID:uQ3jra6Z
保守( ・?ω・?)
>>724 使うヤツがいるかと言ったら腐るほどいる。一般向けでは無いが。
俺もOpenGLは使う というか、俺個人としてはDirectXイラネ
まあ一般人にはあんまり縁のないものではある CAD使うからオレは必要だけどな
larraスレと同時に冷え込んだ気がするんだが ここはアンチでもってたのか?
アンチがいなくなったのなら、冷え込んだじゃなくて正常化したというべき
ゲームも全部OpenGLになってくれたらいいのにな。 そしたらOS関係なく動くのに。
OpenGLはお行儀がいいけど遅い。 DirectXは下品だけどそこそこスピードが出るのが利点。
188 名前:●テヘ権田●[sage] 投稿日:2009/06/20(土) 01:07:23 ID:XSvILvhf
確か安藤氏の記事で「ダメじゃん」と思った訳だが・・・これか?
http://www.geocities.jp/andosprocinfo/wadai09/20090228.htm > これに対して,Demergian氏は,Istanbulでは,Probe Filterを実装し,スヌープトラフィックが減り,
> 実質的にメモリにアクセスできるバンド幅が増えたことが性能向上の原因と書いています。Opteron系のCPUは基本的には,
> どのメモリにアクセスする場合もアクセス要求を全CPUチップにブロードキャストし,全CPUチップからの応答を待って処理を行っているので,
> これが自チップに接続されたメモリをアクセスする場合は,他のCPUに不要なSnoopを行なわずにメモリをアクセスするようにすれば速くなります。
> そして,Stream Benchmarkの場合は,メモリの割り付けを調整し,全て自チップに直結されたメモリだけをアクセスするようにすれば,
> 6割の性能向上は全く有り得ない値ではないかも知れません。
> 但し,このような条件でのStreamの測定はかなり特殊なケースで,一般的には,4ソケットであれば自チップに接続されたメモリへのアクセスは1/4であり,
> 効果も1/4程度になるのではないかと思われます。
> なお,Intelは,FSBを2本持つサーバ用のBlackfordチップセットでは,既にSnoop Filterを採用しており,
> Core i7のQPIではディレクトリ方式を採用して無駄なスヌープを行わないようになっています。
> 従って,Shangaiを使っているユーザはCPUチップをIstanbulに差し替えることでかなりの性能向上を期待できますが,
> Intelチップと比べた場合の競争力がどの程度改善されるかは疑問です。
テヘってまだいたんだ
自宅警備隊
736 :
MACオタ :2009/06/23(火) 17:40:58 ID:tntOpIdc
今年上期のTop500が発表されましたが、AMDの長期低落傾向は止まりませんね。 以下、Top500のx86クラスタシェアのここ数年の推移。 2007年 6月 Intel 51.8%, AMD 21.6% 2007年11月 Intel 66.6%, AMD 15.8% 2008年 6月 Intel 71.6%, AMD 11.2% 2008年11月 Intel 73.6%, AMD 12.2% 2009年 6月 Intel 78.6%, AMD 8.6% ただ互換ソケット路線のおかげで、発売したばかりのIstanbulを搭載したCray XT5が さっそく128位と131位に登録されています。性能ではNehalemにヤラれっぱなしですが、 今年下期は6コアのシステムが意外に増えるかも…
top500のサイト教えてクレクレ
みつけたわ 3 NNSA/Sandia National Laboratories United States Red Storm - Sandia/ Cray Red Storm, Opteron 2.4 GHz dual core Cray Inc. 26544 2006 101.40 127.41
Top50だとOpteronのシェアがトップなんだな >Intel processors are used in 28 percent of systems, >behind of AMD processors in 36 percent and >IBM’s Power processors in 32 percent.
>>740 去年はTop10のうち9個がOpteron搭載だった気がする。
で、TopがOpteron4コア + Cell BEだったかな。
これをOpteron + ATI StreamにすればAMD最強じゃね?
と未だに妄想するが、そんな環境は見たこともない。
OpenCLが普及したらきっとTop500にそんな構成がランクインすると期待している。
>>740 Opteronはまだ強いよ。Nehalem系が今後どんどん入ってくるだろうけど、
それももう少し後だろうし。
そんな時代は終わった
IBM and Cray claim victory in battle for supercomputer supremacy
http://www.tgdaily.com/content/view/42962/135/ Meanwhile, a total of 399 systems (79.8 percent) on the Top500 list use Intel processors.
IBM Power processors are found in 55 systems (11 percent),
followed by the AMD Opteron family with 43 systems (8.6 percent).
Knupffer also noted that 33 of the top 500 systems were Nehalem based "only three months after launch,"
8.6%のほとんどがTop50に入ってるってことか 強いんだか弱いんだか
スパコンの上位だと規模の差も出てくるから、一気に入れ替わらないだけじゃないの? 入れ替わり激しい下の方で、AMD採用が減っていったら、Opteronが強いとは言いにくいんじゃないだろうか。
LINPACK番長決定戦だけが評価軸として突出してしまうのは コンピュータサイエンスにとってはあまりいいこととは思えないなー
>>746 ○○の××が評価軸として突出してしまうのは、
ベンチ全般に言えることだから諦めるしかない気がする。
π厨のことですねわかります。
propusのダイサイズはQ8x00とどっちが小さいかな?
Die size for these processors is estimated at 168mm2, allowing AMD to become competitive with Intel's 45nm Core 2 Duo and Quad, which have a die size of 107mm2 and twice that for the quad core.
168mm^2か…予想通りかな…
>>751 それL2が最大の場合でしょ
2MBのQ8x00はどうなのかなって
>>753 L2/3M/45nmで81mm2だから162mm2くらいじゃね?
6M版を2Mに殺していたとかいうなら107/214mm2になるが
別ダイって話聞いたことないが
L3なんて飾りです、と言われても俄には信じ難い
Q8x00とQ9x00が別ダイだとでも思い込んでいたのかなぁ…。
AMDなら7コアとか5コアの中途半端なCPU作ってくれるはず
5でレンジャーコア 7で侍コア とか呼ばれるようになるのかな
目は大丈夫ですか?
>>749 にPropusのダイ写真あるのに、どうして専用マスクじゃないなんて思えるんだろう。
あと、引用元自体が間違っているけど、それ45nmOpteron、PhenomIIのダイ写真じゃないし。
>>765 PhenomUX2が専用マスクだなんて情報最初から無かったよ
そもそも最初のロードマップには無い急に出てきた製品だし
AthlonUX2と勘違いしたのでは?
RegorとPropusが専用設計じゃないと心底信じている人を笑うスレと化しました。
windows7でAMDの時代くるん?
なにか来るような根拠とか兆候とかある?
ビデオカードのほうならわからんでもない。
AM2以降のAMDプラットフォームなら、 CPUは全部オリジナルx86-64(IntelはAMD64互換)でマルチコアでメモコン内蔵でVTのAMD-V対応、 GPUはオンボならDX10でローエンドレベル、ディスクリートならDX10.1対応。(10月にDX11対応GPU発売) Win7の64BitはAMD64に最適化して開発されている。(AMDのCPUに最適化) AMDのプラットフォームはWin7に最適化されている。 Win7もAMDプラットフォームに最適化されている。
本当にシェア無視して特化したら死亡フラグだわな
sempron てAMD-V対応だっけ?
Sempronは対応してない可能性がある。きちんと調べたわけじゃ ないけど。 Turion/Sempronは対応してないと思ったほうがいい。Athlon以上 なら対応してる。
>>773 Win7で競合を突き放してシェアを取るために特化させていると思うが。
XPやVistaではオンボードが多少高性能という以外は、特色がなかったけど、
64bitやDX10.1/11がメインになるWin7なら、
X64のオリジナルであり現状殆どがDX10.1対応GPUで、
Win7発売以前にDX11対応GPUも出してくるAMDは、Win7環境として最良になるね。
そういえばSempronの存在忘れてた
まあ、5k程度のAthlon X2にでもアップグレードすればいいだけなんだけどね。
その前に「XPモード」なんてのを使う事が来るかどうか…。
HomeにはXPモードないぞ
XPにしがみついてる企業向けの機能だろあれはw
64bitがメインになるとはとても思えない
64bitがメインになって欲しいけど、 私が使っているAdobe製品はいまだに32bitがメイン。 PhotoshopのためだけにPCを用意するのも無駄だし。
VirtualPCって仮想マシンにUSBの割り付けできないから、USBドングルを使えない。 XPモードがあっても結局VMwareが必要になるだろうなあ。
>>782 Photoshopなら64bitでも動くだろ。古いのは知らんけど。
古いのはさいきんのCore 2 DuoをSSE2非対応と誤認識する問題がある
いかにも関係ありそうにして無関係な話を持って来る馬鹿
低価格ムービー編集ソフト(PremiereElementsとかVideoStudioとか)が 64bit対応してくれるのが一番効果的なんだけどな。プロフェッショナル 用だけ64bitとか消費者どんだけなめられてるのかと。
まだしばらくは32bitOSが主流では? ソフト側の対応が遅すぎるし、企業も互換性に不安がある64bitには なかなか移行しないと思う。XPモードでも駄目なソフトもあるだろうし。 それとAMDはGPUでは先行するけれど、CPUではIntelにi7以降は差をつけられているので 64bitは微妙だと思う。i7以降は64bitでもマクロフュージョンが効くようになったので AMDより32bitから64bitの伸び率はi7の方がよくなったし、Win7ではHTTにも対応し、かなり 応答性もよくなっているらしいから。64bit環境はCPUはi7以降、GPUは先に対応するAMD(ATI) の方がWin7発売時に組むのなら、性能的にはいいと思う。
>>789 i7と差がつくのはマルチスレッドアプリの中でも8スレッドのものだけ。
シングルスレッドや4スレッド以下だとあまり差はないよ。
ぶっちゃけ、8スレッド処理なベンチかエンコード以外では差はつかない。
新ブランドのi5以下だと、PhenomII系とほとんど同性能だろうね。
クロックの分PhenomIIが勝るともいえる。
そもそも、オンボードの性能やドライバの最適化等を考慮すると、
Win7ではAMDプラットフォームが無難。
791 :
Socket774 :2009/06/28(日) 13:48:12 ID:kHVTRyKv
>>790 最初の3行はともかく、
>新ブランドのi5以下だと、PhenomII系とほとんど同性能だろうね。
>クロックの分PhenomIIが勝るともいえる。
これは無理。
L2キャッシュ以下等メモリ周りのバンド幅改善をさっさと行えばいいのに
GPU入れるまでの間ループ限定トレスキャッシュ積むとかw
排他キャッシュだからスループットでは共有に追いつくのは無理だな。 その代わり容量効率が良く、メモリの局所性にもうまく適合する。
>>790 64bitの伸び率は、i7はC2Dの比ではないからAMDはかなり苦しいと思う。
いままで何ちゃって対応でも、初代Phenomでは64bitでも若干負けていたし
フォトショCS4などの64bitアプリなどは、Intelに最適化されている場合があるので
AMDには逆に不利では?PhenomIIでXPの32bitを使うならお勧めだろうけど。
排他と共有の各方式をその時の状況に応じて切り替えれば最強?w 切り替え時のオーバーヘッドがすごいことになりそうだが
コンシューマ用途で3GB超のメモリを直にアドレッシングできてもメリットなんて皆無。 メモリ無駄に増やすくらいならその分価格下げろ、CPUに積層して速くしろ、ってな話になる。
>>791 今まで出ているベンチを見る分には、総じてLynnfield=Denebだと思うよ。
そりゃ、ソフト側の最適化がある分だけintel有利だが、構造が似ている分だけに最適化をかけても
Core2対Phenomの時のような悲惨な性能差にはならないと思う。
>>796 L3はそういう構造だったはず。
ループが多いとIntel有利(CPU限定) 分岐が多いとAMD有利
ほう・・・
あほらしか
>>794 リードオンリーの領域を認識したら複数のコアがキャッシュする機構ってどのくらい機能してるんだろうね。
これさえ完璧に働けばかなりいい勝負できそうだけど。
普通のMESIと何が違うの
分岐はパイプラインを乱すからっていうんで、条件加算命令とか 備えたCPUはあるね。何かの条件ビットが1なら加算とか。条件が 成立しない場合はただのNOP命令になるからジャンプが消える。
条件実行があっても結局直前にフラグを変化させる命令があるとストールするので 分岐予測の精度が高ければそっちの方が効率が良い。 なのでコード密度を上げるための実装である事が多い。ARMとか。
ループの継続判定も分岐(=条件ジャンプ)に変わりねーよ
条件フラグで命令ポインタ飛ばすだけ
馬鹿すぎ
>>794 共有キャッシュって上の階層のキャッシュ(独立)が大きいほど相対的に無駄が大きくなるから
排他とは基本的に相性は悪いわな
つーよりPentium M以降ずっと同じこと言われてるけど、実容量に差があったら容量効率もクソもない
しかも容量の割にセットアソシエイティブのWay数が少ないのはAMDのほうだし
>>803 共有の読み取り専用データをロードするには明示的にノンテンポラルロード使うのが
最もハードウェアのコストのかからずかつ低コストな性能改善策だったり。まあプログラマー頼みにはなるが。
「包含(インクルーシブ)だと上の階層のキャッシュ容量が大きいほど無駄が出るから AMDのような大容量L1とは相性悪い」 なら判るんだが>807のは理解不能 まずメモリディスアンビグエーション=プリフェッチを理解出来ないと無理ですくぁ?
団子もID:nI29O69gには言われたくなかったろうなw
ループが速くなれば、ほぼ全ての実用アプリケーションが速くなる。
>>800 というかプログラムの実行時間って殆どループだけど、
ループがおおいってもっと具体的にいうとどういう状況想定なんだ?
また、AMDの方が分岐予測が得意といような論拠は一体なんなのだろうか?
NetBurstのようにパイプラインのステージ数が〜という時代だったらまだ言いたいことはわかるが。
ループがたくさんあるってのは、条件分岐がたくさんあるって意味も内封してているとおもうんだがw ID:nI29O69g は一体なにを考えていたのだろう?
条件分岐はループだけじゃないってこと。例に出した条件加算は 予測がききにくい分岐判定でパイプラインをできるだけ乱さない ためのもの。ループはそもそもジャンプがなければ成り立たないし 分岐予測が威力を発揮する分野だから問題は小さい。
動的分岐予測の基本は、プログラム上の実行パス上の分岐履歴パターンを蓄積するものだよ。 殆ど確率1/2でランダムに分岐するものを除いては、ループだろうが条件加算だろうが 今時の分岐予測は効果でるぞ。
そういうレベルはIntelもAMDもとっくの昔にクリアしている話なので敢えて、 >ループが多いとIntel有利(CPU限定) >分岐が多いとAMD有利 という発言をしたからには、詳しく詳細を説明して欲しいモノだ。
言葉遊びだとか メモリディスアンビグエーション=プリフェッチのような電波を飛ばしてるんじゃないんだから ループつったらループストリームディテクタが働くような、おそらくforやwhile 分岐はK10で強化された分岐処理が役に立つような、ifとか? 共有キャッシュだと排他じゃなくても無駄が出るとかそういう方向で話を進めてるわけじゃない
おわ間違えた 「排他でも無駄が出る」だな
ID:nI29O69g←wwwwww
久々にプリフェッチ先生がきたのでageましゅ
DX11CSで何ができるようになるのか団子先生に質問してぼきゅはもう寝ます(゚д゚)
>>814 条件加算の例はその「確率1/2でランダム」に近い条件の分岐で
パイプラインを「できるだけ」乱さないためのものなんだが。
ARMでαブレンドのコード書いたときすっげー綺麗に書けたので感動したよ
823 :
Socket774 :2009/06/29(月) 00:35:06 ID:evRtFBSr
近いうちにPCを買おうとしています。識者のみなさん教えてください。 IntelのCorei7用の現行のソケットLGA1366は今年の秋ぐらいで代替わり すると聞きました。そうすると将来的に新型CPUへの換装は望めないの でしょうか。 同様にAMDの現行のソケットAM3も将来的に打切りの予定が決まって いるのですか? 教えてください。 アスロンXP2000+ ユーザーより
AM3は2011年まで残るよ
Westmere
>>823 AthlonXPだって3200+までラインナップされてるのにアップグレードしなかったんだろ?
DDR-266世代のままDDR3-1333世代までアップグレードしなかったんだろ?
近いうちにPC買ったとして、CPUを頻繁に載せかえたりする予定でもあるの?
>IntelのCorei7用の現行のソケットLGA1366は今年の秋ぐらいで代替わり >すると聞きました。そうすると将来的に新型CPUへの換装は望めないの >でしょうか。 それは嘘。LGA1156という新ソケットがあと9/1くらいに登場して、 デスクトップの主力はそっちになるが、LGA1366は一応併行して残る。 新型のGulftownという来年の前半にでるやつに十分な金があれば換装もできる。 Intelであれば、数ヶ月まってLGA1156にするか、1366でハイエンド道を突っ走るかの問題。
まあ個人的にはAMDがオススメだがね。 売り上げに貢献してやってくれw
AthlonXP2000+ユーザーならSocket432の悲劇忘れてないだろ?
830 :
Socket774 :2009/06/29(月) 01:57:12 ID:evRtFBSr
>>826 すみません。今使っているアスロンはBIOSでクロックをいろいろ変えていて、
もともといくつのモデルナンバーを買ったのか昔のことなので忘れてしまいました。
ただ現在はアスロン2000+として動いています。(買った当初は確か2600+ぐらいまで
OCしようとして動かなくて、しばらくは2400+で使っていました。ここ数年PCの調子
が落ちてきて2400+だと起動しなくなったため2000+まで落として使っています。)
最初にDuron 1Gを載せたときから10年が経ちましたが、この2、3年以前は性能に
満足していました。長い間PC関連の情報から遠ざかっていたのでアスロンXPが
いつ製造終了したのかを知りません。ペンティアム4の巻き返しが始まった時期を
最後に私の記憶は途切れています。
今PCを買ったとして、あの時のように数年後新しいCPUに交換できればと思って
います。それを見越して今回は例えばCorei7であれば最低ランクの920を選ぼう
としています。
>>824 ありがとうございます。
ソケットやメモリに変更がないとしたら経済的には助かります。最近はAMDも
変化のサイクルが早くなったようですね。
>>827 解りやすい説明をありがとうございます。
資料を見ながら書いていますが、Corei7とCorei5のグレードが大きく重なっている
のでせっかくi7を買っても(920では)秋にはi5の上位モデルに性能で負けてしまい
そうで心配ですね。
私もAMDは好きです。Intelを脅かすようなモデルをまた出して欲しいです。
socket4も8も423も悲劇っていや悲劇か
832 :
Socket774 :2009/06/29(月) 03:09:57 ID:evRtFBSr
うちではずっとSocketAだった気がしますが…。
これだけシステム価格が下がったのにまだソケット差し替えするですか! もう許さんです!
てか、スレ違いのバカに答えてるバカはなんなんだ?
その直前はもっと馬鹿だったし
>>830 典型的な初心者OCか。何使ってもいっしょだよ。
837 :
Socket774 :2009/06/29(月) 20:41:33 ID:evRtFBSr
今回はOCは考えていません。 雑誌にも昔ほどOCOC書いてないですね。
無知なガキなんだからもっと優しくあしらえよw
スレタイにOCとは書いてないが
>>837 このスレは「AMDの次世代CPU」について語るスレでして、
PCパーツの購入相談スレではありません。
たまに「教えてあげる君」などの「スレ荒らし」が無駄なレスをしますが、
そのような方々も基本的に貴方と同様に、スレ違いの話を続ける
荒らし嵐・煽り以外の何者でもありません。
Intel系CPU、AMD系CPUの情報でしたら、各CPUスレに。
購入相談等でしたら「見積もりスレ」などへ移動してください。
また板総合の「雑談スレ」は基本的に話に制限はないので、
そちらでお聞きになったほうがよろしいかと。
よーはするに、これ以上無駄話でスレを荒らすな。
842 :
Socket774 :2009/06/29(月) 21:07:39 ID:evRtFBSr
>>841 わかりました。
AMDがIntelを超えるプロセッサを出してくれることを期待してます。
なんだ。結局厨のage嵐だったってことか。
847 :
Socket774 :2009/07/02(木) 18:20:05 ID:O3CGAAWC
この頃はPC向けCPUよりもOnLive系に期待
848 :
Socket774 :2009/07/02(木) 21:35:55 ID:VL3rK1du
12コアが3万くらいになったら買う メモリは16ギガかな
今月号のパワレポで後藤さんの記事にBulldozerアーキテクチャの 概要というか一端みたいな考察が少し書いてあった アベレージ2命令処理できるクラスタを二つ搭載して シングルスレッドとマルチスレッド処理の両方で 効率良く性能を発揮できるのを目標にしてるとか云々 現在のx86では可変長命令+プリフィックス長すぎなせいで 常時3命令以上を処理するのは限界で難しいと それなら同時に処理できる命令数を増やすために 無理に増強して熱と消費電力に苦しむよりは Atomみたいに2命令処理くらいが効率はベストだから ニコイチにしてアベレージ重視、ピークも3.x命令処理を狙う、みたいな? 良く分からん
今のBulldozerはもっと保守的なんじゃ?
どっちでもいいよ…
>>850 >>852 どちらの記事も同じ内容扱っているのでほぼ一緒じゃないですかね
Bulldozerの目指す方向性としては実行ユニットの共用で
今まで明確に分離していたコアの垣根が溶けるような感じか?
といってもまだ謎が多いので、後藤さんが得た情報が
ガセネタでしたって可能性もありえますけどね
ただこの野心的なアーキテクチャが世に出るとしたら
非常に面白いことになりそう、他に同類のCPUありましたっけ・・・
SunのRockがFPUを共有してたけど、実行ユニットの共用ってつまり 眠ってる実行ユニットを融通しあってトランジスタを増やさずにコアを増やすってことだよね。 同時発行命令数が増えるわけではなく。 実行ユニットの巨大なプールがあって、状況に応じてTLPにもILPにも振れたら素敵だけど そんなのは妄想だよなあ。
2011年の"Bulldozer"は2003年の"K8"来の新コアだ。 途中でK9がキャンセルされているとはいえ、 その過程で開発されていた物全てが無効になったわけではないし、 そう考えると、それなりの蓄積と改良が加えられているはず。 期待はしようじゃないか。まだ情報が少なすぎるから何も言えないけどw
とにかくi7を突き放して突っ走って欲しい ある意味レベルの低い目標だがw
>>855 コアを増やすっていうか、実行ユニットに対するインストラクション
ユニットの比を増やすことが出来るんじゃないかな。ということは、
マルチコアよりダイの利用効率が高く、HTTより本物のマルチコアに
近い効果でOSから見たコア数を増やせるということだよね。
どこまで一つのインストラクションユニットから確保出来るのかは、
現実的にどこまで同時発行出来るケースがあるのかに応じて設計
されるんじゃない? 割り当てを柔軟にすることによるペナルティも
あるはず。
実行ユニット群を1組ではなくて、2組(以上)にするという事なのか [○○] [○○] な2スレッドにしたり [○○][○●] な1スレッドにしたり出切る様にするって事なのか 1コア内でマルチプロセッサ構成と同内容を構築して、完全な同時実行処理を目指すのか
「実行ユニットが足りない」のではなく「同時にドライブできる実行ユニットを増やせない」のが 目下の問題なんだから、コア間でユニット共有して数を増やしても 今より速くはならんような。
良く分からんけど、絶対性能というより面積あたりの性能とか 電力あたりの性能を改善しようって話じゃないの?
コア内にコアを2つ持つと後藤は書いているが、これは実行ユニット(クラスタ)を1つから2つにするって事だろう
今後1チップあたりのスレッドは増え電力性能比は改善していくだろうが、 今よりシングルスレッドが速くなることはなく、 TLPがデスクトップに降りてくることも当分ない。 進歩の中心はPCからサーバや携帯機に移ってしまったわけで、寂しい限りだねえ。
つか1ライターの「俺が勝手に考えた次世代CPU」を前提に 話をするのは不毛だと思う。
知識もなければ、情報を仕入れていない奴が妄想を語ってもアレだが、 ある程度知識があり、情報を手に入れられる奴らの予想ならば、 それを元に推測話をするのは、おかしな事ではないだろう。
Bobcat2つでBulldozer
「3命令発行は効率が悪いから、2命令発行の効率のいいCPUコアを二つクラスタ化する」って 凄くわかりやすいけど、実際そんなことは可能なの?
>>867 多分素直に1コアで3命令発行した方が効率が良い罠。
フロントエンドを2個搭載するけど 実行ユニットは2倍にはせず片一方からでも両方使える2クラスタの 実行ユニットを共有するってことじゃないの? 従来のコアと比べると1.5倍の面積で1.5倍弱のシングルスレッド性能 2倍弱のマルチスレッド性能を目指す感じ。 2命令発行に下げるってのはどうしてもシングルスレッド性能の低下を招くからない。
>>867 IPC=2の物を二つ並べて4になるなら
後藤の言う虫の良い話も成立するが
そんな事は無い。
AtomデュアルしてもNehalemに勝てないのと同じ話。
既存アプリの性能低下はそのまま商品力の低下だから
今後数年の対Intel戦略を考えた場合
そんな馬鹿らしいアーキの採用は無い。
IUとFPUをユニファイド化して、それを複数搭載とかだったりして。 今までと同等性能はユニファイドユニット1個か2個分で、状況に応じて複数使用するみたいな。 スカラ性能重視だから1個あたりのサイズはGPUよりも遥かに大きいけど、 構造としては今のGPUと同じ感じ。 整数演算器と浮動少数演算器が共有化できるのかという根本的な問題は多分どこかの天才が解決してくれるはず。
872 :
Socket774 :2009/07/05(日) 11:29:58 ID:SDrn2Z9A
3本のパイプラインから成るスーパースカラコアがあるとしたら 2スレッド同時実行したい時は2+1 3スレッド同時実行したい時は1+1+1のスカラコアに分割して使えるとか これならスーパースカラモードでは今までと変わりないが マルチスレッド実行時はSMTより効率が高い
873 :
Socket774 :2009/07/05(日) 11:45:21 ID:4P59IQ50
実行ユニット部(演算ユニットとメモリユニット)を単純に2つ載せるんじゃないの? それをインストラクチャユニットで 2つを1つにクラスタ化できたり 個別ユニットとして稼働できたり割り振りするんじゃないかな メモコンとメモリーの関係みたいな Dualとsingleな関係で それを状況に応じて切り替える HTTと違うTLPの同時実行処理に重きを置き ILPも3.xまでに向上させた構成にするんじゃないかなないかな 後はAVXに準拠する訳だから DLPの向上はGPUに任せる
>>870 Atomは実行ユニットも貧弱だぞ
SMTの優位性は、1つの命令ストリームで並列実行出来るところを抽出するのに比べて
並列動作するスレッド間の依存関係が原則的に無いこと。
ユニットに空きがあれば2つ(あるいはそれ以上)のスレッドから実行出来る命令を選んで割り当てることで
充填率を引き上げることができる。
もし演算ユニットがリッチだったら・・・
Core MAは3命令+L/Sによる4命令同時発行だが、それより多彩な組み合わせで最大4命令同時発行を
狙えるならかなり性能は上がりそうな
もちろん2スレッドで分けて使うのにも有利だね。
EV8やTejasだな
ロジックが複雑になって 消費電力と製造コストもかなり上がりそうだな
ロジックが複雑になり、設計が難しくなるが、 消費電力と製造コストはあんまり関係ないな。 バクだしなどの費用も「製造コスト」とするならば、 それは確かに上乗せはされるだろうけど。
製造 原料に手を加えて製品にすること
x86は量産コストが支配的でデザインコストはあまり問題にならない だからエンジニアを多数抱えるIntelが強い
「消費電力」は対策をしっかりしないと上がる可能性はある。 SMTはCPUのトランジスタを効率よく使い"休ませない為の設計"。 "Bulldozer"の32nm世代で"High-k"などの技術を投入するのは、 そういった「理由」があるのかもしれない。
881 :
Socket774 :2009/07/05(日) 12:27:44 ID:SDrn2Z9A
SMTだろうとクラスタ化だろうと充填率が上昇すればその分消費電力は上がるのは仕方が無い クラスタ単位で消費電力をカットできるなら良いけど
>>880 High-Kで抑えられるのはトランジスタが休んでいようがいまいが
消費される電力の方。
Bulldozerは結局どういうものになるの 誰か三行でまとめて
>>883 お前は量産設備開発にエンジニアが要らないとでも思ってんのか?
>>884 Nehalem(初代プランNetburst版)
Chivano
Rock
x86はデザインコストかかりまくりだよ。 Intelがいくつ設計チームを持ってると思ってる? それでもデザインは固定費だから、Intelだけは量産でカバーできる。 数量の出ないAMDはやがて開発に失敗して行き詰まり工場売る羽目になった。 それ以外の互換x86メーカーはほぼ全滅。 RISCなら組み込みで細々でもやっていけるのに比べれば雲泥の差だ。
>>887 工場を手放したのは最新プロセスなどの設備投資が厳しくなってきたからで、
デザインコストの問題じゃないだろ。
>>885 その論が正しいならARMなんかのビジネスモデルは破綻しててもおかしくないよね
論じゃなくて辞書
>>887 Intelの設計チームってイスラエル以外はカスだろ
PenM→CoreDuo→Core2が存在しなかったら、今頃Intelは死亡している
>>889 ARMがいつIntelを脅かしたんだ?
>>892 勝手に危機感感じてるようには見えるけどな。
数億トランジスタのx86とせいぜい数百万のARMを比べても仕方ないだろ
>>893 K8とNetBurstじゃどう転んでもK8の勝ちで、
IntelにイスラエルのCore2以上の代替があったとは思えんが
わかったからIntelスレ池
>>896 オレゴンだったっけ? 米国内の開発部隊の成果がなければPenMもCoreもなかった。
イスラエルだけじゃあんなに大成功しなかった。
近年おいしい成果はイスラエルが持って行っているのは事実だが。
>>893 なんか「銀河系名乗ってるくせにイケル神以外はカス」とか言って暴れてたバルサ厨を思い出した
理解不能
x86ライセンス上で戦ってるのにx64(AMD64)採用ざまぁとか言ってる人々と一緒でしょ それでも本家より性能出ちゃったもんだから始末が悪い 過去ログ見ればわかると思うけど、AVX採用なんてねーよ的な盲目な信者が 少なからずいるのはintelもAMDもいっしょなのさ
このGPGPの現状からすると AVX採用って無駄にならね?
>>902 「現状」ってどんな現状を言っているか知らないけど、
これから発展していくだろう物の展開にどうこう言ってもなぁ。
過去にIntelならばメモコン関連のグダグダで死んだ「Timna」が。
AMDならば、去年お亡くなりになった初代FUSION予定。「Swift」がある。
x86 CPUでも構想こそ昔からあれど、製品化されたモノがないだけだし。
様々な面でようやく構想に技術が追いついてきた感じ。
あと、AVX採用はGPGPU以外の分野で意味がある。
AMDの場合はAVXの上にGPGPU関連の命令を載せることも検討してるから GPGPUにおいても意味がある ※最近、AMDは独自拡張は諦めてAVX互換に切り替えた。 力関係を考えると当然の選択で、とりあえず命令の分裂は避けられた。
>AMDの場合はAVXの上にGPGPU関連の命令を載せることも検討してるから >GPGPUにおいても意味がある これは知らなかったけど AVXはx86のベクタ演算でGPGPがそれ以外のベクタってかデータ並列で DirectXが11でGPGPに対応したりエンコやソフトウェアレンダがGPU使い出したりする現状があり そんな中でAVX載せるために1年遅らせたとしたらすごい無駄なんじゃないか?ってこと
>>905 最大の理由はIntelが採用するものは普及するので、
・ベンチで見かけ上の大敗北を喫する危険性。
・対応が増えればソフトウェアの処理的にも不利になっていく危険性。
これらを考えると、初期で設計に組み込んでおけば問題がない。
後々追加するとなると、完全再設計が必要となるので面倒なことになる。
だったら一年でも設計を延ばして組み込んでおく方が楽。
ちなみにAVXを初期からONにしないって話もある。
個人的にはそれは妥当だと思う。2011年発売では、
幾ら設計段階でAVXを組み込んでもテスト期間が足りなすぎる。
た"Bulldozer"発売後1年程度はAVXがONにされないと予想。
Bulldozerの開発に失敗し、 K10改で仕切り直すために発売1年延期が先に決まって、 だったらAVX対応もしちゃおっか、という順序だろ。
>>896 で?
イスラエルはネトバ以外作った事ないのかよアホ
K10改っていつまでK8使い回すつもりなんだよw さすがにそれは無いと信じたいな
ピーク性能を稼ぐために実行ユニットは多めに用意する必要があるけど 実際は遊んでる場合も多くてトランジスタと電力の無駄になってると IntelのHTも元々は実行ユニットの稼働率改善を言ってた覚えがあるな HTより制御が楽(?)なのとワットパフォーマンスの改善が共有の売りなんかね バラつきの大きい実行ユニットを効率良く使うために共有するのは 逆の見方をすれば常に負担の大きいフロントエンドが 二重化してるとも言えなくもないのかな、Bulldozerの場合
元々「x86で完全フルスクラッチは無理ぽ」との潮流なので、 基盤となるCPUコアが当然あるだろうね。それがK10(K8コア)なのはありえる。 ただ、4オペランドのAVX対応させて「K10改」とかいうならば、 Core2をNehalemが「ほとんど同じ」というのと同じようなもんだな。 それよりも改造レベルが激しいけど。 しかもそれを一年前からの方向転換で作り始め、2011年に投入できるならば、 AMDの開発能力は、Intelの開発能力の数十倍は高いだろうね。 むしろなんでいままでK8コアをひっぱていたのか謎レベルの開発技術力。
今のK10コアを本当に一から作り始めたら10年はかかるってばっちゃが言ってた
>>906 AVXを出させるために「SSE5」をぶち上げた、と考えることもできるよね。
確か、パロミノコアでSSEに対応するときも、演算ユニット自体は3DNow!を流用したって話だし
AVXも実装は同じ方向を向いているSSE5の演算ユニットを使うのかもしれないな。
命令長の不足分などのSSE5だけで足りない部分は、SSE5をニコイチで使えば(速度は保証しないが)何とかなりそうだし。
最初からintelが出すであろう「SSE5対抗の拡張命令(AVX)」をアテにしていたのなら、スゴイ判断ではあるな。
今の1コアが整数・浮動小数点・SIMDユニットの個数が3:3:2(詳細は知らん)だとしたら 1コアを2クラスタに分けて、1クラスタの内部の構成は2:2:1にする マルチスレッドでは1クラスタの2:2:1で動き、シングルスレッド時は 2クラスタを合わせて4:4:2として動く これでシングルとマルチスレッドの性能を両立できるって事かな?
マルチスレッドソフトって基本的には同じような処理を複数のスレッドに分けるよなぁ。 つまりクラスタ分けしても処理(ユニットとか命令並列数)の方向性が 重なってそれほどトランジスタの高効率利用とはいかないんじゃ・・。 いや、シングルスレッドも伸びるってのがミソなのか。
>>914 わざわざGNU Binutilsにパッチをコミットまでしてたわけで
デコーダの再設計の為に1年後退させたとしたら大損失だろ
計算高いとは思えない
AVXは128/256bitSIMD命令セットだが、1024ビットまでのSIMDをサポートするのは既定路線で
Larrabeeの512ビットSIMDもその延長線上にある
K7コアを拡張の積み重ねでK10.5まで来ているからなー 色々とボトルネックや無駄な部分は多そうだ。 その辺を再設計するだけでもトランジスタ数減って速度アップしそう。
SIMDユニットってでかいよね 命令発行部分は増えないとは言っても、演算機は1024bitともなると32bit演算機×32個 各コアごとにそんな物を埋め込むのは電気の無駄な気がするよ
よし、お前は初代Pentiumでも使ってろ
>>919 でも速度測るときに必要なのはそこだし。
ベンチ対策したほうが受けはいいよね
問題はx86SIMDベンチがこの先どれだけ残るかではないか
仮にBulldozerが演算部を共有するアーキテクチャとして 果たしてこの設計は将来性のある変革なんだろうか 研究や開発を行う専門家はどう捉えているのか気になる アイディアや概念は多分実用化される前からあったんだろうと思うが
>>924 基本はSMTの発展バージョンなだけなんだが…。
いや、ちょっと似てそうなSunのRockがポシャりそうな雰囲気 このアイディア自体に対する評価はどんなものなのかと思った もし言われてるようにシングルスレッドとマルチスレッドの 性能を両立させうる前途有望な技術だとしたら もっと広く知られて騒がれていてもおかしくないのでは? それとも実際は大したことないのか
>>918 少なくともIntelはSandyBridgeで
後藤何とかの胡散臭い話のような設計にする予定は無い。
AMDの対称型ALU×3配置によりほぼIPC3に出来る設計は
x86CPUの一つの完成形だから
ここら辺に今更手を入れる必要は無いと思われ。
>>919 データセットが1024ビットなだけだし
たとえば、別に128ビットSIMDユニットで8回実行してもいいんだぜ。
CUDAも1SMあたり32並列のSIMDだがGT2xxまでの物理的な演算ユニットは8基(つまり256ビット)。
Niagaraとか既に演算器共有やってたろ
8サイクル時間をかけたって良いじゃない
スレッド単体の速度を3/4にしてもコア数が二倍になればサーバCPU的には大成功なんだけど 個人用途ではあんまりありがたくないね。
世の中のPC用CPUの主流がそうなったらソフトの側から歩み寄ってきてくれるさ
cellの例で見てもわかるとおり、ソフトはあんまり歩み寄ってくれない
開発者を見方につければ主流にはなれなくても成功はするだろうね
スタンダードにするまでが大変。 ぶっちゃけハードに合わせる、もしくは先をいってるのは MSだけ?というか半導体自体先がみえてるしな〜 もう、性能よりコスパ重視
>>934 特にエンプラ系なんか
今動いてるアプリに下手に手をつけて何かあったら首飛ぶからな。
938 :
所長 :2009/07/12(日) 00:54:55 ID:hL49hQhu
現実的にはBulldozerもK8/Barcelonaの拡張版で、 やっとこCore 2/Nehalemに肉薄できるレベルな予感がします。 まあ、そのときはSandy Bridgeと戦わねばならないわけだが。
>>938 現実? おまえの世界の現実は、
現実世界の妄想っていうんだぜ?
>>939 >>938 の話はかなり現実的だと思うぞ。
AMDが上の価格を狙えないのも、Core 2やCore i7があるからだしな。
>>940 なにが「現実的」なのかわからんので詳しく頼む。
あと、1行目と2行目がどう繋がっているかもさっぱり。
現状で上を狙えないのは当然2行目の理由だが、
それが"次世代CPU"にどう繋がるかをkwsk。
今のところはK10改でないと考える方が根拠のない妄想だ。
日本語の勉強は他でやってくれ
>>941 あぁ2行目は現時点での話。
恐らくBulldozerでも今の状態が続いて、SandyBridgeには追いつけず、
下位の価格を埋めるだけにと、そんな感じ。
>>940 AMDが終わっているのはOpteronが終わっているからだ
Core i7とか秋葉以外では空気
元となるコアが"K10"及びHammer系ってことに異論はないけどね。 「K10改」の改造度合いをどこまで「K10改」と呼ぶのかの問題がある。 ・Coreアーキティクチャを「単なるP6改」と呼ぶレベル。 ・K8を強引にK10と呼ぶレベル。 上ならば「勝手に言っていればいいんじゃない?」程度の扱い。 下ならばAMDが現状で"Bulldozer"に関して出している 情報のすべてを「嘘」と判断しているぐらいの扱い。 当然APUも嘘。AVX対応も嘘。4オペラント対応も嘘。FUSIONも嘘。 そんな感じの扱い。
・Coreアーキティクチャを「単なるP6改」と呼ぶレベル。 じゃないな。もっとだな。 ・Nehalemアーキティクチャを「単なるP6改」と呼ぶレベル。 ぐらいかな?
ha?
Bulldozerというコード名とAVX対応・GPU内蔵以外公式情報がないのに、 なにをトチ狂ってK10改とか決め付けてるんだろう。 それはK10.5のPhenomIIだよ。 まあ、K10改改だとしてもSMT搭載すればi7やSB超えは可能だろうけど。 どちらかというと、FPU/SSE/AVX命令とGPUコアがどう関わってくるのかが気になる。 最初の世代は無理みたいな話も聞くけど、 それじゃAPUと呼べないただのCPU+GPUじゃないか。 GPUでAVX(できればSSEも)命令を処理できてこそAPUと呼べるんじゃないのかな。
Bulldozerではアーキティクチャが一新される期待があってwktkしてたら開発失敗したから 反作用で下方向にぶれるのは仕方ないかと。 APUとかFusionの類だって元のロードマップでは2009年予定でしょ。 SSE5も「AMD独自で大丈夫?」と言われた挙句に案の定の路線変更。 目論見どおりに事が進まないのは企業規模を考えれば仕方ないが、 信用を得るには地道にモノを出して証明していくしかないだろうね。
APUも、実際にモノが出てこないことにはなんとも…… GPU統合に、皆さんがどんなハードウェア/ソフトウェアアーキティクチャを 想定して魅力を感じているのか、さっぱりわからない。 SSE/AVXの拡張でGPUやるんですか(笑)
GPUとCPUの統合は、同一ダイ上のGPUコアとCPUコアで 機能の被ってる演算リソースを共有するだけの 低価格PC向けの技術だろ?
S3のChrome400/500は、shader部がcentaur設計で非積和算器 つまりは既存のSSEユニットの改良 SSE/AVX拡張でGPUなんてのは別に何の不思議も無い larrabeeも結局はそう
>>938 異次元世界の現実ならともかく
演算ではCPUの100倍なGPU入れてやっとこNehalemに肉薄とか
そんなショボレベルになるわけがない
x86コアだけで見るならループ専用キャッシュなんてキモ馬鹿げたもの積みそうにないから
ベンチではいつまでたってもIntel x86コアには勝てないだろうけど分岐処理等ならすでに凌駕している
IntelがSandyBridgeに統合したGPUをコプロセッサとして扱えるようにしてきたらどうなるだろうか、などと L3キャッシュに直付けするくらいだから何かあるとおもいたいが 8月テープアウトなのに何も追加情報が無いってことは何も無いよね、多分
>>955 DirectX11対応らしいから
AMDみたいな工夫せずにそのまま載せるだけでもかなり汎用的に使えるし
エンコやレンダではGPUってだけで既に使えてるけど
IntelGPUって性能低いんでしょ
あぁ、目を覆いたくなるほどな
>>954 どのくらい分岐処理で有利に立ってんの?
性能比較ってループとかバンド幅のしか見たことないから見たいんだけど。
IBMのスーパーエンジニアがAMDに来て設計しなおすっていってたじゃん!>ブル
>>950 「開発延期」の情報はあるが「開発失敗」の情報がない。
SSE5もSSE5で追加されている。路線変更はAVXの追加。
2011年だとモバイルがデスクトップの1.5倍、利益だと2倍とかなってそうなんだけど モバイル向けとして見た場合のワットパフォーマンスはどうなんだろうな。 今のところ鯖向けを第一目標としてそうな雰囲気だが。
>>960 もっとインパクトのある結果が欲しかった。
どうしてもメジャーなベンチで負けるからこそ、
予測的中率がインテルの、可能ならi7の何%増しで、
CPUパワーのいる代表的なアプリでどんだけ速くなるってデータが。
つーかAMDはこういうアピールが全然ないんじゃないか。
>>963 >>960 は分岐予測有利についてのベンチを示した
これで納得がいかないなら、お前自信が分岐予測についての比較ベンチ結果を示せよ
お前は口だけなのかな?
もう一度言う
>>960 は分岐予測有利についてのベンチを示した
帯域とかクロックとか分岐予測だけで勝負するわけじゃないんだし あまり一つの数字に固執してもなぁ
CPUのスレだし話のネタとしては面白いのでは
>>965 >どのくらい分岐処理で有利に立ってんの?
に対する回答だから
分岐予測が絶対至上主義って話ではないからあしからず
強力な分岐予測機構って実は本当にランダムなパターンには弱い。 履歴のパターンからの推測でしかないからね。
>>963 PhenomとCore2のハノイベンチ(改造前)比較で
速度は2倍以上、予測ミス数では8倍以上の差があるのに
メジャーなベンチじゃないってだけでインパクトも無いのかw
ちなみにi7は2からノースとキャッシュをいじっただけなはずだから
速度はともかくミス数はそう変わらんはず(誰かに測定してほしいとこではあるけど)
ベンチなんて指標化のために分岐とか極力排除するはずだし
同じことの繰り返しだからGPUでやったほうが速いもんばっかりだろ
速度じゃなくてクロックだ
ハノイベンチというのは、ソースコードはどこにあるの?
いや、開発者がメンテナンスしている版がSourceForgeかどこかにあるんじゃないのか、という話で…
>>972 の中にソースコードが入ってるよな
後出しで話をすり替えようとは見苦しい
大元のベンチはVectorからのサイトリンク切れてるしバージョンもそのまま 問題のベンチ開発者(改造者?)ID:IZOakc8Z作のほうも単発 メンテナンスて何? Intel最適化して欲しいの?
テヘなんとかいう頭の悪そうなコテハンがいるので該当スレはほとんど読んでいないが、 他に本当のベンチマークはいくらでもあるのに、得体の知れないコード片を拾ってきて 「これこそ待ち望んでいた真実の啓示だ!Core2Duoはやはりもっさりだった!」 モーゼの十戒に出てきた、民衆が金の牛の偶像を崇拝してるシーンを思い出すよ。 このハノイの塔のコードはジャンプが二箇所しかなくて、1箇所は(妙な)カウンタで 1億回に1回しか分岐が変動しない。もう1箇所はハノイの塔なので、周期的に 結果が変わるがこちらも基本的には変動しない。 ごくごく限られた性質の条件分岐について、それぞれのCPUが採用した機構が ミクロに適合するかどうかを調べているに過ぎない。 「この」プログラムを実行する上での優劣を比較するなら良いが、「一般的な プログラム」での条件分岐機構の優劣について考察したいなら、 実際のプログラムで出現する様々な性質の条件分岐を多く含むコードで ベンチマークを取らないと、何の意味もないよ。
>>977 言いたい事がたくさんあるのは分かったけど
本当のベンチマークがいくらでもあるのなら、結果も一緒に貼った方がいいんでは
そのベンチマーク結果を持ってきてよ
確かに
>>977 は「いくらでもある本当のベンチ」を持ってきてくれ。
当然
>>958 氏や
>>960 氏か始まる「分岐予想」に関連するベンチな。
「本当のベンチ」って時点で何を言っているかさっぱりだけさ。
AMDが良い結果を残すベンチ=偽物のベンチなんだろ
むしろランダムの分岐に強いという方が怖いんだが どういう実装なんだろう この辺は興味あるな、速度はどうでもいいけど
ああ、悪かった。俺は別に条件分岐を測ることに全く興味はないんで、そんな ベンチマークは持っていない。ただそのソースコードに含まれるPMC testという モジュールが任意の区間のプロファイルが出来るようなので、もっと一般的な アプリケーションに近いコード、たとえばgzipとか、エンコーダとか、スクリプトの インタプリタとかを実行した方が、意味のあるデータが取れるだろう、という話。 ハノイの塔はほんとにCPUの分岐予測の能力と関係ないんで・・・ これは実際にコードを読むか、読めないなら信じて欲しい。 でも、なんでそんなに分岐だけ好きなの。 CPUなんだから(いや、別に車でも何でもそうだが)、全体見ないと意味ないよ?
分岐予測の精度はK8は低いんじゃなかったっけ? NetBurstなんかパイプライン深いからペナルティ少なくするために精度は高いでしょ
ROMってたけど、ちょっと気になるので質問。 AMDの分岐予測がすばらしいのは分かったけど その分岐予測でどれだけ快適になるの?
>>985 サーバーでの使用が前提のK8の分岐予測が低いとかありえない。
Pen4の予測精度はミスが致命的になるから過剰に高かったらしいけど。
K8の予測精度は高く、ミス時のペナルティは少ない。
NBの予測精度は非常に高い、ミス時のペナルティもかなり大きい。
Core2やi7はK10とあまりかわらなそう。
「高い」と「非常に高い」の差だろ
じゃあC7あたりが普通という基準なのか。 ずいぶんと平均値が高い方に偏った基準だな
>>942 どっかのライターが書いてた
曲芸のようなニコイチプランは
まず無いよな。
ベクタ演算伸ばすんだったら
現行コアにSIMDユニット増強で事足りるんだし。
K8/K10とCore系でもっとも差がついたのが、キャッシュ構造の差。 さらに「どちらが優れている」ではなくて、Intelのキャッシュ構造が、 時代に合っていた…というか。シェアの大きいIntelのキャッシュ構造に、 ソフトウェア側が効率化させたのが、もっとも有利な点だった。 …ってのをどこかの記事で読んだな。
995 :
Socket774 :2009/07/12(日) 18:05:50 ID:BPMeup6X
時代に合っていたんじゃなくて 時代はインテルになびきやすい
いつかのミーティングで見たけどIntelは製造プロセスよりソフトウェアに投資しているらしいね
最適化で変わるのなんて3%あれば良い方
>Intelは製造プロセスよりソフトウェアに投資しているらしいね 俄かには信じがたいが そのくらいしないとサポートは得られないということだろうか
IntelはGMAそのものをCPUから操作出来るようにする予定はないよ。 GPUとして使えるCPU(Larrabee)を先に作ってしまって最終的に統合する算段。
1001 :
1001 :
Over 1000 Thread