昨日1000に達したあと放置だったので建てた。 次世代の話題なんて情報が少ないから、たいしてないんだけどさ…。 そしてそろそろ過去スレ一覧イランかなぁ…。 Phenomスレにあるコードネーム一覧でも置いておいた方がマシかも。
i9に対抗していきなりAthlon10を出す Athlon4とかあったしありえるよな
944 名前:Socket774[sage] 投稿日:2009/09/12(土) 19:04:40 ID:clrVH6Wf
秋葉原行ってきた。
天野氏の謝罪内容
P55チップセットで、USB1.1のデバイスを複数つなぐと、データー干渉の不具合が起こる。
例
キーボード(USB1.1)とアイポッド(USB1.1)を繋ぐと、アイポットの音声にノイズがのる。
ちなみに、USB2.0のデバイス(USB HDDトカ)には影響ない。
また、USBポートにグループがあるらしく、別のところに刺せば回避できる場合もあるらしい。
とにかく、今回のP55の不具合はPS/2のマウスとキーボーどを使ってれば問題なさそう。
まー詳細は、PCwatchあたりに記載されるでしょう。
947 名前:Socket774[sage] 投稿日:2009/09/12(土) 19:10:22 ID:PL5fXyZW
>>944 USBマウスが繋がってるスロットに360コン繋いでゲームしたら360コンが振動しっぱなしになったが
そういうことだったのか
>>6 リンフィールドマンセーの淫厨牽制のために必要と思う
ある意味テンプレか?
Lynnfieldなんてマンセーしてるのは低脳だけだろw
「スレチ」がテンプレ・・・だと・・・?
その低脳が多くてしつこいから仕方ない
>>13 言っている意味がさっぱりわからん。「スレチ」がテンプレって何?
17 :
Socket774 :2009/09/14(月) 23:44:21 ID:b8DCihhc
★オナニーコントロール★ オナニーコントロールとは高度なオナテクの一つであり 約3日で精子がMAXになるという生理現象を利用したオナニー管理の事である。 レベルの高いオナニストは「オナコン」または「寝かせ」と呼ぶ事もある。 オナニーコントロールは毎日精子欠状態で快感の薄いオナニーを続けるよりも 2,3日オナ禁を己に課した後の爆発的快感を伴うオナニーの ほうが前者の快感をはるかに凌駕するという驚異的な発見から生まれた。 快感に飼いならされている若く無知な男は我を忘れ 毎日ちんぽをしごき続けているため短い周期の オナ禁は意外と盲点になりがちな発想なのである。 「快感に支配されるのではなく快感を支配する!」、逆転の発想から生まれた オナニーコントロールをマスターすれば至高のオナニーライフを 手に入れることが可能だ。いざ無限の可能性へ! さぁ君も今日からLet'sオナニーコントロール!
L3なしのクアッドって誰が買うのを想定してるんだろう
安いクアッドコアが欲しい人向けじゃないかな? L3無いと消費電力が少なそうだけど、そういう人は45W版待ちだろうしね
L3無しのクアッドコアはゲームしないなら、良い選択肢だと思う
値段が関心事ならデュアルでいいじゃない。クアッドでないと出来ない事なんてないんだから。 逆にクアッドのパフォーマンスが欲しいならL3省略はあり得ない。
メーカー製PC及び、省電力PC。 どうもAthlon II X4結構省電力みたいだぞ。 「Denebコアが混じっているからTDP95W説」も 信憑性がもたれるほどに。
L3の有無でどれだけ違うの?
>>23 AMD発表では確か10%の性能差じゃないっけ?
当然L3が効果的に効く分野と効かない分野があるから、
効果がある分野では10%以上の差が付くだろうし、
その逆ではクロックが同等であればほとんど差がないだろうし、
どちらが優越とは決め辛いのも現状の気がする。
ぶった切って完成ならわざわざ別マスクにしねーよ
「下半分のL3部分」ではなく「L3部分の下半分]だと・・・
どちらにしろ写真を見れば、Denebコアをぶった切っても、 Propusにならないのはわかりそうなもんだろ。 それとも周囲を囲うパッドに意味がないとでもおもってんのか?
レーザーやチェンソーで物理的に切るわけじゃないだろうが論理的には同じ事やってる それができないならモジュール化って何っていう
上から目線の基地街固定が来ないだけで、 ずいぶんマターリスレになるんだなぁ・・・
モジュール化しているから、別マスクで簡単に造れるんだろうな。
キャッシュを減らすという発想がもうダメ Athlonは安かろう悪かろうブランドじゃなかったはず
キャッシュを増やすという発想が素晴らしい →キャッシュマンセ →CoreMA(2、i7)マンセ
>>33 Phenomから見れば安かろう悪かろうだ
>>33 安かろう悪かろうじゃないから問題なくね?
Pentiumブランドみたいなもんだろ
IntelはPentium4がミソ付けたからPentiumの名前を捨てる必要があったけど それにつられて勝った側のAthlonを捨てるAMDは 何を考えているのかさっぱりわからない。 マーケティングにかけられる費用がIntelとは桁違いに小さいのに Intelと同じ速度でブランド更新していったら 消費者に名前が浸透するはずもない。
ベンチ厨じゃなきゃPen4の惨状なんて知らないし ベンチ厨なら名前変えたって何でもないし (ベンチ厨はもうちょっと広義でも可) パラノイアのIntelに価値観合わせる必要こそ無い
Athlonまだ捨ててないし キャッシュも減らしてないし
>>41 だとしてもAMDのブランディング戦略が完全に迷走してるのは間違いないかと。
まあ、製品がIntelに対抗できるようになってくれればいいんだけどさ。
Core2が出た時点でAthlonも十分ミソ付いたと思うんだけど まあAMDが一番痛かったのは65nmの失敗だと思うんだけどね
IntelはAMD以上に迷走しているがね LGA775/1156/1336と互換性がないまったく別の規格が並存していて 性能も同価格帯では同じようなものだし。 9550と750、860と920とか。
だとしてもって何? 実際にAthlonの新型発売されるんだが・・・
>>45 それでもまだIntelの方がマシだと思うぞ。CeleronがPentiumの下という関係を貫いてる。
Duron、Sempronがなくなってデスクトップ用としてはAthlonが一番下になったAMDと比べると。
いや、製品がよければいいんだよ。だんだん追いついてきたし。
この強烈な電波は一体・・・
intelはHavendaleの開発に失敗したからね。 LG1156用の45nm廉価コアがなくなったから、32nmでラインナップ全部まかなえるまで、 CeleronやPentiumの下をLGA775でしのぐ必要があるので、 来年一杯プラットフォームは統一化できないので、ぐだぐだになっている。
Sempronもまだ消えてませんね
AthlonはPhenomと比べると一応L3が無いとう点で、キャッシュは減っている。 ブランド戦略がイマイチ緩く見えるのは、上位が押さえつけられている事が原因なんだよ。 あと、DuronはSempronになったSempronは生きている。 てか、DruonがSempronになったのってSocketA→SocketS754時代だ。 かなり古い話を持ち込んできたな。おいちゃんビックリだ。
店売りのSempron見ないな、と思ってたが検索してみたらメーカー製PCではまだあるのか。 勘違いしてた。スマンかった。
>>47 本丸のOpteronが虐殺されているのに
追いついてきたとか笑わせんなwww
>>53 終止符打った。スマンかった。
>>54 デスクトップでは一時期より差が埋まってると思うが、
先は暗いかね。鯖がそんな調子では。
未だとノートの方が、デスクトップより売れているから、 デスクトップ以外のシェア上げないとジリ貧なんじゃないかな。
ノートのシェアは一応維持してるけどな AMDはプラットフォーム全体で見たら安いから ノートは一定数は確保できるようだ
L3は無しでよいから、L2を1MBでX4作ってくれ
>>59 去年のAnalyst Dayでも製造プロセスは明らかにしてなかったしな
あのクラスにSOIは使わないだろうから40nmは十分にありうる選択肢
>>58 おぉ。L2キャッシュ信者! これは保護動物登録していいだろ。
分かりやすい奴だなw
64 :
35 :2009/09/17(木) 23:24:35 ID:UrBIyLrJ
>>129 勝手に決め付んな
漏れが使ってるのはL2 64KBのDuronだっつーの
どうやったらそんなに豪快にレス番間違えられるんだ?
CPUをバルクプロセスで作るわけないだろう。
あやや後半恥股
誤爆
何でそんな悔しがってんの?w
45nmでHigh-Kがオプションみたいな事言ってた気がするんだけど もしかしてそれだったりしてね。
単に45nmの改良が進んでるだけだろ AMDではいつものこと High-Kは手を入れなきゃならない範囲が広いらしいからそんなリスクはとらないだろう 現状性能的にはi7やi5に勝てなくてもとりあえず以前の65nmと違って 高クロック化は順調だしリーク駄々漏れという問題があるわけでもないしな
3.2GHzTDP125W→3.4GHzTDP140Wで順調ねぇ……… 普通頭打ちって言うんじゃね? まあ今の素材使ってる限り4GHz辺りが常に限界らしいけどw
3.6GHzでも140Wらしいから単なるプロセス改良と見ていいんじゃないか ステッピングが変わるのはHigh-kとはまた別の問題だろう 逆にHigh-k採用でこれだったらガッカリなんだけど
>>77 High-k使ってようがシリコン使ってる限りプロセスが代わろが常に4GHz辺りが限界でしょう。
その付近になるとリークバーストw
インテルですらアーキテクチャ変わろが常に最高クロックが3.5GHz〜3.8GHz。
Sandy Bridgeも最高で3.8GHz。
あとはわかるよな?
>>78 AMDが世界初の非シリコン材料によるx86プロセッサを開発するわけだ
あとは電波
POWER6は未知の技術で作られていたのか
非効率なx86前提の話だよ。
お花畑ではAtomも4G付近までお手軽OC可能
>>76 記事読んでいないのか。意図的に情報を欠落させる能力が過多なのか。
その双方か。判断に迷うところだ。
もう300ドル以上のcpuなんてニッチ 自作なんて超ニッチで売れ筋は100ドル前後だろ 今後は更に下がって65ドル AMDも十分生き残っていける グラフィック統合すれば知ってる人はAMD一択かも
>>84 イミフ
4GHzTDP125Wの995登場ですか?
まさかたかが3.6GHzTDP140Wで記事とか意味不明な事言ってないよな?
日本語で
姦国人しかいないスレで何いってんの
昔はAMDを選ぶ理由があったが 今は「用途によってはコストパフォーマンスがいい」ぐらいしか 理由がないからなあ。 次世代の情報も出ないし、まともな人はどんどん減っている。
もう一個あるよ intelは絶対ヤダ、っていう人々 自作仲間でそういう人いるけど、恐ろしいほど話が噛みあわなくて困る
Intel絶対やだ信者とAMD絶対やだ信者。
絶対に相容れない関係だなw
てか
>>90 の理由って十分に選ぶ理由じゃないの?
なんとなくAMDな人も忘れるなよ 明確な目的があったりすると選択肢には入らないんだけどね
> 明確な目的があったりすると 宗教上の理由ってやつですか。もしくはブランド命な人。 普通の消費者はコストパフォーマンスを第一に考えますけどね。
エラッタ絶対やだ信者がそんなに珍しいか
インテルのエラッタ隠しは本当に酷い あそこは企業というより最早秘密結社 (秘密でもなんでもないけど)
ところでWindows7が成功確実な件について
>>94 Mini-ITXで小さいPC組むとかあるでしょ信者脳って怖いね
そういうのはatomにいくだろ
だから選択肢に入らないって言ってるじゃん
ああ、そうかい
> Magny-CoursはIstanbul*2ではなくLisbon*2 また延期か
>>78 液体窒素冷却で6GHz行ったどっかのフェノムは何だったんだ
>>104 ぶっかけなら8GHzだってあるだろ。
実用的とは思わんけど。
>>102 Fudzilla…の予想ってあんまりあたらんよね。
ただ統合されるのは"Istanbul"ではなくて、
"Lisbon"ってのは当たりそうだな。
ノート向け改良を鯖にももってくるのか。
あるいは鯖用の改良をノートに持って行くのか…どちらだ。
IstanbulとLisbon同じものでプラットフォームが違うだけ Magny-Coursは元々DDR3のLisbon*2だしチップ的にはIstanbul*2でもある。 AMDはG32よりG34を先に出す予定で発売順はMagny-Cours→Lisbonで Lisbonが2010年Q2というのも発表通り。 Lisbon→Magny-Coursと勘違いしたただのアホ記事だ。
俺なんてSao Paolo*2の記憶しか無いぜ
AMD-V 2.0、AMD-P 2.0なんだから、当然Magny-CoursはLisbon*2
Fioranoになれば、Istanbulも2.0使えるようになるはず。 Lisbonの方がステッピング上がって、今出ているIstanbulより省電力になってるかもしれないけど、 ほとんど一緒なんじゃないの?
111 :
Socket774 :2009/09/21(月) 17:58:50 ID:FRP6VUHl
クアッドコアは本当に速いのか? マルチコア化が進む昨今、デュアルコアは常識になりつつあるが マルチコアを上手く使うためには、プログラムがマルチスレッドに対応する 必要がある。 サーバー用のプログラムはマルチスレッド対応は簡単なのだが 我々一般人が使うプログラムのほとんどはマルチスレッド化が 困難である。 シングルコアは既にローエンドとなってしまったため 現状、エンコードなどごくごく限られたマルチスレッドに向いてる用途と ベンチマーク以外は高クロックのデュアルコア>クアッドコア ということが言える。
普通にデュアルコアとクアッドコア使ってれば、 クアッドコアがいかに快適かわかるけどな。
>>111 もはや、自宅用でハイエンドCPU使うなんて、エンコかゲームだろうけど、
前者はすでに4コアに対応しているし、ゲームも最近のは4コアに対応してきてるから、
それなりに生かされてると思うけどな。
ネットや、音楽聴いたり動画見たりするぐらいなら、2コアで足りるけど。
>>113 これVGAだろ
デュアルCPUでCPU負荷34%にしかならない・
ちなみに8800GTでぬるぬるですた
>>115 済まん。 俺が悪かったw
他にCPUに超負荷が掛かるFlash動画ってないですか?
>>111 「困難」ではない。マルチコアが普及していなかったので、
マルチコア対応アプリも普及していなかっただけ。
Vistaが大失敗だったので、Win7辺りからようやく普及開始じゃない?
〜が出れば、〜が普及すれば、 は数年前から言われ続けて聞き飽きた
やはり「困難」なんでしょ。 アプリケーションの惨状を見るとそう思える。 バカチョンでマルチスレッド対応出来る仕組みが必要なんだよ。 多分、OpenMPなんかよりももっとずっと簡単な仕組みが。 アポーのGCDでなんとかなったりせえへんかな?と思ってるんだけど…どうなんでしょ
OpenMPすら使えないやつがまともに並列アプリの設計できるとは思えない。 そもそもマルチメディア以外のコンスーマアプリで並列化の必要があるものってどんなのがある? アプリ単体でCPUの全コアが必要になるようなものって思いつかないんだけど。
あんまり知識ないけど、オンラインゲームとか悲惨っぽいよ
並列計算の方法論は1950〜70年代にほとんど出尽くしているのに 素人相手に「これからはマルチコアの時代!」と宣伝しなきゃいけない石屋さんカワイソス
うちの会社、マルチコアに対応してるだけで一人勝ちだからなwww
はっ?SMPとCMPを区別するようなコード書いてんの?
区別しないでスケールアップするかよ
え?区別するコード書いてるの?
昔のスパコンの並列化と違ってコア間の通信速度は飛躍的に上昇してるだろ
通信速度の絶対値を違う時代で比べても有益とは思えん。 演算能力と通信能力の比が重要で、それは良くなってないんじゃないのかな 昔って言葉を安易に使うのもどうかな。コア間通信という言葉が 用をなさない時代からスパコンはあったわけで
「これからはマルチコアでどうにかする時代!」なんだから別に間違いじゃないような
>>125 だな。
対応が困難とか抜かしてるロートル脳な開発者は、とっとと市場から退場すればヨシ。
社内で使う業務ソフト開発に携わってるけど マルチスレッドは原則禁止にしてる
MT書ける人間が効率重視で書くコア階層と MTの知識なくても誰でも書けるビジネスロジック層に うまく分離するのが重要なんだろうな。 量と質の両方のベクトルを同時に満たさなきゃ上手く回らないという。
>>134 そりゃあ車内業務用ソフトなんぞは、ユーザーの選択の余地が無いから、難しい事をして
バクるくらいならしない方がマシだからな。
ユーザーの目が厳しい市場で売る為のソフトとは違うのだよ。
138 :
Socket774 :2009/09/24(木) 23:05:40 ID:Hl+xMiCN
アスペルガー障害の特徴 (01) こだわりが強い (02) 規則や理屈を重んじる (03) 頑固 (04) 変化を嫌う (05) 冗談,比喩,ほのめかし,皮肉などの理解が弱い(マジで受け取るなど) (06) 暗黙のルールがわからない (07) 自分の好きな話題(いつも同じ話題)に戻っていく (08) 雑念にとらわれやすく、嫌なことや今不要な思考を排除できない (09) 記憶力の異常 (10) 音に過敏 (11) 感情表現がへた (12) ストレスを受けやすく怒りっぽい (13) 狭い範囲での優れた知識 (14) とても論理的で理数系に強いことが多い (15) 科目で得意不得意の差が激しい (16) 宇宙人,変人,ボケのどれか言われたことがある (17)癇癪持ちで思い通りにならないとすぐキレる
>138 コピペに何だが、全部俺に当てはまっていて驚いたw
140 :
Socket774 :2009/09/25(金) 16:26:37 ID:2MJOebE/
何の話がしたいんだか。 ユーザーにとっては、シングルスレッド性能の高いデュアルコアがあればそれでいい という状況が続くだろう、って話をしてるんだが。 まともに「マルチスレッド対応だから軽い」というコードはそうそう増えない。だから、 軽くならないなら「ユーザーにとって」コアが増える嬉しさは無い。シングルスレッド 性能が増加する方が若干マシ。こっちは一応確実に速くなるし。 「マルチスレッドで楽に組めました」なんてのはユーザーにはどうでもいいし、大体 プログレスバーなんて、オンデマンドでスレッド立ち上げても構わない程度の糞粗い 分散処理だろ。そういうどうでもいいマルチスレッディングの話はしてないよ。2コア 程度で余るだろうし。 スレッド最初に立ち上げっぱなしにして、通信しながら分散処理して、終了時に正しい 順序でリソース解放させていくだけでも、慣れるまでは難易度がシングルスレッドの コードより遙かに高い。しかもパフォーマンス出そうとすると際限なく難しくなる。 だからわざわざ手を出す奴は少ない。 プログレスバーの中にはもしかしたら肝が全て入っているかもしれないが、面倒な部分 は隠蔽されているから意味が無い。 4コアあるけど使ってない時はターボモード、っていう設計をする意義も分からない ではないが、2コアでも時分割してるんだからそっちの方がいいだろ、と。 というか、4コア擁護しようとして、まともなマルチスレッドのコードを書いたことの 無い奴が無理に背伸びしてるように見えるんだけど。ぶっちゃけ。
>>140 某所の記事をそのまま改悪・劣化して書き記した感じだな。
(07)です
143 :
Socket774 :2009/09/25(金) 18:24:39 ID:B5TZ0/Au
16当たってるから病院いくわ
>>140 いくつかのアプリケーション同時に走ってるから効果があるんじゃないの?
プログレスバー君ですか?ひょっとして
AMDの次世代CPUってどうなってんの? IntelはSandyBridgeの実働デモやったみたいだけど
PhenomIIの32nm化は無くなった
ではPhenomIIIですね?お待ちしております。 それよか旧ATIのドライバ書く連中を早く首にしてくれ。 毎月改悪じゃねーかw
その元々ないってのが問題なんだけどな バックアッププランが無いって事だから。 65nの時はローエンドのBriのみで初代Pの遅れるままに延期、 1MBx2版のシュリンクがあれば少しはマシだった。 今度は32nでBulに合わせて32nその物が延期、 P2のシュリンクあれば良かったのにって状況になりそうなんだぞ。
GFがAMD以外の顧客獲得のためにアピールでQ1のロードマップを 見せていただけで、Bulldozerは別に遅れていないかもしれない。 その記事には、40nmの方もSTMicroのスケジュールに合わせて遅らせるって書いてあるし。
>>151 AMDのバックアッププランなんて、現状ほぼ無いだろ。
K9/K10用のバックアッププランは、
K8を馬車馬の如く酷使して凌いだけど、
もう限界に達しているだろうな。
あと"Bulldozer"のバックアッププランはもう出ている。
6コアの"Thuban"がそれだろ。
>147 記事を読んだけど…結局「"risk production"が何を指すかわかんない」って言っているなw AMDは「別に"Bulldozer"は予定通りだけど何か?」って言っているようだし、 GFの方は「AMDにあわせてスケジュールをちょっと変えたよ?」って言っているしw
32nmプロセスの調整用にPhenomIIの32nm版くらいは用意しているとは思うが、 それを商品化するかはBulldozerの出来次第な気もする。 プロセスとコアを同時に切り替えるのはリスクが高いけど、 それが出来るほど出来がいいということなんだろうか。
リスクあっても強行しなきゃならんほど追い詰められてるようにしか見えない。 でも、実際には32nmシュリンク版出すことになるんじゃないかなあ。 Bulldozerの延期を認めたくないから今は言えないだけで。
intelはnehalemを持ってるけどK8はAMDを持ってる状況
GFを分離して少しは楽になったとはいえ、現在のAMDの台所事情を考えると、 K10.5を32mにシュリンクするような人員を割けるのかが謎。 そんなことで無駄に開発予算と人員を分散するぐらいならば、 人も金もbulldozerに使った方がいいだろ。 将来的に出る可能性はあるが、それはbulldozerが終わったあとじゃない?
Bulldozerが大転けしたときのバックアッププランだろう>32nmK10 Bulldozerが今の予定通りなら製品間の差が詰まりすぎるからシュリンクは労力の無駄
BulldpzerがこけたらAMDは死亡するからバックアッププランなんて意味がないぞ 今のAMDが存続できるのは皆がBulldozerに期待しているからだからな
今のAMDが存続できるのは金が入ったからで ライバルがベンチ専用だけど何故か売れまくってるだとかいうのは別に関係無い
何で金が入ったと思う 何の展望もない赤字企業にどこも金なんか出さんよ 今後のトレンドになるGPGPU向けに他社に先駆けてCPU+GPUのFusionを計画して、 K10じゃない次世代コアのBulldozerとRadeonコアなら今後もIntelと勝負出来そうだからだろ
だめだこりゃ
>>160 bulldozerがこけたらさすがにAMDも厳しいだろうな。
まぁ。K10.5コアよりはマシだろうから、
現状と変わらず沈む沈まない位置で漂うだろうが。
bulldozerを突然キャンセルしたら? あぁ。終了だろ。
bulldozerがキャンセルとかになったら株屋どもがぶちぎれそうだな
Sandy Bridgeがガンガン情報出して露出させてきてるのに Bulldozerの方はなしのつぶて、というのは、あんまりいい兆候じゃないね。 一度仕切り直した時に保守方向に振っていて、見せられる所がないのだろう。 まあ最悪なのはSunのRockみたいに一発逆転の革新的ギミック満載して 開発しきれずにポシャることなんで、それに比べればマシなんだけど。
Intelのデモ好きは毎度のこと…と言いたいところだけど、 この頃"裏IDF"とかやんねぇな。AMDは。
雲行き怪しいけどブルドーザはちゃんと予定通りに出してほしい。 今はうちではi7が動いてるけど、本当はこれブルドーザの予定だったし。
Bulldozerは来年の今頃にデモが出来るかどうかだろうし、 今情報を出せるような段階じゃないだろ というか、下手に情報出してIntelに対策されたら目も当てられない とりあえず ・マルチスレッド化 ・L1/L2排他キャッシュの廃止 ・K7から増設しまくって効率が悪くなったコアの再設計 ・x64の高性能化 位は実現して欲しいね
コメント欄でいきなり突っ込まれている通り、ARMは製造にタッチしていないので、 (ARMがライセンスした会社が製造する) GFと何を合意するというのかよくわからない。
GFのプロセスに対応したハードマクロでも作るんじゃね?
GFのプロセスに合わせたIP提供しますよってことじゃ
ライセンスの概要
http://www.jp.arm.com/products/licensing/index.html インプリメンテーション・ライセンス
実装ライセンスは、ARMの最も人気の高いライセンス・モデルであり、
ARMプロセッサを搭載した集積回路を設計、製造するための総合的な情報を提供します。
実装ライセンスは、設計と製造の設備を持ち、
複数の製品にARMプロセッサを使用しようと計画している半導体ベンダに最適です。
ARMは、各パートナーの設計フローに応じ、ハード・コアまたはソフト・コアのデリバラブルを提供します。
ファウンドリ・ライセンス
ARMプロセッサ・ファウンドリ・プログラムは、
製造設備を持たない(ファブレス)半導体ベンダや機器メーカがARMプロセッサ搭載製品の開発と販売を行い、
製造をライセンスのあるファウンドリに委託するための革新的なモデルです。
このプログラムは、2つの特有のライセンスで構成されます。
1つは、デザイン・ライセンスで、ファブレス半導体ベンダまたは機器メーカに供与されます。
このライセンスに、ARM搭載システムオンチップを設計するために必要なすべての要素とビューが含まれます。
もう1つは、ファウンドリ・ライセンスで、半導体ファウンドリに供与されます。
なるほど、顧客はGFの方か。 チャータードが既に持ってるライセンスのような気もするが、まあいいのか。
ARM、IP買うファブレス企業、ファブ企業、3社が契約して成り立ってるわけだな
ARM系の会社からも仕事が受けられるようになったわけか。
その手の話を何度聞いても二重取りだと思えてならない。 ファウンドリもライセンス要るなんて。
逆に考えるんだ。 ファブレス企業とファウンダリでライセンス費用を分担してると考えるんだ。 むしろ「今までARM製造ライセンス無しでファウンダリ言うてたんかい!」と 突っ込むべき所な気もしてきた。 TSMC並に最新コアを優先して製造できる契約ならGF大勝利だな。
ネタが尽きたのかな。
次世代ネタも新しいネタが出てこないから。
>>169 もうブロック図出てるんだけどなwwwww
http://www.tomshardware.com/forum/265666-28-bulldozer-core-patents-diagram-core-turbo デコーダは2スレッドで4Wayのデコーダを共有してるのはNehalemと同じ。
ただし全デコーダがComplex Decoderになってるので命令供給は速い。
2つの整数クラスタ毎にL1キャッシュや整数レジスタが分かれてたり、スレッド毎にリソースを固定配分
してるぶん、2スレッド動かしたときの実効性能はSandy Bridgeよりは高くはなりそうだが、
その分トランジスタ数も割いてるわけで、なら物理コア数増やせよってツッコミが入らんでもない。
整数クラスタ部のALU+AGUペアが3Wayから2Wayに減らされてる。
1スレッドのスカラ整数演算性能は落ちるってことな。
整数のシングルスレッド性能はいろいろ残念なことになりそうだ。
まあ浮動小数ユニットはそれなりに高性能になってるので落胆しなくて良いと思うと思うけどさ
例によってAVX/XOP使わないと使い切れないけどな。
まあ、AMDも早いとこシミュレータ出せばいいと思うよ。
IntelのSandy Bridgeのほうは良くも悪くもCore MAの正統進化。
>>183 こんなとびっきりのネタがあるのだぞ
君の目はフュージャネイザンか!
整数演算落ちるのか… もうAMD捨てようかな 整数演算でIntelと差がつきすぎ…
なぜ整数演算を強化していかないのだろう
189 :
,,・´∀`・,,)っ-○○○ :2009/10/06(火) 00:35:16 ID:pNgM/YvX
特許の文書通りであんまりに説得力ありすぎて笑うしかなかった 一応FADD+FMACだとピーク性能は同クロックのSandy Bridgeの1.5倍だったり、 いかにもAMDらしいなって思った。 なにより整数性能は1スレッドでならピーク性能は落ちるが2スレッド合計ならかなり伸びるでしょうよ。 確かにこれならサーバ用途でNehalemに奪われたシェア奪還できるかもしれないって思った あー、問題はシングルスレッド性能ね K8 Opteronは3Way ALU+AGUだったけどスケジューラが貧弱で同クロックのPentium M(2Way ALU) に並ばれるケースすらあった。 3Wayの割りにあまり性能上がらなかったのは、依存関係ろくに調べずに3つのパイプにディスパッチしてから 各パイプ内で独立にスケジューリングしてたからなわけで 2Wayでもディスパッチ前に依存関係をきちんと調べてスケジューリングすれば有る程度実効効率はあがる。 それでも良くて現状維持だけどな。
ターボブースト的な機能が無いとそれこそベンチマークで酷い目にあいそうなんだが AMDはどう考えているのだろう? 細かな電力コントロールを一朝一夕に実装できるとは思えないけど 今後のシングルスレッド能力はこれにかかってそうなので何とか頑張ってほしい
団子が急に元気になったな あんなうわさ話程度のブロック図で何を騒いでるんだか まだまだ2年先でなんの情報もないし、PhenomIIよりは性能高いから気にすんな お前はインテルの次世代スレでLarrabeeでもマンセーしてろ。
>>190 Dresdenboyが「PCU」の存在について触れてるよ
K8のスケジューラってバッファに近いんじゃ Packの段階で依存関係を調べてるんじゃないの
整数演算だけ強くても全体の性能で見た時にバランスが悪いのでは?と思う。 PCのパッケージに例えると、整数演算がCPUで、他がHDDだったり、メモリだったり bus速度だったりと…。 そもそも整数演算しかしない状態のアプリって限られるんじゃないか?
整数演算てグラフィックの2Dと同じで今や十分な性能を持っていると思うが。 ボトルネックはメモリやHDDとかのIO関係でしょ。
>>190 いずれは乗せるんじゃね。
ただ今はマルチスレッド化されたアプリでの性能が最優先だろうから後回しになるけど。
何を今更…
TSMCがIntel陣営だなんて前々からわかってのことだな。 今年の頭には既にATOM製造の話が出てたじゃねぇかと。
これくらいで同じって言ってたら業界全部同じ陣営だw
デュアルOpteronの片方をHyperTransport対応Fermiに差し替えて最強スパコン化計画というのは なかなか因果な話だと思った。
>>201 それはなかなか面白い話だな。
"Bulldozer"でも上位コアはGPU内蔵ではないから、
そういった方法で汎用性があるのはいい事。
http://www.ne.jp/asahi/comp/tarusan/main214.htm 〜中略〜
と言うわけでAMDの方針が見えてきたように思う。
シングルスレッド性能は「3つのウォール」の壁の直前までにとどまり、これがNehalemと比べて極端に上がることはないと予想する。
しかし、マルチスレッド動作時の電力効率は大きく改善すると思う。
狙いは
シングルスレッド動作時にNehalemの絶対性能を、マルチスレッド動作時にAtomの高効率を、同一チップで両立させること
だと予想する。
たるさんはマルチコア全体のTDPを生かしたクロックアップについては全然考慮して無いな ターボブーストが今後のシングルスレッド能力を左右すると思われ
共有なんかしてたら高クロック化や非同期が難しくなるだろうしな 普通にヘテロでええやんっていう
>>207 そうなりそうな気もするが、なんか嫌な未来予想図だな。
高性能化は「無理させる」しか方法ありません、みたいな。出来る範囲の無理なんだろうけど。
メモリがDDR3のままだから、AM3のソケット形状をそのまま使うってしか、 まだそのロードマップからは読み取れないと思うけど。 コードネームが変わっているのが気になるが、他のとあわせたってだけの可能性もあるので、 Bulldozerが遅れたとあきらめるにはまだ早いとような。
ServerのInterlagosが無くなったらやばそう
確かに、サーバーロードマップまでコードネーム変えてくるとは思えないし こっちもリークしないかな
CPUオンダイIGPの最終出力をHT利用でチップセットに流して、そこからVGA出力を生やすことは不可能ではない。 従来IGPでメインメモリをVRAMとしてCPU経由接続していたことを考えると、むしろHT帯域占有率は減る。 "チップセット側にVGAの最終出力段のみを設置したAM3=AM3R2"と考えれば、 単に新ソケット(実はAM2系ソケット群の最新型)と新コアの正式コードネームが決まった程度じゃないか? 過去にも180nm Athronで"Corvette"→"Palomino"、 180nm Duronで"Spitfire"→"Camaro"→"Morgan"、 90nm Athron64で"ClawHammer-S"→"Sandiego"といったように、 コードネームの変更は昔からある。 Intelでも"Tejas-C"→"CedarMill"や"Nehalem-C"→"Westmere"、 "Gesher"→"Sandy Bridge"などなど。
確かに過去にコードネーム変更はあるし、 "Orochi"だけがコードネームとして異質だったのは確かだけどさ。 ただ、"K11"がCPU側にどれだけの機能が追加されるのかが謎なのと、 "K11"が仮にIntelの"Lynnfield"のように"PCI-e"などのノース機能も CPUに統合するならば(しなければ問題ない)、逆にHTの帯域は増えるだろうし、 そうなると"AM3"のピン数で大丈夫なのか? 統合したとしても"AM3r2"でHT帯域上昇する可能性もあるけど…。 てか、"Zambezi" = "Orochi"となると"Scorpius"プラットフォームは GPU統合ではないので、上位コアだけは"K11"の可能性はあるのか?
最上位はサーバーと同じCPU使うだろうから、 PCIeなんてCPUに統合しないだろう。 というか、PCIe統合しているのに、チップセット側からPCIeのバスでるなんて 変な構成やらないだろう。 やるなら、ソケット自体変更して、Fusionと同じCPUからPCIeのバスが出る構成だろう。
>>217 君なら幸せになれる壺を100万円で買ってくれそうな気がするよ。
"Bulldozer"がIA-128なんか噂なんかよりも、 AVXの256bit実行ユニットを積むって妄想の方が信じられる。
>>206 atomって高効率なん?
あの性能とtegraなんかのchipと比べたらとてもそうとは思えない
AMDの生きる道は500ドルで3DFPSできるgaming note か 動画サクサクnote いずれにせよゲームも動画もOKのグラフィック強化ノート
>>220 設計上2GHz以上でも回る石を、大人の事情で倍率制限かけて1.6GHzに抑えてるのがAtom。
(Yahoo掲示板でPentium M 1.5GHzよりクロックが高くてHT対応してるより性能がいいと思っちゃう残念な消費者だって多くいる)
ARMそのものはAtomよりずっと性能低い。
N270に最新鋭のCortex-A9のデュアルコアをL2数MB積んで2GHzで動かして
辛うじて勝てるかどうかのレベル。
シングルコアでAtom Z550に対抗できるくらいの設計にしようと思ったら
4倍以上のダイサイズと消費電力が必要になる。AMDer、もといアムダールの法則だな。
ハイエンドでその程度だからそれより低クロックな、Tegraに組み合わさる石なんて多寡がしれてる。
GPU部分ありき。
28nmのSnapdragon待ち
>>220 MID等ならともかくPC用途で非x86なんて検討に値しない。
現行のネイティブx86アーキではAtomのBonnellコアが最高効率。
そりゃトランジスタの効率であって性能の効率じゃないだろ
>>222 たしかにgpuありきだがHD動画をより低消費電力で見れるからatom(プラットフォーム)が高効率と言われると大人の事情があれ違和感がある
cpuとて単独では意味がなくプラットフォームで語ってこそ意味があるんだし
絶対レベルこそ低いものの電力まで加味すると余計にarm系の進化がかなり速いと感じる
「倍率」って断ってるぞ GMAがOCの足を引っ張るって大昔からの問題のような。 IONだとどんなもんかね
正式のは533/800対応の945GCだがASRockは1,333MHzまで上げた! これなら大丈夫だと思ってAtomに適用したら諸君の愛してくれたAtomは、OC率27.53%〜と絶叫して死んだ! なぜか!
>>226 ちなみにSharpのあれはA8ベースで800MHz
それでもARM搭載MIDの中ではトップクラスの性能だから笑うしかない
組み込みの掟として、デモで出てくるようなスペックの製品は実際の製品に組み込まれるまで3〜4年かかる。
あるいは顧客がつかなくてポシャる。
組み込みの場合は量産が前提だから、ソフト屋が頑張ってチューンすることで
ギリギリまで低コストの石載せることで単価落とすのが掟だからね
ハイエンドなんて使われようがない。
2GHzヅアルコアなんて程遠い
>>230 ぶっちゃけAtomの性能増やすのにはクロック上げるよりはIPC増やす方がいいだろ
いや、Core MAでええやんって話になるけどさ
全角英数を指摘すると火病を起こす奴がいるけど、 全角英数を指摘される奴は、往々にして知識的に微妙だよね。
x86プロセッサの場合共通のハードウェア・ソフトウェア基盤があるから完成後即リリースできるが 組み込みプロセッサは、SoCのチップが完成してからそれに対応した組み込みソフトウェアの開発が始まる。 組み合わせられるアクセラレータのタイミング制御とか云々は実機を触ってからでないとわからない。 リアルタイム性が求められるからPCよりシビア。 実際の製品に使われてるARMってプロセスルールだいぶ古かったりするだろ。 あくまで最初の製品製造までの起点は同じなんだよ。 たとえばいま40nmで製造されたARMがデモされてたりするが、実際組み込みとして市場に出るときには 40nm自体が旧世代になってて、x86(Atom含む)なんかは更にその先をいってしまっている。
イミフ
AM3も息の長いソケットになりそうなのか?
最低2コアで最高4コアのAgenaが旧行AM2+なのに 最高2コアで最低1コアのRegorでAM3を使う意味は無い Regor=4コア〜8コア予定だったK11コアで確定だろ
AM3Rev.2は単純にDDR2のサポート切っただけじゃないかな
>>238 何の皮肉にもなって無いんだが
RegorはDDR3対応という新要素があったから1コアでもAM3専用になった
4コアのZambeziがAM3Rev2なのは
現行のPhenomII+HT3.0とは違う新アーキテクチャだからということに他ならない
K8→K10もAM2→AM2+で行われたからな
鯖のロードマップが出てきて、従来どおりBulldozerコアのコードネームがあれば、 ZambeziはOrochiからコードネーム変わっただけの可能性が高くなるんだが。
可能性はある。 ザンベジ川の神は巨大な蛇だそうで。
何の皮肉にもなって無いんだが LisbonはDDR3対応という新要素があったから4コアでもC32専用になった 12コアのMagny-CoursがG34なのは 現行のPhenomII+HT3.0とは違う新アーキテクチャだからということに他ならない HT1→HT2もAM2→AM2+で行われたからな
244
>>234 そう思ってればいいよ
省電力、携帯性、そしてなによりも低コスト Windowsmobileの資産もあるし
そのうち寝首掻かれないといいけどな
>>231 そこでMIPSですよ。
ミップスがCEATEC会期中にセミナーを開催、「家電にAndroidならMIPS」と主張
http://eetimes.jp/news/3384 そして、Androidが最初にターゲットとしたARMアーキテクチャとの性能比較の結果を披露し、MIPSアーキテクチャ
こそがデジタル・ホームに適したプロセッサであると強調した(図2)。
図2 MIPSアーキテクチャとARMアーキテクチャの性能比較
左側はシングルコア、右側はデュアルコア・プロセッサでの比較結果。シングルコアではMIPS32 74KとARM Cortex-A9
(Osprey)、デュアルコアではMIPS32 1004KとOspreyを比較している。どちらもMIPSアーキテクチャの方が高い性能を
示したという。
>>244 Socket G34に使用される"Magny-Cours(12/8コア)"は、
"Lisbon(6/4コア)"のMCM版でDDR3が4chだからで、
妄想しているところ残念だけど、双方とも従来と同じで、
K10.5アーキティクチャなわけだが。
皮肉は言わないが、妄想はやめとけとしか…。
ID:4pELrNs/=ID:p1odnWsZ
よう
や、やぁ
252 :
,,・´∀`・,,)っ-○○○ :2009/10/11(日) 11:01:36 ID:X3Uk0g//
あと1年アーキが変わらないってのも寂しい限りだな SSSE3, SSE4.1くらいはリビジョン改良で入らないのかね 焼け石に水だが
自サイト放置プレーしてないで畳めよ
新アーキでたら本気出す
信じていいんだな?
またコテ増やすのかよ・・・
これは死亡フラグだなw
AMDのなw
誰もトーリニータしてくれなくて悲しい
新アーキテクチャ(設計思想)のコテ作って本気出すとか言って結局どれも同じ低脳じゃねえか
>>147 SOIってまだ高級なの?
もっと色んな所が採用して良いと思うが・・・
高級過ぎてどこも使いたがらないでござるの巻
コストかかりすぎでマージン高く取れるCPUぐらいしか用途がない。 AMD自身がGPUに使わないところから推して知るべし。 GF分離前からSOIプロセスの生産能力は余ってたんだから SOIが使い物になるならとっくに使ってる。
SOIプロセスが流行らなかったから、シリコンまで特注になっているからな。 最初の目の付け所は良かったが、変える機会を逸していたのが痛かった。
そぉい!!
微細化が進むに従って色んなコストがかかるから 相対的にSOIのコストは下がってくるはずだけどねえ
微細化が進むに従って色んなコストがかかるから費用対効果の薄いSOIイラネって話になる
>>266 ARMはSOIで消費電力を40%も削れるのに
なぜAMDのx86やPowerPCの電力性能比はばっとしないのか。
安いが命のARMでSOI使って、果たして利益になるかどうか・・・
273 :
Socket774 :2009/10/13(火) 05:04:57 ID:M+Kea34U
SOIって微細化が進む程効果薄れるんじゃなかったっけ
SOIはチップの面積も減らせるからなぁ
SOIヤ!SOIヤ!
自作板には微細化が進むとSOIの効果が薄れるっていう話が広がってるよね なんでだろ SOIはキャパシタレスのeDRAMが実用的になりそうなところもメリットじゃね TSV採用時にはeDRAMも使うって話があるし
貫通電極使えるなら 本物のDRAMを繋げばいいじゃない。 CPUの、先端プロセスの貴重なシリコンをeDRAMには(bitあたりのコストが 高すぎて)使えない、ということで結論出てるように見えるけどな。 POWER7は使ってるけど、いろんな意味で常識外れのモンスターチップだから 可能なのではないか。
あー、重い。 めんどくさいサイトだな。
iidaとプリキュアと防衛省がベンチサイト
Primeの代わりに使えそうだな。
何やったらここまでCPUメーター上がるんだ
ちょ火噴きそう
まったくソースが見てみたいぜ
プリキュア、うちのボロPCでもゆっくりと動いてるから最新のヤツならストレスないのかな、と思ってたけど、 新しめのPCでも遅かったりするの?
どうやらFlash内でキラキラの描画をCPUでやってるっぽい ページを下にスクロールしたら一気に負荷下がるんだがwwwww
東映のWeb担当はどんなPCでブラウザテストしてるんだろうな
平凡なアイデアですが PVでインセンティブが付くような契約をする 担当するサイトにわざと糞重いフラッシュを置く 2ch各所にさらす ”観光”ビジターでPVを稼ぐ ウマー
今AMDの開発リソースってどんな感じに 振り分けられてるか分かる?
>>291 CPU部門は確か2チームだか3チームじゃないっけ?
>>291 そんなもんAMD本社のとても偉い人以外誰も分からんよ。
プリキュアサイト訪問したらなんかさっきよりもものっそい負荷がさがってんだけど
ホントだすごい軽くなってるな 使用率は変わらんのに何なんだろうね
使用率落ちたよ
団子さん、もっとお花畑全開じゃないと、 スレ伸びないよwww ,,, ( ゚д゚)つ┃ ,,・´∀`・,,)っ-○○○
だんごやさんだよ
,,・´∀`・,,)っ-○○○ ↑最近、見かけるようになったAAなんだが、これ見るとムカツク。 以後、一切使用禁止だ。分かったな。
団子厨涙目wwww
>>299 FusionVSララビーとかになったら……
そして任天堂がナノイオンとか……これはないな。
任天堂次世代はsnapdragonチックになるんでないの? ARMと(元)ATIの組み合わせで無難に選ぶと GFが請けられたらミラクルですが、可能性が無いとは言えないー、かな ARMのライセンスもゲットした事だし 仕事増えるといいですね
なんだその「今後のご活躍をお祈りいたします」的な不採用の通知
ただしオーバークロック
Intel Pentium 4 Prescottは、あまりにも偏った性質を持つプロセッサで ある。汎用なソフトウェアには、とてもじゃないが使えない。 Intel Core 2は、命令レベルでは性能が良い。癖のないよくできたプ ロセッサである。ただしメモリとプロセッサ間のメモリバンド幅がネックにな るようなプログラムには向かない。 Athlon 64も命令レベルでは大体Intel Core 2と互角。またadc命令が 速いためGMPでは有利に作用している。メモリバンド幅が必要なプログラムでは Intel Core 2 よりも有利である。 ハイパフォーマンスコンピューティングでは、メモリバンド幅というのは非常 にクリティカルな部分であるので、ここではAthlon 64系のCPUを使うことに なるだろう。 しかしデスクトップで事務処理をするようなレベルであればCore 2系とAthlon 64系のパフォーマンスの差を議論するのは意味がないように思 われる。 またWeb サーバのようなものメモリバンド幅はあまり関係ないので同 様である。
何年前の論考だよもう…
何年経っても進歩なし
昔の言い草じゃ今頃は10ギガヘルツとかで動くCPUが出てたはずなのに。
今頃はCPUとGPUがFusionしてるはずなのに、とか
SSE5対応のBulldozerって今年だったよね、とか
40nmのOntarioが完全新規の情報か
二桁MHzからの長期的な視点で対数的に見れば 10GHzと3.6GHz(i7 870 TB)ってそんなに遠くない気がしないでもない
おっと、AMDのスレッドだから3.4GHz(X4 965)と書かなきゃな
Core2もっさりの原因を昔ホームステイ先で知り合ったドイツ人(在イスラエル)技術者に 昔話で盛り上がったついでにダメ元で聞いてみたら、あっさり教えてくれた。 Core2は、L1〜L2(XEONではL3も含む)とパイプライン中の命令全てをキャンセルする仕組み が有って、ハード的に non maskable interrupt つまり、ソフト的な拒否が不可能な 割り込み信号線が用意されているらしい。 本来は、サーバ機用にデッドロック発生時の最終回避手段として用意されているらしい のだけれども、普通のパソコンでも安価なマザーの場合、複雑な配線やBIOS構造を簡略化 する手段として、HDDアクセスの直後などに、この割り込み信号を使ってメモリとキャッシュ が一致するように一旦L1〜L2とパイプラインの全てをクリアしてしまう物が多いらしい。 つまり、手抜きだ。 そうすると、その割り込み処理をしてる間は、他の割り込みが禁止されるので、プチフリや もっさりが発生してしまうと言う事なんだって。 8層以上の基板を使ったマザーなら大丈夫な可能性が高いらしいけど、$150以下で 安価に出回っているマザーの場合は、まず、これが原因で引っ掛る感触を受ける(つまり プチフリやもっさりの事)になるんだそうな。 こんな事、公表できないだろうし、ソースは友人からの口伝えだから、 信じなくても当然だよね。 4月1日じゃないんで、嘘は言ってないと思うけど、都市伝説レベルで 考えてもらってもいいよ。 漏れは8層以上の3万〜の母板で組み直してみるか、それともX2に乗り換え るかで迷ってる。
まとめ
ということで性能ベンチマーク編からだいぶ空いてしまったが、内部解析編を無事お届けできた。
とりあえずPhenom IIは、Phenomで最大の問題だった消費電力の多さを、プロセスの改善により解決することが出来ており、6コア製品もこのまま問題なく開発できるだけのヘッドルームを持っていることは確認できた。
その一方、Core i7に対する最大のネックはL2/L3/MemoryのBandwidthの低さである。CPUコアそのものやL1キャッシュには十分な帯域があり、かつそれを使いきれるだけの構造になっているが、その先が大問題といったところ。
例えるなら、3リッタークラスのパワフルなエンジンに軽自動車のタイヤやついてるようなものか。
問題は明確だし、コアに手を入れる必要はないから、CPUのパイプラインを変更するほど難しい作業ではないとは思うが、だからといってちょっとしたRevision Upで解決するほど簡単な問題でもないだろう。
このあたりの改善作業がIstanbulに間に合うかどうか。これが間に合えばCore i7に負けない性能を発揮できるだろうが、間に合わないと依然としてCore i7に大きなビハインドを負い続けるだろう。
特にサーバやHPCの分野でこの性能差は致命的なものがあるわけで、このままだと折角これまで獲得してきたサーバ分野のシェアを失いかねない様に筆者には感じられる。今後の展開が気になるところだ。
http://journal.mycom.co.jp/special/2009/deneb02/022.html
>>319 トピックまとめ
Thuban:
・TurboBoost相当の技術を搭載
Zambezi:
・Bulldozerコア
・8コア
・8MB L3$
・AM3r2
Liano:
・PhenomUと同じコア
・1MB/コアのL2$、DDR3-1600に強化(L3は海外記事によると4MB)
・ソケットはFM1
・2~4コアで展開
・デスクトップの主流〜ノートのハイエンド用
Ontario:
・40nmの低価格ノート向け(AthlonNeoの後継?)
8x0Gx:
・785のOC版で55nmのまま
・890FXはパッケージが巨大化(サーバー用と共有?)
・DirectX11対応,40nm内蔵グラフィックはLianoまでお預けか?
・たぶんBulldozer、Lianoに注力するために新製品無しなのだろう
SB8x0:
・SATA 3.0,USB3.0対応
・地味にNB、SB間の帯域倍増
>>323 ザンベジは今まで通り排他キャッシュかな。
それだと現状のままintelの同世代より少しトータルキャッシュが多いくらいか。
>>323 SB8x0はUSB3.0には非対応なんじゃないの?
SB810はSATA 3.0(6Gbps)にも非対応の筈
新しくロードマップの発表があったのかとおもいきや 新規分の図表は全部copyright bun ... IOMMUすら知らないライターの妄想じゃないか
あと一ヶ月弱でAnalystDay 公式ロードマップも更新されるだろう
328 :
Socket774 :2009/10/18(日) 11:52:38 ID:dpnz9F+h
>>327 情報っていえば確かに情報だけど、つなぎ合わせの提灯記事だよこれ。
4亀だし
>>328 「提灯記事」の意味がわかっていない奴乙。
>>319 "Thuban"わろたw 入れないと思ったけど"Turbo Boost"入れてきたかw
しかし、"Zambezi"="Bulldozerアーキティクチャ"なのかなぁ。
「AM3r2」が何時でる板まで対応してくれるかわから無いけど、
(公式上では)RD8x0以上ではないと無理っぽい気がする。
>>328 は多和田のグラフを丸一日眺めてから書き込むべき
提灯の本当の意味が分かる
334 :
Socket774 :2009/10/18(日) 15:02:18 ID:dpnz9F+h
どちらにしろ「提灯記事」じゃねぇな。
336 :
Socket774 :2009/10/18(日) 15:20:27 ID:dpnz9F+h
確かに、どこをよいしょしてる訳でも無いので「提灯」って表現は正しくなかった。
ただの、予想だった。(競馬と一緒か?)
>>333 多和田さんのベンチは、たまになんか勘違いして論点がずれてる時があるけど
まだ、かなり公平な方だと思うよ。
本当にひどいのは、マイコミ。
雑誌の方はいたって普通だし良い所ついてくるけど、サイトの方はありゃ
完全な粘着基地外がやってるとしか思えん。
>>336 ロードマップ記事を「提灯」と言ったら、
CPUロードマップを載せた全ての記事は
AMDであろうとIntelであろうと「提灯記事」だな。
さらに多和田記事の大半が提灯じゃないと思うのは、
頭がお花畑でいいんじゃないのでしょうか?
結論。「ID:dpnz9F+h」は必死にageて荒そうとしていたけど、
頭の緩さから目標を達成できませんでしたとさ。
338 :
Socket774 :2009/10/18(日) 15:59:46 ID:dpnz9F+h
337<<ロードマップ記事を「提灯」と言ったら〜 提灯改め、大・予・想って訂正したじゃん。 公式ロードマップなら提灯でもなんでもないし、誰かからネタを元に書いてる のならそれは、提灯であろうが無かろうが、きちんとしたレポートだけど、 寄せ集めの情報をつないだところで、ただの予想にすぎないでしょ。 多和田さんの件は、一言も提灯じゃ無いとは言ってないだろう?
939→AM2のような下位も上位も互換がないような変更は当分先ですか?
「本間文」の記事なんて、話のネタにならんけどな。 あいつの記事の99.9%は妄想で出来ているし。
>>319 記者にもここでもスルーされてるけど
AM3(DDR3) L2 1MBのSempronなんてのが出るんだね
なんかしらんがとりあえず
>>338 の棲む世界には類義語なるものは存在しない
>>343 4gamerの記事中の図は間違ってるの?
Regorの1コア削減版の予定はあるな。 だからDDR3対応でL2が1MB。
SocketAM3Revision2のCPUってなんだ・・・ 現行AM3にも下位互換でのせられる・・よな・・・?
>>346 下位互換がないならば、同じ名前は使わないでしょ。
注文の多いやつらだ。話題にしてもらえるだけでも感謝しろ(・´ω`・)
>>319 このペースじゃノート市場はインテル総取りだな……
>>347 まあ普通に考えりゃそうだよね
ありがとう
またチャーリーデマ自演か。 まあTSMCの32nmプロセスが余り出来が良くない(28nmから本気出す)って よく言ってたけどな
>C State Performance Boost もうちょっと何とかならなかったのか、名前
名前からしてTurbo BoostていうかIDAだな〜 まあPCUやPowerGate実装したら2010年には出せないよね
AtomだけでなくARMの製造にも使えるんだから、プロセス技術の供与はあり得ないと思うけど。
見える!NVIDIAがハイエナのようにたかるのが見える!
AMDはi9に対抗できるんでしょうか
amdのネーミングセンスに愕然
>>319 の本間文の記事を信じるとか。あとで痛い目に遭うぞ?
>C1Eを,他のコアのクロックアップ要件 AMD定義のC1e:全コアHalt & コア周辺回路(xbarやL3等)の消費電力削減状態 全コアとまってるのに何をクロックアップするのかと小一時間 C5導入あたりの「Cステートパフォーマンスの改善」を勘違いしたんでねーの?
AMDもhpとacerにどれだけ採用してもらえるかが勝負だろう
採用してくれるところまで値引くから、その勝負なら負けはないな HPとしても(相応のインセンティブなしなら)Intel一社依存はしたくないわけだし。 だから本当の勝負は「シェア2割の最低線にどれだけ上積みできるか」 「四半期黒字をいつ達成できるか」だと思うんだが。
四半期黒字は、GFがSTMicroから受注受けるまで無理なんじゃないの? AMD本体は黒字で、製造部門が大赤字な状態だし。
仮にhpとacerのうち半分とったとしてもまだ約17% でもノート中心の東芝とかlenovoにathlon NEOは売り込めそうにない 小規模メーカー除くとあとはBTOと自作向けぐらいしかないけど、こればっかりはAMDが頑張らないと仕方ない部分だよな
>>365 PhenomUとAthlonUとTurionUを華麗にスルーするなw
精神分裂病(統合失調症)の危険性 1. 誰かに嫌がらせをされているという。 2. 誰かに狙われたり、つけられたり、盗聴されたりしているという。 3. 電波のようなものであやつられるという。 4. 自分の考えが不思議な力によって回りの人たちに伝わってしまうという。(テレパシーなど) 5. 周りに人がいないのに自分を責めるような声が聞こえてくるという。 6. 誰かが自分にのりうつっているという。 7. 体の中に何かの機械がはいっているという。 8. 体の一部(骨、脳など)が溶けたり形がかわったりするという。 9. 頭の中が混乱して、何を考えていたのかわからなくなるという。 10. 話にまとまりがない。支離滅裂で何をいってるのか理解できない。 11. 自分の考えている事が声になって聞こえてくるという。 12. ずっと独り言をいっている。一人笑いがある。 13. 喜怒哀楽の感情がなくなってしまった。 14. 引きこもりがちで、ほとんど外出しない。 15. 以前は見られなかったような奇妙な言動がある。
最近のAMDはすごいな。 精神鑑定までするのか。
このスレはAMDの提供でお送りしています な世界があります
1. マイクロソフトに嫌がらせをされているという。 2. Intelに狙われたり、つけられたり、盗聴されたりしているという。 3. HyperTransportのようなものであやつられるという。 4. 自分の考えがインターネットによって回りの人たちに伝わってしまうという。(テレパシーなど) 5. 周りにHDDがないのにヘッドをシークするような音が聞こえてくるという。 6. ゲイツが自分にのりうつっているという。 7. 体の中にIntelのCPUがはいっているという。 8. M/Bの一部(コネクタ、キャパシタなど)が溶けたり形がかわったりするという。 9. キャッシュの中が混乱して、何を処理していたのかわからなくなるという。 10. ロードマップにまとまりがない。支離滅裂で何をいってるのか理解できない。
何かワロタ
11. 会社の考えている予定が事実になって聞こえてくるという。 12. ずっと独り相撲をとっている。一人勝利宣言がある。 13. ハイエンドローエンドの区別がなくなってしまった。 14. シェアが引きこもりがちで、ほとんど上昇しない。 15. 以前は見られなかったような奇妙なプロセッサ名がある
>7. 体の中にIntelのCPUがはいっているという。 x86のライセンスの事か…
深いな。 プロの犯行か。
結局GFは子会社でx86ライセンス違反ではなく ファウンダリ分離でライトアセット云々は妄言だった、で終わりなのか
言いがかりはIntelの得意技
いや、莫大な現金を吸い込んで外に吐き出さない製造部門が切り離せていないのは 本体の致命傷に繋がるんだが……
Intelに製造してもらえば良くね?
今回も証拠書類改竄発覚とかしたのかね
Sandy BridgeがGesherって呼ばれてた頃にはMSは既にWindows 7/Server 2008 R2に 新しいレジスタへの対応進めてたんで抗うだけ無駄だった
>>381 だったら面白いね。拡張命令の分散されるよりはIntelとしても良いかもしれないし。
バイナリが完全に分かれる64bit対応と違って OSのAVX対応とSSE5対応は排他じゃないんだから、 OSの側は言えば対応してくれただろう。 やめたのは性能メリットのないAMD独自拡張にユーザーの需要がないから。
SSE5がSSEの独自拡張であるように XOP/FMA4はAVXの独自拡張なのだから 拡張命令の分散という点では何も変わっていない AVXが使える分だけAMDが得しているだけなんだが どこにIntelのメリットがあるんだか
AVXの普及促進
そもそもintelの技術を互換で搭載するんだから AMDはそれなりの犠牲を払ってるんじゃないの? 契約の内容は知らないけど、タダで使っていいよ♪とはいかないんじゃ…
AMDは毎回SSEの実装がタコなのでAVXもあんま期待できないなぁ
Shanghai系アーキテクチャを来年も続投しないといけないというのは大きな代償だと思うが 元々の計画ではBulldozerは45nmだったんだし。
AVX実装のおかげで開発も一年延びているしな。 しかし、SSEの実装がタコって言う奴。ほぼ100%でソース無いよな。
タコだからタコなんだろう
まぁ。「タコはほ乳類」という奴は滅多にいないだろうけどな。 でも、昨今の自作板はソース無しでも信じる奴が増えているから、 「タコはほ乳類」と言っても信じる奴が出てきそうなのが玉に瑕。
権田は哺乳類なのか?
>>390 開発が一年延びたからAVXの実装も含められるようになった、では。
SSE5という対抗能力も一応備えている新チップを、
これから市場にバイナリが登場するAVXの実装のために一年遅らせるのは
合理的な判断とは全く思えない。
大きすぎて45nmじゃ載りきらないのが判明したから32nm待つことにしました、
というのならよくわかる。
そりゃ「元から間に合わないっぽかったから丁度良かった」なんてバラしたら ぶっちゃけすぎでしょう。まともな会社なら真相が明らかになるはずはない。 3D Now!の歴史見ればシェア2割のAMD独自拡張がしょっぱいのは自明。 でもそれはニュートラルな消費者側の視点だからであって、 作るAMD側は別の論理で動いている。 SSE5出せばIntelだって動くのは当然予測した上でシナリオ書いたはずだから、 SSE5のBulldozerがスケジュール通り出来てたなら、AVXが来ても スケジュール通り出してた、と考えるのが合理的でしょう。 AVXがAMDの想定を遥かに上回る競争力で登場した、なんてことは 実際なかったんだから。
また次のアーキまでAVX無しってw
デコード方式が違う上256bitレジスタにも対応しないといけないAVXを 元々の遅れのついでで実装できるとはAMDの設計部隊すごいな。
要するにBulldozerは元々遅れていたんだ、と言い張りたいんだろうけど、 詭弁まみれの長文書いてまで主張する意味がわからん。
レジスタ本数に関しては問題ないだろう。 もともと論理レジスタの数倍の規模の物理レジスタに対し動的にアロケートする方式だし。 K7もなんだかんだで短期間でSSEに対応してるからなー。 どっかでバックアッププランが発動したのでは?
>>398 陰儲は恐ろしいほどAMD技術レベルを、
過大評価しまくるときもがあるからな。
Fusion(笑)でRadeonのR600アーキテクチャをダイレクトに実行するような機構作ろうとしてるのがAMDだ。 今のGPUの演算粒度そのまんま使うなら10240ビット(笑)だぜ。 フカシにしても面白すぎる。
AMDの場合R600系統のまま統合するとIntelでいうSandy Bridge的なものにしかならんし ま、それを狙ってるんならいいんだけど 演算云々は出直しておいでって感じ それともR900系統でも用意するの? アーキテクトいないのに 遠いようで実は一番近いところにいるのがVIAなきがする
>>403 統合するのは"Evergreen"世代。HD5x00世代のMobile版っぽいね。
一応DirectX11までは対応しているみたいよ。
その次の世代のVGAは流石に時期的に無理じゃないの?
第二世代Fusionでは統合してくるだろうけどさ。
だからEvergreen=R600世代なんだよ
超並列お絵かき器を棄てて新しいGPUを作る力が今のAMDにあるのかね? Haswell以降どう対抗していくんだろうか?
まぁ待ちなさい、相手が転ぶ可能性もあるよ?
転ぼうが転ぶまいが、圧倒的なシェアの差の前には関係ない
まったくもって汎用コンピューティングには向いてないR600の延長で経営持ち直そうとしてるんだから 皮肉なモンだよな
>>405 その通りだが、凄いな。いろいろな意味で。
R600の改良版でNVが傾きかけてますが
>>409 ユーザーが求めているものは「コスト効率にすぐれたGPU」ってことなんだよな・・・。
おいおいFusionの存在意義を否定するなよ
(笑)をつけろよデコ助野郎
>>413 初代Fusionなってのは、一般向け小型PC向けだろうよ。
"Evergreen"じゃなくて次のR900(?)世代なら別だろうけど。
NVIDIAのお陰でAMDが生き延びてIntelもそれに対抗するCPU開発の手を緩めないんだから結構なことだ
知的障害者が来てた
>R600の改良版でNVが傾きかけてますが そう思ってるのはお前らだけだろ 実質RV870の構造じゃG80にすら届いてない
>ユーザーが求めているものは「コスト効率にすぐれたGPU」ってことなんだよな・・・。 絶対性能が現世代品の1/10でもか? なら数世代前の捨て値で売ってる中古のグラボを買って来い、でおわりそう話だな
ノートやネットブック売れまくっとるし そんな性能もう要らんのや
enableにするだけでLWP使わなくてもコンテキストスイッチのオーバーヘッドが 増える、というのは許容?
>>420 商業的な話に設計的なツッコミしてアホか?
どうせ突っ込むなら「ふえるわかめ」のほうに
RV870の構造でG80にも届かないって、先行き不明なGPGPU限定の話だろうが ゲームのFPSや動画トランスコードのワットパフォーマンスはGT300でもRV870の足下に及ばない
>>421 いまのIntel GPU搭載ノートやPCに同じことを言うのか?
絶対性能ですら5870優勢じゃねーのか?
出てない時点でビジネス的に負けてる。 もちろんLarrabeeも含めてだけど。
まあGPGPUに関しては、FireStreamは性能云々の前に まずスタートラインに立つのが先だと思うけど。
全く噂すら聞かないよなFireStream GPGPUやOpenCL対応を謳っているから、HPC向けも用意しているはずなのに。 もしかしてRadeonを優先してStreamは後回しなのかな。
ラデと差を付けるのやめちゃったろ
機能や性能での差をなくしただけ。 HPC向けには性能と同じくらい品質とかサポートが重要。 今は環境やドライバがDirectX>>OpenCLだから、RADEONへのリソースを多くしているんだろう。
ECCもないカードがHPCで実用たりうるかという問題もある。 HPC用としてはTeslaの性能あたり価格が異常に安いのはECCに 対応してないからという面もある。 もちろんGPU基準ならボッタクリ
その辺まるっとFermiで対応してきたから、HPC用途のGPGPUで FireStreamが検討の爼上にのることはないでしょ。 そういう目的のチップじゃないし。
HPCを真面目にやる人(大学とか研究所とか)向けの ちゃんとしたGPGPUカードはFermiにくれてやるのが正解でしょうな。 どうせ市場狭すぎてnVと取り合って儲かるほどでないし、 実際の戦力がどれほどかは不明ながら、近い将来 戦艦Larrabeeに全滅させられる可能性もあるし。
GPGPUもできるけどメインはグラフィックだよ路線で行ってくれればグラフィックはラデ、 GPGPUボードにLarrabeeという夢のタッグマッチの完成ですよ(Fermiなら1枚でどっちもできるという突っ込みは受け付けない)
どうせコンシューマ向けのGPGPUなんてDX Compute Shaderで ゲームの物理演算とエフェクト、動画トラスコ辺りにしか使わんのだから、 ECC付けたり倍精度演算装置をたくさん付けたりして HPC分野の専門家喜ばせるだけの高いものにしてもしょうがない。
AMDも関わってたか… そういやヘクター・ルイズってCEO退いてから何やってたんだ?
GFの会長
MACオタが喜んでネタにしそうな話題なのに最近見ないな Intelの財務担当もこの件で首突っ込んでたっけ?
MACオタは名無しで書き込んでるかインフルエンザで逝ったか
知障コテならこの前来たばかりじゃん
まぁ、こんなウンコ経営者じゃ経営悪くなって当然ってことか…
中村 前半になんでかわからないけど、ルイス・ガルシアが2回くらい俺が走ったのに 出てこなかったから、見えてなかったのかなと。あれが出てたら決定的なチャンスだったし、 もらえればチャンスってところでもらえなくて、味方のチャンスを作ってたんで、結構難しいね。 ↑代表の10番 31歳のベテラン ↓代表の20番 23歳の若手 本田 パスが来ないというのが俺の実力。それでも俺は勝負したい
中村の主張 ・足が痛くて万全じゃない ・ルイスガルシアがパスださない ・代表が3人程度の雑魚チームじゃ技術で劣る ・代えられたのは監督が怪我を心配したからで出来は関係ない、足痛い 中村のやらかしている点 ・プロ選手で怪我を言い訳にする人は茸ぐらい ・ルイスガルシアはスペイン(EURO2008制覇 ワールドカップ優勝候補筆頭)で代表クラス、茸はEU圏外の助っ人(年俸2億) ・メディアの評価がチーム最低の選手がチームメートの技術を批判 ・試合前は怪我を大丈夫と言いながら、低パフォーマンスは怪我のせい
450 :
Socket774 :2009/11/01(日) 15:38:24 ID:cflGvpE5
直リンやめればいいのに
452 :
書き逃げ :2009/11/01(日) 21:01:17 ID:oGAV8xce
IntelによるDDR3普及を糧に、ある程度普及したときを見計らって、 AMDはネイティブ8コアを出して、Intelのなんちゃって8コア(i7)と勝負! また同時に来年あたり、ATOMに対抗して省電力CPUも二種類出すかも
ところがどっこい 来年出るCore i9はネイティブ6コア12スレッドなんです
>>452 書き逃げ以外に何もできない。
何もコメントしようがない内容だな。
オレならば恥ずかしくてネタでも書けない。
あえてコメントするならば妄想はチラシの裏にとしか。
i7でHT有効にしてBOINC回してるがニコ動見ると微妙にカクツク BOINC止めると大丈夫なんだけどね 905eだとBOINC回しながらニコ動見ても大丈夫 やっぱHT切ったほうがいいんかなあ 切ったらカクツキ無くなるかどうか確認はしてないが
456 :
Socket774 :2009/11/01(日) 21:09:38 ID:oGAV8xce
>453 ならば、ネイティブ12コアで勝負! >454 (・ε・)ピヨピヨ
あれか?あれが「ネイティブ」か?
コア適用計数てなんだよ団子 ぐぐるのめんどうだから教えろ団子
広辞苑引けカス
ありがとうゴミ
POWER6なんでコア係数1.0なのん? SPARC T1の1.2GHzは0.25で1.4GHzは0.5とか意味不明 いっそベンチスコアの1ポイントいくらで価格決めちゃえYO!
ID:mtXW/RVqが暴れるための予備動作がID:oGAV8xce
と妄想するアム厨であった
更に別のコテ名まで無意味に持ち出す 真に気持ち悪い雑音
頭の悪い同胞まで貶すなよ
PC版ベヨネッタでねーかなー HD5870でヌルヌル遊びたい
ゲハに帰れ
>>469 高い金出した以上、開発と製造を自国でやりたい、というのは
真っ当な話だが、実際に出来るかどうかは未知数だな。
うっかり「アラブ企業化」したと認識されれば、顧客と人材流出で無惨なことになりそうだ。
AMD終了wwwwww
今の状態で終わりなら 3年前にすでに終わってますけどねw
資源国の通貨は資源輸出のせいで高くなりがちだから製造業に不利。 こうなったら出来るだけ石油成金からボッたくってTSMCとかに投資する方がいいかも。
>>475 勘違いしている。
石油成金が石油がなくなった時のために″GFに″資金を入れているんだよ。
AMD本体への投資はオマケ。本命はどうみてもGFの半導体製造施設。
AMDが潰れてもCPU系の技術は中東には流さないし、流れないので、
投資者としてはAMDは潰れなければ潰れないでいいぐらいの気持ちかと。
軌道エレベータにでも出資してくれ。
一方Intel(違法行為当たり前会社)のほうは休職扱い
AMDの違法行為は綺麗な違法行為
Intelはアマアマだねぇ まあ某国企業と比べれば目くそ鼻くそですな
会長はまずいだろ 頂点が汚職じゃ歯止めがなにもねえ
トップの汚職という弩級のスキャンダルを華麗にスルーしてIntel批判とは儲の鑑ですな
思い出したように湧いて出てきて吹いたわw
ヘクター・ルイズがAMDに貢献したことあった? 害にしかなってないじゃんこの人
以上クズ儲の負け惜しみでした
tst
Intelだと係長くらいにならないと退職しなくて済みそう とか書くと「AMDの係長は綺麗な係長!!!」とかいうお花畑レスが返ってきそうだが
AMDの係長は綺麗な係長!!!
汚職に絡んで「休職ですむ」のも問題だわな。
Chartered voters approve takeover by GlobalFoundries owner
http://www.brightsideofnews.com/news/2009/11/6/chartered-voters-approve-takeover-by-globalfoundries-owner.aspx Dresden, Germany: Fab 1 Module 1 and Module 2, expandable with Module 3
Saratoga, United States: Fab 2 Module 1, expandable with Module 2 and 3
Singapore, Singapore: Fab 3 Module 1 to Module 6 [former 2, 3, 3E, 5/SMP, 6CSP, 7]
2010 - GlobalFoundries Inc. completely merges with Chartered Semiconductor Manufacturing Ltd.
2010 - Chartered facility is renamed into Fab 3 with associated modules [Module 1-7]
2010 - AMD announces the foundation of AMD Design Center in UAE, financed by ATIC
2010/2011 - ATIC announces strategic acquisition of two more companies
2011 - 65nm equipment is transitioned from Singapore to Abu Dhabi for learning phase
2012 - Fab 2 Module 1 in Saratoga officially opens
2015 - ATIC announces the building of Module 2 in Fab 2, Saratoga NY
By 2015 - ATIC announces the building of Fab 4 in Abu Dhabi
ATIC資金でUAEにファブとデザインセンター
>>491 UAEに…ねぇ? インドや中国に建てた方が人材の意味で現実的のような…。
中国インドではスポンサーにとって意味がない。 でもたとえ中国インドでも半導体開発を成功させるのは難しいような。 金さえ出せばなんとかなるのか。
意外と数学者とか技術者を国中からかき集めれば設計はできるんじゃないか。 龍芯は意外といいできっぽい。生産はST丸投げとして設計でどれだけ関わってるのかわからんけど。
>>485 それを在籍中言われたら顔真っ赤にして怒るくせにw
辞めたからどうでもいいとばかりに叩くとか、最低だな
煽りあいをやりたければ該当スレへ逝けよ。 陰厨はどうして空気が読めないのか。
今日のお前が言うなレスですか
499 :
Socket774 :2009/11/07(土) 21:53:50 ID:ohFZ3R1V
>>495 > 龍芯
MIPSのデッドコピー。
まあ後からライセンス買ったからいいんだけど。
>455 BOINCのプライオリティ変更で済む話じゃ?
>455が何のプロジェクトやってるか知らんけどたまに優先度がアイドルじゃない実行ユニットがあるんで確認してみて たまに最適化版とかで優先度が通常になってるのがある
Analyst Dayで何か面白い情報が出るといいんだが。。。
0
AnalystDayみたいけど超眠い…
穴リスト…だと…
Chekib Akrout, General Manager, Technology Groupのpdfに > Two tightly linked cores share resources to increase efficiency と書いてあるけど Bulldozerのコア数=整数ブロックの数なのかね?
>>508 流石にop reg., reg/mem形式はこれまで通りfusedで扱えるようにするんでない?ストアは独立だろうけど。
>>512 つか、ほかにIntelの倍もコアを積めこめるような魔法の種は見当たらない。
しかしまあ、Intel以上のズコー仕様なわけだが。
AMD2009 Analyst Day_Server Platforms.pdfの17ページを見るとL3$もBulldozer”module毎に独立なんだな
Intel: 256ビット版AVXを使わないとフル性能を発揮できない AMD: FMA4を使わないとフル性能を発揮できない(ただし128ビット版でも埋められる)
よくわからん4行でまとめてくれ
PDFどこ
519 :
Socket774 :2009/11/12(木) 11:42:57 ID:p6k7otTn
どうでもいい疑問だけど世代としてはK10なのかな このシェアした構成でシングルスレッドとマルチスレッドそれぞれで どれくらいのピーク値を叩き出せるか興味深いところ 時期的にはSandyBridgeとの直接対決になるけど ここでキャッチアップできないと今後も苦しいしなぁ
カス過ぎワロタ
>>519 いちおうK11でしょ。
SIMD性能についてだが
ユニット構成だけ見れば、Intel AVXのコードの土俵では最大2倍の
差をつけられて不利というのは確実だな。
演算ユニットが256ビット化されてないし、積和ユニットも乗算のみor加算のみでは持ち腐れ。
AMD独自のXOP, CVT16, FMA4が使われて初めて勝負に持ち込める。
とりあえずコンパイラをどうにかしないとな。
あとシャッフルユニットはどこに消えた?
FMACと同時発行できないと実効性能は期待できない。
decode性能と、intパイプ内部でのループができるか否か そこがポイントになりそうだなー 第一印象では「省電力は狙えるかもしれんが速さは期待できない」感じ
海外でもNiagara/Rockとか言われてる デスクトップ&モバイルはK10続投かな
6コア35Wなんて書いてあるページもあるから処理能/電力は狙ってそうだな
絶対性能は期待しちゃいけないけど ワットパフォーマンスには期待していいよってことか
あー35WはLinsbon世代で出す話かもしれん pdfは全部がBulldozer世代の話じゃないから
>>527 いや6コア=3クラスタとすればそんなもんじゃないの?
何気にSocketC32の概要は今回が初めて?だよね と言っても省電力関係とDDR3以外前世代と変わったところ無いけどさ
>521 APUのpdf 5ページとかみると、Bulldozer世代の時期にはスループット コンピューティングの重いやつはまだGPUでやれと思ってるくさいなAMDは
semiaccurateのフォーラムから(中の人発言) ・コア(つかモジュラー)のカウントと呼び方を用意している ・(SunのNiagaraみたいに)CMTとは呼ばないで欲しい ・Interlagosは8モジュール、計16integerコア ・概略図は極めて大まかで実際はもっと書き足す要素があるよ ・マーケティング畑の連中があのスライド作ったんだろうな ・だから幾つか他の要素が抜けてるね(笑) ・Bulldozerにはお楽しみが一杯あるよ、としか言えないね ・沢山の革新的要素があるけど時間が経てば明らかになるよ
>>528 35Wって数字が載ってるのがOpteron4000のページだった
Bulldozer世代でも同様の物を出してくるとは思うけどね
>521 >530 で、それに対してIntelは、独立したGPUは持ってないも同然だから 早い時期にスループットコンピューティングも自分の土俵に 引きずり込むためにAVXやらLarrabeeを推進中、ということなんだろうな
> ・概略図は極めて大まかで実際はもっと書き足す要素があるよ > ・マーケティング畑の連中があのスライド作ったんだろうな > ・だから幾つか他の要素が抜けてるね(笑) ちょっとだけ安心。256ビット化は置いといても、FMADとは独立した シャッフルユニットが消えたらHPCでの勝負は厳しい。 なんにせよ256ビット版AVXはしばらく遅いのは確実 22nmまでにSIMDユニットの倍増と3オペ版FMA対応できれば 対Haswellで優位に持ち込むことができるかもしれない。 それはそうとクラスタ化はGPUと演算ユニット共用するための布石に 見えるんでFusionで何かやらかすかも知れんね。 そのときにはGPUコアもVLIWアレイじゃなくなりそうだが。
>>534 AVXの実装はインテルも初期は128bit×2で実行だったはずなので、
そこは別に問題ないはず。実行ユニットの性能はわからないが。
あとは色々と情報がでてこないとわからない。
L3も各コアだとすると、インテルのように、
キャッシュをリングバスみたいなので繋ぐのか?
ただ…本当に作っていたんだな…。よかった。
…イスラエルの魔術が絡んだらしょうがない。
2010年内にカスタマーにサンプル出すと言ってるから 登場は2011年前半でいけるかな バリデーションとか予定通りに進めばだが
いや今のスケジュールだと後半らしいよ
>>541 AMDの予定は遅れるのがデフォだから
半年か一年ズレるのは今から覚悟してるがw
GFのプロセス的には開発さっさと終わらせろってくらい余裕あるから どんだけAMDが頑張れるかだな
まぁBulldozerが予定より遅れて 2012年以降に登場なんて事態になったらもう詰みだな
OpteronのほうはともかくZambeziなんて出せるんかね
でもBulldozer出ればAMD圧勝じゃね? Intelにこれを凌ぐだけの性能が出そうな次世代計画あんの? クラスタ化も特許押さえてるからまねれなさそうだし。
いやいや、とりあえずベンチとってみんことには・・・
AMDによるとクラスタ化は50%のリソース増で80%のスループット向上。 intel曰くHTTは5%ほどのリソース増で15〜30%の性能向上。 クラスタ化の方がHTTより効率が凄く良いというわけではなさそう。
>>547 それは最初のSSE5プランで今年中に出た場合ならそうだったかもな
現時点の情報では
Sandy Bridge 256bit FADD+FMUL / cluster
Bulldozer 128ビットFMA×2 / core
で、クロック当たりのピーク浮動小数演算性能はどっちも同じ。
性能評価したいなら、Sandy Bridgeの簡易サイクルシミュレータをIntelのサイトから落とせるよ。
クラスタと言ってもデコードフロントエンドは共有なので、そこで2スレッドの合計性能は頭打ちになる。
合計4issueだとしたらそれこそSandy Bridgeも同じだし、そうなるとピーク性能で差別化するのは難しい。
あとAMD独自命令抜きのAVXの土俵だとAMDは厳しいと思う。
どっちかというとL1データキャッシュがスレッド毎に独立してるのでキャッシュを取り合わずに済むとか
ワーストケースでの性能低下を防ぐ要因が大きいんじゃないかと思うんだが、この辺はどうとも言い難い。
SMTにもCMTにもそれぞれ利点はある。
逆だ Sandy Bridge 256bit FADD+FMUL / core Bulldozer 128ビットFMA×2 / cluster
いきなりSandyBridgeキャッチアップ出来たら本当に軌跡だよ Pentium4からcore2位の衝撃を感じる 後は電力だな
>>543 ここで一年なんぞ後ろにずれ込んだらマジで終わりだろ。
来年に続き再来年もフルボッコじゃ流石にもたねーよ。
IntelはHaswellまでにかけてFMAを実装、AMDはMADの256ビット化で 浮動小数ユニットの実装の違いはある程度埋まるかと思う
コアが大きくなって、リソース共有で複雑化して、 クロック周波数が犠牲になる気がするんだけど杞憂かしら。 デスクトップはもう市場は広がらないとみてあきらめたのかな。 ただサーバにしても、デコーダ共有で80%スループット向上するのかな?
557 :
Socket774 :2009/11/13(金) 01:29:59 ID:EQWfLDgj
Bulldozerが1年早く出ればIntelに勝てるんだが。
12.5億ドルあればBulldozerが出るまでは延命できるかな
2スレッド同時実行とするとき
>>549 の言うとおりに、AMDのほうが面積は喰うけど
性能が良い、Intel HTは面積は喰わないけど性能はあまり伸びない、
という点だけから単純化して考えると、同じ面積のチップでは当然、AMDのほうは
同時実行スレッドは少ないけど最大負荷時にスレッドあたりのパフォーマンスは上、
Intelはスレッド数多いけど最大負荷時のスレッドあたりのパフォーマンスは下
というトレードオフになる。
Intelが今のHTのやり方でこのまま進むかは不明だけど、両社が2011年以降のPC用
プロセッサで同時実行スレッド数とスレッドあたりの性能のどっちを優先している
かの違いと単純に見ることも出来るかも。
560 :
Socket774 :2009/11/13(金) 02:01:46 ID:Cbg6mSdh
1モジュールを2コアと数えるのか・・・・。それとも、1モジュールを1コアと 数えるかで相当考え方が変わってくるような気がするけど。
どう考えても1モジュールが既存の概念での1コア相当 1モジュール内で2スレッドを走らせることが出来る
モジュラーに割り当てられる仕事が1スレッドの時は2コア分のリソースを占有できて 2スレッドの時は柔軟にリソースを分配することが可能ってことか? 1スレッドあたりに用意できるリソースがふえるならシングルスレッド性能もあがりそうだな つーか今後はモジュラー単位でスケジューリングしろってことになるのかな いままではソケット-コア-スレッドだったけど 今後はソケット-モジュラー-コア-スレッドってことになるのかな?
564 :
Socket774 :2009/11/13(金) 03:11:04 ID:Cbg6mSdh
後藤氏曰く、1モジュールは2コアとカウントするそーな。 だとすると、良い方へ考えると、むちゃくちゃ効率の良いデュアルコアって事かな。 悪い言い方だと、2コアの様にも動作する1コアを、2コアとして売るって事になる。 どっちみち、なんかまだ仕掛けがありそうだけど。
なんとかMhz相当とか昔あったけど 相当って嫌なんだよね。なんか・・・。 その分値段絶対高く設定するっしょ。
>>562 > モジュラーに割り当てられる仕事が1スレッドの時は2コア分のリソースを占有できて
> 2スレッドの時は柔軟にリソースを分配することが可能ってことか?
図を見る限りデコードとFP unitだけが共用、逆に言うと、1スレッド/モジュラーの
時は片方のIntegerパイプは遊んだまま。流石に2スレッド分のIntegerパイプ全部
アウトオブオーダで1スレッド実行ってのは、無茶苦茶大変な割に効果出ないでしょう。
FPパイプのスケジューリングの詳細はまだよく判らないけど。
>>564 2人で暮らすのに主食の米を食うのに必要な箸と茶碗だけは2組用意するけど、
毎食使うわけでもないフォークやスプーンは1人分しか用意しないという感じ
統合するGPUの性能では引き離しそうだ。
1モジュールを1コアと数えると同じコア数のインテルを整数演算でぶっちぎるが 2コアと数えると同じコア数のインテルに浮動小数点演算でぶっちぎられる 値段付けの問題もあるから悩ましいが1コアと数えて欲しかったな
ベクタ演算はベクタコアででしょ
>>547 ブロダイ見る限り圧勝する要素が無いんだが…
572 :
Socket774 :2009/11/13(金) 08:44:47 ID:aa2/JaLQ
一部を共有させたデュアルコアだな。 一部死んでたら両方死ぬ。 部留まり悪そ。 これをコア数何個に数えて売るんだろ。 セコイ売り方しないで欲しい。
理論値では浮動少数負けてるけど 実効値ではそんな事ないっ(キリッ
低脳の孫引きが活発化しています
577 :
Socket774 :2009/11/13(金) 09:54:57 ID:aa2/JaLQ
スレッド性能はほとんど上がらないな。 面積5割増で性能8割増。 面積効率2割増。 HTと大差無い。 なのに1単位が大きくなり、部留まりが低い。 最低が2コアになれば、マルチスレッド化が進む。 いかに多くのコア、高いクロックが要点なのは変わってない。 そして、面積効率以上に電力効率が必要になるだろう。 ブルドーザがそういう性質なのかは、分からない。
ただでさえ複雑なx86のフェッチ/デコードを 2スレッドで共有するのは合理的でないと思うんだが。 分割して簡素化して「50%のトランジスタで80%の効率」を達成すれば、 トランジスタを増やさずに効率を上げられるところなのではないか?
AMDはデュアルCPUをデュアルコアにしたけど、 今度はデュアルコアを更に融合させて1モジュールにするってことだよね。 ダイサイズ50%増でパフォーマンス80%アップというなら、 ダイサイズ100%増でパフォーマンス100%アップだったデュアルコア時代よりも効率がいい それに1モジュールの中の2スレッドは同じL2L3キャッシュを参照するから 今までのAMD CPUで弱点だったコア間のキャッシュヒットが向上する。
浮動小数点演算が2スレッドで共有なのは確かに弱点だけど それってその頃にはGPU側が担うこと多くなりそうだから問題無い希ガス
>>579 デュアルコア化はシングルスレッド性能を落とさないが
モジュール化では間違いなく落ちる。
性能低下がどの程度かによってチップとしての評価は変わるが、
個人的には(程度の大小に関わらず)受け入れ難い。
「ハイパースレッディングは80%性能が落ちる」ですか?
>>582 モジュール化するとシングルスレッド性能が落ちるというのが意味不明なんだけど
デュアルコアと1モジュールでは、
同じダイサイズならば後者のほうが普通に性能上でしょ
そもそも1スレッドしか走らせないという前提ならば
デュアルCPUだろうがデュアルコアだろうがSMTだろうが同クロックで性能同じやん。
>>581 インテルもi系で整数を強化してきたわけで
浮動小数点はGPUにシフトしていくのは時代の流れかも
まあ、一言で言えばAMD's Rockなのだよ。 スループットコンピューティングに振って巨人Intelとの棲み分けを図るのは 間違っていない。くらうどwの時代だしな。 わざわざ「個人的に」受け入れ難いと書いたのはそういう意味。
よく考えると、SMTは入れてこないあたり、スループットに振ったわけでも ないんだな。やっぱりモノをみないと、何者なんだかよくわかんないな。 本当にやりたかったのは、(浮動小数点演算と同様に)多数の整数演算パイプを並べて、 1スレッドで占有も2スレッドで共有もできる仕組みだったと思う。 シングルスレッド性能を犠牲にすることなくスループットを向上できて、 素人目に断然カッコイイ。でもやってみたら難しくて挫折したんだろうなあ。
589 :
Socket774 :2009/11/13(金) 11:25:37 ID:aa2/JaLQ
FPUを使うのは古いソフトで、古いソフトはシングルスレッドプログラム。 てことで、こうなったのかな。 最低4コア時代だと4コアモジュールにするんか。 性能向上の目的じゃないな。
共用する128bitのFPUって、今までどおりSSEとAVXも実行するんだろうから、 古いソフト以外にも関係すると思うけど。
>>585 CMTの意味分かってるのか
INTが縮小したと解釈するのは間違い
あとそこの抜粋部分だけじゃなくて
続きの文章にもきちんと目を通そうな
その前のレスから目通せばわかるけど、585はシングルスレッド性能の話だよ。
こいつはあくまでもモジュール単位で見るべきであって 物理的なブロックで見てしまいがちでそう思えるんだろうな IntelのHTよりもむしろH/WリソースをINTに割いてる構成だからね HTでシングルスレッド性能が下がると言ってるくらいにおかしいから
Bob猫沢山積むのが一番性能上がりそうな気がする。
> こいつはあくまでもモジュール単位で見るべきであって そして2スレッド並行実行が前提。 認めたくないのはわかるけど、 Bulldozerのアプローチだと「シングルスレッド性能は」落ちるよ。 Hyper-Threadingとは違う。 スループットはパフォーマンスとのトレードオフなんだから、しょうがない。
>>588 突然その位置まで飛躍は無理でしょ?
次世代以降ではそうなるのでは?
あと、シングル性能は落ちるだろうけど、
時期的には拘らなくてもいいかもね…。
BobcatはBulldozerよりさらによくわかんないな。 50%のダイサイズで90%のパフォーマンスを実現する技術はなんだろうね? それが本当ならBobcat二つ並べれば180%で、Bulldozerなんて要らない(笑)。 キャッシュ省略、デコーダも演算器も良く使う命令にあわせて簡素化・・・ 90%は実は誤解を招く数字なんじゃないかと思えるし、 ダイサイズ半分では、コストも消費電力もあまり下がらないないようにも思える。 モノがないとさっぱりだ。
>>597 仮説1:シュリンクによる縮小分も含まれる
仮説2:キャッシュやアンコア部を削る
大本営発表を真剣に考えちゃう人って…。
ピーク性能が高いのがintel 実行性能が高いのがAMD 1w単位の性能が高いのがintel 1\単位の性能が高いのがAMD
SSEや128-bit AVX性能だと若干Bulldozer有利。 2つのMADをmulps×2のみあるいはaddps×2のみとして使えるから。 256-bit AVX性能だと断然Intel有利。 256-bit vmulpsとvaddpsを1サイクルに同時実行できるから。 AMD独自のXOP/FMA4もありでなんとか肩を並べることができる 256-bit vmulpsとvaddpsに対し、128-bit版vmaddps×2あるいは256-bit版×1で 張り合うことができるから。 > 1\単位の性能が高いのがAMD これ誇ることじゃないけどな。 製造コストが低いならまだしも、そうじゃないし。 卸値が安い今の現状は単に市場競争力がないだけ。
そういえば、TurboBoost的な何かの搭載は発表なかったのかな?
>>595 さっきから言ってることが無茶苦茶すぎる
シングルスレッド性能が落ちる理由をきちんと説明してみな?
パイプ減ってるのに落ちないはずがないだろ
Hyper-ThreadingだってOnにすればシングルスレッドの性能は落ちるよね
まあパッと見 デコーダーが足引っ張ると転けそうなアーキだな。 フロントエンドの共有化って結構バクチなような気がする。
>>602 APM Boostという類似技術は搭載される模様
>>604 HyperThreadingと比べるとスレッドの競合起きないから
その分有利にならないのかな?単純にシングルスレッド処理が
落ちるという計算も妙な気がするけれども
HyperThreadingと比較する意味がわからん。
>>585 まさかデコーダーが1個とか考えてるの?
>>597 シングルスレッド性能が落ちるからしか考えようが無いだろ
AtomをマルチコアにしたらNehalemなんて要らない(笑)。すか?
凄い低脳が来た
ttp://pc.watch.impress.co.jp/docs/2008/0523/kaigai441.htm >ホットスポットであるデコーダが、CPUの動作周波数の事実上の制約となる
各integer coreが2つの整数演算実行ユニットを持ってたとしてもデコーダは4命令同時発行で、かなり複雑
これからクロックを追求したPower6的プロセッサでないことが分かる
スレッド並列だけを求めるなら、それこそBobcatを並べたほうがシンプルなコアでクロックを高くできて、
(内部バスとかメモリ帯域とかの問題を解決できるなら)チップ単位でのパフォーマンスが高くなる
消去法的にIPCを高めてあると考えられるけど、
ttp://pc.watch.impress.co.jp/docs/2008/0428/kaigai438.htm >Intelも、おかしなプリフィックスがない“ノーマル命令(Normal Instruction)”を、3から4命令ずつデコードすることを前提としているはずだ
>それ(ノーマル命令)以外のケースに(3〜4命令の同時デコードを)拡張しようとすると、デコーダが極端に複雑になってしまうだろう
各integer coreが3つ以上の整数演算実行ユニットを持ってたら、デコーダが6以上同時に命令発行できなきゃいけない
これは非現実的
とすると
>>531 の「書かれていない他の要素」に
@シングルスレッドをハードで動的に2スレッドに振り分ける機能
A2つのinteger coreを1つのリソースとして扱う機能
のどちらかがある、と考えられる。どっかに論理の飛躍あるかな?
今すこし考えたんだけど、 コア数に対してデコーダーは1/2になるんだよな? そのぶん熱容量浮くからクロックアップにまわすとか・・・・・・ない? なんだかんだいって4コア以上はソフトが対応しててもほとんど費用対効果わるいし、 クロックアップだけが今のところフリーランチ的に性能をあげられる唯一の手段なんだから、 コア数をそのままにして1スレッドあたりに用意されている実行リソースも減らさないで 一部リソースをコア間で共有化して節約しcpu全体で熱量さげてクロックあげられるなら、 ありえない選択肢ではないと思うんだが。 問題はクラスタードアーキテクチャのオーバヘッドと、Bulldozer以前と比べたシングル・マルチスレッドの実行効率で、 この良し悪しによりクロックアップ分の性能が生きるか死ぬかのどっちかになるんだよな。 あと、キャッシュ自体をどうにかしないと永遠の二番手におさまっちまう
>>612 2011年まで待たせるんだからそのどちらか位のことはやって欲しいね
HTから5年後くらいにこの整数演算機構のCPUが出ていたらなあ・・・
>>611 >デコード能力が十分だったとしてもALUの処理能力で全体の能力が決まる
これデコーダーとバックエンドが1対1の場合の話な。
頑張ってデコーダーが命令送り込んでも
実行ユニット足りなきゃ意味無いよって話。
Bulldozerは基本1対2だからバックエンドは足りてるんだよ。
だから逆に
ALUの処理能力が十分だったとしてデコード能力で全体の能力が決まる 。
Bulldozerの場合は。
>>612 の
>各integer coreが3つ以上の整数演算実行ユニットを持ってたら、
>デコーダが6以上同時に命令発行できなきゃいけない
両方のInegerCoreの演算器が全部動く自体なんて想定してないんじゃないの?
特許から予想しているサイトみたいに、
デコーダーは4命令発行で、デコード後のμopsをキャッシュして再利用することによって、
デコーダーの負担を減らすんじゃないだろうか。
そろそろデコードなんかしないで、コンパイルしてから実行した方が早くね?
RISCが壊滅した今にそれはない
>>617 でもそれってK8・K10の「最低速を速くする」アプローチとは真逆だよね。
対象なデコーダ・ALU・AGU×3でワーストケースに備えるような。
デコーダは対象4wayでinteger coreで2+2になるって感じの方が、AMDらしい気がする
> 対象なデコーダ・ALU・AGU×3でワーストケースに備えるような。 そこまで考えた設計じゃない。 あれはただ単純にスケジューラの実装が楽だから。 どこに突っ込んでもALUの機能が均一だからスケジューラをサボれる。 LSUが2本しかないのにAGUが3つあっても理論性能上意味ない。
デコーダ1つと言っても中身はほぼ2つ分で FP schedulerに送る部分で情報共有+最適化しているだけじゃね。 fetchも状況によって1:1が2:0に変わるくらいで。
大原さんのレポ来た
AMDがロードマップ公開 - 2011年にFusion投入、Bulldozer/Bobcatコアの概要も
http://journal.mycom.co.jp/articles/2009/11/13/amd/index.html 3ページ目
>Photo13: ここでは128bit FMACが2つとされているが、実際にはもう少し複雑な構成になると思われる。
>恐らくx86のFPU命令を実装するのは片方のみで、もう片方はSSE3とAVXなどの128/256bit演算のみを
>実装しているのではないかと思われる。それと、遂にIntegerが4Pipelineになったのは注目に値する。
>恐らくALU+AGUのセットが4組、という構成であろう。
この辺は情報が少ないこともあって見解が分かれるようですね
合計4組だとリソース50%スループット80%も増えなくね?
>>626 去年の今頃、SPECintでNehalem 4コア(8スレッド)でShanghaiの2ソケットよりスループット上回ったなんて
どっかのMACオタが狂喜してたがさ
事前最適化ありの定型的なベンチですらそうなんだから
要するにHPCじゃない一般的なサーバのワークロードにおいてOpteronは平均2IPCは確実に下回ってるわけだよな。
なら、2スレッド合計4IPCになるなら、80パーセントは達成出来るんじゃないの?
まあこれはデコーダが4Wayで十分な根拠にはなるが
ALUとAGUを別パイプラインにして1スレッドで性能が出るかどうかは別だよな
今、気がついたんだけど 2コアを1モジュールにすることでリソースを1/4節約して(逆に言えば1コアから1モジュールにアップグレードするのに1コア分の50%の追加リソースが必要)、 それにともなう性能低下も2コア合計で1/10におさめました(逆に言えば2コアを一つにすることで80%の性能向上が見込めます) って事なんだよね? HTTと比較するとけっこう対極的な位置関係になってるねこれ
レジスタをそれぞれのALUの近くに完全に分散して持てるから HTとは違うんでない。
>>617 >両方のInegerCoreの演算器が
>全部動く自体なんて想定してないんじゃないの?
そう思う。
実際には片側4つ全部遊んでいる状況もあるだろうな。
よくわからんが、C2Dっぽい二気筒エンジンになるのか。 デスクトップ向けが4コア8スレッドなのかな?
632 :
底辺投機家 :2009/11/13(金) 23:04:16 ID:Ly7aps2U
有識者の方々にお尋ねしたい。 先日発表された内容の A. Bulldozerがポシャる可能性 B. Bobcatがポシャる可能性 C. Fusion/APUがポシャる可能性 を具体的数字で示していただけますか。
まず「ポシャル」の定義を教えてくれ
A 12l B 24l C 38l
Q:Bulldozerがポシャる可能性 A:0 Q:Bobcatがポシャる可能性 A:0 Q:Fusion/APUがポシャる可能性 A:0 Q:それぞれが遅れる可能性 A:低くない
なんか妙な言い回しが板のあちこちでみる 別に困ることでもないだろうに A,わからん B,わからん C,わからん おれたちトーシローの意見をきいても意味無いと思うが
今さら中止も変更もないだろ。 仮にAMDが倒産してもIBMが引き継ぐんじゃね?
A. これまで紆余曲折あってアーキテクチャー公開だから、中止・デザイン変更の可能性は低いと思う。 B. ダイ写真の公開してるし、中止・デザイン変更の可能性は低いと思う。 C.中止・デゼイン変更の可能性は 上二つほど低くないと思う。 思ったほど性能が出ないとか、発売が遅れるとか、プロセスの歩留まりが向上しないとかはありがちだが。
識者の皆様 貴重なご意見ありがとうございました<(_)>
識者じゃないが、あそこまで時間とリソースをかけて開発してきたのだから ブルドーザーが市場投入されないとしたらAMDがその前に潰れた場合だけだろうな。
整数演算ユニットを4パイプx1組じゃなくて 2パイプx2組にするメリットって大きいのかな? 消費電力の低下には寄与しそうだけど 性能面での貢献が期待できるのかどうか 特にシングルスレッド重視の用途に限れば 不利になりそうに思えるけどそうでもないのかね
3パイプ+ストアの予感
そもそもAMDの資料でも4パイプ書かれてるわけなんで AGUはALUとペアにするべきかLSUとすべきかは議論の余地はあるが Fused μOPs形式を辞めるとかぶっちゃけ無いだろ。 デコーダのドメイン数が増える。 ま、256ビット AVXが2ドメインなんでそういう面では不利確定ぽ
性能予測だとコアの増加に比べて、Integer性能の増加が小さいので、 整数演算ユニットがすごくリッチになるとは思えない。 「ALU+AGUのセットが4組」はありえないと思う。
>>644 でやっとさんざ書かれた
>両方のInegerCoreの演算器が
>全部動く自体なんて想定してないんじゃないの?
が理解できた気がする。
4命令/サイクルの命令が各integer coreに必ずしも2:2で振り分けられるわけじゃない。
それこそ4:0から0:4まで状況に応じて変わる。
スレッド数が少ないときのシングルスレッド性能は、K10からデコーダの性能向上分上がるし
スレッド数が多いときは、K10よりはシングルスレッド性能が低いコア×2として扱える。
ってことでおk?
iMac、じゃなくてIMAC機能も2つのFMACユニット両方で使える気がするんだが IMACが有効に使えるケースでのSIMD整数算術演算のスループットは最大2倍ってことになるよな PMUL* と PADD* を連結して使いたい場合に有効だな ま、整数で積和使えても美味しいケース少ないけどな
画像を見る限り、2コア8整数2浮動小数が全体で1コアなのか、 これが4コアとか複数展開されるのかよくわからないな。 L3まで書いてあるってことは、これがCPU全体の処理構造になる ように読めるんだが。
コアの考え方が曖昧になるな
652 :
Socket774 :2009/11/14(土) 15:03:08 ID:M3LDRNq8
オラクルのライセンスで揉めそうだなw
否定的なことを言えば、FPUのコア間共有はトランジスタを増やさずに 見かけのコア数を増やす(整数演算を優先する)過渡期のアプローチ。 微細化で余裕が出来る次の世代では1:1で持つようになるはず。Niagaraとか見ると。 スレッドを複数束ねればピークはずれるので、2コアといわず4コア・8コアを集約して リソースを配分できれば理想的だが、高速なチップはそういうふうに作れないようだ。 あと、マルチコア全盛に至った理由の一つが「きっちり1コア作ればあとはコピペでおk」 という点であり、手間をかけて2コアを融合させるのが、1コアを改良 するより費用対効果でみて有利なのかどうかはまだわからない。
肯定的に言えば、Intelの後追いではないことを明確にアピール出来たのは 借金抱えてアラブの投資家のご機嫌を伺わなければいけないAMDにとって 大きな意義がある、かな。 Atom対抗という位置付けだったBobcatも、Atomとは違う高付加価値路線だった。 IntelがAtomで利益を上げていることを考えれば、Atomクローンを 作ってもよさそうなものだが(派生品を作りやすいのもそのセグメントだろう)、 価格競争しても勝ち目はないという真っ当な判断が働いたのだろうか。
LlanoとSandy Bridgeのコアサイズ見ると既にSandy Bridgeの1コアがLlanoの1.5倍くらい GPU部分はほぼ同サイズなんだが
たるさんの予想が当たる
>>656 HTTアリと無しでは話がまた違うが…。
アンカ違いか?
何それ怖い
まあ何にせよフロントエンドとFPUを共用する以上、 HTと同様にタスクの振り分け方で性能が変わるなんてことがあるわけで OS側の対応が大変だ
SMTも入れてスループット特化したらもっと面白かったかな きっと売れないけど
実は4pipeが独立スレッドとしても動かせて 1コアで4*2=8スレッド、4コアなら32スレッドで動くとか エンコ屋さんは喜ぶかもなー
そういえばSMTがないなんて一言も言ってないんだよな
つか前に1モジュール内で並列処理やるって言ってなかったっけ 整数ユニット2つ積んでるのがそれだと思ったんだけど
Bulldozerモジュール内で4スレッドも走らせたらFPUパンクしちゃうよ ところでFPUってL2にしか繋がってないの? 両方のL1Dに繋がってるって書き方してる人もいるけど
整数部のLoadユニットで読んで内部データバスで供給でしょ。今までと同じかと。
たとえば addps xmm0, [rax] って言う命令は整数パイプと浮動小数パイプの両方にオペレーションが発行される。 整数部のAGUを使ってアドレスを算出、格納先の128ビットデータを読んで FPUのシャドウレジスタに格納→浮動小数ユニットでそのデータをxmm0に加算 みたいな。 Bulldozerの場合はシャドウを含めたレジスタセットをスレッド毎に持ってそれぞれの 整数コアに接続すればいい。
きも過ぎ
マクロFusionはx86の実行効率向上にかなり効果的みたいだな。 AMDもRISC変換はしてるけど、インテルの特許技術と同じような 手法はとれないと思うし、AMDの高速化に向けたアプローチは 苦難の道が待っていそうな気がする。
AMDが使えないインテルの特許技術ってx86のことですか
今年通ったIntel特許だとLarrabee関連とか
4つのパイプラインが肝だろうけど謎が多いな ALU+AGUのペアが4つというのは難しそうだが かといってペアが2つだと性能落ちてしまうよな うーん・・・
LSUは整数コア毎に128bit×2基なのかな? 2スレッド合計で64KB/clkのロード帯域になるなら、Sandy Bridgeに対する優位性としては十分だな
64byte/clk orz
>>675 3+3なら(スレッドが少ないときの)シングルスレッド性能とマルチスレッド性能両立できるよ
>>647 参照
1スレッドあたり平均2命令発行だから2ペア、だろ +50%で1コア相当の省スペース性がウリなんだから リッチなわけもなし
>>676 >>679 K8以来ずっとALUとAGUのペアがで1組の構成でしたが
これが3組だとしたら残りのパイプ1つはどうなるのでしょうか
だからAGUだけ(Load or ストア専用)
死ね
整数演算リッチにする余裕あるならフェッチ・デコードも分離すると思うんだけど。 要はRockと同じくFPUのみ共有。新味はないが確実。 2スレッド分のリッチな整数演算パイプに充分な命令を発行できる スーパーリッチな共有型フェッチ&デコーダだったらミラクル過ぎる。
OSのスケジューラはスレッド毎に256bitAVX使用の有無に応じて コアへの割り当てを配慮しなきゃいけないのかしら。 出来なくはないだろうけど、面倒そうね。
1スケジューラにつき1スレッドなの? 1フェッチ&デコードにつき1スレッドなの? 後者ならBullはデータL1とスケジューラが2つになっただけで 「2コアで1モジュール」とかあんま関係無いような気がする
よーするに「整数演算はインテルより強い」といわる時代がまたやってくるのか。
整数の4パイプは 「ALUx2、ロードx1、ストアx1」ってことはないのか? BobcatもAGUを分解してそんな感じだけど
>>689 まー浮動小数点演算を大々的に使うならGPUという時代が目の前だからねぇ
整数演算強化は正解かと
GPGPUは「これまでCPUでは出来なかったこと」をやるためのもので 仮にGPGPUが普及しても、CPUの浮動小数点演算需要は減らんよ
>>689 まあ、数=性能じゃないと思うけどねぇ。振り分けが巧くないと結局ユニットが遊ぶ。
>>690 ロードと整数演算を分解するとμOPsのドメイン数が増えるだろ。Macro fusionを辞めるわけがない。
辞めたところでデコーダのポートが増えてスケジューラが大変になるか、スループットが落ちる。
まあBobcatは外部2〜3 issueの内部4issueだろうからそれでいいんだろ。
>>691 だからそれはSandy Bridgeのスペックが解るまでの話だろう。
SSE5(現FMA4)を使うことで浮動小数演算性能も2倍で、
今年に登場しNehalemをぶっちぎる予定だった。
PenrynとNehalemって殆どパイプライン構成同じでHTが増えたくらいなんだが それで性能増えるのは要するにそれだけスカスカだったってことで。 大体にx86みたいなレジスタ本数が少なくて依存関係の多い命令セットじゃ 整数演算ユニット増やした分だけ性能があがるようなもんじゃないだろ。 整数コアに更に2スレッド動く構成とかならありだろうが。
>>692 いや、画期的に減ってるんですが……エンコをGPUでやれるのは大きい。
GPUが「使える」ようになってきた以上、とくにAMDみたいな内蔵GPUが強い場合、
演算能力はCPU単体で考えるより、内蔵GPU込みで考えた方がいい時代になってきた。
そしてグラボ追加でエンコなどの能力アップと。
,.ィ , - 、._ 、
. ,イ/ l/  ̄ ̄`ヽ!__
ト/ |' { `ヽ. ,ヘ
N│ ヽ. ` ヽ /ヽ / ∨
N.ヽ.ヽ、 , } l\/ `′
. ヽヽ.\ ,.ィイハ | _|
ヾニー __ _ -=_彡ソノ u_\ヽ、 | \
.  ゙̄r=<‐モミ、ニr;==ェ;ュ<_ゞ-=7´ヽ > つまりコプロセッサ増設の時代が戻ってきたんだよ!
. l  ̄リーh ` ー‐‐' l‐''´冫)'./ ∠__
゙iー- イ'__ ヽ、..___ノ トr‐' /
l `___,.、 ./│ /_
. ヽ. }z‐r--| / ト, | ,、
>692はまず1行目に突っ込むべきだと思うんだが・・・ 1行目がこのままなら2行目との矛盾は無いけれど 「これまでCPUでは出来なかったこと」ってPC内で言うとHDDやらLANやら電源やらの機能のどれかってとこかな そんなことがGPGPUに出来るんですか 現実世界のGPUは「演算なら何でも御座れ」なCPUの機能限定版ですよ
限定というか特化か
DOS/VマシンがCPUとGPUを別パーツに分けたように 「あれ?もう整数演算と浮動小数点・ベクトル演算を同居する意味無くね?」 と気付いてしまったのが現在
みなGPGPUにあらぬ期待をかけすぎだ。 団子はもっとプロパガンダ頑張らないと。 GPGPUはバズーカ持ったシュワルツェネッガーみたいなもんだ。 戦場の様子を一変させる破壊力。 でもやっぱりマシンガンも要るんだよ。
FPUはCPUに取り込まれたし、 GPUもCPUに食われると思うが・・・
>>701 往年のシュワちゃんはボディービルダーだからアウターマッスルは立派だが
インナーマッスルは相対的に弱い。
銃撃戦に必要なのは瞬発力だろう
そもそも今現在、CPUで浮動小数点演算使う場面ってあるの? 職場で使う大ファイルのエクセルくらいじゃないのか。 レタッチやキャド分野ではもうGPUにどんどん移行してるし 3D描画やゲームは全部GPUで決まるし、 エンコももうGPUにどんどん移行してる。 CPUの浮動小数点を無くすのはまだ乱暴だが、現状維持程度にするというのは ニーズからいっても非常に現実的な解だと思うが。 欲しいのはやっぱり整数演算でしょう。
>>704 だから浮動小数も2倍になってるっつーの
>>704 ×どんどん移行してる
○ゆっくり移行してる?
DTMはレイテンシが命だからGPGPUとか無理 CPU並みのレイテンシでGPUを使えるAPUが将来的に望まれる
てかGMA内蔵Sandy Bridgeの対抗は当分K10.5のLlanoだろ Bulldozerは鯖とエンスー向けで
こんなにFermiへの期待度が高いとは正直驚きだ。 Fermiだよな?
FermiはGPUとしては単体カードでGTX295を超えられるか微妙
GPUを扱えるAPUってなんぞw 普通に、サウンドカードのチップとかコーデックが 全てソフトウェア化してCPUに取り込まれれば、解決する問題じゃん。
>>683 >>690 >>693 K8の、というかAMDの3命令/cycle哲学からして
さすがに2(ALU+AGU)は無いんじゃないの?
同様にストアだけ強化っての何だか違和感あるし
正当な進化として4(ALU+AGU)にならんのかね
Chekib Akroutのpdfで5ページ目、Single-Core Eraの項が気になる この先シングルスレッド性能が上がるか下がるか?って書き方だしなあ 以前どこかの記事でシングルスレッド性能は落とさないとAMDの人が言ってた気もするんだが
>>713 むしろストアって基本的に整数演算とペアにできないんだよね。
add [eax], ecx だとload→add→storeになるけどさ
load+add と storeで十分だろってさ。
ストアアドレスが確定するまでロードが出来ないことを考えるとストア専用パイプを用意して 専用のスケジューリングをする意味はあるのかなと。 アドレス値予測して投機的にロードするテクニック(Memory Disambiguation)はどこぞの特許に抵触するし。
低脳うぜぇ
逆に言うとストアアドレスが確定するまでストアできない制限がある以上 ALU+AGUのペアをいくら増やしても頭打ち
○逆に言うとストアアドレスが確定するまでストアの後ろのロード命令を先行実行できない制限がある以上
メモリディスアンビグエーション=プリフェッチ=フェッチはどこの特許に触れますか?
US Patent 6591342
プリフェッチ君背走
未だにメモリディスアンビグエーション=プリフェッチ=フェッチと信じてるとは驚き
プリフェッチ君おはよう
プリフェッチ君(ID:67+W7s0j)の恥ずかしいレスが見れるスレはこのスレだけ
ねえねえプリプリフェフェフェッチくん♥
L2の速度ひとつで性能2、3割とか余裕で変わるんで コア内部だけのユニット構成だけで性能予測しても 殆ど当たらんけどな。
まあパフォーマンス要因はL1が2つあることだと思う。 1つのL1の帯域・ポート数を増やすのは大変だが、クラスタ化すればスケールする。 結果的に浮動小数ユニットに2倍のスループットでデータを供給できるようになる。
>>597 自分も非常に気になった部分だ。
クラスタードを採用するとかしてないと無理な気がするが、其処まで面倒な事を
してるのかな?
まあいずれにしてもクラスタードはいいなあ。
IntelのHTやターボboostなんかで差をつけられたイメージが有ったが、一気に
取り戻した感じがするよ。
3年遅れているけどな
2011年の淫は3年先を逝ってるのか・・・
なんつかAMD黄金時代がまたきそうだな
もっさりスレの主をファビョらせるとはだんごせんせーもなかなかのもんじゃな
でも、AMDのはまたコスト上がりそう。 今のAMDの石は、ぶっちゃけ値段を下げて無理矢理Intelとタメ貼ってるような状況だから これで決定的な差が出せなかったら、色々きついんじゃないか・・・。 そうでなくても、今だってSOIとかIntelに比べてコストのかかるの使ってるんでしょ?
SOIの価格に関しては確かに割高ではあるけど、技術の出始めと 安定後では価格が劇的に下がるのが工業製品の常識。 詳しい価格差は明らかになってないので何ともいえないところでは あるんだけどね。 個人的な印象としてはAMDは下の温度は下がりにくいかわりに、 OCしてもあまり温度が上がりにくい、インテルはその逆という感じ がする。
かけるコストに見合う見返りがあるからこそずっとSOIを採用してるんでしょ ウェハが高いからSOIは高コストなんて言っても意味ないよ それに微細化が進んでいろんなテクニックが必須になってきてるから 相対的にウェハコストの影響は小さくなるし
739 :
Socket774 :2009/11/16(月) 01:30:41 ID:BLwecK3L
工業製品、特に汎用品でコストパフォーマンス以上に重要なものなんてない
>>716 もしストア専用にパイプを足したとしても
他のALU+AGUのペア含めた制御面倒じゃないの?
果たして性能面でそんなに寄与するのだろうか
AMDがSOI採用してるのは他に方法が無いから以外にないでしょう 最初にSOI導入したときは何も導入してないIntelにそれで勝った。 IntelはSOIの導入を飛ばしてHigh-kを実現したが、 材質や配分などを独自研究して誰よりも早く実現したのであり そこまで至ってないAMDはSOIに頼るしかなく今に至る。 AMDもやっと2010年からHigh-k導入。
採用時はいいアイディアだったんだよ、SOI。 クラスタ化も多分そんな感じになる悪寒。
複数コアでのFPU共有は悪いアイディアではないと思う。 そこから一歩進めてコア自体を不可分に一体化するのは、 長期的にはメリットよりデメリットの方が多いと思う。
よく考えると、開発の遅れと言う形で、 短期的にも既にクラスタ化のデメリットは露出しているのだった。 仮にクラスタ化のアプローチが成功しても、Bulldozerの次の世代で さらに4コア1モジュールに進めるのは現実的でないし、 逆にクラスタ化マズーとわかっても戻れないし、 これは分の悪い賭けだ。
シングルコアなら暇だろうと何だろうと各機能が一通り配置されてないと いけないが、マルチコアなら暇そうにしてる機能ブロックは共有化してしまえ (忙しそうなところだけ多重化した、でもいい) つまり、どこも忙しくなることを目指した、ということだと思っていいのかい
データL1を1コアに2つ積んだんでしょ
>>746 FPUはともかくフェッチ・デコード段が暇なのか、というと、あまりそんな
風には思えないけど、考え方としてはそういう事。
BulldozerはSandy Bridgeよりも確実に同時実行スレッド数が多くなり、
マルチスレッド化されたアプリケーションならば整数演算能力で
上回り、256bit AVXを多用するアプリケーションでなければ浮動小数点演算でも
同等の能力を発揮する。
>>747 1コアではなく1モジュールに2つ。
1モジュール=2コアと考えるならば、ふつう。
だからデータL1を1コアに2つ積んだのをモジュール言ってんでしょ
1コア=1モジュールという言い方はAMDもしてないと思うが、 仮にそういう視点に立つと、Bulldozerはとてもでかいコアということになる。 (2倍まではいかないが) 実際そのために開発遅れたし45nmに載らなかったんだから、 そういう見方でいいのかもしれないなあ。 で、1ハードウェアスレッドあたり1個のデータL1だから、ふつう。
実際に大事なのは性能だから AMDが見誤ってなければそれなりの商品に仕上がってるんじゃね? 何しろcore2の後だしなんだからこれで駄目だったら本当につぶれる
性能と一口に言ってくれるが、一人一人みな違う性能を求めているのが今の時代。
L1少量でL2を2コアで共有、Bulldozerの構造はC2Dの改良版に見える 一方core i7はphenom類似の構造になってるし、 隣の庭は青く見えるのかね
どっちも似てないと思うけど
メモリ回りのアプローチが気になる Intelは、CPUとメモリの速度の違いを吸収するために 間に多段階のキャッシュを潤沢に用意してるし、 メモリチャンネル数もハイエンドは3チャンネルにしてる。 AMDは伝統的に小容量キャッシュだが、Intelもメモコン内蔵してしまったし、 Phenom2のL3の遅さと容量の少なさも既に問題になるレベル。 1モジュール内の2ハードウェアスレッド動かしてL2が共用となると それなりの大容量L2、L3じゃないと意味ないと思うんだよね
メモリスタッキング
今になって考えるとPhenomではやや過剰に思えるほど L1の幅を32bytesに強化したのはBulldozerへの布石だったのかな
何を言おうと結局は体感速度にどれくらい影響してくるかだろう
Z-RAM
うーん、海外のサイト見てると整数の4パイプが 2ALU&2AGUってのはまずあり得んだろうという論調が支配的だ もしこれだと何のためのBobcatだよってなっちゃうしね じゃあ具体的な構成は?となるとまだ定まってないが・・・
このCMT原案はAndy Glewらしい・・・w
どうもChuck Moore氏のコメント通りなら それぞれの整数演算ユニットで4命令/cycleできる模様 にわかには信じがたいな
分解した後の4命令?
○片方のスレッドだけに命令供給した場合だけじゃないの?
AMDよ頼む! BulldozerもAM3で対応してくれ頼む!
>>764 Each Bulldozer "core" is capable of 2 loads/cycle; each is a 4-way out-of-order machine
Each INT scheduler can issue 4 inst./cycle; the FP scheduler can issue 4 inst./cycle
らしいよ
FPからみて合計4load/cycleだな。 HPCも十分狙えるんじゃないの?これ。
769 :
Socket774 :2009/11/17(火) 01:01:02 ID:HWM8g8Qc
wktkできるのはいいことだ
771 :
Socket774 :2009/11/17(火) 01:17:28 ID:V8eHzwsO
なんてことはない 基本的にはCoreDuoと同じか 二つのコアを融合させてL2は共有、これを基本モジュールにしてるだけ モジュールふたつで4コアCPU扱いのデスクトップ向けダイ モジュール4つで8コアCPU扱いのサーバー向けダイ
| | ∩___∩ | | ノ _, ,_ ヽ (( | プラプラ / ● ● | (=) | ( _●_) ミ _ (⌒) J )) 彡、 |∪| ノ ⊂⌒ヽ / ヽノ ヽ /⌒つ \ ヽ / ヽ / \_,,ノ |、_ノ
>>764 Float>IntからInt>Floatに変わったのか?
Opteronがスパコンランキングトップ取ったぞw 5位にはHD4870を使った中国のスパコンが初ランクイン AMDがんがれ
まさかの4 ALU + 4 AGUなのか あるいはALUとAGUの対称構造を 崩した実装になるのか・・・?
776 :
Socket774 :2009/11/17(火) 01:43:35 ID:HWM8g8Qc
>>774 元々トップ10は全部オプテロンだったよ。
つまり5位以外はオプテロンということだ。
ALUが整数ユニットでAGUってなんぞ?
Bulldozerのコア数が大きくスケールするならFermiキラーにもなるかもな といっても、発売時期が1年違うから比較すべきではないか
>>776 いや、前2回はOpteron+Cell。
今回の1位は全部Opteron
微妙に話がずれてるなw
でもORNLの新型はOpetron+Fermiの特注品という噂
ALU = Arithmetic Logic Unit AGU = Address Generation Unit のはず Load/Store担当です。たぶん
正確にはロード・ストアのアドレスを生成するのと、ユニットに指令を投げる役目な。 AGUをつかってアドレスを算出 →ロードユニットに○○番地呼んでこいという指令を発行 →読んだ値をALUで利用 っていうコンボ
784 :
Socket774 :2009/11/17(火) 03:06:46 ID:HWM8g8Qc
>>781 どのみちオプテロン使っているな
多分詐欺スペックのフェルミ(単精度2T、倍精度1T、220W位)での計画だから、その組合せはキャンセルになるだろうね。
何せCPUソケットに挿す為には130W以下に抑える必要があり、倍精度が200G程度に落ちることになる。
それなら550mmで高コストかつ数が限られるフェルミより、180mmのHD5770使ったほうが安く大量に積めるよ。
> 多分詐欺スペックのフェルミ(単精度2T、倍精度1T、220W位) これ自体がなにげに詐欺だわ。 公称スペックが1.26GHz動作の単精度1.26T, 倍精度0.63T, 225W
Tsubameや天河の理論と実測の乖離具合を見るとありえないきがするんだg
Dresdenboyさんが予想しているように、 ALUでアドレス計算できるようにするってことかな。
焦点はただ一つ。 再びi7を超えて帰り咲けるか否か。 それしか興味ない。 もしも逆転を成し遂げられることができるならもう一台パワーユース用PCが増えるだろう。
There was one AMD patent about an AGU, which recycles intermediate results for more complex address calculations. While I'm not sure, if this patent could be related to Bulldozer (but to Bobcat or Geode or something else instead), it offers the possibility to use a regular ALU for address calculations with only little modifications. これか
Fermiって実装考えると糞だな 面積と電力食い過ぎて実用的でないな
再びAMDが盛り返しそうだな 長かった
793 :
Socket774 :2009/11/17(火) 12:19:53 ID:HWM8g8Qc
サンディ対抗はリャノになりそうだ。 AVXのサンディvsDX11CSのリャノ。
Sandyは12SPでGPUアーキのメジャーアップ無いから L3共有等の効果を楽観的に見てもG45(10SP)の2倍ってところだろう。 かなりCPU偏重な性能バランスだと思われる。 一方のLIano GPUは480SP、レイテンシ増加等を考慮しても4650以下は無いだろう。 95W枠でCPU部を3GHz後半〜4GHz前半にできればLIanoが有利か? …しかしこうやって考えてみるとGMAアーキのダイ効率の悪さはGT200の比じゃないな。
CPUとGPUを1パッケにするとなると、とたんにIntelのGPU部分のまずさが 浮き彫りになってくるね
again? っていうところがミソ。 3DMark Vantage は早く動くけれど、他はそんなに早く動きません。 っていうところもミソ。 だとすると、crap(ry
>>797 細工というか、GMAが遅いならCPUを使えばいいじゃない、という本末転倒作戦だよ。
GMAがピクセル、バーテックス処理で飽和したなら、ジオメトリー処理はCPUが肩代わりする。
DirectX9のときの設計で10にも対応できるようにしたけど、性能が全く足らないので、
GMA950以前のように、またCPU頼りになっているんだろう。
GPU同士ならフレームなりラインなりブロックなりで 簡単に負荷分散できるんだけどね・・・
intelがNVIDIAを買収すると見た。
それはない
いやそうでもない
AMDがATI買うよりもはるかに難しい。 Intel自身が全てがNVIDIA並みの企業を独立してつくってNVIDIA買う方が楽。
それこそない
実際Intelから見てNVIDIAに欲しいものってあるの?
ない
809 :
Socket774 :2009/11/17(火) 21:03:51 ID:HWM8g8Qc
どのみちDX11対応でHD4650以上の性能を発揮するLIanoに対抗する術は、インテルはおろかヌビというか地球上のどの企業も持ってないない。 Propusと同程度のサイズと消費電力でCPUは4コアL2 1MでPhenomIIx4クラス、GPUはDX11対応した480SPのHD4650クラス。 しかもオンダイだからCPU-GPU間通信が高速でGPGPUも期待出来る。 正直サンディが対抗出来る気がしない。 明らかに完成度の次元が違う。
NVIDIAから技術者を引き抜く方が手っ取り早い
2011年にK10コアなんだから、確かに次元が違うわな。
"LLANO"じゃないの? "LIANO"なの?
LLANOじゃないかな。後藤氏はずっとLlanoだし、本間文はLianoと書いてたけど、 後でLlanoの訂正してたし。
Intel+NV は、AMDよりチップが大きくなりそうね。残念。
LlanoはHD4650級のチップがCPUと一つになるのかよ…やべー
816 :
Socket774 :2009/11/17(火) 21:57:10 ID:gLyEgX+s
480spだからチップとしては4650より上 でもメモリ帯域落ちるから4650ぐらいの性能では?ということだろ 780GみたいにGPU専用メモリつけられるなら変わってくるだろうけど
818 :
Socket774 :2009/11/17(火) 22:50:23 ID:HWM8g8Qc
>>811 傑作コアのPropusの唯一の弱点のキャッシュを1Mに倍増と、サイズパフォーマンスが非常に優れたHD5000コアの融合だからね。
ターボもどきも多分搭載するだろう。
正直bulldozerが失敗しても気にしなくていい位のハイスペックだろう。
少なくともデスクトップやハイエンドノートに敵はいない。
ところでLlanoってAVXとかXOPに対応してんの?
>>809 でも油断はしない方がいいと思うよ、イスラエルチームはオレゴンチームと違って
秘密主義で統率が取れているチームなので、Core2の時のような隠し玉がある可能性も
結構ありそう、まだ全容が完全に明らかになったわけではないし。
隠し玉=ベンチ対策
K10.5
LlanoはWiiの次世代機に乗りそう
まじで?
SPがなんぼあっても、ROP&各種固定ユニット&メモリ帯域とのバランスが 取れてないと(ゲームとしての)性能は出ない ボトルネック部分をCPUによるエミュレートが少し手伝うって手が取れるくらいFusionしてると良いのだが
>>809 > どのみち256ビットAVX対応でCell以上の性能を発揮するSandy Bridgeに対抗する術がないAMDは愚か。
まで読んだ
というか、GMAが圧倒的なシェアを得るのに性能が強みになったことは一度たりとも無いわけで。 オフィス用途にはG41レベルですらオーバースペック過ぎるが、 一方で世の中にはアホみたいにCPUスペック要求する業務アプリがあるわけだ。 どのみちグラフィック性能が必要な人はGMAで満足するわけないわけで、 それこそディスクリートGPUを増設しろって話になる罠。 CPU側をキャッシュ容量もSIMD性能も半分の「K10.5のL3削除版」に落としてまで Llanoの内蔵GPUを使いたい人は相当変わり者だと思うぞ。
256ビットAVX 果たしてどれくらい利用されるのかなあ
鼻くその人はいつも頓珍漢なことを言ってるけどわざとなん?
そうやって新レジスタが創設されるたびに、タスクスイッチのコストがどんどん大きくなっていく 正直かんべんしてほしい
>>827 ノートしか持ってない人でゲームもやりたい人は、潜在敵に相当な数に昇るだろう
ゲームもできて困る人はだれ一人いないと思う
>>831 ノートもディスクリートでいいじゃん。
ゲームも貧弱なノートでできるようなローエンド側のほうが幅が広がってる
まさかとは思うがAthlon64 X2とCore 2 DuoでSIMDユニットのスループット差が見事に現れたの忘れてないよな?
まさかLlanoがノートに載るとか思ってないよな?
ノートのプラットフォームはDenubeだろ?しっかりしろよ。
ロードマップ見てきた。 載るのね。ごめん。 デスクトップからノートまで同じようにアーキ刷新するのにノートは周回遅れなのね。
アム厨火病しすぎwww
ディスクリートGPUだと、省電力機構を細かく駆動させることが難しくなる CPUとGPUのIdle状態監視を同時に、高い時分割で行いたいわけで
>>767 整数演算が4命令/サイクル想定だとすれば
ますますパイプラインの構成が分からんな・・・
LlanoはK10コアなのでALUとAGUが3つずつ対称だが
BobcatはALU2つに対しロード1つ、ストア1つと分離している
ところがBulldozerだけわざわざ公表しなかったということは
これらとはまた違った構成を採用している可能性が高いし
PCゲームはポストCrysis級のヘビー路線と韓国産MMOみたいなカジュアル路線で二極化してるから
ノートでゲームやろうって人はそれこそディスクリートか、DX9クラスで十分かのどっちかだと思う。
ちなみにネットブックでも出来るクラスのローエンドゲームが一番売上げ伸びてるそうだ。
>>835 バッテリーで3Dネトゲやるの?
電源に応じて内蔵とディスクリートを切り替える機構付ければ十分でしょ。
>>838 >PCゲームはポストCrysis級のヘビー路線と韓国産MMOみたいなカジュアル路線で二極化してるから
>ノートでゲームやろうって人はそれこそディスクリートか、DX9クラスで十分かのどっちかだと思う。
つまり、「Intelの十万クラスのゲームマシン(GeForceの最下位モデルとか付いているやつ)より
ずっと速いゲームマシンがたったの6,7万で!」とかってアピールできるわけで。
場合によっては、ずっとチップサイズの小さい Llanoのほうが
「プレミアム製品」として高く売れるかもしれない。
それに、PCゲーで最強の売上、利益を誇っているのはWoWだよ。
つーか、Sandy Bridgeの内蔵GMAの性能に対して満場一致で期待外なのな。 クロックは倍以上になるしトランジスタ数も増える、L3にアクセス出来る なによりイスラエルチームが手を入れるので大穴くらいにしとこうや。
ララビがいけそうだったらGMAにも期待する
> Intelの十万クラスのゲームマシン(GeForceの最下位モデルとか付いているやつ)より > ずっと速いゲームマシン Phenom IIのキャッシュ容量を半分にするとNehalemより世代の進んだSandy Bridgeより速くなる 理屈を教えて下さいな
>>842 もちろんゲーム性能的な意味でだよ。
今だって、デスクトップ比で超ショボイGPUが
載った製品にすごいプレミアム価格が付いてるじゃん。
ああいうのを総取りできるかもよ、って。
画面が高解像度化してきてるからGPUの性能は高い方がいいな
まあ、Sandy BridgeとLlanoのGPUは同程度の面積だし、 32nmは面積当たりトランジスタ数はIntelのほうが多いし、 次のGMAは1GHz以上駆動だとかいうし、なんともいえまへんな。
ディスクリートなんて余分な金銭発生するじゃん 同じ価格で倍以上のゲーム性能 カジュアルゲーマーなら十分
>>845 32nm同士だとIBMグループの方がSRAM面積小さいけどね
848 :
Socket774 :2009/11/18(水) 01:09:51 ID:anBjiZBy
LlanoはPropusと同程度のサイズだから160mm2前後、サンディはネハレムと同サイズの240mm2前後でコストが倍以上違う。 CPUベンチの最高性能は少し劣るけど、総合ベンチは互換以上だろうね。
850 :
Socket774 :2009/11/18(水) 01:14:33 ID:anBjiZBy
>>845 トランジスタ数はAMDが多かったはず。
少なくともGPUはイスラエルキャッシュレベルの化け物効率。
CPU側のキャッシュが削られてる分メモリ帯域を消費すると思うんだ。
まして、なけなしのL2キャッシュを使ってGPU側の帯域をセーブできるわけでも無し
どんなマジックで倍の性能が出せるのか逆に期待してしまいますよ。
>>848 たぶんLlanoの当て馬は2コア4スレッド+GMAだと思う。
>>850 低クロックなんだからGPUのトランジスタ密度が高いのは当たり前だが。
853 :
Socket774 :2009/11/18(水) 01:24:26 ID:anBjiZBy
>>849 リャノは2万円以下、サンディは3万円以上だから値段が重なることはないだろう。
それと今のインテルオンボの2倍とHD4650じゃ倍以上の性能差があるよ。
それ以前にDX11未対応でドライバもイマイチだから相手にならない。
ノートpcのゲーム性能なんてgpuで決まってしまうだろう 同じ価格で比べると尚更 i7ノートなんて買う層は当初そんなにいないだろ 20万近くするんじゃね?
i7ノートなんて出始め1年くらいは、今のクワッドcpuノートみたいな位置づけだろ 普及するまで結構かかるんじゃね?
つかノートPCならAESアクセラレータのほうが存在大きいと思うけどな。 GPUじゃどうにもならん。128ビットじゃ並列っていうほど並列度高くないし。 つか、なんでノートが「i7」になってるんだ? 当分メインストリームは2コア(4スレッド)だろ
インテルのオンボが嫌いなわけではないが、性能が悪いのが どうにも許せない。オンボで7600GTぐらいの性能があったら、 文句も言わないんだけどなぁ。
ノート用は2コアでもi7 リネーム商法を上回る売り方
実はi740の系譜を継ぐという噂 ・Vertex Shaderがソフト(CPU)処理 ・なおかつFSB経由でデータやりとり あるいみCPUとくっつけ甲斐がある。
基地外が粘着して糞スレになっちゃったなココ・・
1年後 10万のノートでなんとかこのゲーム遊べました (AMD) 15万円ノートでも、全くこのゲームが立ち上がりません (intel) ><
WestmereベースのCULVで低価格帯を固めたIntelに隙は無かった
そもそもCeleronじゃないIntelのづあるコア積んだA4ノートなんて今でこそ6万程度で買えるのに 10万もかけて何するの?
ID:1G6YN+hdはIntelを叩けばAMDが優位になるとでも思ってるのかね?
「キャッシュ半分のPhenom II X4はSandy Bridgeの性能2倍!」(キリッ
キャッシュってなんであんなにダイサイズ取るんだろホント Power7のeDRAM技術ぱくれんもんかねAMD
868 :
Socket774 :2009/11/18(水) 02:25:17 ID:anBjiZBy
ゲフォの選択肢がなくなる来年以降のインテルはラデオンの重要な御得意様。 時にノートはAVXなんか直ぐに対応しないからDX11ラデは性能やマーケティング上重宝される。
869 :
,,・´∀`・,,)っ-○○○ :2009/11/18(水) 02:32:48 ID:r93Gw0lQ
GMAドライバのソフトウェアVertex Shaderが最も身近な最初のAVXアプリケーションになりそうだけどな
LlanoのPropusからの性能向上の要因は ・L2倍増 ・ステッピング変更による最適化 ・32nm化によるクロックアップ ・GPGPU ぐらいかな? CPUは正直「Sandy Bridgeから絶望的な差はつけられない」レベルだと思う GPUは逆に「Sandy Bridgeにかなりの差をつけられる」レベル 要するに今とあんまり変わらずこのセグメントでシェアが急伸することもない、ってのが現実的だと思う
871 :
Socket774 :2009/11/18(水) 02:34:56 ID:anBjiZBy
ちなみにソフトのAVXやDXCSはどちらが進むだろうか。 ハイエンドのみ対応のAVX、オンボすら対応するDXCSで、シェア的にはDXCSが優位ぽいけど。
APUったってノートとかローエンドPCにしかうまみがないから あんまり興味ないんだよな。
レジスタを256bitに拡張するより、従来の128bitのSIMD演算を1/2サイクルとか 1/4サイクルとかで実行してスループットだせないもんなの? Pen4のALUみたいなの
874 :
,,・´∀`・,,)っ-○○○ :2009/11/18(水) 02:42:30 ID:r93Gw0lQ
というかDX11はGMAですら対応しますが・・・ (というよりCPU処理の比重を上げる気がする) ヒント:オンボ程度の性能でいいならCompute ShaderはCPU処理でも十分 AVXは透過的に使われる Pentium 4からCore 2にしてからGMAの性能が上がったと思ったら それがソフトウェアVertex Shaderです
>>873 ATIの人にも同じこと言ってくれませんか?
並列度高すぎて使いづらいです><
オンボ程度の性能でいいならとか言われても そのオンボGPUの性能が今までより飛躍的に上がるんだから。
キャッシュ半分に削られたPhenom IIとDDR3メモリメモリの帯域取り合うことでの性能向上を「飛躍」というのなら それは私は論理の飛躍と解釈する
878 :
Socket774 :2009/11/18(水) 03:03:48 ID:anBjiZBy
つまり、リャノのDX11ネイティブ対応のCSと、サンディのAVXによるソフトDXCSの比較になるのかな。 まあ価格帯がかなり違うから直接比較出来ないけど。 仮に価格が3万円や消費電力95Wで統一したらどうなるだろうか。リャノは3G+HD4650、サンディは2.6G+G45の倍位になるかな。
キャッシュが倍になったAthlonIIと考えるんだ!
Sandyはもっと高クロックで出ると思うよ
881 :
Socket774 :2009/11/18(水) 03:11:24 ID:anBjiZBy
GPUに直結で64bitGDDR5で128MのLFBを付けるとか出来たら最高なんだがな。
Sandyのコア比較を見てる限りでは、面積ではWestmereとそんなに変わらないんだよなあ だから性能向上は考えにくい アンコア部での性能向上がどこまでなのかわからないけどね
>>881 敢えて逆に考えてほしい。
もし性能良かったら上位製品(Bulldozer)なんて売れないでしょ。
お互いに帯域取り合って性能殺しあうくらいが丁度いい、というか
へんにボトルネック解消しようとしたらコスト高くなりすぎるのでは?
ノート向けで性能引き出すにはDDR3 SO-DIMMの1600MHz 2枚が必要って時点で価格的には不確定要素だし。
>>883 GPU側はそんなに弄ること無いのでは?
AVX世代では浮動小数演算能力は4コアでもCellに匹敵するんだから
CellよろしくソフトウェアVertex Shaderの使い甲斐はあると思うけどね。
CPUのL3キャッシュ経由でデータやり取りできるようにするんだから使わない手は無い。
そういえば面白い情報。
Intel C++ CompilerではCVT16相当、、すなわちhalf floatの変換を行う組み込み関数が
ソフト的に提供されている。
これ一般的にはグラフィック向けだよね。
このへんはGMAを使うミドルウェアの開発者向けかなと思ったが。
なんかこのへんはLarrabeeとは別のGPUプランが見え隠れする。
(LarrabeeはGPUに見せかけてスパコンプロセッサだし)
>>865 1年後6万pcで3dゲームできるAMDと3dゲームできないintelならAMDが優位になると思うぞ
露骨な違法商売も遣り辛くなるだろうし
ゲーム(笑) 企業ユーザーならAESアクセラレータで快適にソフトVPNできるほうを選ぶかも
どうせゲーミングノートならGPU別に積むんだからIntel CPUにモバラデ積んだの買えば良いじゃねーかめんどくせぇ
>>887 6万では無理だろw
東南アジアはじめ世界での売れ筋はそんなもんだろ
東南アジア(笑) AVXのプログラミングマニュアルに プロセッサによってはAVXをサポートしてるがAESをサポートしない場合があるので両方見てね 的なこと書いてあるが、それどう見てもBulldozerのことだよな BitLockerなんかのAESアクセラレーションは少なくとも今後3年はAMDプラットフォームでは使えない・・かもね
BRICS全体で日本の10倍のcpuがはけそうだ
Netbookがな。
Atomなんであんな異常に安く作れるの?w 後工程どうやってコスト下げてんだろ
以前設計した回路の再利用。 (インテルにとって)いらない部分を取り除く事によるサイズの縮小。 小さい回路なので、1ウェハ辺りに大量のチップの元ができる。 薄利多売
いや、多売だけど薄利ではなかったはずでしょ それに一定以下のダイサイズならダイ単価よりパッケージングが相対的に高くつくのではないかと
23レスきもすぎ
団子が言いたかったことは、カジュアルゲーこそLlanoが適してるね adobeがAMDに最適化したし ワンチップによるGPGPU性能にも期待がもてるね ってことだな
atomとか低価格ノートが売れ筋ってことは性能なんてあまり重要視されてないってことだよな
Atomの低消費電力は性能の範疇に入るかと。 あとは小ダイと先端プロセスの組み合わせによる破壊的な価格と、Intelというブランド。 BobcatやLlanoを求める層は確かにあるだろうが Atomのように新しい層を開拓してヒット商品を生み出すような インパクトは感じない。
Atomを求める層=Bobcat、Pineview、ION(2) LlanoはHPのdv2のようなものを求める層?
何れにせよ2011年の話でここまで妄想できる馬鹿には脱帽
AtomよりAthlonNeoのほうが安いし 純RISCのほうが省電力だし ネット程度の運用にWindows要るのかと Intel製品じゃなきゃニッチにしかならないとしか思えないAtom それに続こうってのがBob
ARM最強ですねわかります
年間40億個は確かに最強
価格と省電力を「両立」したから偉いのであって、 いくら安くてもTDP15WのAthlon NeoはAthlonのリネーム品・見切処分品としての 扱いしか受けられないわけです。
一般人はリネームがどうとかなんてわかりません
Intelだから偉いんです
atomが省電力でパフォーマンス面でも優秀というのはいいんだが、 その優秀なCPUを使うためにはCPUより格段に大消費電力で発熱がでかいチップセットが必要というのはどうよ? 冗談にもなれないw
Atomの省電力を売りにしているのはZシリーズ。 NetbookやNettopで採用されているNや無印はただ安いだけしか売りがない。 次のAtomでNorthBridgeがCPUに統合されちゃうから多少マシになるけど。
Sandy Bridgeが4コアしかないが如く話が進んでるな…
Tegra + Windows Embedded CE 6.0 の超ミニノートが理想。しかし日本じゃ売ってない。 超ミニって言っているけれど、シグマリオン位がぴったりね。 Atom よりも長時間稼働できるし。ARMも良いCPUだよ。
>>907 atomの純パフォーマンス知ったら愕然とするよ
糞過ぎてw intel信者御用達のπだと104M 90秒台w
K7にも余裕で勝てないw
Atom の利点は低消費電力CPUで、小さいボディのPC作れて x86 アプリケーションが使える。 というのが利点だけれど、それ以上でもそれ以下でもない。 誰も速いCPUと言ってないし 誰も他のチップが低消費電力って言ってないし そして案の定速いCPU出したと思うと消費電力が増加。それでスマートフォンとか家電とか進出しようとしてるし。 いやな意味でたまらんねぇ。
>>912 家電はバッテリー駆動でもないし、それほど消費電力に対する要求厳しくないんじゃない?
それに今はどうだか知らないが、オリジナルのFusion構想でのBobcatは
(Atomと同じ様に)テレビ・携帯機器もターゲットにしてた。
AMD大好きなのは分かるが、Atomを貶める言葉はそのままBobcatに返ってくるわけで。
つまり、製品が出てない今うだうだ言ってもしょうがない。
モノがないのもそうだけど、Bobcatはどんな技術で(割り切りで)1W以下を達成するのか まだよくわからんのよね。
Bobcatは1W以下も可能ってスライドに書いてあったから、 スマートフォン目指しているZのAtom系ほどじゃなくても、 それなりに消費電力が低いのが出るんじゃないの?
遅れた分、Atomの市場での評価を見極めた上での現実的な仕様に 出来たってことかね。
つか2命令/cycのアウトオブオーダーだから 消費電力はAtomより高くなるし難しいだろう SMTが無いのもちょっとしんどい
>>917 1wでatomより高性能なx86なんてとても簡単な気がする
それくらいatomの性能は低い 10年近く前の演算性能かも
スゴいこと思いついた。
>>918 が開発して売り出せば大儲けできんじゃね?
Bobcatは現行AtomとCULVの間狙ってるんだろうけど、
2011年にはAtomもSaltwellコアになるし、結局似たようなレンジに収まる気がする
シングルスレッドの整数演算はBobcatの方が速いだろうけど
> 1wでatomより高性能なx86 それは、OoOで低クロック低電圧な方向のチップ設計にすれば確かに可能ではあろう しかし、OoOによってダイサイズが大きくなるというコストアップのトレードオフを背負う事になる Intelの判断がなぜPenryn-LではなくAtomなのか、と
変なものを新しく開発したかったから
intelのAtomとAMDのBobcatで狙っている市場が違うんじゃないの? intelは本気でスマートフォンにx86を入れたいと思っているけど、 AMDはそこまで小さい機器は、少なくとも今のところ狙っていないんじゃないだろうか。
>>911 要するにBobcat作る前にK7ベースのGeodeGXを作っておけばAtomにデカイ顔される事はなかったってことかね。
そのK7コアは4Wなり1WなりっていうTDP枠で、何Vで何クロック回るんですかっつうのに答えてもらわないとね
AthlonXPを45nmで作り直したら、ネットブック用の いいCPUになると思うんだけどね。
初代Power nowじゃ今のネットブックでは劣ってる方だろう。 性能でも消費電力でもなくその辺が問題ではないかね。素性はよくてもモダンじゃない。 一番の理由は「AMDにそんな余裕はなかった」って事だろうが。
SocketA対応のPhenomX4を出したら、馬鹿売れ確定 939でもいい
>>920 確かにダイは増えるだろうが、現状のatomでさえダイは余っている。そのためのGPU混載でもある。
ダイ面積は、I/Oのための接続部分である程度以上には小さくしても効果が薄い。
それならインオーダーじゃなくアウトオブオーダーにしたほうがよい。
むろんGPUを混載するならPineViewより大きくなるかもしれないけれど、
性能のよいGPUを混載できるAMDの強みがあり、ノースブリッジやサウスまで統合した1チップ統合へと進めば、
ノースやサウスを作らなくてよくなるわけだから、製造ラインはむしろ余裕が出てくるだろう。
IntelはSoCを狙っているので絶対性能を高くしてくることはあんまり考えられず、
せいぜいクロックアップしたAtomになるくらいだろうから、
Bobcatはネットブックや新興国向け需要ではかなり競争力が高いものになるのではないかと予想
ダイがあまってるからアウトオブオーダにするというか デコーダが糞熱くなって熱設計的にめんどくさいからインオーダにしたんじゃないのか>Atom
>>929 あーなるほどなぁ
そんだけ今のx86CPUがデコーダーに頼りまくりなわけだねえ
atomの場合、商業的な理由でクロックは控えめだ。
(うちのはファンレスで2.4Ghzで電圧デフォで安定して動いておるし)
もしアウトオブオーダーだったら50%もクロックアップはできなかったろうね。
特にファンレスじゃ。デコーダーがホットスポットになって。
俺はbobcatのデコーダーはそんなにIPCが高くない=高度な最適化をしない
と予想してみる。
そうすりゃ計算量、すなわちゲートの量、すなわち発熱とか押さえられるのではなかろうか。
もしさほど高度なデコードを行わなくても、それでもインオーダーよりはぜんぜん性能が高いだろうとも思う。
定量的な数値は素人だからわかんないが。
プロセス技術、AMDもHigh-Kを導入するのな。
High-Kすごいからうまくいきゃ冷えるだろうなぁきっと。
IPCじゃなくてILPのまちがいっすねwサーセンw
http://pc.watch.impress.co.jp/docs/column/kaigai/20091112_328392.html >>Bobcatは、2命令発行2命令リタイヤ/サイクルのOut-of-Order実行コアで、パフォーマンスは相対的に同クロックのAtomより高いと推定される。
ここみると、2命令発効(2 issue)ってある。
アウトオブオーダー自体、演算器のリソースを有効活用する仕組みでもあるので、
AtomのSMTの目指すところと、結果は似ているっちゃ似ている。
Atomの場合OSから2コアとして見えるってことは2命令をOSが発効するわけだし。
OSというかプログラムがその辺を最適化すればOKなAtomはまさに組み込みでは効率がよくなんだろう。
一方bobcatはOoOで2命令同時発行するので、OS、プログラムは普通に命令していけば、2命令同時にできるだけ実行してくれると…
なんかOoOでなおかつSMTなんてことがあれば、それこそすごく複雑そうだな。
ブロック図を見ると整数のユニットは4つ(2セット)あって浮動小数は2つ(1セット)あるようだ。
3命令とか4命令とかを処理しなくて良い分、やっぱりデコーダーはそんな複雑ではないのだろうと思ったが、詳しい人おらんかな。
LIanoはシュリンクとhigh-kで5Ghz位で出してきそうだ。 今でも3.4Gで出せているんだから1.5倍程度余裕だろう。 それでもsandy対抗は厳しいだろうが。
そろそろDRAM2GBくらい載らないでしょうか?
>>933 リークバーストをどうするのかが興味深いところだと思う。
>>933 微細化でクロック上がるっていつの時代からのタイムトラベラーかと小一時間
>>933 精々4GHz前後だろう
今時MAそのままでシュリンク、しかも初出プロセスが数世代前じゃろくに伸びんよ
あくまでSandy対抗の本命はBulldozerしょ LlanoはNehalemのグレードでいうi5相当の対抗で 基本65wあたりを中心に展開しそう まぁSandyのパフォーマンスしだいだろうけど
4コアなのにキャッシュ4MBしかないCPU買うおとこのひとって
4MBってPhenomクラシックと同等だから、過度な期待は出来ないわな
クラシックPhenomにHD4650がくっついたと思えばいいのか
で、メモリはUMA
Bulldozerはどうやって4命令を達成するつもりなんだろうか 正攻法でやったら消費電力と熱がとんでもないことになりそうだが
デコーダから見たら4wayを2スレッドで埋めるから それほどILP追求しなくていいとかじゃね? でもシングルスレッドの時はどうするんだろうな
4way×2スレッドだという話のような。 俄には信じがたいけど。 デコーダだけでなく整数演算パイプも2スレッドで共有して、 通常ケースで2〜3way×2スレッド、 ベストケースで4way/スレッドだ (そのときは相方スレッドは犠牲になる)というなら トランジスタを増やさずにシングルスレッド性能を最大化しつつ マルチスレッド時のスループットも追求する 理想的なクラスタ化アーキテクチャだと思うけど そういうわけでもないようだし。
L1別なのに2スレッドで整数パイプ共有なんかしたらむしろ性能落ちる
むしろ分ける、ってのが最大の特徴だろ ただ4wayの内訳は何かしら工夫あるだろうね 今までのようなALUとAGU対称じゃ無理そう
つーことは4way2スレッドが1コアで、これがデュアルとか クアッドで展開されると見ていいのかな?
L1L2L3キャッシュとあるけど、L0.5キャッシュってないのか レジスタと同一の性能持った1KBキャッシュ
ストアバッファ
より正確に言うとストア&フォワードバッファ
っレジスタウィンドウ 過去には性能向上に貢献した時代もあった 今はおすすめはしない
今のx86のストア&フォワードバッファって レジスタどころかL1キャッシュ並みのダイ面積食ってるぞ まあトランジスタ密度も大きく違うので容量はそんなに無いが
ふむう、LSUのネックほっとくわけねーか、なるほど …x64って、64bit拡張だけしてレジスタ追加せんでも良かったんじゃねーかなw
REXプリフィクスの是非はともかくとして、 8本は明らかに足らない
アドレッシングの必要性からEIPとESP/EBPは64bitに せざるを得ない。また、アドレス演算の必要性がある ので整数レジスタも64bitにせざるを得ない。 結局アドレスを64bitにしたらレジスタも全部64bitにする 必要がある。
XMMレジスタはレジスタリネームがあるから論理8本でもそんなに困ることはないが、 メモリアクセス用にポインタ+添字用変数は割と欲しい。 r8〜r15使うと多次元配列のアクセスがだいぶ楽になる。 行列積とかやるならSIMDレジスタもっと欲しいわ。 ロード・ストアだってゼロコストじゃないし
死ね
960 :
Socket774 :2009/11/20(金) 09:26:05 ID:+0yZyYPF
>>940 K10のL2 1MはL2 512k+L3 6Mに匹敵するのはAthlonIIが証明した。
それに一般アプリなら512k、ゲームでも1Mで充分だから問題ない。
そもそも鯖向けやマルチプロセッサは考慮していないから低性能な共有L3はいらない。
そういう意味じゃクアッドが要らないよね
963 :
Socket774 :2009/11/20(金) 11:47:21 ID:+0yZyYPF
いや、クアッドコアというか4スレッドまでは体感出来る場面も多くなってきたから必要。 8スレッドは活用出来るのがエンコとレンダリングだけだから当分いらない。
たいかんwww出来るかはともかくとして、 クアッドを生かす局面がある人は、L3キャッシュもケチるべきではないと思う。
>>923 Geodeって、モバイルAthlonXP-MのNXを除いた最高性能のLX900でも、何世代も前の
130nmプロセスで作ってんだよなぁ…
素人考えだが、これを65nm辺りのプロセスで、デュアルコア出来るように再設計して
グラフィックもATIからそこそこの性能の適当コアを摘まんで来て乗せときゃ
atom相手になら、そこそこ行けそうな気がするんだけど、
そんな簡単なもんじゃないんだろうな。ヤッパり…
つか、Geodeの開発チームって、今、何やってんの?
つーか、Windowsのタスクマネージャーからプロセス見ると あれだけ複数のプログラムが同時起動されてるなら、 コア数なんて、あればあるだけ使うんじゃないの?と思うが・・・
大半がCPUにそれなりに負荷かけて同時に動いてないからでは?
大体は1コアの1%くらいしか使わないプロセスなんだろ。
>>966 起動されているだけで、コンピュータのプロセスは
大半の時間をidle状態で過ごす
雑魚プロセス用に小さいコアを詰め込むとか…
動作している時間のほとんどがIdleだからといって、 そのプロセスでは処理速度が必要ないって事にはならんだろォて
>>971 複数スレッドが「同時に」RUN状態になることは意外に少ない、という事
人間から見て動作中のはずのスレッドすら、
実はI/O待ち(CPUに比べるとストレージはとてつもなく遅い)や
排他のためのロック待ちでスカスカだったりする。
高速で休めと言うことかね?
>>965 LXは根本サイリックスだからな。
むしろNXあたりをDDR2対応・SSE4追加・4コアにして45nmで作ってだな
>>966 マルチコア化の目的はCPU使用率を下げることじゃない
アベレージとピークの両立 出来るのか?
とにかくシングルスレッド性能を必要とする1本のスレッドと、 その他大勢っていう状況が、PC時間の大半を占めている …結局、最適解はターボブーストに行き着いてしまう
>>974 「Cyrix ≠Athlon XP(K7) ≠ K8 ≠ K10」ですね。わかります。
Intel ≠C3 ≠ C7 ≠ Nano(Isaiah) とかいきなり呟くとかどうなん
デスクトップやノートPCでは、パフォーマンスコアを1-2個と Atomのような小さなコアを複数載せる非対称マルチコアが トランジスタや電力効率から見て最適なように思える。 OSの対応が必要になってしまう上に、マルチコアを前提としたアプリケーション でないと意味がなく、サーバ向けでもないとくれば、誰も作らないのも無理はないが。
市場の中心はサーバや携帯機器に移り、 デスクトップPC向けパフォーマンスCPUが進化の先頭から外れてしまった、 という構図が根底にあるのか。
PC向けが進化の先頭だったのってどれのことよ
電卓用4004から続くマイクロプロセッサの系譜だよ。 8088がIBM PCに採用され、玩具だと言われながらも80486でワークステーションに追いつき、 進化を遂げる内にサーバにまで使用されるようになった……のはいいが、 同時に主たる用途がPCからサーバ向けに移ってしまった。 NehalemもBulldozerもサーバ上のプログラムをどううまく実行するかに 設計の主眼が置かれている。個人用PCの性能向上はそのおこぼれに過ぎない。
商業的なメジャーさとかコストパフォーマンスとかと ”進化”の先頭とは違うこと CPUを進化させた多数のアイデアのうち、他のアーキテクチャに 先んじてx86に採用されたアイデアが何割あるんだ
985 :
Socket774 :2009/11/21(土) 18:05:20 ID:aaPHx07G
bulldozerはいつ発売?
結局はX86に縛られる運命だな
ところで 「Bobcatはカスタム回路を使わずに、再利用しやすいように高レベル言語で書かれている。」 ってどういう意味?
最近はハードの設計にも、まずCを拡張した言語とかを使って挙動を記述する。 そこからRTL→物理設計と行くけど、普通のCPUはコンピュータのツールとか使わず、人の手でバリバリの最適化をする。 けどBobcatは単体のCPUだけじゃなくて、他の周辺回路をSoCにしたいろんな種類のチップを作る気だから、 バリバリの最適化をしてるとむしろ使いづらい ってことだと思う
ソフトコアのメリットは、製造プロセスに縛られないということじゃないかな? つまりSOIとバルクの両方に展開できるようにしていると。 あるいはTSMCでの製造かもしれないけど。
Bobcatだけ65nm、45nm、32nmのどれでもない色で塗られていたね、ロードマップだと。 噂にあった通り40nmバルクで作られるのだろうか。
元麻布によると28nmだそうで 兄貴のプレゼンじゃ40nmになってたけどな
>>980 コアの並びを仮想化、アクティブ時間の長いスレッドを検出して、
でかくて速い物理CPU0に割り当てる…っていうのをハードウェア側だけでできないもんだろうか
ハードウェアは論理スレッドがわからない。動いているスレッドのコア割り当てを 切り替えるのは、L1キャッシュの総入れ替えを含めとてもコストが高い。 コア割り当てはあくまでkernelの仕事。
BulldozerもFPUを2コアが共有するのでスレッドの割り当てには配慮が必要になる はずだが、技術情報の公開とOSの対応はどのタイミングになるんだろうか。 早めでないと(Linuxなら各ディストリビューションのメジャーリリース、 WindowsならSPに間に合わせないと)性能が出たり出なかったりのややこしいことになりそうだ。
そうなんかなぁ…例えば、コンテキストスイッチ発生(割り込み検出)時に プログラムカウンタ値を記憶しておいて、復帰した事をアバウトでもわかってれば、 アクティブ時間の予測ができないもんだろか んで、明らかにそのスレッドだけビジーが連続しているならCPU0に投げる 仮想CPUの貸し出しはhalt命令からの復帰、返却はhalt命令時に
そもそもFPUってそんなにビジーにさせ続けることが出来るモンなのかな。
MMXと相乗りで登場したくらいだしね>FPU 確かありえない数字で呼び出すんだっけ…
共有といっても128bitx2だろ? 普通のsseならバッティングも糞もかんけいないんじゃ・・・
素人の意見だと、ほぼすべて共有するSMTのほうが 効率が高そうな気が
素人の考えでも、それはないだろ。むしろ実行コアまで共有してよく複数のスレッドが動くもんだ、とさえ思う。 仕組みはわかるけど、動作中はややっこしいことになってるんだろうなと思う
1001 :
1001 :
Over 1000 Thread