CPUアーキテクチャについて語れ 20

このエントリーをはてなブックマークに追加
1Socket774
おいお前らいい加減、無能なAMD房・Intel房・GKに振りまわされず、
エンコ時間がどうとかPIがどうとかPS3がどうとかじゃなく、
CPUコアのアーキテクチャについて語りましょう。

x86/RISC/CISC/スーパースカラ/VLIW/MIMD/SIMD
等について語ってもよし、
各SPUの汎用レジスタ128本のCell B.E.マンセー、
x86なワンチップスパコンのLarrabeeマンセー、
時代はGPGPUだ!、Sunは漢の浪漫!、龍芯(笑)、
昔々8086の時代は(以下略・・・等もよし。

さあ、不毛な争いを止めてCPUアーキテクチャについて語ろう!

前スレ
CPUアーキテクチャについて語れ 19
http://hibari.2ch.net/test/read.cgi/jisaku/1305200489/
2Socket774:2011/10/09(日) 08:34:43.13 ID:pd6B4c1l
>>1のつ

パッケージはDIPで頼むわ
1000ピン超のDual inline packageは今にも動き出しそうでかっこいいぞ
3Socket774:2011/10/09(日) 11:20:27.88 ID:RmdgPw4r
>>1乙。

ヘテロジニアスマルチコアマンセー。
4竹島は日本領土:2011/10/09(日) 17:31:28.47 ID:ZNb+V1Ri
Qualcomm's New Snapdragon S4: MSM8960 & Krait Architecture Explored
http://www.anandtech.com/show/4940/qualcomm-new-snapdragon-s4-msm8960-krait-architecture
5Socket774:2011/10/12(水) 23:21:04.12 ID:KaJQiQDm
492: Socket774 [sage] 2011/10/12(水) 15:24:37.43 ID:rgns2cVw (8)
国内レビュー

AMD FXシリーズ最上位「FX-8150」ベンチマーク
http://pc.watch.impress.co.jp/docs/topic/feature/20111012_483000.html
遂に姿を現した8コアCPU「AMD FX」はCPUの覇権を握れるか?
http://ascii.jp/elem/000/000/641/641601/
Bulldozerは気難しい──AMDの新CPUアーキテクチャ“Zambezi”を試す
http://plusd.itmedia.co.jp/pcuser/articles/1110/12/news041.html
「FX-8150」レビュー(前編)。ついに発進するBulldozer世代のCPU「Zambezi」はゲーマーの福音となるか
http://www.4gamer.net/games/100/G010000/20111012001/
Bulldozer世代の8コアCPU「AMD FX」"Zambezi"徹底攻略 - 性能ベンチマーク編
http://journal.mycom.co.jp/special/2011/zambezi/index.html
6,,・´∀`・,,)っ-○○○:2011/10/14(金) 01:06:02.24 ID:yly8pXmE
デニス・リッチー死去・・・
7Socket774:2011/10/15(土) 00:37:55.49 ID:+GoXuSGa
この記事を読んでて今更気付いたんだけどBulldozerのトランジスタ数が20億っておかしくない?

ttp://www.xbitlabs.com/news/cpu/display/20111013232215_Ex_AMD_Engineer_Explains_Bulldozer_Fiasco.html
>AMD publicly said that each Bulldozer dual-core CPU module with 2MB unified L2 cache contains 213 million transistors and is 30.9mm2 large.
(中略)
>As a result, all four CPU modules with L2 cache within Zambezi/Orochi processor consist of 852 million of transistors and take 123.6mm2 of die space.
>Assuming that 8MB of L3 cache (6 bits per cell) consist of 405 million of transistors,
> it leaves around whopping 800 million of transistors to various input/output interfaces, dual-channel DDR3 memory controller as well as various logic and routing inside the chip.

Tukwilaの総トランジスタ数が約20億なんだけど、そのうちの大部分に当たる14.2億は24MBのL3キャッシュに費やされてるんだよね。
一般にアンコアと呼ばれる部分(12ポートのクロスバ、2MBのディレクトリキャッシュ、QPIとFBDのI/Fとコントローラー)のトランジスタ数はわずか1.95億しかない。
粗っぽく仕様を比較するとこんな感じで、明らかにTukwilaのアンコアはBulldozerよりリッチなのでBulldozerがTukwilaの4倍以上もここにトランジスタを費やしてるとは思えないんだが。
Bulldozer … 4M, On-Chip-Memory 16MB(L3$ 8MB), HT 4ch, DDR3 2ch
Tukwila … 4C, On-Chip-Memory 30MB(L3$ 24MB) QPI full*4 + half*2, FBD 4ch,, Directory Cache 1MB*2
8Socket774:2011/10/15(土) 01:16:53.86 ID:+GoXuSGa
あ、ごめん。記事をちゃんと読まずに脊髄反射で書きこみした。xbitもBulldozerの20億は多すぎるって言ってるのね。(そこから設計に不備がある可能性を指摘。)
9Socket774:2011/10/15(土) 03:56:38.28 ID:NhgPmXsG
なんか面白い話が出てきたな
http://northwood.blog60.fc2.com/blog-entry-5351.html
Bulldozerが遅いのは手作業をやめて自動設計ツールに頼ったのが原因らしい
10Socket774:2011/10/15(土) 04:47:59.92 ID:+GoXuSGa
xbitの作文をスルーして読んだらアンコアが悪いとか、どうもそういう単純な話じゃなさそうだな。
AMDが本格的にファブレス企業へなってしまったような印象を受けた。
ttp://www.insideris.com/amd-spreads-propaganda-ex-employee-speaks-out/
Bulldzerは紙(企画書?)の上では素晴らしいチップだった。俺はBulldozerの物理設計が始まる前〜物理設計中の時期にAMDで働いてたんだ。
俺に言えるのはBulldozerはそれ自体の魅力も薄ければIntelに対する競争力も無いってこと。
(何故なら俺はAMDの設計手法が全く駄目だと確信しているから。)
俺がAMDで働いてた頃、Bulldozerに何が起きたかは語りたくもないんだが…

何が起きたかって言うと、経営陣はクロスエンジニアリングを決定したんだ。
これは手作業でのCPUの設計を止めてSoCの設計手法へ移行しろってことだった。
この結果、パフォーマンスやダイサイズや効率性について色々諦めなきゃならなかった。 (DECのところ省略)
今までIntelとAMDは少なくともクリティカルな部分については常に手作業で設計してきた。
だがそれは俺の退社前には変わっちまった。AMDは論理合成、フロアプラン、配線等の自動化ツールに頼り始めてたんだ。
俺はAMDを辞める前の数年間は設計フローの部署に居た。
そこでツールベンダの要望に応えて自動化ツールを使った加算器や乗算器などの試験的なデザインをしたよ。
ツールのパフォーマンスを引き出すために色々な手を講じたけど、毎度ツールから産まれる機能ブロックは、
手作業で設計したものと比べて2割大きくて2割遅い上にエレクトロマイグレーション等の問題を抱えた代物だった。

これが今のAMDの設計手法さ。さぞかし立派な物が出来るに違いないね。
11Socket774:2011/10/15(土) 05:39:33.95 ID:0EucyfqB
CPUアーキテクチャについて語れ 16
http://pc11.2ch.net/test/read.cgi/jisaku/1253517890/

587 名前:MACオタ[sage] 投稿日:2010/02/14(日) 03:24:04 ID:Wj71GeXX [1/17]
(略)
- The only bad thing is that some guys I know at AMD say that Bulldozer is
 not really all that great a product, but is shipping just because AMD
 needs a model refresh. "Sometimes you just gotta ship what you got."
 でもなぁ… AMDのツレが言うにはAMDは製品サイクルに切迫して製品化
 してくるらしいんだよな。「何でもいいから今出来てるのを出さなきゃいけない
 時もあるんだよ」って。


ここら辺のことって自動配線の話だったのかな
12Socket774:2011/10/15(土) 05:58:36.78 ID:whlisdOx
まあベンチ結果があれだし
製造技術で差をつけられてるのに設計まで放棄したら
馬鹿でも結果が分かる
とはいえGPU統合まで考えるとまだまだAMDは捨てたもんじゃないが
13Socket774:2011/10/15(土) 06:36:54.16 ID:ulnDUdfZ
ほうほう、なかなか興味深い
設計で手抜きとは…こっから手作業で取り戻せるのかね
14Socket774:2011/10/15(土) 08:16:29.60 ID:HTRKNxsH
意図的に手を抜いたならまだいい。
クリティカルな部分すら自動化ツールに頼らなければならない状況になってなければいいが。
15Socket774:2011/10/15(土) 10:41:48.53 ID:+GoXuSGa
Hot Chips 22 - AMDの小型、低電力CPUコア「Bobcat」
ttp://journal.mycom.co.jp/articles/2010/09/02/hot_chips22_bobcat/index.html
>Bobcatの設計ターゲットの第一は電力、チップ面積が小さいこと、2番目が高い性能であるが、その次にカスタム設計のメモリなどの種類数を少なくして、
>プロセサコアの大部分を論理合成で作れるようにすること、そしてプロセスが変わっても容易に移行できることが挙げられている。
>
>Bobcatコアを使用する最初の製品である「Ontario」はTSMCの40nmプロセスを使うと見られているが、関係の深いGLOBALFOUNDRIESのプロセスへの移行も視野に入っていると思われる。

そしてAMDがBulldozerの後継コア(Piledriver)をTSMCでも生産するという噂が…
ttp://www.techpowerup.com/153567/AMD-to-Turn-to-TSMC-for-Bulldozer-Manufacturing.html
16Socket774:2011/10/15(土) 12:07:30.21 ID:sWyGoRQ1
K10あたりからあのクラスのCPUは本格的にAMDの開発リソースでは手に余るようになってきてるんだろうな

やっぱりK10のデコーダとかロードストアとかキャッシュ周りを順当に改良していった方が
良かった気がするんだがそれじゃ駄目なんかね?

K10ってノースブリッジのクロック上げるだけで性能豹変するらしいし
まだいけそうな気がするんだけどなぁ
17Socket774:2011/10/15(土) 12:10:10.02 ID:gWGsaGjK
xbit記事の手作業or自動設計という対立軸はどうなんだ?
ふつー自動設計ツール&人力カスタムで造り上げていくもんだろ。

長年のノウハウがあるTSMCと比べてGFから提供される
各種デザインキットがショボかった可能性はありそうだが・・・。
18Socket774:2011/10/15(土) 13:20:09.87 ID:72p6jp6o
>>17
失敗したのを確認してから出てくるような自称5年前までの元社員の投稿に
どれほど意味があるのかは、まあ読み手次第だが。
19Socket774:2011/10/15(土) 13:33:28.28 ID:+GoXuSGa
>>17
この人がAMDに勤めていたと思われる時期はまだFabが売却されてGFになってないのでGFのデザインキットは無関係。
ツールを購入してテストしていたというくだりからするとAMDは社内製ツールをある程度諦めたっぽい。

>>18
記事になったのは2日前だけど投稿自体は1年以上前のものだった。
ttp://forums.macrumors.com/showpost.php?p=9745462&postcount=612
Bobcatも同様な設計をされていることは知らなかったみたいだね。
20,,・´∀`・,,)っ-○○○:2011/10/16(日) 04:27:05.81 ID:arCmCIWG
ふつうは守秘義務で退職後5年間は口外してはいけないことになっている
21Socket774:2011/10/16(日) 04:27:51.80 ID:lKlxp30A
http://www.theinquirer.net/inquirer/news/2116600/intel-8nm-wont-exascale
このままのやり方では2018年に8nmまで行ってもエクサスケールのスパコンは出来ませんよ

http://www.theregister.co.uk/2011/10/14/intel_predicts_continued_life_for_moores_law/
ハイパフォーマンス向けCPUの上にDRAMを積層させるとCPUの熱でDRAMはまともに動きませんよ
(つまりDRAMは別に積層させ、それとCPUを繋ぐHMCのようなものが必要ですよってこと?)
22,,・´∀`・,,)っ-○○○:2011/10/16(日) 04:44:59.99 ID:arCmCIWG
> Bobcatも同様な設計をされていることは知らなかったみたいだね。
Atomより小さいのに性能がいいとかいいたいんだろうけど
CPUコア自体はAtomのほうが遙かに電力効率はいいんだぜ

N/Dシリーズが残念なのはチップセットがAtomに最適化されていないから。
23Socket774:2011/10/16(日) 05:24:40.78 ID:1J/5fE5h
>>21
後藤さんはIntelはDRAMの上にCPUを載せる方向を考えているって書いてたよ
24Socket774:2011/10/16(日) 09:20:07.18 ID:duuL/4ob
追加
AMDのデザイナーであるJerry Moenchが2004年のVLSIで「リソースの少ないAMDは自動化ツールに頼る必要があるのでK8とK9の配線層数は非常に多くなる。」という発言をしていたらしい。
ttp://arstechnica.com/civis/viewtopic.php?p=10607812#p10607812

>>22
AMDのトレンドがそうなりつつあったのかなと思っただけでそれ以外の意図はない。
25Socket774:2011/10/16(日) 10:01:55.99 ID:lKlxp30A
Bulldozerは11層
Bobcatは10層
>>24の話は今回の件に関しては関係無くね
昔からIntelの方が配線層は1,2層少なかったからそのことだと思うけど
26Socket774:2011/10/16(日) 10:07:58.41 ID:duuL/4ob
そして昔からIntelのキャッシュは速かった。
27Socket774:2011/10/16(日) 12:16:55.20 ID:XTNiHNmW
えっ?w
28Socket774:2011/10/16(日) 15:33:29.54 ID:NjkXCo1L
同じ自動化でもBobcatの方は目に見えるようなアンコアの無駄がないから
AMDから引き継いだGFの設計ツールの方がTSMCのより劣っているじゃないのか?
29Socket774:2011/10/16(日) 19:58:55.07 ID:inoe90w3
ボブはデュアルだから4M8Cのブルと比べてもな

アイドル見る限りGFの32nmは優秀っぽいからそこだけ救いかね
まぁ歩留まりはいつものAMDみたいだが
30Socket774:2011/10/16(日) 20:59:20.13 ID:NjkXCo1L
K8のデュアルの頃から同じアンコアの無駄あるから
31Socket774:2011/10/16(日) 21:24:59.36 ID:fCUXbMeg
>>23
後藤さんのIDFレポートで、CPUの上に載せる構想はフェイクだったと言ってる。

http://pc.watch.impress.co.jp/docs/news/event/20110920_478686.html
----
Intelは、これまでDRAMスタックの上にCPUを載せた構想図を示してきたが、それはフェイクで、
実際にはキューブメモリの共同開発を進めていたことがIDFで明らかになった。
32Socket774:2011/10/17(月) 01:28:09.67 ID:tXXGEmNb
つーことは>>21の方針ということだね。
33Socket774:2011/10/17(月) 12:45:22.65 ID:Qb1Z2fwV
>>31
スカイネット…
34Socket774:2011/10/17(月) 23:33:58.98 ID:oiNLt3WA
>>31
インテルが忍者プログラマなどと言うかww
http://pc.watch.impress.co.jp/img/pcw/docs/478/686/16.jpg
35Socket774:2011/10/17(月) 23:43:42.05 ID:tXXGEmNb
>>34
これ、何度見ても吹くw
36Socket774:2011/10/21(金) 10:54:18.31 ID:swxSwYAF
マイクロソフト、次世代機「Xbox Next」を2013年ホリデーシーズンに投入か
http://www.inside-games.jp/article/2011/10/21/52256.html

ソニー、プレイステーション4向けのプロジェクトを複数の内部スタジオで開始か
http://www.inside-games.jp/article/2011/10/21/52257.html
37Socket774:2011/10/22(土) 08:30:40.15 ID:WXy0l5/4
当然研究開発はするでしょう。PS3は10年もたせると言っていたから、
新箱が2013年末ローンチなら、PS4は1年後の2014年末ローンチでその位だが…

The Cell processor 2 is in development, and go for PlayStation 4
http://translate.google.es/translate?sl=es&tl=en&js=n&prev=_t&hl=es&ie=UTF-8&layout=2&eotf=1&u=http%3A%2F%2Fwww.anaitgames.com%2Fnoticias%2Fchip-cell-2-playstation-4
38Socket774:2011/10/22(土) 09:49:55.09 ID:khfWeJNr
Cell 2 そんなものが存在するのだろうか・・・
39Socket774:2011/10/22(土) 11:24:37.20 ID:taA5UawY
まあSPEを乗せないと話にならん
40Socket774:2011/10/22(土) 12:39:23.57 ID:tJPrvzew
PS4はPS2の機能を最実装して欲しいよ。
41Socket774:2011/10/22(土) 13:51:29.05 ID:U8K0kVfc
エミュでいいと思うが、任天堂が特許とってたな…。
42Socket774:2011/10/22(土) 14:33:32.67 ID:ENHfY00V
2014年までひっぱるならSPEもソフトエミュでの再現が視野に入ってくるのでは?
43Socket774:2011/10/22(土) 14:55:02.22 ID:MAhgU7wM
ゲハが来ると如実にレベルが下がるな
44Socket774:2011/10/22(土) 14:58:26.58 ID:gkhHBwkF
CellはGPUと違って好きに叩かせてるらしいから
互換を優先するなら載せてくるだろうけど
PS3のように敢えて載せず、PS2を16000円で売るような事もやるだろう
まあ投資額としてはPS4にも載せるつもりだったと思うけど
45Socket774:2011/10/22(土) 16:24:00.70 ID:1URor+rl
今頃何言ってるんだっていわれそうだが、時分割で高速に切り替えて
実効的に回路規模数倍相当になるFPGAを売ってるベンチャーがあるんだな

ttp://www.kumikomi.net/archives/2010/06/co13de13.php
ttp://eetimes.jp/ee/articles/1110/18/news125.html
46Socket774:2011/10/22(土) 18:31:44.02 ID:vFNOAi9C
すげーな、これ。
47Socket774:2011/10/27(木) 13:14:14.67 ID:EqjWh8zl
ARM+SPEでPS3のゲームを動かすときだけARMでPPEをエミュでもすりゃいいんじゃないかと
暴論
48Socket774:2011/10/27(木) 18:39:29.88 ID:+a53G7Tz
手堅い
いまどき新PPEを作ったりSPEを他コアでエミュるよりは
49Socket774:2011/10/27(木) 19:17:38.67 ID:d4vvlLlg
どこが手堅いんだかさっぱりわからん
WiiUや次期XboxもPowerだしSPEつけるならPS3との互換性捨ててARMにする意味が全く無い
50Socket774:2011/10/27(木) 21:05:14.90 ID:+a53G7Tz
WiiUは45nmで低消費電力志向だと判ってるから
現行世代のスループットをターゲットにしたコアだろ?
MSはAMDのSoCになるらしいからPowerじゃないんじゃないか?
51Socket774:2011/10/27(木) 21:08:58.22 ID:+a53G7Tz
ARMなら効率も設計自由度もコストも市場環境的にも優位
最新技術をキャッチアップしたいならARMを使うのも手堅い

これからIBM自体がARMに走ってもそれほど驚かないくらい
52Socket774:2011/10/27(木) 21:12:02.00 ID:+a53G7Tz
>>50
現行世代並みのスループット
53Socket774:2011/10/27(木) 21:14:38.26 ID:sGYvlMJa
ARMは魔法のアイテムじゃないぞ
54Socket774:2011/10/27(木) 21:15:29.88 ID:+a53G7Tz
もちろん
だがIBMも魔法使いじゃないしな
55Socket774:2011/10/27(木) 22:04:14.78 ID:d4vvlLlg
>>50
現行の箱もAMDが統合設計したCPU+GPU1チップコアだし
GFはIBMのプロセスグループだからPowerコアの設計変えずにSoC化するのに有利だろ
56Socket774:2011/10/27(木) 22:18:12.76 ID:BkS80NSl
次世代箱はFSAでプログラミングするんだろうか。
57Socket774:2011/10/27(木) 22:29:42.34 ID:+hQYM3Yu
Cell2ではPPEはお払い箱になってARMに変わるのは決定済みだよ。
ttp://blog.esuteru.com/archives/2510625.html

ARMはIBMと共同開発しているから、IBMにとっては技術の横展だね。
IBMにとってCellでの用途開発で苦しんだのは黄犬Linuxが絶滅種寸前だった
からで、ARMでWindows8が走ると用途が広がるからね。SPE自体のコンパイラは
IBM謹製でお手の物だし、ARM/SPEのマルチCPUはすごい事になりそう…
あと、CPUチップ内でのARMのバスとIBMのバスは接続技術を開発済みだよ。
ARM/SPEの構成ならARM用とIBM用の各周辺回路のどちらでも使えるみたい。
58Socket774:2011/10/27(木) 22:38:29.25 ID:BkS80NSl
おお、そうなのか。
59Socket774:2011/10/27(木) 22:46:35.77 ID:yC3sUmy2
>>57
乞食クズブログのURL貼るなボケ
60Socket774:2011/10/27(木) 22:47:57.13 ID:JrjwHkPq
その内容だとcell2じゃなくて
armの何かだろ
61Socket774:2011/10/27(木) 23:09:47.57 ID:lsXw4+Im
ARM+SPEだけど・・・読めない人はどう読んでんだ?
62Socket774:2011/10/27(木) 23:10:53.04 ID:+hQYM3Yu
>>60
医療とか防衛とかスパコン用にはPPEは全然役に立ってなくて、SPEの命令役
だったからね。ARMもその位置だが、Cellの時はPPEの動かし方がうまくいかず、
intelチップでWindowsを動かし、そこからPPEに命令を出し、PPEがSPEに命令
する形だったし。
面倒くさいからMercuryもCellをやめたみたいだけど…
http://www.mc.com/cell/
63Socket774:2011/10/27(木) 23:39:47.26 ID:/cZ9SvRl
非力すぎて使えないPPEをもっと非力なARMで置き換えるのか
64Socket774:2011/10/27(木) 23:44:37.04 ID:U+QpyrCB
もうPS3除いてCell事業は終息してるし、ゲーム機も2014年まで先延ばしなら
ゼロベースで考えたほうが良い。少なくともSPEは互換のためだけで拡張すべきではない。
65Socket774:2011/10/28(金) 03:48:42.60 ID:uxT0py/S
どこにARM+SPEってかいてる?
66Socket774:2011/10/28(金) 09:15:10.73 ID:bVCzwYja
ARM+SPUとか意味ねーから。
ゲハは自分の無知をまず認識しろ
67Socket774:2011/10/28(金) 12:57:48.02 ID:Ebk/AFh4
68Socket774:2011/10/28(金) 18:21:48.03 ID:ykbIX3om
64bitの新命令セットARMv8きたがな
69Socket774:2011/10/28(金) 19:28:17.59 ID:ANkZ9EDu
ARMv8は2012、3年頃にチップが登場して
2013、4年頃には搭載された製品か
70Socket774:2011/10/28(金) 19:29:12.41 ID:ANkZ9EDu
新市場開拓なら名称もCortexから変わりそうだな
71Socket774:2011/10/28(金) 21:39:37.63 ID:ISgdXLYI
これか。もう最初のモデルとコンパイラが出回っているのか。
http://www.electronista.com/articles/11/10/27/arm.explains.armv8.chip.architecture/
72Socket774:2011/10/28(金) 21:58:03.65 ID:8J0wjmaF
そろそろメモリが4GB超えるから移行しただけじゃね
ARMで変わるならOpenSPARCで変わってただろ
73Socket774:2011/10/29(土) 00:08:37.56 ID:vGX3+EAr
ARM始まったな。
74Socket774:2011/10/29(土) 19:26:36.33 ID:iNqdvA4W
PowerコアはWiiUで終わりなのか さびしいのう
75Socket774:2011/10/30(日) 00:31:26.92 ID:wSXfHyUw
http://www.arm.com/files/downloads/ARMv8_Architecture.pdf
命令長は32bit固定で、レジスタフィールドは5bitか
76Socket774:2011/10/30(日) 03:35:40.78 ID:K7d+RoXx
へーレジスタ増やすんだ
普通のRISCになったな

NEONは従来の128bitx16 or 64bitx32ではなくて
下位ビットのみ共有して128bit or 64bit x32になるということね
77Socket774:2011/10/30(日) 10:54:29.95 ID:2xBo3Uq2
☆ARMの次世代core, SoCについて語るスレ #001☆
http://hibari.2ch.net/test/read.cgi/jisaku/1319938708/

とりあえず建てといた。
78Socket774:2011/10/31(月) 00:13:57.64 ID:Zmdm7KSJ
79Socket774:2011/10/31(月) 00:20:01.30 ID:hSXKN7Rt
命令長32Bitとな
80Socket774:2011/10/31(月) 01:39:39.59 ID:71p1k9kP
別に普通じゃね
PPCもMIPSもSPARCも命令長32bitだ

条件実行フィールド削る分でレジスタフィールド拡大するんだろうな
81Socket774:2011/10/31(月) 06:19:51.08 ID:R14/KgF7
>>78
>AMCCの発表によると、「X-Gene」の最大動作周波数は3GHz、待機時消費電力は300mW未満。
300mW未満に笑った。これはプロセッサコアのIdle powerを単純にコア数倍してるだけだね。
サーバープロセッサのIdle powerはほとんどがコア以外の成分だからこんなに減らせない。
1コアのIdle powerを約10mWとすると32コアくらい積んでくる予定かな?
82Socket774:2011/11/02(水) 18:02:31.93 ID:qtcEsICV
理研と富士通のスパコン「京」、10ペタフロップスを達成
http://www.rbbtoday.com/article/2011/11/02/82634.html
83Socket774:2011/11/02(水) 18:54:29.83 ID:2sy8VIVP
>>82
http://pr.fujitsu.com/jp/news/2011/11/2-1.html

CPUが増えて速度が上がっているのに実行時間が前回よりも長いということは、
前回よりもサイズの大きい計算をしたんだな。
84Socket774:2011/11/02(水) 18:58:11.90 ID:2pf8QHcu
紆余曲折有ったけどよくやったな
次の世代はどうなるのかな
85Socket774:2011/11/02(水) 19:44:05.62 ID:EbMxVKzY
ありません
86Socket774:2011/11/04(金) 02:36:55.25 ID:DcmrmQit
スーパースカラとマルチコアは、どっちもパイプラインを複数用意してますが
「パイプライン」≠「コア」ならコアは具体的にどの部分を指してるんですか?
制御部のことかなって思いましたが、スーパースカラも各々のパイプラインを制御する
制御部は必要だと思うので違う気がしました。
87Socket774:2011/11/04(金) 04:01:38.52 ID:QCGb5Kp8
>>86
一番簡単な考え方はこんなもんか?

スーパースカラー …… ステージを分割しユニットを複数実装することで「1つのスレッド」を並列実行するための技術
マルチコア …… 入力から出力までの1単位であるコアを複数実装し「複数のスレッド」を独立して並列実行するための技術
SMT(HTT) …… スーパースカラーを拡張することで「複数のスレッド」を並列実行しているかのように見せる技術

パイプラインとコアの違いは直列か並列かと処理できる能力の違いだね。
パイプラインはベルトコンベアで作業する人間1人で、コアはそのコンベア1本って感じ。
88Socket774:2011/11/04(金) 05:27:58.84 ID:gUSV43lT
>>87
なるほど、スレッドの数の違いですか。
並列処理のハザード検出とか大変だろうな(多少は必要でしょうけど)
と思ってたのですが、別々のスレッドならそれほど心配しなくてもよさそうですね。
とてもわかりやすい説明有難うございますm(_ _)m
89Socket774:2011/11/04(金) 14:33:21.18 ID:tsu7Pvfb
AMD、大規模なリストラを実施

http://pc.watch.impress.co.jp/docs/news/20111104_488639.html

さようならAMD
90Socket774:2011/11/04(金) 16:50:40.03 ID:Moxb7+zr
うわぁ・・・
91Socket774:2011/11/05(土) 05:39:27.19 ID:knogqZxw
一つの時代が終わったな。今後はIntel対ARMが本格化するのだろうか。
生産に関してはどうか。AMDを主要顧客としていたGFはどうするのだろうか。
92Socket774:2011/11/05(土) 07:09:13.26 ID:oux3Fupy
>>91
逆に危機感を持って本気出して来るってことは考えられないかな?頑張って欲しいな
93Socket774:2011/11/05(土) 09:15:27.13 ID:nSjbwRr9
求人する>有能さを見極める>リストラする というサイクルを
回して有能な人間の濃度を高めているだけなのでは
94Socket774:2011/11/05(土) 09:23:28.85 ID:3hTz23j3
>>93
社会に出てみるのをオススメしておく
95Socket774:2011/11/05(土) 09:30:01.01 ID:6H1oJD1y
日本企業と米国企業でリストラの意味がだいぶ違うことを社会人なら知っておくべきw
96Socket774:2011/11/05(土) 12:32:46.28 ID:w3HSRgUz
リストラは首切りを意味する和製語なんだよ!!なんだtt
97Socket774:2011/11/05(土) 13:51:59.22 ID:JUY1imzA
またの名は構造改革
98Socket774:2011/11/05(土) 14:13:11.82 ID:grJTobZV
業績好調なのに大量首切りやった会社は例外なく落ちぶれてる。
99Socket774:2011/11/05(土) 14:18:35.80 ID:Jm1rArRd
え、今は落ちぶれてないの?
100Socket774:2011/11/05(土) 14:59:59.36 ID:6H1oJD1y
大量首切りなんて業績好調な大企業なんて普通にやってんだろ。
新卒3000人採用、数ヶ月後2000人削減
101Socket774:2011/11/05(土) 15:35:46.59 ID:9ww8bgSH
例外なく落ちぶれるww
Intelだってリストラやったことあるけどね

新CEOが就任して注力する部分が決まったからそれ以外の贅肉はそぎ落とすということでしょ
そぎ落とす部分が本当にいらないのかどうかは分からんけどね
2月のAnalyst Dayで方向性は見えてくるんじゃない
102Socket774:2011/11/05(土) 16:56:21.98 ID:hN4Jy1Vp
インテルが1万人レイオフを行ったときは
Core2で挽回し始めていて、その裏でNehalemアーキ開発も進んでいた

今のAMDは……
103Socket774:2011/11/05(土) 17:17:33.74 ID:gqLPNyoW
空っぽだな
104Socket774:2011/11/05(土) 19:41:18.38 ID:xAARp2gD
10%って何人なんだろうね
105Socket774:2011/11/05(土) 20:35:14.97 ID:Wjwrq41X
10年度の時点で16000人か。ということは1600人。
何か撤退する分野があってそこを切るのか?
106Socket774:2011/11/05(土) 20:42:56.94 ID:xAARp2gD
centaurが16社できるぞ
107Socket774:2011/11/05(土) 21:21:53.72 ID:3hTz23j3
AMDの製品ラインの中で、現在から将来に渡ってダメなのは
どうみてもBulldozerなんだが、
ここ手放すと終焉が見える。
108Socket774:2011/11/05(土) 22:07:51.09 ID:TcWmJEa8
>>102
Intelのリストラが話として出てきたのは2004年じゃないか?ちょっと記憶が怪しいが。C2Dの前なのは確か。
ただしエンジニア(R&D)は減らさず逆に増強されたはず。
あの頃はOpteronにやられてたから価格競争に耐えられるような組織作りを迫られてたんだよな。
リストラの実施とPentiumDの価格改定が重なった2006年の第2四半期は大きく業績を落とした。
ただリーマンショックの時には既に組織改革が粗方終わってたので上手く乗り切れたね。
109Socket774:2011/11/05(土) 23:15:05.74 ID:O0U6bSI1
110Socket774:2011/11/06(日) 00:06:26.80 ID:Nt3idcCl
ごめん、2004年は大嘘。
Intelが2006年の第1四半期に前年同期比で4割ほど減益だったのが始まりっぽい。
ttp://www.intel.co.jp/jp/intel/pr/press2006/060420a.htm

決算の発表から一週間後に投資家へリストラによる経営体質の改善を約束。
ttp://news.cnet.com/Intel-to-get-widespread-restructuring/2100-1014_3-6065708.html
>The comprehensive project, which will look at ways to cut costs per unit and improve employee productivity, will take place over the next 90 days, he said.
(略)
>In an effort to overcome its loss of market share amid a slower-growing overall market, Intel plans to launch its largest product refresh in years.
>
>"New products based on the Core microarchitecture for power and performance will be launched this summer and refresh the Intel product line in all segments," Otellini said.
>
>Three new chips, one for each of the Core market segments, will be part of the rollout: Woodcrest for servers in June, Conroe for desktops in July, and Merom for notebooks in August.

文脈的にはCMAを採用した製品を6〜8月に前倒しで投入するというのもリストラクチャリングの一環。

6月にはMarvellへXScaleを売却。
ttp://news.cnet.com/Intel-sells-off-communications-chip-unit/2100-1006_3-6088305.html

2006年第2四半期の、前四半期より更に低調な決算を発表した翌日(7/20)には役員人事。
ttp://pc.watch.impress.co.jp/docs/2006/0721/hot438.htm
111Socket774:2011/11/06(日) 00:49:17.48 ID:UAQkgGYY
世の中には最高益出したと同時に開発者を大量リストラしたスクエニって企業もあるのよ。
112Socket774:2011/11/06(日) 01:09:50.77 ID:CcEL+lwI
あそこは開発を自社で抱えたくないんでしょ
113Socket774:2011/11/06(日) 01:24:19.83 ID:H60KplLz
結局どこに事業ドメインをおくかでしょ。

AMDは半導体を外に出しちゃったしATIも一定の成果あげちゃったし
営業にいたってはIntelのパワーゲームに勝てるわけないし

理論設計だけでやってけるか謎だけど、Intel一社になったらx86はマイナー転落だろうな。
114Socket774:2011/11/06(日) 01:32:51.18 ID:ecJIB34Q
スクエニは確かクビ切ったのと同時に新入社員も大量に入れてるな
社長がイエスマン欲しいのか、若手7割にしたら問題解決とか言ってたし

AMDは厳しそうだな・・・ATI買収しといて良かったね
ってくらいか
単体ならまず死んでる
115Socket774:2011/11/06(日) 01:39:55.74 ID:gZZxRbNS
>>114
スクエニは組織を新しくしたいのか。
毛色の違う会社になるのかも。
116Socket774:2011/11/06(日) 03:25:15.07 ID:In7LY003
コンピュータの高性能化が終わったら科学技術の進歩はどうなるんだ?
117Socket774:2011/11/06(日) 05:15:28.01 ID:7JHbn030
AMDが終わっても、アーキテクチャ間の競争は終わらない。
118Socket774:2011/11/06(日) 10:20:21.92 ID:UeaW747B
AMDの存在はコンピュータの歴史全体から見ると
あってもなくてもたいしてかわらん程度の影響度でしかない。
ARMの方がはるかにでかいよね。
119Socket774:2011/11/06(日) 10:46:42.31 ID:uUPBubTs
>>118
結局はx86互換メーカーの1つでしかないから、AMD
ところで、未だに?オクでSUNのSparc機が出たりしてるが、買った人いる?
俺は、Blade150買ったけど、、たいして役にたってない。

120Socket774:2011/11/06(日) 10:53:48.88 ID:uUPBubTs
SpecCPU2000辺りだとUltaraSparc3の1.2GhzがPen4-2Ghzぐらいの性能だけど
実際のアプリでの性能差だとどうなんだろ?
121Socket774:2011/11/06(日) 11:01:11.44 ID:H60KplLz
コンピュータの歴史全体という視点からなら、AMDがないとIntelは成り立たなかった。

Intelは単なる半導体メモリの製造技術しかなく、一方AMDはCPU周辺回路設計技術があり、
AMDからの技術供与でIntelCPUが成り立った。 ともにフェアチャイルドからの独立組みな。
122Socket774:2011/11/06(日) 11:14:18.53 ID:uUPBubTs
SUNのSparcが登場したころは、x86は行き詰まり死滅するはずだったが、、
現に、性能では386/486より上で俺は「いつかはSUNやHPのUNIX機を買うぞ」
と思い、十数年、、いざ買ってみると「なんだ、この程度か。」と拍子抜け。
何か普通のPCとは違う世界を味わえるかと思ったが的ハズレだった。
123Socket774:2011/11/06(日) 11:49:04.48 ID:gZZxRbNS
うお、フェアチャイルドがもとだったのか!?
これは目から鱗。
124Socket774:2011/11/06(日) 12:22:51.16 ID:jXisSrix
486/Pentium時代は、IntelはRISC勢にぼろ負けしてた
ただしその後、Intelはチップ内部にRISC的な設計思想をかなり取り入れ、
従来のCISCの命令セットの互換を保ったままCPU内部をRISCとCISCのいいとこどりみたいなのに進化させて、
RISCの利点がなくなったけどな
125Socket774:2011/11/06(日) 12:38:25.88 ID:TNhtuW9t
>122
90年代ならAlphaあたりはx86と格の違いを見せ付けてたんだけどな

日本語で一番詳しいのはando さんのところか。他のサイトはもっと頑張らないと
 AMCCのARMv8プロセサX-Gene
 Calxedaのサーバ用4コアARM Cortex-A9チップ
 ttp://www.geocities.jp/andosprocinfo/wadai11/20111105.htm

どちらもモバイルとはインターフェイスのリッチさが違うしECC使えたりで
なんちゃってサバ仕様ではなく本気だなって印象
126Socket774:2011/11/06(日) 12:42:14.89 ID:gZZxRbNS
Andoさんは別格。
127Socket774:2011/11/06(日) 13:03:49.84 ID:NSXl9wKe
andoさんは確か富士通のSPARCアーキテクトで、仕事やめてからも、
大学で非常勤かなんかで講師やってるんじゃなかったっけ?
128Socket774:2011/11/06(日) 13:23:17.37 ID:gZZxRbNS
SPARCに絡んでたのは聞いてたが、アーキテクトだったのか。
すげぇw
129Socket774:2011/11/06(日) 16:17:20.23 ID:UeaW747B
>>121
なんでこういうデタラメを平気で書く人がAMD周辺からはあとを絶たないんだろうか。
Intelは自社のメモリを拡販するためにプロセッサを作ったのが事の始まり。
AMDはプロセッサは後発参入なんだが。
130Socket774:2011/11/06(日) 16:21:57.35 ID:JxM2qe8P
intelのセカンドソ−スでは
131Socket774:2011/11/06(日) 17:05:41.70 ID:u/JJbn9o
>>125
一つ上の記事が気になった。MIPS系だろうか。
132Socket774:2011/11/06(日) 17:42:20.30 ID:L8kSdmbW
>>129
だよな。AMDはx86の生産委託を受けたって企業ってイメージしか無いわ。
133Socket774:2011/11/06(日) 17:47:12.12 ID:gZZxRbNS
元DECのエンジニアが多いんだったっけ?
134Socket774:2011/11/06(日) 17:58:04.43 ID:u/JJbn9o
>>133
とりあえず今話題にしているAMDプロセッサの黎明期って意味では
DECのエンジニアは関係ない。AM2900の顧客がDECだったとかは関係あるかもしれないが。
135Socket774:2011/11/06(日) 17:59:46.43 ID:gZZxRbNS
ダーク・メイヤーが元DECだったのが印象深くてね。
黎明期はまだDEC色はなかったんだね。
136Socket774:2011/11/06(日) 18:02:07.67 ID:H60KplLz
>>129
なんでこういう無知を平気書く人がIntel周辺からは後を絶たないんだろうか。
「プロセッサ」「CPU」ってぇのを半導体で集積回路を起こした「マイクロプロセッサ」だけしか知らないからだろうなw

Intelがプロセッサを作ったのは日本のビジコン社から電卓用チップの製造委託を受けたのが事の始まり。
結局Intelだけでは設計できず、ビジコンから嶋さんが設計に入ってようやく完成したのがi4004。
電卓用ではなく汎用にしたらいいんじゃね?的な発想はIntel側から出たが、結局理論設計やったのは嶋さん。

i4004で味をしめたIntelはその後i8008開発したけど失敗、さらにi8080開発しようとしてテンでだめだったから
結局嶋さんをヘッドハントしてようやく完成にこぎつけた。

そもそもIntelが世界で始めて開発したのは「マイクロ」コンピュータであって、おもちゃに毛が生えたものでしかない。
当時は汎用機のCPUが中心で、コアメモリや磁気メモリ中心だったところに半導体メモリに目をつけたのがIntel。
一方のAMDは汎用機のCPUの周辺回路をマイクロチップ化することで事業をスタートした。

AMDは周辺回路のほかに不揮発性メモリの技術もあって、Intelはこれらの技術もライセンス供与を受けている。
137Socket774:2011/11/06(日) 18:05:14.84 ID:gZZxRbNS
>>136
日本人すげーw
138Socket774:2011/11/06(日) 18:12:26.70 ID:gZZxRbNS
嶋正利
http://ja.wikipedia.org/wiki/%E5%B6%8B%E6%AD%A3%E5%88%A9

こんなすごい人がいたなんて知らなかった!
CPUなんてものは最初から欧米の人間が設計の中心だと思ってた。

>嶋は「欧米の人たちと比べても、自分が劣るなどと決して思ったことはありません。
>機会さえあれば日本人も創造的開発はできます」[7]と述べている。

勇気付けられるね。
139Socket774:2011/11/06(日) 18:16:40.94 ID:7JHbn030
×日本人がすごい
○嶋さんがすごい

あと池田敏雄とか
エンジニアリングに国境はない
140Socket774:2011/11/06(日) 18:38:05.20 ID:H60KplLz
いやいやいや、日本人も結構スゴイんですよ?

半導体も真空管もリレーも使わずにフェライトコアだけで論理回路を構成するパラメトロンとか日本人の発明ですぜ。
パラメトロン計算機とか上野の博物館で隅に追いやられて忘れ去られてるけど…。
141Socket774:2011/11/06(日) 18:54:34.80 ID:UeaW747B
>>136
このスレならそれくらい常識。
ネットで検索して多少はまともなレスができたようだが、
Intel的にはビジコンの件もDRAMを売りたいからむしろマイクロプロセッサがメモリの周辺ICの感覚だったのよ。
で、AMDがなければIntelがなかったという論拠はなんなんだろうか?
セカンドソースって米国と日本のメーカーを含めて何社もあった中のAMDは一つにしかすぎんのだが。
142Socket774:2011/11/06(日) 18:58:30.49 ID:UeaW747B
ちなみにIntelの創業者のノイスは世界初の集積回路の発明者で、
マイクロプロセッサ、SRAM、DRAMの発明はTIと並んでIntelが最初。
4004は嶋さん自身も言っているとおり、メインフレームのアーキテクチャの影響は受けてない。
143Socket774:2011/11/06(日) 19:34:50.14 ID:UUUJ6fve
>>139
俺が最初に嶋正利について知ったとき感じたのはこの人のすごさよりも
日本企業のビジネス感覚、人材活用ののしょぼさ、間抜けっぷりへの失望だった。
144Socket774:2011/11/06(日) 21:59:51.68 ID:H60KplLz
>>141
> Intel的にはビジコンの件もDRAMを売りたい
i4002はDRAMではない。嘘の上塗り恥ずかしいよ。
145Socket774:2011/11/06(日) 22:01:03.61 ID:H60KplLz
>>142
で、どこのだれがi4004がメインフレームのアーキテクチャだなどと主張を?
146Socket774:2011/11/06(日) 22:03:08.08 ID:xLjXsWBB
>>144
横から失礼
それはおまえの認識不足か読み違ってるだけ
147Socket774:2011/11/06(日) 22:04:07.66 ID:c5UKFg5N
AMDの設立って1969年でセカンドソースはじめたのってi8088の1979年くらいからだろ
製品がでる10年も前からセカンドソースの一つってどんだけオーパーツ?
148えるえる:2011/11/06(日) 22:21:19.61 ID:UeaW747B
4002
The RAM chip stored four 80-b numbers and additionally the chip had an output port.
The use of three-transistor dynamic memory cells made the RAM chip feasible.

three-transistor dynamic memory cells
誰とはいわないけど。嘘の上塗りってほんとに恥ずかしいですね。わらい。
149Socket774:2011/11/06(日) 22:24:24.08 ID:H60KplLz
>>147
セカンドソースはi8085からなのと、i8080のデッドコピーをAMDも作っているから、
その意味ではAMDは1975年くらいから互換プロセッサメーカだった。
ただその当時からAMDはオリジナルCPUだしてるけどね。

で。
i8080はおろかi8085にいたるまでIntelはDRAMコントローラを出すことができなかったし、
i8085に至ってはメモリを接続するのにアドレスとバスを分離するのに自社外のバスコントローラを必要とした。
半導体メモリの拡販のためのプロセッサ開発なんていうのは相当苦しい後付の理由だね。
事実だとしても、Intelは自力じゃ自社のマイクロプロセッサに自社のメモリをつけることができないという
間抜けっぷりをさらしたことになる。

AMD(というかその他の半導体メーカ)はマイクロプロセッサ開発においてはIntelに水を開けられていたのは事実。
嶋さんがZilogに移ってZ80出したおかげでひっくり返されて、IBMが8088/80286採用するまで沈んでたけど。

AMDはバスコントローラやFPU、時代が下ってからは不揮発性メモリなどの技術を押さえ、
この部分でIntelに対しライセンス供与を行っている。
150Socket774:2011/11/06(日) 22:25:23.29 ID:H60KplLz
>>148
あら失礼。
151えるえる:2011/11/06(日) 22:26:11.87 ID:UeaW747B
4004はテッドホフ=アーキ担当、嶋=実装担当
みたいなイメージなのかな。

もともとコンピュータ史に興味があれば、
IBM > CRAY, Intel, DEC, UNIVAC > Sun, Motorola > AMD
としか思わないはずなので、
ネット見ながら応戦しているのがばればれである。
152Socket774:2011/11/06(日) 22:28:43.25 ID:UnBk6tkg
つうか70年代当時に販売担当上級副社長だったエド・ゲルバッハが「我々は
マイクロプロセッサをメモリ製品の拡販の手段と考えていた」と語っているんで、
そこら辺は常識の範囲だろ。
153えるえる:2011/11/06(日) 22:29:48.49 ID:UeaW747B
>>149
そんなに堅く考える必要性ないだろ。
今みたいにIntelに自社の支配力がない時代には、他社と補完路線で商売やってたってだけのような。
セカンドソースは自社で製品安定供給できる製造体制ととのえば、利益ないからやめたくなるんじゃないの?
154Socket774:2011/11/06(日) 22:29:52.81 ID:H60KplLz
>>151
> 4004はテッドホフ=アーキ担当、嶋=実装担当
それはさすがに嶋さん怒るな。

> ネット見ながら応戦しているのがばればれである。
というレッテル貼りしたいのがミエミエなわけだけが、
コンセプトメーカしか並べられず半導体メーカを出せていないあたりでニワカってレッテル貼りかえせばいいのかな ;-)
155Socket774:2011/11/06(日) 22:34:29.76 ID:H60KplLz
>>153
実際その状況になったのは i80286が安定してからだよね。

Intelはセカンドソーサを何度かつぶしにかかってるけど、AMDはそのたびにしぶとく生き残ってる。
背景の一つにクロスライセンスがあるわけだけど、前に更新したのが2001年だからそろそろ切れるのかもね。
156Socket774:2011/11/07(月) 00:47:53.34 ID:598dwazn
携帯電話が地球シミュレータと同等の演算能力を持つというのか。
ARM恐るべし
157Socket774:2011/11/07(月) 04:17:23.77 ID:L773e4Yw
Core 2 Duo はキビキビしすぎて少しでもプログラムが
遅れてタイミングがズレるとにエラーになる事が多い。
WMPみたいに、しぶといプログラムはエラーにならず、
開始するのに時間がかかる。P4の、もっさりの方が快適
なんだが、熱に弱いのがネック。
158Socket774:2011/11/07(月) 04:58:20.16 ID:+h1mwsvo
えるえるって前にトンデモ理論振りかざして
ボコボコにされてたやつじゃねえか・・・
159Socket774:2011/11/07(月) 07:59:19.61 ID:4hSB2nzz
まあ言ってることは間違ってはいない
160Socket774:2011/11/07(月) 09:29:25.35 ID:tIhiyhKc
>>153
×Intelに自社の支配力がない時代
○Intelに自社の開発力がない時代
そう言えばMotoは自社で6800の周辺チップ一通り揃えてたけど
性能や価格面ではダメダメだったのを思い出した
161Socket774:2011/11/07(月) 11:15:11.29 ID:vqJLMGpp
リファレンスを提示するとかが主で、性能や価格を頑張らない
ものってのが昔はあった気がする。
どこもかしこも世知辛い今はもうなさそうだが。
モトローラが該当するかどうかは知らない
162Socket774:2011/11/07(月) 16:14:07.75 ID:uNNC+L/4
富士通、最大23.2PFLOPSを実現するスパコンを発売〜京で用いた技術をさらに発展
http://pc.watch.impress.co.jp/docs/news/20111107_489081.html

40nmで16コアで1.848GHzで110W
163Socket774:2011/11/07(月) 17:41:17.11 ID:vqJLMGpp
164Socket774:2011/11/07(月) 18:00:54.19 ID:mETZ5tg9
消費電力倍かよ。
フル構成時のシステム消費電力凄い
事になりそうだな。
165Socket774:2011/11/07(月) 18:11:35.63 ID:vqJLMGpp
同じ1PFLOPSのシステム同士で比べたら
VIIIfxからIXfxでノード数が半分近くに減るから
インターコネクトチップやらなんやらの分だけ電力は減るだろう

IXfxのダイサイズがかなり恐ろしいことになってそうなのが気になる。
Tukwila も超えて最大級なんじゃないのかな

POEWR7 567mm2
POWER6 341mm2
SPARC64 VIIIfx 513mm2
SPARC64 VII 445mm2
Tukwila 699mm2
Montecito 596mm2
Westmere-EX 513mm2
Nehalem-EX 684mm2
Magny-Cours 346mm2x2 MCM
GTX580 520mm2
Radeon HD6970 389mm2
166Socket774:2011/11/07(月) 18:49:14.06 ID:mHeWIMwy
コピペ情報

SPARC64 IXfx
TMSC 40nm
ダイサイズ 21.9 mm × 22.1 mm
トランジスタ数 約 18 億 7000 万個

SPARC64 VIIIfx
富士通45nm
ダイサイズ 22.7 mm × 22.6 mm
トランジスタ数 約 7 億 6000 万個
167Socket774:2011/11/07(月) 19:10:05.65 ID:bCCRVu4f
富士通先端プロセスェ……
168Socket774:2011/11/07(月) 19:45:33.28 ID:gMmqsDRj
>>154
フェデリコ・ファジンを忘れてもらっては困るでござるよ。彼も嶋さんとザイログ行っちゃったけどね。
ピーナッツでIBMが出した2ndソース要求が元々だけど、MILスペックを取ってたのはAMDだけだったからアタマ一つ飛び抜けてた。
169Socket774:2011/11/07(月) 21:26:10.62 ID:fmSbxnKO
ここで IBM fab club について一言↓
170Socket774:2011/11/07(月) 23:12:17.05 ID:UlJ7ISjD
>>158
そんなことあったか?
171Socket774:2011/11/07(月) 23:32:04.50 ID:mHeWIMwy
妄想垂れ流してた漢字コテハンのやつが使ってた
もう一つの名前がえるえるだとおもってたけど違うのか
172Socket774:2011/11/07(月) 23:35:44.59 ID:UlJ7ISjD
このあたりかな。1年前の。結構いまみると他のレスよりまともだと思うが。
http://www.varusu.com/thread/jisaku/1274809074/
173Socket774:2011/11/08(火) 00:03:29.63 ID:whGG3rJt
日本発のCPUアーキテクチャを開発してほしい。
ARMに対抗するようなヤツ。
174Socket774:2011/11/08(火) 00:05:11.31 ID:NQmcsU5G
あるだろw SHとか。
175Socket774:2011/11/08(火) 00:54:43.81 ID:siJmdRDd
M2090(GF110) 40nm 520mm 177GB/s 6GB TDP225W
 LINPACK 346? GFLOPS/理論値 665GFLOPS = 0.52?
SPARC64 IXfx 40nm 484mm 85GB/s 64GB 110W
 LINPACK 220? GFLOPS/理論値 236.5GFLOPS = 0.93?

GPUもTufuみたいなインターコネクトでつなげば実効効率あがるのかな。
しかしそうするとコスト差が小さくなるはず
176Socket774:2011/11/08(火) 00:56:14.51 ID:+6Q8QlOQ
震災でルネサスから出荷とまって自動車産業に大打撃与えたのってSHだっけ?
177Socket774:2011/11/08(火) 02:25:10.88 ID:xQnlrl77
>>164
ワットパフォーマンスは上がるだろ
だから実質的に消費電力が減る
178Socket774:2011/11/08(火) 02:38:01.96 ID:4J5KFli2
TSMCのプロセスでも1.8GHzぐらいなら出せるんだ
179Socket774:2011/11/08(火) 03:14:21.38 ID:4AFzjJ75
>>178
TSMCと富士通でどっちがクロック出しやすいかはしらないが、
TSMCは40nmで倍のコア数(トランジスタは2倍弱?)の模様。
180179:2011/11/08(火) 03:15:38.40 ID:4AFzjJ75
上の方に書いてあったか。二倍強だ。
28nm移行も、みたいに書いてあったけど28nmはみんなが
TSMCに委託するからバックオーダー抱えまくりじゃん。
181Socket774:2011/11/08(火) 06:26:18.59 ID:JWtVALlg
SPARC64はハイエンド側に追いやられてどんづまりだと思っていたが、
まさかHPCで生きのこるとは。
182Socket774:2011/11/08(火) 06:37:19.82 ID:siJmdRDd
IXfx は特化CPU、T4も特化CPU、もし両方生き残れれば
汎用ではないことが生き残りの理由ってことになるのかな
183Socket774:2011/11/08(火) 07:14:54.67 ID:JWtVALlg
メインストリームから外れた以上、ニッチに特化するのは必要条件、
って当たり前すぎて面白くないけど。
全ては(チップアーキテクチャの優劣とは無関係に)強力なユーザーを捕まえられるかどうか、
そのユーザーが生き残れるかどうか、にかかっていると思う。AlphaはDECとともに倒れた。
RISCのもう一つの雄、ハイエンドには行けなかったMIPSはどうなるかな。
184Socket774:2011/11/08(火) 09:46:57.26 ID:MhLpVB9N
Bladeワークステーションを買って、Solaris使えばスパコン気分が味わえるはず。
185Socket774:2011/11/08(火) 10:13:35.78 ID:JWtVALlg
豆腐もつけないと……
186Socket774:2011/11/08(火) 12:57:09.18 ID:MhLpVB9N
>>181
元からハイエンド向けに作られたのがSparc64じゃないの?
端から、PCや携帯なんて考慮してない。
187Socket774:2011/11/08(火) 13:16:02.11 ID:cCvfqTaO
そういやItaniumってまだ息してたっけ?
188Socket774:2011/11/08(火) 13:22:39.10 ID:rD8+vPdx
来年、32nmのが出るので、まだ息はしている。
hpが採用している限り、やめられないだけな気もするけど。
189Socket774:2011/11/08(火) 14:24:09.71 ID:DRZy98ol
>>183
中国のスマートフォンやHPCはMIPSベースだべ
190Socket774:2011/11/08(火) 15:21:10.07 ID:czzaVWbf
MACオタが消えると本当に誰も口上に載せないな>POWER
191Socket774:2011/11/08(火) 16:09:58.18 ID:065VaUjw
http://news.mynavi.jp/news/2011/11/08/020/index.html

なお、同社ではGPUコンピューティングやIntelのMICアーキ
テクチャなどについても、

「IntelのKnightシリーズは8SIMD、GPGPUは16SIMDだと思っており、
単に演算器を増やすほうがコアを増やすよりも確かに増やす
トランジスタ数の問題では楽になる。
しかし、もう1つの問題として、超並列演算を低消費電力で
実現するためにはインタコネクトをCPUに内蔵する必要がある。
我々はTofuで、その第一歩を築けた。
我々のほか、こうしたアプローチが現在出来ているのは
IBMがBlue Geneで実現しているだけであることを考えれば、
我々が一番Exaスケールの実現に近いと思っている」

と、2018-2020年ころが目標とされているExaスケールを20MW
程度で実現するのに、最も近いのは富士通であることを強調した。
192Socket774:2011/11/08(火) 16:47:48.56 ID:ByYh8jJ6
富士通研、CPUの廃熱を用いた冷却用冷水製造技術を開発
http://news.mynavi.jp/news/2011/11/08/021/index.html

富士通ノリノリですね
193Socket774:2011/11/08(火) 17:49:53.61 ID:08YawsXY
理研の建物が既にそうなんじゃないのかという気がする(プレスリリース日がFXと同じだし)んだけど、実際はどうなんだろう。
194Socket774:2011/11/08(火) 19:14:09.33 ID:whGG3rJt
富士通すげぇな。
195Socket774:2011/11/08(火) 20:08:38.70 ID:9JctjHde
富士通はいいから早くJapanistの製品版と64bitドライバをリリースしろ
196Socket774:2011/11/08(火) 23:26:19.31 ID:czzaVWbf
関係ないけど,大学時代富士通のスパコンでOAKが使えたのには笑った。
197Socket774:2011/11/09(水) 00:05:01.16 ID:7cxnclMt
本当に全く関係ないな。
198Socket774:2011/11/09(水) 01:02:11.88 ID:gwae3QrI
>>178
SPARC T4 は 3GHz だよ
199Socket774:2011/11/09(水) 10:13:37.93 ID:kkv8OM+F
シンプル・低クロック・ローパワー・メニーコアだったNiagaraが
どんどん普通のパフォーマンスコアに近づいていく一方で
またARMで同じ歴史をもう一回繰り返そうとしている件
200Socket774:2011/11/09(水) 13:38:46.51 ID:S7d2/MTH
つまりARMがハイパフォーマンス指向で行き詰まった後RXマイコンの時代が来るというわけだな。
201Socket774:2011/11/09(水) 14:00:38.48 ID:kkv8OM+F
RXのARMに対する優位性がよくわからない。
ルネサスの全面サポートがあるからマイコンにはいいんだろうけど、
それはD/Aコンバータ買ったらおまけで付いてきたコアがたまたまRXだった、みたいな話で、
別におまけはARMでも構わないだろう、と。
202Socket774:2011/11/09(水) 15:38:17.66 ID:kVU5uXh9
Niagaraの失敗を見てもAMDは何も学ばなかったようだな。
203Socket774:2011/11/09(水) 18:49:14.26 ID:Vban78Wt
>>196
大型コンピューター用のOAKはJEFっていうんだぜ。
204Socket774:2011/11/10(木) 09:43:36.82 ID:GMIxkngh
Niagaraは失敗じゃないyo!
205Socket774:2011/11/10(木) 18:44:32.62 ID:Kfh1/tzs
206Socket774:2011/11/10(木) 21:28:10.30 ID:vtMmLWuT
糞なコアをたくさん積んでも糞は糞でしかない。
207Socket774:2011/11/10(木) 22:30:50.00 ID:SUJUpFk+
>>205
流石のビッグブルー。
208,,・´∀`・,,)っ-○○○:2011/11/11(金) 01:51:27.39 ID:lEV7BMte
>>201
ARMはでかすぎるだろwww
携帯電話にPentium 4を載せようって言ってるようなもの。

RXはM16Cの系譜で十分な実績がある。ボタン電池で動くような機器にも使われてるぜ。
とはいっても三菱を中心とした国内家電メーカーのガラパゴスプラットフォームが主戦場なんだけどね。
209Socket774:2011/11/11(金) 11:00:05.55 ID:y5bnUGEx
ARMv8でレジスタ倍増して、コンディションビットが削られて、
なんか普通のRISCになってきた件
実はMIPSで良くね?
210,,・´∀`・,,)っ-○○○:2011/11/11(金) 21:03:47.91 ID:lEV7BMte
MIPSってARMが台頭してから斜陽って印象あるけどいまだに時価総額ではIntelの倍もあるんだよな。
211Socket774:2011/11/11(金) 21:39:52.54 ID:BQdc+Z2g
んな馬鹿な
212,,・´∀`・,,)っ-○○○:2011/11/11(金) 22:02:16.40 ID:lEV7BMte
http://finance.yahoo.com/q?s=MIPS
Market Cap: 273.30M

http://finance.yahoo.com/q?s=INTC
Market Cap: 122.51B


MとB読み間違えてた
213Socket774:2011/11/11(金) 22:07:37.99 ID:ZsiHYzJb
だんごも人間だなw
214Socket774:2011/11/11(金) 22:11:38.97 ID:UARXw3tP
えっ
215Socket774:2011/11/11(金) 23:11:31.66 ID:/rubVh8/
lol
216Socket774:2011/11/11(金) 23:38:51.01 ID:sbpA7QMM
http://news.mynavi.jp/articles/2011/10/31/arm8/001.html
> オペコードは32bitで、レジスタ指定ビットは5bitとなる。命令によってはこれに32bitまたは64bitのオペランドが続く。
32/64/96bit可変長? 相変わらずRISCらしくない。Thumb-2もそうだけど。
217Socket774:2011/11/11(金) 23:52:37.78 ID:FN/1HnC6
>>75の資料にはそんなこは書かれていない
ライターの勘違いだろ
218,,・´∀`・,,)っ-○○○:2011/11/11(金) 23:54:36.10 ID:lEV7BMte
x86フォーマットの利点を部分的に取り入れた形だね。
従来のARMのようなリテラルプールからのロードはコストが大きい。
命令フェッチと同時に即値が得られるメリットは大きい。
219,,・´∀`・,,)っ-○○○:2011/11/11(金) 23:55:17.93 ID:lEV7BMte
>>217
まあ単なるリテラルプールかもしれないね
220Socket774:2011/11/12(土) 00:07:47.27 ID:IvUr1heL
A64はThumbなしでx86のオブジェクトコードサイズに対抗出来るのか?
221Socket774:2011/11/12(土) 00:44:55.20 ID:yYVXMI0w
レジスタフィールドに各5bit使っちゃうとさすがに16bit化はできなそうだよな
222Socket774:2011/11/12(土) 01:06:38.48 ID:8gOK4EVR
ThumbもコンディションビットもARMの差別化要因だったのに、
それを捨てての32レジスタ化はやや疑問
223,,・´∀`・,,)っ-○○○:2011/11/12(土) 01:29:11.61 ID:rlP+RKEI
汎用レジスタは31本じゃね?
32本目はゼロレジスタなのか、あるいは特別な意味(たとえば11111=即値参照)を持つのか
どっちやろね?
224Socket774:2011/11/12(土) 02:19:52.00 ID:U45BaRXO
ゼロレジスタはあるようだが32本目として実装されてるのかは分からんな。
225Socket774:2011/11/12(土) 02:54:07.90 ID:yYVXMI0w
知らなかったがNECのV800シリーズはリテラルがあるときだけ32bitで通常命令は16bitだったのな
http://www.cqpub.co.jp/dwm/column/mpi/dwm0038mpi7.htm
226Socket774:2011/11/12(土) 11:24:50.41 ID:IvUr1heL
31か32かは問題ではない
227,,・´∀`・,,)っ-○○○:2011/11/12(土) 11:53:51.03 ID:rlP+RKEI
問題あるよ。11111Bがレジスタではない別のオペランドを表現できる可能性があるからね。
228Socket774:2011/11/12(土) 12:03:31.81 ID:8gOK4EVR
いやそれもちょっとは問題だけど、レジスタ指定が4bitか5bitかに比べれば些細な問題だろう
229,,・´∀`・,,)っ-○○○:2011/11/12(土) 12:10:35.57 ID:0Rl4D2Is
Knights*のSIMDは5ビットになるけどね
230Socket774:2011/11/12(土) 17:29:41.07 ID:tY9Kax8N
IEE754形式の単精度型で表現できる数の最大の正の数
正規化された数で最小の正の数、最小の正の数がわかりません
おしえてくださいmm
231Socket774:2011/11/12(土) 17:56:13.02 ID:BqqThEFE
逆にベクトル演算は32本じゃ足りないのでは?
232,,・´∀`・,,)っ-○○○:2011/11/12(土) 18:28:59.08 ID:9Qg5HDCp
16x16単精度の行列積でギリギリ足りる程度。
233Socket774:2011/11/12(土) 22:17:49.39 ID:8gOK4EVR
512bit*32本ってSPEの128bit*128本と同じサイズなのか。
234,,・´∀`・,,)っ-○○○:2011/11/12(土) 22:26:53.12 ID:9Qg5HDCp
更に4つのスレッドごとにあるから4倍だね。
SIMDレジスタだけで1コアあたり8KB。
冷静に考えると凄い量だよな。
235Socket774:2011/11/12(土) 23:06:16.05 ID:8gOK4EVR
多い分だけL1キャッシュ並のレイテンシなんじゃないの?
236Socket774:2011/11/13(日) 00:03:21.42 ID:jL9bcfGb
IPFは未だにL1$のレーテンシが1だが
237Socket774:2011/11/13(日) 00:13:00.04 ID:014AhMR2
クロックいくつの話だろう
238,,・´∀`・,,)っ-○○○:2011/11/13(日) 01:16:19.61 ID:T27q85rv
>>235
L1キャッシュのアクセスはタグ引きがあるから番号と物理位置がすぐに求まるレジスタファイルには勝てない。
レジスタリネーミングとかやりだすとまた話は別だけどね。
239,,・´∀`・,,)っ-○○○:2011/11/13(日) 01:22:12.27 ID:T27q85rv
GPUでは数十KBあるけどやはりレイテンシは大きいらしいね。
使いやすくするために次世代Teslaではレジスタファイルの階層化やるって話だから
キャッシュとあんまり変わらなくなるかも。
240Socket774:2011/11/13(日) 01:36:08.54 ID:AFjtl6VE
Knights Cornerを安価にばらまいてくれたら
いろいろやってみる機会ができて面白いだろうになあ
一般向けでバーゲン価格はありえないかもしれないけど
241Socket774:2011/11/13(日) 02:00:17.52 ID:Utilcmxj
>>239
>GPUでは数十KBあるけどやはりレイテンシは大きいらしいね。
シェアードメモリのことかな?
やっぱいくつかで共有するとアービトレーションでレイテンシかかるのかな。
242,,・´∀`・,,)っ-○○○:2011/11/13(日) 02:31:37.97 ID:T27q85rv
いや、レジスタファイルそのものがでかい。
単精度×32768本って何バイト?
243Socket774:2011/11/13(日) 03:13:38.55 ID:Utilcmxj
えっ、レジスタなのにレイテンシ大きいの?
最悪じゃん。
244Socket774:2011/11/13(日) 03:44:13.48 ID:DOg34JEF
それを隠蔽するのがGPUの真骨頂だからなぁ >レイテンシを最適化するCPUとスループットを最適化するGPU

数百クロックのメモリレイテンシを隠蔽するために長大なパイプラインと膨大なレジスタが必要になるわけで。
そして膨大なレジスタの搭載でレイテンシが長くてもパイプラインである程度は隠蔽できるしね。
フルHDなら常に200万スレッドが並走しているからレイテンシよりも容量を取ってもおかしくない。
245Socket774:2011/11/13(日) 07:11:40.39 ID:LN6eg/Tp
GPUは、レジスタへのアクセス(とシェアードメモリ)はレイテンシがマルチスレッドで完全に隠蔽できて、実質1クロック
246Socket774:2011/11/13(日) 22:38:45.60 ID:lCs86oaR
>>244
200万スレッドw
1pixel1スレッドw
どんだけ無駄な設計だよw
247,,・´∀`・,,)っ-○○○:2011/11/13(日) 22:42:46.62 ID:T27q85rv
512SPで8192スレッドくらいだったような。
248Socket774:2011/11/13(日) 22:44:39.56 ID:y3Ce4y6z
>>246
シェーダープログラム書いてみ? 1ピクセル1スレッドだから。
249,,・´∀`・,,)っ-○○○:2011/11/13(日) 22:48:12.02 ID:T27q85rv
同時処理するわけじゃないからね。
250Socket774:2011/11/13(日) 22:48:32.89 ID:014AhMR2
物事は様々な抽象レベルで考えるんだ
251Socket774:2011/11/13(日) 23:12:55.54 ID:lCs86oaR
>>248
GPUってデバッガで実行過程をトレースすることもできないのに
シェーダのソースコードだけから物理的な動作を推測するのは無理があるわw
252Socket774:2011/11/13(日) 23:45:12.33 ID:LN6eg/Tp
Parallel Nsight使え
253Socket774:2011/11/13(日) 23:52:49.81 ID:Utilcmxj
なるほど。
GPUはレイテンシをうまく隠蔽してるんだね。
254Socket774:2011/11/14(月) 00:26:23.84 ID:ak2saiFA
CPU ヨボヨボで1つのことしかこなせない老人
GPU いろんな人から多くの仕事を任せられる若者

って感じか
255Socket774:2011/11/14(月) 00:33:54.70 ID:FGGcGxSM
CPU 少数だけど頭が柔らかい人
GPU いっぱいいるけど頭が硬い人

こんな感じだろ
256Socket774:2011/11/14(月) 00:36:44.30 ID:Bvkz2l47
CPU … 数個の複雑な仕事をこなせる職人
GPU … 数千単位の単純な仕事をこなす工場

ってカンジだと。
生産性では大量生産な工場に敵わないが、
オーダーメイドでいろいろな仕事を熟せるCPUさん。
257Socket774:2011/11/14(月) 00:40:02.34 ID:+CNvzy9s
CPUは老練な感じがするね。
258,,・´∀`・,,)っ-○○○:2011/11/14(月) 00:57:34.26 ID:JD7xK2Zg
何か指示をしたら全員同じ動きをする人々
259Socket774:2011/11/14(月) 01:03:05.37 ID:+CNvzy9s
日本人みたいだな。
260Socket774:2011/11/14(月) 02:38:22.79 ID:/X0n8WLm
>>238
タグ引きはL1では並列に行うからレイテンシは増やさないよ
レジスタファイルはポート数大きいしレイテンシで特に有利ということはない

レジスタの見かけのレイテンシが小さく見えるのは
実行ユニット間でのフォワーディングがあるからだよ

>>239
NVIDIAがレジスタキャッシュを導入するのは消費電力を減らすのが主な目的らしい
CPUもレジスタキャッシュを持ったものはあるけど
これはポート数を増やすのがしんどいから見かけのポート数を増やすのが目的

AMDのVLIWはフォワーディングでレジスタのレイテンシを隠蔽している

>>248
GPUで言うところのスレッドは複数スレッドでPCを共有しているから
CPUのスレッドとは数え方が違う
言うまでもないかもしれないが
261Socket774:2011/11/14(月) 16:38:51.48 ID:cQRpyNQk
D.E Shaw研究所はAntonと呼ぶ分子動力学(Molecular Dynamics:MD)計算専用のスパコンを開発し、その最初のシステムでのシミュレーション結果を発表した。

タンパク質のフォールディングではミリ秒程度のシミュレーションを
行わないとどのように折りたたまれて行くかが分からないのであるが、
汎用スパコンでのシミュレーションでは1日掛かって100ns程度に
相当するシミュレーションしか出来ず、msのシミュレーションには
何万日も掛かってしまうので、実用的ではない。
これを専用アーキテクチャで100倍程度加速すれば、実行可能な範囲に
入るというのがAnton開発の狙いである。

D.E.Shaw氏が創立したD.E.Shaw & Coは運用資産2.5兆円の
世界最大規模のヘッジファンドであるが、現在は、Shaw氏は
ヘッジファンドの日常のマネジメントには携わらず、
D.E.Shaw Researchのチーフサイエンティストとして、
MDのアルゴリズムやAntonシステムの開発を行っているという。
そして、同研究所の運用費用はShaw氏のポケットマネーで賄われていると
言われている。

このAntonの512ノードシステムの最初の2台が完成し、それを用いて、
2万3,558原子のDHFR(5DFR)では10.4μs/day、11万6,650原子の
T7Lig(1AOI)では3.06μs/dayの性能を達成した。
http://news.mynavi.jp/articles/2009/12/01/sc09_gordonbell/001.html
262,,・´∀`・,,)っ-○○○:2011/11/14(月) 17:38:53.58 ID:JD7xK2Zg
>>260
論理レジスタと物理レジスタのマッピングが一致してる場合においてはレジスタ番号から
レジスタファイル上の位置の算出は低コストでできるでしょ。

キャッシュはヒットを確認してからはじめて転送できるので、確実にデータの存在が保証される
レジスタと同等のレイテンシってことはないはず(あくまで同等の容量と仮定した場合の話)
263Socket774:2011/11/14(月) 23:41:47.15 ID:MWtnjh65
バフェット氏のバークシャー、IBM株を107億ドルで購入−CNBC
http://www.bloomberg.co.jp/apps/news?pid=90920013&sid=aZZ5tMhrWX1Q
264Socket774:2011/11/15(火) 01:13:02.64 ID:RPSb6iGS
>>262
レジスタファイルはアドレッシングは簡単でもポート数が多いのでレイテンシが大きくなるという話だよ
265,,・´∀`・,,)っ-○○○:2011/11/15(火) 01:22:09.78 ID:Cr2GvgSQ
それはL1のRead/Writeポート数を増やしても同じことだ
266Socket774:2011/11/15(火) 01:28:39.77 ID:P4uo+OFN
まぁ、DRAMのレイテンシに比べたらかわいいもんだ。
267Socket774:2011/11/15(火) 08:40:11.45 ID:alKNyBpn
日本の家電メーカーはこぞってARMに向かっているのだね。

東芝「レグザ」,パナソニック「ビエラ」など,最新テレビの映像エンジンを支えるARMのCPUコア
http://www.4gamer.net/games/143/G014356/20111114064/
268Socket774:2011/11/15(火) 08:54:47.31 ID:CtWv9QlY
>>265
L1はせいぜい2ポートとかだけど
レジスタファイルはSNBのPRFなら多分7ポートとかそれくらい

そもそもレジスタファイルのレイテンシはほとんどの場合隠蔽される
269Socket774:2011/11/15(火) 09:00:12.30 ID:alKNyBpn
270Socket774:2011/11/15(火) 23:19:14.66 ID:dOqUwe6R
このスレはKnights Cornerの話が
あまり出てきてなさそうだね


将来、京を負かすかもしれないぞ?
271Socket774:2011/11/15(火) 23:33:03.32 ID:M+XUj+BO
じゃあ、お前がネタ振りすればいいだろ
最近なんかトピックあったっけ?
272Socket774:2011/11/16(水) 01:40:17.71 ID:dgvdiitO
こないだIntelが複数のペタ級スパコンに採用されたよ!!って発表して以来特になんもない
273,,・´∀`・,,)っ-○○○:2011/11/16(水) 03:04:06.02 ID:iPcYYMFW
機密保持契約破ってまで話したがるベンダーもユーザーもいないでしょ。
274Socket774:2011/11/16(水) 03:16:41.93 ID:VoaI1vrk
米国国策事業に組み込まれたからどうでもええわ
275,,・´∀`・,,)っ-○○○:2011/11/16(水) 03:25:02.22 ID:iPcYYMFW
東大の次期スパコン、中国の大手IT企業浪潮と提携とか、おまいらがスルーしてただけで、
今年の7月以降大きな話題だらけだったしな。
あとは次のIDFあたりを待つくらいか。
276Socket774:2011/11/16(水) 03:27:33.27 ID:qvMADfQv
個人向けに売ってくれることを祈るだけw
277Socket774:2011/11/16(水) 03:39:29.08 ID:tLFbwzqP
>「Intel Federalは世界最高のスパコンを作り上げることを目的として
>米国政府と協力して立ち上げた」と米国政府との緊密性をアピール
278Socket774:2011/11/16(水) 04:32:36.71 ID:7nRxkD9l
大学研究機関が主要顧客なんだし
Knightsはもっと情報出してもいいとおもうんだけどな
279Socket774:2011/11/16(水) 04:53:51.39 ID:dgvdiitO
こないだCERNが出した発表でも使ったのKnightsFerryだったしパートナーのとこにもまだCornerは届いてないとか?
280,,・´∀`・,,)っ-○○○:2011/11/16(水) 07:27:06.84 ID:iPcYYMFW
現状、Larrabee 1の倍精度強化版である以上の何かだとは思ってないんだけどな。
281Socket774:2011/11/16(水) 07:50:46.96 ID:a0ElPuLG
【スパコン世界一「京」の全貌】
「世界最速」を実現したアーキテクチャ
http://itpro.nikkeibp.co.jp/article/COLUMN/20111104/372504/
新機能満載のCPUとTofuインターコネクト
http://itpro.nikkeibp.co.jp/article/COLUMN/20111104/372508/
プログラム実行とMPI通信を高速化
http://itpro.nikkeibp.co.jp/article/COLUMN/20111104/372509/
282Socket774:2011/11/16(水) 08:15:48.84 ID:ztjVMwFg
東大の次期スパコンってこれじゃないの?

東京大学情報基盤センター、スパコンシステム刷新--PRIMEHPC FX10を4800ノード
http://japan.zdnet.com/datacenter/case-study/35010521/
283Socket774:2011/11/16(水) 08:44:02.75 ID:CXSQmpeK
>>279
Cornerは22nmノードだから、今作ってるところ

のはず
284Socket774:2011/11/16(水) 20:06:40.30 ID:/RfE+OZP
64bit後発組は、先発組にくらべてデコーダ負荷が軽くなる命令セット採用しやすくなるから有利じゃね?
先発組は、互換性維持したまま性能揚げないといけないので、デコーダがどんどん複雑になるが、
後発組はデコーダがシンプルになる命令セットにできるからな
285,,・´∀`・,,)っ-○○○:2011/11/16(水) 20:52:47.09 ID:iPcYYMFW
PRIMERGY RX300のほうならいけるかなと思ったけどはPCIeボード刺さりそうに無いな。
RICCの入れ替えには使えそう。
286Socket774:2011/11/16(水) 21:31:50.36 ID:/QFnuRJw
MICが東大のスパコンで使われるって何処情報なん?
研究開発には使用してるみたいだけど
287,,・´∀`・,,)っ-○○○:2011/11/16(水) 21:56:55.99 ID:iPcYYMFW
研究開発だけして使わない手は無いでしょ
まあ、東大のアカポス受け入れ先の国研あたりならいくらでも入る余地はあると思ってるが。

Opteronはなくなったとは思ったがVenusは意外だった。
288Socket774:2011/11/16(水) 22:02:14.06 ID:lo5v5tzi
289Socket774:2011/11/16(水) 22:06:05.26 ID:/QFnuRJw
何だルーマーでもなく妄想を吹聴してただけか
290,,・´∀`・,,)っ-○○○:2011/11/16(水) 22:10:26.67 ID:iPcYYMFW
倍精度で1Tなら単精度だと2Tは出るのか。
291Socket774:2011/11/16(水) 22:10:46.59 ID:hj3oZ/F8
>>288
> Interestingly, but the KNC accelerator is not just a PCI Express accelerator like its predecessor,
> the Knights Ferry compute accelerator for software developers,
> but looks like CPU that plugs into a socket or a special adapter.
何気にすごい事書いてあるんだけど
292Socket774:2011/11/16(水) 22:11:24.24 ID:hj3oZ/F8
QPI版ktkrってこと?
293,,・´∀`・,,)っ-○○○:2011/11/16(水) 22:25:51.15 ID:iPcYYMFW
京は早くも国会版事業仕分けで予算削減対象に祭り上げられてるがMICの影響もあるんだろうな。
日本主導の技術ってなんでこうもガラパゴス化するんだろうな。

WiMAX2がdocomoのLTE帯域増加より先行するとか。
294,,・´∀`・,,)っ-○○○:2011/11/16(水) 22:36:45.46 ID:iPcYYMFW
あれ?ひょっとしてWestmere-EXと同じLGA1567か?
http://img.club.pchome.net/upload/club/other/2010/3/8/pics_tianzhon_1268060498.jpg
295Socket774:2011/11/16(水) 23:14:17.10 ID:02wRMdCb
Itaniumとか見てると、システムベンダもIntelの非主流チップの舟には乗りにくいんじゃないか
296Socket774:2011/11/16(水) 23:20:46.78 ID:PRQQPRpb
http://www.xbitlabs.com/images/news/2011-11/intel_knights_corner_big.jpg
これじゃメモリ帯域足りなすぎで実効性能出ないっしょ
297,,・´∀`・,,)っ-○○○:2011/11/16(水) 23:34:40.11 ID:iPcYYMFW
DRAM混載前提だな
298Socket774:2011/11/16(水) 23:35:23.14 ID:tw/xpRHh
Intelは、新アーキテクチャで技術的に優れてるけれど互換性が無い新CPUを作るも商業的に成功せず、
自社の互換性があるCPUが商業的に成功してきた

IA64でも、過去のインテルのCPUの法則とおなじようになった

いまや、PA-RISCの後継機として、HP-UX専用CPU化してるな
299Socket774:2011/11/16(水) 23:42:06.64 ID:t32s0ZdB
メニーコアにソフトウェアの対応は追いつくのかな?
多少ワットパフォーマンスが落ちる程度なら、従来通りのリッチコアの方が
ソフトウェアは数段書きやすいような。
300Socket774:2011/11/16(水) 23:47:17.16 ID:EkOolI4e
Itaniumって技術的に優れてるの?
最初から全然ダメにしか見えなかったが。
301Socket774:2011/11/16(水) 23:59:29.81 ID:6Og8WK5r
TSVか
302301:2011/11/17(木) 00:00:31.91 ID:6Og8WK5r
>297 宛な
303Socket774:2011/11/17(木) 00:04:54.79 ID:na+c1KzK
まあ来る来る言ってなかなか来ない技術の一つですがね……

http://202.218.219.41/news/3637
> 450mmウエハー、EUV、TSV、半導体製造の最新技術は実用化のめども立たず
304Socket774:2011/11/17(木) 00:22:26.40 ID:umKNouZr
短波長のEUVへ移行せずに16nmを製造するって? マジか
おじさんは頭が古いからびっくりだ
305Socket774:2011/11/17(木) 00:27:27.73 ID:umKNouZr
ttp://news.mynavi.jp/news/2011/11/16/009/index.html
Wide IO Mobile RAMは約1200の端子だからTSV

これはTSVの実用化には該当しないの?
306Socket774:2011/11/17(木) 00:40:05.50 ID:na+c1KzK
サンプル出荷は出来た。予定通り2012年中に量産も開始できるかもしれない。
しかし離陸できるかどうかは、なんともわからんのですよ。

http://pc.watch.impress.co.jp/docs/column/kaigai/20111107_488696.html
> TSVの量産準備ができているかどうかについては、JEDEC内部でも見解がわかれている。
> 今回のカンファレンスでBill Gervas氏はTSVは少なくとも2016年まではスピードイー
> ルドの面から準備が整わないと発言。それに対して、メモリの部会を束ねるDesi Rhoden
> (デジー・ローデン)氏(Chairman, JEDEC JC-42: Solid State Memories)が、「JEDECの
> 見解は、TSVは現在すでに準備ができているというものだ」と反駁する一幕があった。
307Socket774:2011/11/17(木) 00:42:20.21 ID:Kbxcu78w
メモリ側の方という意味では該当しますよ。ただこれはあくまで容量・速度を稼ぐためのメモリ内部のTSVであって、この後ロジックと接続するという工程があり、
そこに関してはまだこれから開発するという段階です。メモリ内部のTSVの応用ではサーバー向け大容量モジュール(32〜64GB)が開発され既にサンプル出荷されています。
兎にも角にも問題はロジックとメモリとの積層で、ここでは後工程メーカー(パッケージング、ダイ加工・接続など)、半導体ファブなどとの連携が必要ですし、
デバグ・テストも相当な苦労が要ります。それと当然ですが加工自体が相当な歩留まりを落とす要因でありますから、メリットがそれを上回るかできる限り不良品を出さないかの
努力がまだ追いついていませんでしょうね。下手に加工失敗すればウェハでは良品でも不良品になっちゃいますから。
308Socket774:2011/11/17(木) 00:48:48.85 ID:mNtps0XJ
マジでDRAM混載しないかな。
セットでイイじゃん、もう。
レイテンシ劇減りでみんなハッピー。
309Socket774:2011/11/17(木) 00:54:05.50 ID:Kbxcu78w
熱(はあと)
積層接続間の経年劣化も結構気になるところではあります。
310Socket774:2011/11/17(木) 00:57:13.27 ID:mNtps0XJ
フォン・ノイマンが現代を生きていたら、プロセッサの性能は違っていただろうか・・・
311Socket774:2011/11/17(木) 05:48:36.96 ID:gmf+EPHn
熱問題が出るような用途は
積層でなくてシリコンインターポーザ使うんでないの?
312Socket774:2011/11/17(木) 10:58:40.25 ID:2dHuUS9E
TSVじゃないけどTSVと同じように使える積層チップはすでにソニーが実用化して使用してるな
原理上2層までしか無理で3層以上には使えないけどMCLってやつ
313Socket774:2011/11/17(木) 14:46:24.90 ID:umKNouZr
2004年にはこんなこと言ってたのにな

>米Intel社は2009年の32nm世代半導体製造技術量産に向けて,波長が
>13.4nmの光源を使うEUV(extreme ultraviolet:極紫外線)リソグラフィ技術を
>研究してきたが,それが実用化に向けた開発段階になったことを明らかにした。
ttp://techon.nikkeibp.co.jp/article/NEWS/20040802/60624/
314Socket774:2011/11/17(木) 15:02:52.92 ID:VVYxBFrh
EUVは光源出力が量産レベルには足りない
数年前はEUVマスクの欠陥を検査する方法が無いとかいう笑えない話もあったが解決したのかな
315Socket774:2011/11/17(木) 19:50:39.26 ID:CIVizuwi
KLAが開発したじゃなかったっけ?
後はレジストと一番最大な問題光源だな。

未だに平均30Wで15WPHとか話しにならん
316Socket774:2011/11/17(木) 22:33:32.53 ID:y57/jaoC
印刷以外の方法でトランジスタ形成できないものか。
317Socket774:2011/11/17(木) 23:17:51.97 ID:U99XJNWw
電子ビーム直描
318Socket774:2011/11/17(木) 23:20:04.21 ID:mNtps0XJ
ちょw量産でwww
319Socket774:2011/11/18(金) 00:40:22.80 ID:XqnW1ixr
印刷以外の方法で 同じくらい安く トランジスタ形成
320Socket774:2011/11/19(土) 10:45:29.51 ID:xIm2Liy1
タンパク質の勝手に整列する性質を利用して云々というのを
いつぞや新聞か何かで見たような。
321Socket774:2011/11/19(土) 13:01:28.68 ID:PjvX6VpV
DNAコンピュータの原理を改良して配線づくりか。新しいな。
322Socket774:2011/11/19(土) 13:21:17.33 ID:ZQ7Ge7PR
新聞でたまに◯◯技術を開発みたいなのがでるが、
ああいったのの9割以上は実用化せずにお蔵入りだからな
323Socket774:2011/11/20(日) 09:37:33.71 ID:UCJ0QIk0
価格を下げたり利益を出したりするのはもっと難しい
レアメタルみたいに痛い目を見ないとw
324Socket774:2011/11/21(月) 23:40:51.51 ID:wUvFXnJ5
http://cybergarden.cocolog-nifty.com/blog/2011/10/amd32nmintel-f9.html

AMDの32nmは歩留まりで苦戦しているが、Intelよりトランジスタが小さい。なんで20億トランジスタが300平方mmなんだ?
GLOBALFOUNDERIESは凄いことをしている。最高だぜ!
325Socket774:2011/11/21(月) 23:46:43.31 ID:zfmv3eWw
>>324
The Interlagos chip has a total of 2.4 billion transitions, which means the Valencia chip has 1.2 billion.
http://www.theregister.co.uk/2011/11/14/amd_opteron_4200_6200_launch/

実は12億トランジスタでした
最初20億とでたのは間違い
326Socket774:2011/11/22(火) 00:38:01.26 ID:GCEFOAA9
モジュールx4とL3だけで12億超えそうだけどな
327Socket774:2011/11/22(火) 00:57:42.87 ID:XVOOGEAh
間違いというかてきとーに見積もっただけですかね。にしてもかなりスカスカな感じです。まあダイ写真見ても明らかですけど。
ノースブリッジは既存のK10からかなり流用したというらしいので、そこら辺のレイアウトが甘いんでしょうかね。
といっても1Module+L2で213MいくのでL3とあわせるとどう考えても足りんような気がします。

一応GPUにトランジスタを使えばかなりの密度には詰め込めるようなので、GFの32nmSOIは性能より密度重視なのでしょう。
(Llano 4Coreは1450Mに対して228mm^2で1mm^2あたり6.36M、Bulldozerを2Bとしたときの1mm^2あたりの密度はほぼ同じ6.35M)
328,,・´∀`・,,)っ-○○○:2011/11/22(火) 01:07:33.62 ID:reyen26Y
どっちでもいいじゃん。
トランジスタの量は結果を得るためのコストであって、消費者が求める結果(性能)そのものではない。
本当に20億も使ってこんな程度のものしか作れないならx86から逃げてもまともなもの作れないぜ。
329,,・´∀`・,,)っ-○○○:2011/11/22(火) 01:10:33.41 ID:reyen26Y
>>327
低クロック動作だと密度あげられるからね。
CPUでもL3キャッシュのクロックをコアより落とし密度をあげて容量増やすのは常套手段だし
(キャッシュの場合クロックだけじゃなくて平均アクセス頻度も少ないけど)
330,,・´∀`・,,)っ-○○○:2011/11/22(火) 22:13:22.64 ID:reyen26Y
俺のスレストぶりは半端ない
331Socket774:2011/11/22(火) 22:14:38.05 ID:o4wpKpTF
おまえってセコンドガレッジやってるほう?
たまには更新しろよ
332,,・´∀`・,,)っ-○○○:2011/11/22(火) 22:28:26.84 ID:reyen26Y
レンタル料3年分纏め払いしてそれ以降払ってない。
故に今月いっぱいで閉鎖。
333Socket774:2011/11/23(水) 02:02:38.97 ID:ZSEGTZX/
だんごさん、AVXやってる?
あれ速い?
SSE2系の延長で考えていい?
334Socket774:2011/11/23(水) 12:42:11.78 ID:vYM1HkSG
なぜここで
ム板の汗スレじゃいかんのか
335Socket774:2011/11/23(水) 14:24:38.07 ID:sEh8QXTP
インデックス修飾はどのような目的で作られたアドレッシングモードなのか
教えてください
336Socket774:2011/11/23(水) 17:28:42.10 ID:Q+Hu7iID
x = ar[3];
337Socket774:2011/11/26(土) 10:07:02.49 ID:RNSKGm+6
ソフトウェアトランザクショナルメモリのハードウェア支援は
Rockと共に消失?
338Socket774:2011/11/26(土) 11:14:55.81 ID:E514+JLY
64バイトのキャッシュラインを単位に、複数のラインを同時に書き換え監視したり
atomicに更新できたりすると、夢がひろがりんぐ。
339Socket774:2011/11/26(土) 13:19:37.46 ID:Tml2pRZY
>>337
BG/Qで復活
340Socket774:2011/11/26(土) 13:25:17.55 ID:E514+JLY
341Socket774:2011/11/26(土) 17:16:29.03 ID:s4W95dtS
tbbのcache_aligned_allocatorとatomic使えばよくね?
342Socket774:2011/11/26(土) 17:39:32.64 ID:gxKc78+W
>>341
TBBのatomicってよく知らないけどただのクリティカルセクションじゃないの?
だとすると複数のクリティカルセクションを合成したときにデッドロックが発生する可能性がある
STMはそれをプログラマが特に考慮する必要がない

ただ、純粋にソフトウェアで実装するとマジで重いので
バリアとかをハードウェアで実装して高速化する
343Socket774:2011/11/26(土) 17:41:32.96 ID:gxKc78+W
変な書き方をしてしまった
クリティカルセクション -> ロックを使ったクリティカルセクション
344Socket774:2011/11/26(土) 19:25:30.11 ID:E514+JLY
ロックを使った排他制御は、メニーコアにスケールさせたときに性能劣化が激しいのも問題。
クアッドコアで1コアが共有資源をロックして、他3コアを待たせるのは許容範囲でも、
メニーコアで他の15コアとか63コアとかを待たせると、結果として待ちだらけになってしまうからね。
345Socket774:2011/11/26(土) 19:45:43.93 ID:JqHPUTc4
ロックとかスヌープとかないようにできないんかな。
コア増えるほど頭打ちになってくじゃん。
346Socket774:2011/11/26(土) 20:03:55.74 ID:E514+JLY
BG/Qのmulti-versioned cacheは他アーキテクチャに広まればかなり有望かと。
347Socket774:2011/11/26(土) 20:09:44.85 ID:izktWWga
Itaniumにも似たような機能なかったっけ
348Socket774:2011/11/26(土) 20:17:57.37 ID:E514+JLY
無いと思う。
> BG/Qが実用化されると、トランザクションメモリのハードウェアサポートを
> 持つ初めてのプロセサとなる。
と本文にもある。
349Socket774:2011/11/26(土) 21:16:39.80 ID:s4W95dtS
>>344-345
parallel_reduceを使えばロックは結構な割合で削減できるしパフォーマンスもコア数に比例して上がる事が多い
350Socket774:2011/11/26(土) 21:25:49.48 ID:E514+JLY
>>349
ここでやりたいのは並列処理じゃなくて、
たとえば一つの連結リスト(同等の機能を提供する構造であれば何でもいいが)という共有資源に対して
どう効率よく並行アクセスを許すか、という話なのだ。
351Socket774:2011/11/27(日) 03:06:32.10 ID:g/uiiUxD
>>344
待たなかったら正常動作しないんだからしょうがない
4個と16個じゃプログラム設計から変えないとならんがメモリは一本だからヤル気出ねぇ
352Socket774:2011/11/27(日) 04:40:03.01 ID:S3cb5ypX
よく最適化された同期ルーチンは
ほぼmfenceのコスト
つまりロード・ストアキューのフラッシュのコスト
なんでSTMだろうがロックだろうがあんまりかわらん

まぁOpenMPですら多くの場合ろくに最適化されてない
最適化されたロックは自作するほかないという現状は問題ではあるが
353Socket774:2011/11/27(日) 06:25:35.19 ID:X4h1uf+C
この場合に着目している排他制御のコストは
ロック方式の場合、実際にロックが衝突してスピンで待たされる事象かと。
STMというロックのない同期(代わりにリトライはあるが)をいかに低コストで実装するかを考えたときに
IBMの回答がマルチバージョン化L2キャッシュによるハードウェア支援。
RockはL1だけだったので一歩踏み込んでいる。

しかし、トランザクション中、プロセスコンテキストスイッチとかL2をフラッシュするような事象に
対応できるのだろうか……?
ひょっとしてHPC限定なのだろうか。
354Socket774:2011/11/27(日) 07:22:01.68 ID:6jXdGQU6
結局、マルチバージョンとか楽観的並行制御とか
トランザクション処理で研究されてきた手法になるのか……?
355Socket774:2011/11/27(日) 11:01:23.94 ID:l+fyjYfS
マルチスレッドや同期の説明が詳しいアーキテクチャの本ってないの?
356Socket774:2011/11/27(日) 14:03:05.27 ID:8LUvJufy
357Socket774:2011/11/27(日) 18:41:19.85 ID:S3cb5ypX
STMでもコア間通信をメモリシステムを介しておこなう以上
衝突がなくてもメモリオーダリングを保証する必要がある
現代のx86CPUではここにコストがかかってしまう
358Socket774:2011/11/27(日) 19:26:52.36 ID:+BBan95l
>>357
x86を駆逐すると言われているARMだと低コストなの?
359Socket774:2011/11/27(日) 20:05:56.75 ID:QOcm5FUv
>>355
まずはTanenbaum先生から学ぶのを強くおすすめしておく。
http://www.amazon.co.jp/dp/4894715376
> モダン オペレーティング システム 原書 第2版 [単行本]
360Socket774:2011/11/27(日) 20:06:05.30 ID:bo6+qjty
>>358
誰がそんな寝言を?
361355:2011/11/27(日) 23:14:49.27 ID:l+fyjYfS
>>356, >>359
thx。今度買って読んでみるなり。最近めっきりソフト事情わからんので。
362Socket774:2011/11/28(月) 00:49:48.08 ID:nZys/Ktu
>>360
そういえばAMDスレの気違いが言ってたな。
363Socket774:2011/11/28(月) 00:51:26.04 ID:OvAxwLmt
スーパーファミコンについて質問だけど、
スーパーファミコンのCPUは16bitで、
メモリ容量は64KBまでしか扱えないはずだけど、
メインRAMだけで128KBも搭載しているのはどうして?
364Socket774:2011/11/28(月) 00:55:52.14 ID:cYUakT45
セグメント方式を採用してるのかな?
365Socket774:2011/11/28(月) 01:00:00.72 ID:G530zl56
>>363
SFC/SNESのCPUは65816互換の16bitチップで24bit(16MB)のメモリ空間を持つ。
命令カウンタやアドレスレジスタは16bit長なんでバンクアクセスだけど。
366Socket774:2011/11/28(月) 01:00:01.50 ID:nZys/Ktu
>>363
http://ja.wikipedia.org/wiki/65816_(%e3%82%b3%e3%83%b3%e3%83%94%e3%83%a5%e3%83%bc%e3%82%bf)
アドレスは24bit。
367Socket774:2011/11/28(月) 01:22:03.41 ID:OvAxwLmt
なるほど。
残りの8Mbitはどうやってメモリ空間を確保しているんですか?

でもCPUが16bitだから、一度に扱えるプログラムの最大量は64KBが限度ですか?
368Socket774:2011/11/28(月) 01:28:21.03 ID:PWNpyKXW
君のパソコンにも付いているx86の元祖16bit CPUのi8086だって16bit CPUで1MBも扱えたよ。
369Socket774:2011/11/28(月) 01:32:42.11 ID:G530zl56
>>367
基本は16bitアドレス+8bitのバンクレジスタ値=24bitアドレスだが、24bitダイレクトアドレスを
扱う命令も持ってる

ttp://hp.vector.co.jp/authors/VA042397/snes/65816.html
370Socket774:2011/11/28(月) 01:37:38.49 ID:OvAxwLmt
つまり、16MBのメモリ空間を256個に分割し、
16bitCPUから64KBのメモリ256個にアクセスできるように見せているんですか?
371Socket774:2011/11/28(月) 07:23:57.83 ID:4zQT3kTK
>>357
え?
キャッシュ経由、あるいは内部バス経由で届かなかったっけ?
372Socket774:2011/11/28(月) 12:50:08.20 ID:j/RjBP71
>>371
チップ内バス経由でもコストがかかるということ
大体だけどロードストア片方なら50cycle両方なら100cycleくらいかかる
373Socket774:2011/11/28(月) 19:27:51.22 ID:4zQT3kTK
>>372
把握

しかしFXのインターコアレイテンシでかいな・・・
昨日Sandraで計ったが棒グラフが飛び出してやがる
374Socket774:2011/11/28(月) 19:29:37.91 ID:cYUakT45
いつもメモリアクセスが足を引っ張る。
375Socket774:2011/11/28(月) 21:38:22.70 ID:OvAxwLmt
ここにはSFCのCPUは64KB×256バンクと書いてある

http://www.d-colors.net/game/sfc.html
376Socket774:2011/11/29(火) 10:32:45.64 ID:ESmoCS4I
65816は24ビットアドレッシングに対応してるんだよね?
64180みたいに、64KB空間内に別のアドレス領域を呼び出す形じゃないと
バンク「切り替え」とは呼びづらい印象
377Socket774:2011/11/29(火) 18:45:38.37 ID:V664wuwR
65816は一部のアドレッシングモードで24ビットリニアアドレスに対応している
>>369のリンク先が正確

かなり嫌なCPUだった
378Socket774:2011/11/29(火) 18:59:50.87 ID:BsFBzaDa
マルチコアから高性能コアで進化を目指すインテルのCPU
http://plusd.itmedia.co.jp/pcuser/articles/1111/29/news008.html
379Socket774:2011/11/29(火) 19:03:54.17 ID:V664wuwR
でもないな
スタック相対アドレッシングが二つ抜けている
380Socket774:2011/11/29(火) 19:13:37.34 ID:s/l3GAGD
>>378
うん
やっぱこの企業アホだわ・・・
381Socket774:2011/11/29(火) 19:25:33.48 ID:V664wuwR
と、中卒ひきこもりが申しております
382Socket774:2011/11/29(火) 19:35:17.22 ID:BsFBzaDa
ID:s/l3GAGD

Socket AM3/AM3+マザー総合 Part4
596 :Socket774[sage]:2011/11/29(火) 01:18:48.37 ID:s/l3GAGD
>>595
オンボならソレくらい大目に見てやれよ・・・
価格から言えばC/P最強なだけある

それでもBulldozerを買った漏れは豪傑
588 :Socket774[sage]:2011/11/29(火) 01:21:01.38 ID:s/l3GAGD
>>586
俺貴族か
なら貴族らしく憐れな民をAMDへと導いていかねばならぬな

【AM3+】AMD FX総合 2台目【Bulldozer】
481 :Socket774[sage]:2011/11/29(火) 11:23:00.18 ID:s/l3GAGD
k15statはよ

【AM3+】AMD FX総合 2台目【Bulldozer】
489 :Socket774[sage]:2011/11/29(火) 17:46:39.65 ID:s/l3GAGD
>>486
実際はCPUとかの場合色々と要素があるから単純にはいかないけど
まぁ大まかにはそうだね

それでもBulldozerを買った漏れは豪傑
603 :Socket774[sage]:2011/11/29(火) 19:06:50.68 ID:s/l3GAGD
>>601
同感

マジな話、自身で使ってみるまでわかんねぇ

383Socket774:2011/11/29(火) 21:57:03.94 ID:M4jKqbzM
CPUは1Gヘルツぐらいにクロック周波数を抑え、
コアを16コアぐらいにした方がいいんじゃないの?
384Socket774:2011/11/29(火) 21:58:08.94 ID:q0VU5NZY
つ「シングルスレッド性能」
385Socket774:2011/11/29(火) 22:09:19.79 ID:P5LxLEmN
処理にはほぼ必ず並列化できない部分があり、アムダールの法則により、
シングルスレッド性能は依然として重要。
メニーコアCPUの代表・SPARC T1は1.4GHzの低クロックコアで始まったが、
最新のT4では3.0GHzの「普通の」コアになっている。
386Socket774:2011/11/29(火) 22:11:13.10 ID:lRNv0DQ2
EPIC+OoOEでも1GHzじゃC2Dに負けるな
387Socket774:2011/11/29(火) 22:30:11.28 ID:M4jKqbzM
>>384-385
だよね。
OSやソフトが必ずしもマルチコアに対応しているとは限らないから。
388Socket774:2011/11/29(火) 23:14:17.83 ID:rW23Gh8f
PGの立場からすると性能を上げるためのマルチスレッドって難しいし面倒なんだよね
排他処理だとか同期だとか何だとか
GPGPUが何だとか騒がれててもなかなか一般用途に降りてこないのはそのせい

GPGPUを本気で普及させたいなら、勝手に並列化してくれるコンパイラが必須だと思うわ
何も考えなくても勝手にMMXやSSE使ってくれるIntelコンパイラみたいにさ
389Socket774:2011/11/29(火) 23:24:05.91 ID:AXPxuOSq
ICCはそんなに賢くないよ。使ったことあるの?
SIMD化できるのは単純なループ位
まともにSIMDを活用するにはintrinsicsを使わざるを得ないのが現状

GPUを使った自動アクセラレーションとか実用には程遠い
OpenMP程度のセマンティクスすらGPUコードの自動生成とかできない
そもそもGPUでまともな性能を出すためにはアルゴリズムから調整しなおす必要がある
GPUにポートしたのにCPUよりワットパフォーマンスが悪化するなんてことは簡単に起きる

どうせ人力が必要ならせめて書きやすくしたいよねってことでC++AMPとかが提案されている
390Socket774:2011/11/29(火) 23:41:46.71 ID:s/l3GAGD
>>381
残念ながら高卒だ
まぁアホなのは自他ともに認める
391Socket774:2011/11/30(水) 00:37:54.44 ID:U/q7yGsd
先日のIDFでIntelはCilk Plusをアピールしてたな
Xeon用のコードを書いておけばMICへの対応はリコンパイルだけで良いと
392Socket774:2011/11/30(水) 00:39:55.06 ID:5tFd22DD
>>390
正直でいいなw
まあ統計では高卒以下って決して少数派じゃないんだけどね。
393Socket774:2011/11/30(水) 01:13:54.75 ID:Dw2YNB+j
>>378
Intelすげぇな・・・
わくわくしてきたぞ。
394Socket774:2011/11/30(水) 02:14:33.62 ID:sDhY0nUo
スマートフォンや組み込み向けでGPUを積極的に利用する動きが盛んだから
そこから逆輸入される展開もありじゃね
395Socket774:2011/11/30(水) 17:48:59.46 ID:LwEgcoZn
ゲームにしか使われてないじゃん
396Socket774:2011/11/30(水) 20:15:28.61 ID:j5ymgfwb
米クレイ、京大からスパコン受注 富士通「京」に競り勝つ
スーパーコンピューター専業の米クレイ(ワシントン州)が、京都大学の次期スパコンを受注した。
学術情報メディアセンターに納入、2012年5月に稼働させる。旧帝大7校が海外製スパコンを主要機種として採用するのは初めて。
京大は1969年以来、富士通の牙城だった。受注額は外部記憶装置などを含め40億円未満。クレイは今回の受注を機に、国立大学や公共研究機関への販売を強化する。
397Socket774:2011/11/30(水) 20:25:41.66 ID:aBgYbdRO
>>388
ソフト屋さんでもマルチスレッドってそんなに難しいの?
俺はBASICやC、Javaの基礎しか知らないタコなんだけど。

マシンを会社組織になぞらえて、この処理は山田さん(山田スレッド)、この処理は鈴木さん(鈴木スレッド)
忙しいときにはみんなで手分けする、呼び出し(メッセージ)をやり取りして。
単純だけど大量の処理は下請けの爺費有(GPU)さんに外注する。

そんな素人の考えじゃだめなのかな
398Socket774:2011/11/30(水) 20:56:23.47 ID:5mvHBE8Z
>>397
山田さんの仕事の結果次第で鈴木さんの仕事が変わるような処理が多い

399Socket774:2011/11/30(水) 21:27:41.42 ID:sDhY0nUo
>>395
んなこたぁない
普通の操作の画面遷移にGPU支援使うのはもう当たり前になって来てる
GPGPUもどんどん使っちゃおうぜって流れも
400Socket774:2011/11/30(水) 21:31:29.94 ID:BSOM0wor
>>397
「アムダールの法則」
www.ne.jp/asahi/comp/tarusan/AMDAHAL.jpg
401Socket774:2011/11/30(水) 21:41:50.37 ID:BSOM0wor
間違えて画像だけのそれも不完全URL張ってしまった…

古いがわかりやすいブログ記事
http://www.ne.jp/asahi/comp/tarusan/main72.htm
同トランジスタ数でコア数を変えた場合の性能グラフ
http://www.ne.jp/asahi/comp/tarusan/AMDAHAL.jpg
HTやBulldozerのような手法が有効な理由のグラフ
http://www.ne.jp/asahi/comp/tarusan/SMT-CMT.jpg
402397:2011/11/30(水) 22:02:46.68 ID:aBgYbdRO
進捗報告会議・対応再検討スレッドも必要になるのか
動的にコードを書き換えて再コンパイル・リンクみたいで訳わからなくなるわ
403Socket774:2011/11/30(水) 22:07:08.66 ID:+rXwWkIl
>>396
クレイってことは、これOpteronなのか?
404Socket774:2011/11/30(水) 22:09:59.15 ID:2uIjQAjY
>>397
> 忙しいときにはみんなで手分けする、呼び出し(メッセージ)をやり取りして。
手分けする処理を予め決めておかないといけない
呼び出しあってデッドロックが発生するとアウト

とはいえ、マに任される現状のままではマルチスレッド化は進まないね。
コンパイラやハードの支援も欲しい。
依存関係がなくて空きコアがあれば、自動でスレッドを分ける、
くらいのコンパイラとハードは作れるはず。
405Socket774:2011/11/30(水) 22:14:42.80 ID:6LhwoOoq
仮想化サーバのように、無関係な処理を持ってこない限り、
依存関係がない、ということは無い。
406,,・´∀`・,,)っ-○○○:2011/11/30(水) 22:29:33.52 ID:BLsBPrps
>>403
Xeonもあるからなぁ。
Magny-Coursからのアップグレードならともかく、Opteronを今選ぶ意味ってあんま無い気がするんだが。
407Socket774:2011/11/30(水) 22:30:14.73 ID:oo875wwP
>>404
C言語の仕様で依存関係の有無を判定するのは無理だろ
ポインタで指された先の領域がどこかでオーバーラップしてるかもしれないんよ
408Socket774:2011/11/30(水) 22:32:01.92 ID:oo875wwP
409Socket774:2011/11/30(水) 22:56:30.75 ID:QJ/zeYrz
2位じゃダメですね、入札も
410Socket774:2011/11/30(水) 23:15:21.40 ID:jT2q8XBk
>>397
マルチスレッド自体は別に難しくないぞ
山田さんが営業して、鈴木さんが電話番して、佐藤さんが会計処理するみたいな感じなら

難しいのは3人で分担して会計処理をして早く仕事を終わらせろって言われた場合
分担をきちんと決めておかないと作業が重複して無駄になるし、
二人以上同時に同じ書類を見られないから、誰かが使ってたら使い終わるまで待たなきゃいけなかったり
Aを処理するためにはBとCの情報が必要で、Bを処理するためにはDを…なんて場合もあるし

そういった諸々を勘案してプログラムを作るのが面倒くさくて難しいってお話
411Socket774:2011/12/01(木) 15:14:20.44 ID:Do65qa+4
64kBの頃にはメモリーを確保するのに少しの量、少しの期間の占有も
無駄は省かなければ、みたいな感じがあったが、
今、メモリーを少し余分な期間や分量を確保してもあまり気にしていない
プログラマは多いだろう。保守性の高さとか、メモリー最適化よりも
優先したいことことがいくつか考えられる。

今はせいぜい1ソケット20スレッドくらいだから、どのスレッドも常に
フル稼働するのがハードを生かすよいソース、と考えている。
もしも使えるスレッド数が数桁ほど増えたら、立ち上げたスレッドに
暇そうにしてる時間があってもあまり気にしなくなるかもしれない
412Socket774:2011/12/01(木) 15:36:56.78 ID:wde0wUa6
リッチコアはコスト高いが、
メニーコアのインターコネクトはもっとコスト高い。
413Socket774:2011/12/01(木) 15:37:35.92 ID:Do65qa+4
>>403
12年のはOpteronだな。予定通りに14年に追加があるならそっちは
インターコネクトがPCI-EのCascade だから、その時点で性能のいい方になるだろう
414Socket774:2011/12/03(土) 02:14:38.21 ID:0PWAawPk
ブルの評価が、意外と悪くない
ttp://news.mynavi.jp/special/2011/zambezi2/index.html
大原評

・サーバ用のCPUとして使う限りはSandyに匹敵する性能
・これをデスクトップPC向けに流用したことが論外、暴挙。
みたいな感想が書かれている。
デスクトップPC用のCPUとして使う限り、PhenomIIと比べても少し劣る性能しか出ない。とね。
415Socket774:2011/12/03(土) 02:35:04.73 ID:go6ULmKY
大原自身は最初のころより随分発言が変わってるけどなw

http://ascii.jp/elem/000/000/489/489200/index-2.html

>独立した3つのALU命令と3つのLoad命令であれば、実質1.5サイクルで処理できることになる。
つまり、単純に「IPCが減った」と言い切れない構成に変わったわけだ。
Load命令+ALU命令であっても、実質的なスループットはむしろK10よりも向上する可能性が高い。

それが

>本来ならIPCが3→2に下がっているのだから、これを補うためには動作周波数を50%引き上げる必要がある。
416Socket774:2011/12/03(土) 03:14:49.56 ID:OjyaBmr3
庇おうとして庇いきれなかった
最低限現行アーキテクチャと同等の性能はあるだろうという低めの予想をも下回った
417Socket774:2011/12/03(土) 03:16:16.80 ID:dcYG1PdD
1年くらい前はAMD自身がK10→BullはIPCも向上するって言ってたから
418Socket774:2011/12/03(土) 04:07:35.11 ID:cj9P9sX8
実行ユニットが減ったから2命令でぴったり張り付いてるグラフはある意味笑えた
419Socket774:2011/12/03(土) 06:50:25.61 ID:2a8NDgog
相変わらず長い
420Socket774:2011/12/03(土) 13:36:44.51 ID:qVme7aJ5
噂: 3GHzCPU、768MBRAM…国内開発者がWii Uの具体的なスペックをリーク
http://gs.inside-games.jp/news/comment.php?id=20883&page=2
421Socket774:2011/12/03(土) 14:17:45.46 ID:Jvwn3hJZ
G3系と970系で若干違うとはいえ
Broadwayの拡張がXenon風PowerPCのクアッドというのはわかりやすいが、
DRAM内蔵等で差異化できないと
本当にXbox360を遅れて出しただけになってしまうな。
422Socket774:2011/12/03(土) 14:23:15.09 ID:2a8NDgog
PCの派生品で作るようになってからまるで面白くなくなったなゲームコンソールも
OSも順調に重くなってるようだし
423Socket774:2011/12/03(土) 16:59:42.34 ID:MGMqsxof
2Gbitチップを3枚か4枚重ねたら768MBか1GBだし
噂が本当ならダイスタックなんだろうな。
でも45nmなら熱が多いし、スタックはDRAMだけでCPUとはMCMかも
424Socket774:2011/12/03(土) 17:51:34.52 ID:OjyaBmr3
そういえば、Broadway製造元のこんな話を読んだばかりだった。

http://www.geocities.jp/andosprocinfo/wadai11/20111203.htm
> 2011年12月1日にIBMとMicronは,IBMがMicronのHybrid Memory Cubeを製造すると
> 発表しました。製造プロセスは32nmのHigh-K Metal gateで,IBMのEast Fishkill
> 工場で製造されます。

任天堂は必ず変なメモリを積んでくるが、まさかなあ……
425Socket774:2011/12/03(土) 18:24:39.35 ID:cj9P9sX8
いままで1T-RAMとかeDARMとか実績たっぷりすぎるし容量より速度取るとか2012年に出すにはメモリ少なくねとかほんとにやりそうで怖い
426Socket774:2011/12/03(土) 20:36:14.85 ID:VsY2lY6Z
チョニーと任天堂は変なメモリを積む上に容量を少なくするから、
PCでのゲーム製作技術が応用できないし、
少ないメモリ容量をやりくりする事に終始するので最悪。

PCで主流となっている汎用メモリをたくさん積むのが一番良いのに何故それをやらないのか?
427Socket774:2011/12/03(土) 20:43:42.76 ID:XhgvODwK
容量より帯域
428Socket774:2011/12/03(土) 20:47:44.78 ID:0PWAawPk
>>426
たぶん、PCとは比較にならんほどにコスト削減圧力が強いからだろう。

と思うのだが、PS3とかの値段を考えれば、もうちょっとメモリ増やせって思うのが普通だよな。
出現当初はともかく、今もこの値段っていったい... とついつい考えてしまうレベル。

PC用メモリが今のように格安で売られる時期には特に強く思う。
429Socket774:2011/12/03(土) 20:56:39.56 ID:1Vwxncur
発売時期も勘定にいれなよ
430Socket774:2011/12/03(土) 21:07:44.51 ID:78eB8o52
ヘテロジニアスだとか新CPUをギリギリまでコストかけて頑張っても
そのしわ寄せコストの折り合いでメモリサイズまでギリギリじゃ
開発者にいったい何をやらせたいのか
片手落ちもいいところ
431Socket774:2011/12/03(土) 21:40:23.95 ID:MGMqsxof
やっぱ帯域のために容量は絞り込んでると思うな

PCでメインメモリが遅いのに見栄えのいいゲームができるのはGPU-VRAM帯域が
広いからと、CPUが多くのキャッシュを積んでメインメモリの遅さを
隠蔽しているから。キャッシュのふんだんなCPUはダイが大きくなって
高くつくし、VRAM専用帯域を設けるハードもチップ数が増えて高くつく。
PS3を企画した頃のようなコストのかけ方は今は難しいだろう
432Socket774:2011/12/03(土) 22:05:01.06 ID:pHu+kt/h
変なメモリを使うのはDDR3とかだと帯域稼ぐのにビット幅を増やさないといけないからだよ
ビット幅を増やすとボードのコストにそのまま跳ね返るから

コンシューマゲーム機は長い期間で大量の部品を調達するから
変な部品を使う方がまだコスト削減できる
433Socket774:2011/12/03(土) 22:15:45.52 ID:LgGuUF7E
PS3や箱は良い線いってたと思うけどな
まだPS2時のHL2みたいなソフトがPCで出てきてないし
新ハードは何処も厳しそう
頓挫した物理演算チップとか変化球で載せてこないか期待してるけど
それなら部品数削ってGPUに金かけた方がよさそうだし

>>432
初期の箱のGDDR3配線はぐちゃぐちゃだったな
PS3のGDDR3はGPU上に載せてたけど、メモリクロック下げたんだっけ
434Socket774:2011/12/03(土) 22:18:49.02 ID:K/AEA7Z2
ゲハは無知なんだから黙ってろ
435Socket774:2011/12/03(土) 23:10:16.28 ID:EXilt/Jd
ゲハすぎるわ
436Socket774:2011/12/04(日) 00:39:59.81 ID:QVduBP7n
そもそもPCじゃないんだからメモリ容量そんなにいらない。
437Socket774:2011/12/04(日) 00:48:37.27 ID:oCAY8S/P
>>436
少ないだろバカ

特にPS2とPS3は酷すぎる
438Socket774:2011/12/04(日) 00:55:39.34 ID:JJWNyvSc
RING基板は1GBらしいから少ないけど全然ダメという少なさじゃない。
とはいえ、アップグレードせずに数年使い回すのだから1GB越えるくらいじゃないと。
439Socket774:2011/12/04(日) 01:40:45.81 ID:qd4UWlbn
PSPも初期設計どおりeDRAM 8MBのみだったらいまごろ楽しかっただろうな

PC-FXにはメインメモリの増設スロットがあったなそういえば
440,,・´∀`・,,)っ-○○○:2011/12/04(日) 11:55:28.57 ID:i89MGNmc
>>417
IPCが向上するなんて言ってないぞ。シングルスレッド性能が向上するとは言ってたが。
(もちろん「XOPやFMA4などの新命令を使わずにできる」なんてことは言ってない)
441Socket774:2011/12/04(日) 12:23:56.34 ID:Rre4N0Rl
コンソールはハード決め打ちなこともあって
メモリが足りないのは工夫すればなんとかなるんだけど
帯域とかレイテンシはわりと工夫の余地がなく、致命的に表現を制約するんですよ。
5年同じハードを使い回す≒工夫に費やす時間の猶予はある、という観点で
容量よりも性能が優先されがちです。
442Socket774:2011/12/04(日) 13:20:44.26 ID:wx/hqeKO
K10をFMA4やXOP、C6ステートに対応させりゃ良かったんじゃねというのは禁句なんでしょうか(´・ω・`)
443Socket774:2011/12/04(日) 14:00:59.47 ID:QMlML57q
>>442
TimnaのためにP6の要素を分解して再構成したチップをつくり、
さらにBaniasへと進化させたイスラエルチームのような別チームをAMDが持つ余裕があれば、
並行してそういうのを作ることもできたんじゃないの?
444Socket774:2011/12/04(日) 14:30:59.65 ID:Qtx7SijC
鯖用とPC用に異なるアーキテクチャのCPUを並行開発できないAMDの弱点が、
Athlon64では逆に有効手になってたけど、
今回のブルでは順当にデメリットが大噴出した。

ということだよね?
445,,・´∀`・,,)っ-○○○:2011/12/04(日) 14:56:28.12 ID:i89MGNmc
>>442
Llanoが未だにSSSE3すら対応してない(Core 2登場から5年も経ってるにもかかわらず)。
あのデコーダ改良できる人いないんじゃないの?
446Socket774:2011/12/04(日) 15:39:32.86 ID:ekxDfIq4
作った本人以外でも改良できるような骨太の開発体制の構築って難しいよな
中小企業はどこも苦労していると思う
447Socket774:2011/12/04(日) 17:03:24.04 ID:u38wn0LR
COBOLが思い浮かんだ俺。
448Socket774:2011/12/04(日) 18:38:29.17 ID:YSZkohac
449Socket774:2011/12/04(日) 18:43:42.34 ID:ekxDfIq4
モジュールあたりのIPCだったんだよ!!!1!
450Socket774:2011/12/04(日) 18:50:38.73 ID:3uqlOV77
な、なんだtt(ry
451Socket774:2011/12/04(日) 19:43:44.26 ID:wx/hqeKO
>>446
ファブレスになった以上最早R&D部隊の確立無くしてAMDの存続は成しえないから頑張ってほしいなぁ

まぁあの取締役会だからこれからもお馬鹿な決定をいっぱい寄越してくれそうだけどさ・・・
452Socket774:2011/12/05(月) 20:40:01.96 ID:w2YwVfa9
>>441
でもPS3でXDRAMを採用した事は評価できない。
当時からDDR3SDRAMは存在していたし、
今でもDDR3SDRAMが現役。
453Socket774:2011/12/05(月) 21:05:19.37 ID:ZQ/O2CSZ
>>452
当時のDDR3じゃPS3のXDR RAMの帯域出せないだろ
454Socket774:2011/12/05(月) 21:07:11.74 ID:iGMiZNca
黄石。
455Socket774:2011/12/05(月) 21:21:04.85 ID:w2YwVfa9
>>453
メモリは帯域よりも量が重要だよ。
PS3はメモリの量の少なさが足枷となり、
ライバルのXBOX360やPCゲームに勝てないし、
少ないメモリをやりくりする為にソフト開発費が高騰している。
456Socket774:2011/12/05(月) 22:37:26.00 ID:pEGnq++x
1チップの帯域とシステムの帯域。ゲーム機はコストがタイトで
チップ数を減らしたいから、同じ容量、同じシステム帯域でもチップ数が
少なくなる速いインターフェイスを選ぶ。
457Socket774:2011/12/05(月) 22:48:08.31 ID:5plYKqOo
バカが沸いてるな
458Socket774:2011/12/05(月) 22:52:28.70 ID:CgxaGLhl
少なくとも、456の言うような考え方でハードを作ってる会社があるのは事実だと思うんだ。
その方向性が妥当かどうかとは別問題として。

その奇抜な発想が突き抜けていたのがPS2のローカルメモリのビット幅の広さ。

結局、後継ハードで互換性を確保できなくなった原因でもあるんだろ?
それに、時間が経つと製造コストが下がる、はずがなぜか下がらなくて赤字を出しやすかったり。
459Socket774:2011/12/05(月) 23:13:08.93 ID:si5ddA9c
PCを超えるゲーム機は出ないってことになる
ま、アーケードで唯一がんばてるtypeXがPCだしな
460Socket774:2011/12/05(月) 23:47:25.77 ID:K5X7vRTH
戦いは数だよ
461Socket774:2011/12/05(月) 23:57:03.75 ID:iGMiZNca
PCは金かけただけ良いグラフィックスで楽しめるのがイイなぁ。
この拡張性は魅力だよ。
選択肢は多いに越したことない。
462Socket774:2011/12/06(火) 00:11:38.96 ID:vpYBVsuC
登場時点でハイエンドPCより描画性能が高いというのはPS2が最後だったからね

PS3/XBox360以降のコンシューマゲーム機のアドバンテージは
1)同一性能であれば低コストであることと
2)PCでは最低限遊べる環境を低めに設定する必要があるがその必要がないこと

今後数年でIntel内蔵GPUが十分な性能を持つようになれば
ゲームを遊べるレベルのPCが普及することになるので
これらのアドバンテージは消失する

となるとあとは さらに高性能に逃げるか 特殊なUIで差別化するしかない
でもMSはKinectをPCに開放してるしあまりゲーム機本体に囲い込む気はなさそう
463Socket774:2011/12/06(火) 00:16:44.27 ID:ZOtQUQa5
3)電源とゲームメディアを入れるだけでゲームが出来る

これ、大きいぞ。子供でもお年寄りでも簡単にできるからな。
464Socket774:2011/12/06(火) 00:22:12.88 ID:V03LSFq0
しょぼい考察聞かされる身にもなれよ
2+1個しか挙げられないってどんだけ低能だよw
ゲハはおとなしくロムってろ
465Socket774:2011/12/06(火) 00:34:31.53 ID:eRNtx7t8
取り敢えずPCあればゲーム機イラネ
466Socket774:2011/12/06(火) 00:42:14.71 ID:ICZgaaMK
>>465
ゲーム機用のソフトの大半がPCでもプレイ可能な状況じゃなけりゃ
そもそも二択が成立しないんだが
467Socket774:2011/12/06(火) 00:43:54.96 ID:ooBSftg1
そうなった今ゲーム業界側はどういうハードを構想するべきなのかね。
PCのGPUが高速化しちゃった今ゲーム向きに差別化できるCPU・GPUは何か。

まあやりようがないってのが答のような気もする。
468Socket774:2011/12/06(火) 00:44:07.33 ID:nkntBAEY
>>462
VRAM4MBのゴミのどこがハイエンドなんだよw
一年以上前に発売されたドリームキャスト以下のメモリ容量。

>>463
>3)電源とゲームメディアを入れるだけでゲームが出来る

PS3と箱○のソフトは、電源とゲームメディアを入れるだけでは遊べないから糞
家庭用ゲーム機のアドバンテージを自ら放棄している
469Socket774:2011/12/06(火) 02:00:00.06 ID:+sMuGSqC
まあ、GSはシェーダ以前の古典的なハードで
フィルレート=帯域命の設計だからな
470Socket774:2011/12/06(火) 05:39:52.78 ID:HMCNVH6p
DirectX7の世代の範囲で、
速度を優先して機能を削減したような構造だよね。

テクスチャを張ると速度半減ってのも大きな制限の一つだけど、
VRAM容量が小さすぎるからテクスチャを利用すること自体が困難だから、
速度半減という弱点は実質的にはあまり関係ないか。

カタログスペック通りの高性能を発揮させるためにはすさまじく労力が必要な厳しい構造だったんだよな?
471Socket774:2011/12/06(火) 08:27:01.95 ID:qsGC0f82
>>462
そもそも性能の要らない2DゲームみたいなものだってPCでやる人は少ないわけで
コスト云々以前に市場がない気が…
ハイエンドなんて志向する客はさらにほんの一部なんだから、高い金出してグラボ買ってね!で棲み分け出来てると思う
472Socket774:2011/12/06(火) 20:27:53.02 ID:nkntBAEY
PS2の糞仕様の所為で、どれだけ多くの日本のソフトハウスが潰れ、
どれだけ多くの日本のソフトハウスが開発能力や競争力を失ったか知れない。
473Socket774:2011/12/06(火) 20:29:47.18 ID:nkntBAEY
>>471
廃スペックゲーム機が生き残る道は、
アーケード筐体と同じアーキテクチャを採用し、
業務用のソフトがそのまま家庭用でも動くみたいにしないと厳しいね。

でも、今だともうネオジオみたいなやり方は利益を出せないだろうな。
474Socket774:2011/12/06(火) 20:39:15.12 ID:OAsF2Vhf
いつからここはPS2を叩くスレになったんだ
475Socket774:2011/12/06(火) 23:02:34.54 ID:JfSoh2Tt
>>473
アーケードってx86のCPUかつNvやAtiのGPUなどPCのシステムそのものか、それに近い仕様で動いてるやつ多いみたいだぞ。
しかもハイスペックでも何でもない感じで

OSもWindows系を使ってたり
476Socket774:2011/12/06(火) 23:19:18.85 ID:3QucKl2k
アーケードは全部Winだよ
コスと考えたらあたりまえだけど
477Socket774:2011/12/06(火) 23:27:50.39 ID:CrERfVp2
eX-BOARDはC7とCN700(UniChrome)
478Socket774:2011/12/07(水) 01:33:59.16 ID:o3fwvsWW
久夛良木健氏が語る、PlayStation 3とCellの正体
http://pc.watch.impress.co.jp/docs/2003/0901/kaigai015.htm

>[久夛良木氏]  次は面白い。(PS3は)ただ垂直(ネットワークしない状態)で見て、
>単なるゲーム機だと思ってやってもすごいと思う。

>だから、(ソフトウェア開発が)ナイトメアにならないようにしないと……。

ナイトメアになっちゃったね。
479Socket774:2011/12/07(水) 13:48:40.43 ID:pqQ/Om99
今のアーケードマシンって随分化石染みたスペックの物使ってるんだな。
ハイエンドでも。まあ組込み系だから当然だけど。
480Socket774:2011/12/07(水) 19:04:32.16 ID:9pABluLs
アーケードは一台あたりにかけられるお金が違うし、逆に台数は出ないから
ハイスペックな汎用PCそのもの方がいいに決まってるだろ。
481,,・´∀`・,,)っ-○○○:2011/12/07(水) 21:47:20.51 ID:xKk7Jj7U
PCとは違って連続稼動が求められるから多少はPCよりは周回遅れの「枯れた」パーツ使うことになるね。

といっても組み込み向けとして売られてるCPU・チップセットって現状、型落ち品を
高く売りつけるための手段になっている気はする。
(最新プロセスのCPUは連続稼動に耐えられるほど安定してないなんて言っちゃったら
Xeonは誰も買いません)
482Socket774:2011/12/07(水) 22:10:00.73 ID:Mefp1xgV
組み込みマザーボードメーカが
ASUSみたいなメーカみたいに
神速で作れないだけだろうと思う
483Socket774:2011/12/07(水) 22:47:20.51 ID:V9HR29/A
劣悪環境前提ってのも考慮に入れてな
484Socket774:2011/12/07(水) 23:24:51.32 ID:cbOImle5
PCゲーや家庭用ゲームがこれ程発達した現代では、
既にアーケードゲームの存在意義は無くなったと言っても過言じゃない。
485Socket774:2011/12/07(水) 23:41:54.62 ID:tic2SsQx
大型筐体ゲームを家に置きたいとは思わんがな。
486Socket774:2011/12/07(水) 23:42:57.40 ID:cbOImle5
しかも一台で自動車が買える程の値段がする
問題はアーケード筐体の方で、家庭用ゲーム機である程度代替できてしまう
487Socket774:2011/12/07(水) 23:58:26.43 ID:JeHEETRm
>>483
そこだよな、なるたけ消耗系部品点数を削りつつ必要なレベルを維持できないといけない
その上原価も安く・・・となると最新は・・・
488Socket774:2011/12/07(水) 23:58:33.28 ID:qU5C+c1o
かなり以前からゲーセンの主役はプライズやメダルや体感筐体機で
ビデオ表示性能を誇示する時代じゃなくなってるし。
489Socket774:2011/12/08(木) 00:16:27.21 ID:pgKkSncP
あとは特殊な機材が必要なヤツとか。
三国志大戦とかWCCFとかガンダムカードビルダーのようなカードゲームや
戦場の絆みたいな体感ゲームとか。

見れば見るほど特殊なCPUやらアーキテクチャーは必要ないな。
490Socket774:2011/12/08(木) 00:20:39.82 ID:Z5x4kOaj
Teslaとか載せて家庭用PCとは一線を画するハイエンドスペックを実現して、
それで高いインカムが確実に望めるならそうするだろうけど、
あんまり期待できないよね……
客にアピールするのは、幸か不幸かそこじゃない。
491Socket774:2011/12/08(木) 01:00:46.86 ID:2klS0qwD
京を繋いでゲームを作ったら良いんじゃね?
492,,・´∀`・,,)っ-○○○:2011/12/08(木) 03:51:49.02 ID:s0p69/Mg
15年位前にゲーム雑誌で読んだけど北米じゃ一番近いゲーセンまで10kmなんてことも珍しくないそうな
(人口密度の高い日本ですらかなり潰れてるし今はもっと酷いんじゃないのか?)

巨大冷蔵庫に食料大量に詰め込むのと同じ感覚でゲームに金かけるのがゲーム大国アメリカ

もっとも、その消費志向も変わりつつあるけどね。
丁度日本のコンビニみたいな品揃えの小型店舗が増えてるらしい。
493Socket774:2011/12/08(木) 08:17:36.36 ID:fiRGPmzm
へぇ〜、たしかにアメリカでゲーセンってイメージないなぁ。
494Socket774:2011/12/08(木) 08:33:16.10 ID:Z5x4kOaj
映画のTRON見てよ
495Socket774:2011/12/08(木) 09:17:13.35 ID:x69JnpA9
>>485
格闘ゲーやシューティングゲーで使われるような筐体なら重さ100Kg(家庭用400L冷蔵庫と
同じぐらいの重量)だから、工夫すれば家に置けないこともない
(ただし幅が70cmはあるから、分解しないとだめだな)http://
>>492
海外でゲーセンあると、ストリートギャングや麻薬売人の類がたむろして
治安的にもよくないからゲーセンがあまりないと聞いたが?

後、今はx86CPUでコプロのx87など使わなく、FPU性能もSpecCPUベンチを
見る限りじゃ他アーキと遜色ないのに、「x86=FPU遅い」の扱いをされてるのは
何故?
496Socket774:2011/12/08(木) 09:24:02.09 ID:Z5x4kOaj
レジスタ8-16本しかないからじゃない?
497Socket774:2011/12/08(木) 11:52:33.51 ID:ot2kYU6c
>>495
固定観念て奴ぢゃね?
498Socket774:2011/12/08(木) 12:55:55.72 ID:npraXjtK
日頃の行いだよ
必要な命令を載せるよりクロック上げる方を優先すんな
499Socket774:2011/12/08(木) 13:24:07.50 ID:PZTbgDbu
浮動小数点演算が主用途と割り切って128bit×128本とか載せてるやつに比べれば
そりゃ遅いよね。しかし汎用CPUである限りはレジスタをむやみに増やすわけにもいかず。
500Socket774:2011/12/08(木) 14:16:16.65 ID:x69JnpA9
>>496
Pen4以降は物理「レジスタ増えてる
>>498
x86はCISCだから命令の数は多い
>>499
おそらくCELLのことを言ってるのかな?
しかし、CELLのSPE1つの浮動少数性能はいくつかのサイトを見ると実効で
23Gflopsでこの数値はCore2 1コア分のFPU実効値22Gflopsとあまり変わらない

そうか、CPU関連のサイト製作者は何気にアンチx86RISCマンセーみたいな人が
多いから、叩きたいだけのかも。
501Socket774:2011/12/08(木) 17:09:11.57 ID:VIBtiN/+
なに勝手に結論出してるの、ダイサイズ考えろよ

>>499の考えで問題ないだろ
502Socket774:2011/12/08(木) 17:45:45.30 ID:zjTFlDhH
DreamcastのSH4のSIMD
PS2のVU
PS3のCell
とゲーム機向けのCPUは当時としてはFPUにリソースを割いたものが多かったからな
503Socket774:2011/12/08(木) 18:37:59.65 ID:pgKkSncP
いっそ中国の新型CPUを使ったゲーム機とかでたら面白そうだが。
GPUどうすりゃいいのかわからんけど。
504,,・´∀`・,,)っ-○○○:2011/12/08(木) 21:30:00.19 ID:I95SPawS
>>499
別に遅かないよ。
i7-2600あたりでDGEMM 100GFLOPS出せるし実効性能はかなり高い。
SIMDの物理レジスタは百数十本とかあって、リネーミングして並列動作させてるから
FPの稼働率を高められる。
むしろ論理レジスタが少ない方が動的スケジューリングしやすいんじゃなかったかな。
(いまやC++ネイティブと遜色ないパフォーマンスを得たJavaVMなんか1レジスタのスタックマシンだし)
安藤さんとかは故意にこのあたりをミスリードしていると思う。
505Socket774:2011/12/09(金) 00:22:11.85 ID:h+0V9M4A
>>504
団子のそのレスも故意にいろいろミスリードしてません?
506Socket774:2011/12/09(金) 00:26:06.36 ID:2o4dp7+U
>>503
爆発するから気を付けないといけないな
507Socket774:2011/12/09(金) 01:04:24.56 ID:d+Ytikgd
>>506
そっちでも面白いけど、ゲーム機になってない主要RISCってAlphaとSPARCだろう。
SPARC独自実装してる富士通かAlphaパクった中国に新ゲーム機を期待したい。
508,,・´∀`・,,)っ-○○○:2011/12/09(金) 01:07:59.26 ID:HaOcUE8E
>>505
レジスタリネームを備えたアウトオブオーダ実行型のアーキテクチャだと
論理レジスタ本数の多い少ないはそれほど性能に影響しないね。

インオーダのAtomとかなら確かにレジスタ16本じゃ性能出すの辛いって思うけど。
でもそれこそどうにでもなるんじゃね?
巨大論理レジスタを表現するためのオペランドフィールドを増やすとか可変長のx86のほうが柔軟に出来ると思うけど

SPARCのISAは1オペランドあたり5ビットしか指定フィールドがないからさ、
京に採用されたHPC-ACEでは、前置命令に拡張フィールドの3ビット(×3フィールド×2命令分)を
収めることで、強引に256本のレジスタを表現してるわけで。

そういう手を使うならx86でも(プリフィックス新設すれば)可能だと思うんだよね。
実際MICはSIMDの論理レジスタを32本に増やしてるし。
509Socket774:2011/12/09(金) 01:10:06.79 ID:vkP4u9nJ
HPCで使われてgreen500で京より上にも入っているXeonは2GHz台、
デスクトップのパフォーマンスクラスは3GHz台、
他のプロセッサよりも電力的に有利な製造プロセスにも関わらず
デスクトップ並みのシングルスレッド性能の高い版では
greenで上位に入れないのがx86の限界
510,,・´∀`・,,)っ-○○○:2011/12/09(金) 01:17:13.26 ID:HaOcUE8E
詭弁だな。
それを言うなら京のVenusも2GHzでインオーダ実行だからデスクトップPCの
シングルスレッド性能には程遠い。

x86なみにシングルスレッド性能の高いCPUを例示してみてよ。
511Socket774:2011/12/09(金) 01:17:41.70 ID:SlhJ+Auu
fmaddが無いだけ
512Socket774:2011/12/09(金) 01:27:03.40 ID:FbvidVGx
>>509
POWER6さんの悪口はそこまでだ
513,,・´∀`・,,)っ-○○○:2011/12/09(金) 01:28:02.96 ID:HaOcUE8E
BlueWatersって事実上x86(MIC)に負けたんだよな
514Socket774:2011/12/09(金) 01:50:44.94 ID:vkP4u9nJ
>>512
でもPOWER7 は自身の最高クロックのままgreenで100以内に
いくつもランクインしていて、ある意味男らしい
515,,・´∀`・,,)っ-○○○:2011/12/09(金) 01:52:24.43 ID:HaOcUE8E
SPECpower_ssjのほうには登録しないのがIBMクオリティ
516Socket774:2011/12/09(金) 01:53:57.04 ID:U2+rp+qb
,,・´∀`・,,)っ-○○○ )´Д`;) Oh...
517Socket774:2011/12/09(金) 03:04:51.91 ID:I/NYD7pb
ワットパフォーマンス重視が頭打ちになったらどうするんだろうね…
現在のスパコン並のマシンがコモディティ化するだけかい?
518Socket774:2011/12/09(金) 03:08:55.81 ID:lvgCYANa
シュリンクや回路の最適化など製造面での進歩がメーカーを問わず全ファブまで行き渡ったら、最も効率的なアーキテクチャ以外の演算装置は淘汰されるだろうか?
519Socket774:2011/12/09(金) 03:46:39.98 ID:d/CXajCs
>シュリンクや回路の最適化など製造面での進歩がメーカーを問わず全ファブまで行き渡ったら
その前に非シリコン半導体が出てくるんじゃね
量子コンピュータはどうなんだろうな……
520Socket774:2011/12/09(金) 04:01:21.34 ID:3Q4MIBDJ
>>514
IBM「電力効率が悪いからPOWER7はPOWER6よりクロック下げます」
という経緯も知らないニワカは黙ってろ
521Socket774:2011/12/09(金) 06:56:24.69 ID:Na8JAD0m
>>510
え?普通にアウトオブオーダ実行だろ?
522,,・´∀`・,,)っ-○○○:2011/12/09(金) 07:33:15.87 ID:HaOcUE8E
ああ、レジスタリネームが無いだけでOoOE自体はあるのね
523,,・´∀`・,,)っ-○○○:2011/12/09(金) 07:35:04.89 ID:HaOcUE8E
いや、例のプレフィックス命令の作用考えれば広義の「リネーム」はあるか
524Socket774:2011/12/09(金) 09:16:20.21 ID:vkP4u9nJ
1995年 SPARC64(無印) out of order
1995年 PentiumPro out of order
525Socket774:2011/12/09(金) 13:26:37.13 ID:zgcIhzKZ
普通に論理/物理レジスタ 32/64、OoO、SMTだ
526Socket774:2011/12/09(金) 15:33:41.83 ID:h+0V9M4A
>>508
ARMさんもA64で増やしたし
論理レジスタは32本がミニマムじゃないかな?
527Socket774:2011/12/09(金) 17:36:47.33 ID:n+x5si1T
>>505
シッタカの団子にそんな芸当はできないよ
528Socket774:2011/12/10(土) 00:58:37.09 ID:liiZowda
論理レジスタが少ないとレジスタの使いまわしや早いフェッチの機会が少なくなるため、
物理レジスタがいくらあっても性能向上の余地は限られる。

整数演算ではあまり差はつかないが、きっちりスケジューリングされた浮動小数点演算では差が大きい。
529Socket774:2011/12/10(土) 00:59:35.96 ID:liiZowda
団子の書き込みの半分くらいはデタラメだと思えばいいね。
530Socket774:2011/12/10(土) 01:18:22.16 ID:+2qEBKmT
「団子氏」って「団子虫」に似てるね
「団子厨」って団子虫からきたのか?

団子虫
団子無視
531Socket774:2011/12/10(土) 01:43:26.00 ID:metW1VQM
物理レジスタが多ければ大丈夫っていうのは
あくまで論理レジスタだけでspllingなしでプログラムが組める場合だよね

あとRSのエントリ数はCore2で32・SandyBridgeでも54で
これはレイテンシの大きいFPU命令やL2アクセスを隠蔽するには不十分
まだまだソフトウェアレベルのスケジューリングの比重は大きい
532 忍法帖【Lv=40,xxxPT】 :2011/12/10(土) 02:23:29.00 ID:C8DWaXpD
Haswellでもその辺の拡張は行ってくるだろうね
Core2→Nehalem→Sandyと各世代ごとで必ず強化されてる部分だしな
533Socket774:2011/12/10(土) 02:25:35.71 ID:PpnmWU9Y
>>529
実際7割はデタラメだな
534Socket774:2011/12/10(土) 02:43:17.19 ID:liiZowda
ソフトウェアパイプラインなんかは論理レジスタがたくさん必要だしね
あるいはIA-64みたいな支援が
535Socket774:2011/12/10(土) 04:57:01.03 ID:metW1VQM
OoOが優れているのはMemory Disambiguation等の投機的動作が可能なところで
静的には不可能ななアグレッシブなスケジューリングが可能になる
536,,・´∀`・,,)っ-○○○:2011/12/10(土) 11:58:54.72 ID:DK7iOzHK
> 論理レジスタが少ないとレジスタの使いまわしや早いフェッチの機会が少なくなるため、

うーん、それこそデタラメだな。
君はその一言をもって、俺の指摘してるレジスタリネームの存在を全く理解してない
無知蒙昧なちんけな存在だと自分で証明してしまった。

たとえばAVXにおける倍精度4x4行列積のループの内側はこうだ。

vbroadcastsd ymm0, [rcx]
vmulpd ymm0, ymm4
vaddpd ymm8, ymm0
vbroadcastsd ymm0, [rcx+256]
vmulpd ymm0, ymm5
vaddpd ymm9, ymm0
vbroadcastsd ymm0, [rcx+512]
vmulpd ymm0, ymm6
vaddpd ymm10, ymm0
vbroadcastsd ymm0, [rcx+768]
vmulpd ymm0, ymm7
vaddpd ymm11, ymm0

なぜymm0を使いまわしてるのか君には理解できないだろうけどこれはこれでいいんだよ。
この場合ymm0はload(vbroadcast)によって依存関係を断ち切ることができるので
別の物理レジスタを割り当てて、後続のvmulも含めてパイプラインで実行可能になる。
もちろんvaddは反復するのでレジスタリネームによる並列化がきかないので、
FP加算器のレイテンシはなるべく小さく(この場合4以下)デザインされてなければならない。
537Socket774:2011/12/10(土) 12:08:50.00 ID:r+smprMN
つまりレジスタリネームは万能じゃないってことでしょ?
デタラメじゃねーじゃんw
538Socket774:2011/12/10(土) 12:16:09.46 ID:Ays5e9k6
CPUのアーキテクチャがわかるレベルの人が読める本で
GPUのアーキテクチャがよくわかるおすすめの本ってないですか?
ハードの本でもプログラミングの本でもよいのだが。
539,,・´∀`・,,)っ-○○○:2011/12/10(土) 12:21:32.88 ID:DK7iOzHK
>>537
全然内容理解してないのな。

> 早いフェッチの機会が少なくなるため、

これがデタラメだって言ってるの。スケジューラのリソースのある限りいくらでも
レジスタ(この場合ymm0)を読み替えて先読みが可能。

ロード・ストアの帯域さえ十分なら、加算ユニットのレイテンシ×2+α程度のレジスタ本数があれば
実用上問題ないね。Sandy Bridgeはストアが狭い(Bulldozerはもっと狭い)からできるだけ
オンレジスタで処理したいが。
逆に論理レジスタが多いほどレジスタリネーム機構の実装コストは大きくなる。



単精度行列積の場合も書いておく。
AVXのYMMレジスタでは8x8単精度行列は8本のレジスタで表現できるけど、こればかりは
こればかりは論理レジスタ16本は少し苦しくなる。
加算用に8本、被乗数用に8本、乗数ロード+乗算用に最低1本でできれば17本以上は欲しい。
まあ入れ替えて処理するしかない。
加算用に8本、被乗数に7本、ロード+乗算に1本にして被乗数を入れ替えて処理すれば
Sandy Bridgeの持つLoad帯域的にはなんとか間に合う。
540Socket774:2011/12/10(土) 12:26:50.17 ID:SgeYfZrr
団子は日本語の理解力に少々難がある上に間違いを認めないから、何を突っ込んでも無駄w
541Socket774:2011/12/10(土) 12:27:37.51 ID:CiN3DMvv
なんだかよくわからんがその書き方だと、レジスタリネームとやらを廃してレジスタを倍にすれば良いんじゃねって
素人は思うよ
542,,・´∀`・,,)っ-○○○:2011/12/10(土) 12:27:46.83 ID:DK7iOzHK
↑と、日本語の読解力が無い馬鹿が言っております
543,,・´∀`・,,)っ-○○○:2011/12/10(土) 12:31:28.45 ID:DK7iOzHK
>>541
vbroadcastsd+vmulpdの合計レイテンシが何サイクルあるか調べておいで。
ついでにいうと論理レジスタを増やすと退避のオーバーヘッドが大きくなってマルチタスクに弱くなるよ
544Socket774:2011/12/10(土) 12:31:38.03 ID:Ays5e9k6
>>539
レジスタリネーミングではコンパイラがスタック領域に割り当てする部分は
マップできないよ。だからそこがネックになるってのが一般論。
現代のプロセッサでメモリリネーミングをサポートしているのは製品としてはないよ。
団子先生の説明はレジスターリネーミングの通常動作の説明をしているだけで
論点からははずれている。
545Socket774:2011/12/10(土) 12:34:56.43 ID:CiN3DMvv
>>542
だからトーシロだつってんだろが
まぁ団子の文もうちょっと読みやすければ真面目に読むが

読み返したら大方わかったがな
俺が思ったのはレジスタの本数よりその並列化できない処理のレイテンシとやらを必死こいて削った方が・・・

素人考えだが。
546,,・´∀`・,,)っ-○○○:2011/12/10(土) 12:35:51.90 ID:DK7iOzHK
> レジスタリネーミングではコンパイラがスタック領域に割り当てする部分は
> マップできないよ。だからそこがネックになるってのが一般論。
スタックに割り当てなきゃいけないほど変数使うコードって何があるんだよ?
547Socket774:2011/12/10(土) 12:36:31.01 ID:SgeYfZrr
顔真っ赤な団子ワロス
548,,・´∀`・,,)っ-○○○:2011/12/10(土) 12:38:59.98 ID:DK7iOzHK
そもそもVenusのアプローチは「逸般的」ですし。
32ビットの定数をレジスタにロードするのに2命令かかるような命令セットが
一般的なアプリケーションの実行に有用なわけがありえない。
549Socket774:2011/12/10(土) 12:43:47.07 ID:oM8nSmng
8では足りない
16でもやりくりすれば足りるが
24ぐらいはあった方が当然楽で
コンテキストスイッチのコストについては
数値演算では問題になることは少ないかなと。
550,,・´∀`・,,)っ-○○○:2011/12/10(土) 12:48:27.73 ID:DK7iOzHK
数値計算用プロセッサにおいて一番大事なのは市場で低コストで調達できること。
それ以外の用途で全く使えない代物を作っても結局高コストでは意味が無い。
551Socket774:2011/12/10(土) 15:59:14.64 ID:kGzQQxe5
論点がずれてるw
552Socket774:2011/12/10(土) 16:00:36.84 ID:QUG9OmcR
団子の常套手段です
553Socket774:2011/12/10(土) 16:12:55.85 ID:/Rt0/jy6
ところで単発IDの奴ってなんか意見ないの?
554,,・´∀`・,,)っ-○○○:2011/12/10(土) 16:46:57.56 ID:DK7iOzHK
SSEの16本に比べて多いという印象は無いけどな
むしろシフトみたいにSSEなら即値指定すればすむ命令もAltiVecではわざわざ
ビットパターンをレジスタにセットしておく必要があったり。

いまどきレジスタの数が性能の決め手だとかいう主張自体が時代錯誤。



一般論として論理レジスタが多いほどコード密度は下がる。
RISCは時間当たりの処理量を増やしてペイする設計だったが、200X年代初頭には
そのアプローチは既に破綻してた。
クライアントサイドJavaの実行パフォーマンスはハイエンドのSPARCですら
Celeron搭載のWindowsマシンに負けていた。
555,,・´∀`・,,)っ-○○○:2011/12/10(土) 16:52:14.15 ID:DK7iOzHK
>>551-552
論点ってなんだ?自分の読解力のなさを棚に上げるなよ。
レジスタだけ増やしただけの頭でっかちCPUなんてHPC以外では使えないって言ってるんだよ。

HPC以外で使えないことが、結果的に最先端プロセスルールでの製造単価を押し上げ
HPCですら居場所がなくなってきたのがベクトルプロセッサ衰退の歴史。
Venusはスカラベースでそれを再現しようとしてるにすぎない。
556Socket774:2011/12/10(土) 17:06:13.65 ID:cYTou5iw
何でファミコンやセガマークVは8bitCPUで発売しちゃったの?
当時既にPC用やゲーム機用の16bitCPUが出てたでしょ。

8bitCPUなんて先が見えてるし、
同じ仕様で長く売るゲーム機の性質を考えれば、
16bitCPUを採用した方が良かったと思う。
557Socket774:2011/12/10(土) 17:08:13.00 ID:DJ21u0YB
>>496から始まってるのに、なんでコストの話になってるんだよw 馬鹿すぎw
x86のコスパの良さの話をしてるわけじゃないからw
558,,・´∀`・,,)っ-○○○:2011/12/10(土) 17:11:38.22 ID:DK7iOzHK
> 後、今はx86CPUでコプロのx87など使わなく、FPU性能もSpecCPUベンチを
> 見る限りじゃ他アーキと遜色ないのに、「x86=FPU遅い」の扱いをされてるのは
> 何故?

これが的外れだって言ってるんだが?
理論性能あたりのGEMMの実行性能比はレジスタ128本のCell-SPUなんかよりNehalemのほうが高い。
559Socket774:2011/12/10(土) 17:24:42.53 ID:DJ21u0YB
なんで「理論性能あたりの実行性能比」を出してくるの?
560,,・´∀`・,,)っ-○○○:2011/12/10(土) 17:29:06.62 ID:DK7iOzHK
いや、既に単精度・倍精度ともに絶対性能でCore i7-2500>PowerXCell 8iだしw
32SPEのCellはお蔵入りになったし結局は採算性が命運を決めるんだよ。

たしかVenusよりもSandy Bridge-EPのほうがソケットあたりのFLOPS数は上だったはず(同じ8コア)
561Socket774:2011/12/10(土) 17:39:42.82 ID:DJ21u0YB
SandyEPのFLOPSが増えたのはAVXのおかげだろ?
HPC向けに特化されたプロセッサと比べればx86は余分な物にトランジスタ割きすぎで
x86がコスパで最高峰なのは賛成だが、トランジスタ効率で負けてる

だから特化させたKnights Cornerが投入されると思っているんだが
562,,・´∀`・,,)っ-○○○:2011/12/10(土) 17:51:02.48 ID:DK7iOzHK
> HPC向けに特化されたプロセッサと比べればx86は余分な物にトランジスタ割きすぎで
> x86がコスパで最高峰なのは賛成だが、トランジスタ効率で負けてる

同じような負け惜しみを前世紀末のRISC衰退期にも聞いた。
563Socket774:2011/12/10(土) 18:28:48.51 ID:cWOsrElB
>>556
カセットビジョンなんて4bitCPUだったんだぞ、あの当時では8bitCPUは必要十分だ。
究極の8bitCPUゲーム機のPCエンジンがその後に控えているし
564Socket774:2011/12/10(土) 18:46:15.78 ID:DayEWj5U
1982〜3年頃のトラ技の通販広告だとZ80が1000円未満なのに対し6809や8086は数千円、
68000やZ8000は数万円だったと記憶してる。
ボリュームカスタマーの調達価格は上記より遥かに安いのは当然だが、それでも小売で
一万円台のコンソールに当事の16bitCPUはコスト的に荷が重い。カスタムチップ用の
マクロセル商売が行われてたものが殆ど無かったってのも理由だろうけど

ぴゅう太に採用されたTMS99xxはパーツ屋の広告で見た記憶は無いな。コンパニオンチップで
ありMSXやセガSCにもさいようされたTMS9918(VDP)は見たけど。
565Socket774:2011/12/10(土) 18:56:25.85 ID:DayEWj5U
後は1980年前後の16bitCPU全般について(命令語長のコンパクト化に特化したISAである
8086を例外として)コードが肥大化しがちでROMカセットのコストが嵩むとか、(外部8bitバス
バージョンの石ならOKだが)周辺やメモリも16bitにする必要があってそれもコスト圧力になる。
566Socket774:2011/12/10(土) 19:01:30.93 ID:8XGosEEf
>>556
本体赤字で売ったらダメよ
ソニーのえらいさんもこう言ってる

久多良木
基本的には我々はハードウェアから限界利益をたたき出して、それを次に投資しているわけです。ソフトは1本約5000〜6000円ですが、みんながいつも年間で4〜5本買ってくれるわけではない。

そこから利益はとれるけど、年間ではすごい数字にはならない。その点ハードウェアの利益はすごくデカイ。
3万円のハードが年間2000万台出ると6000億円でしょ。末端で。6000億円で赤字出したら会社がつぶれますよね。

ということは、そこで利益をとって次の投資をしていかなければならないわけです。
半導体や部品を全部外から買うと、残るものはアセンブリだけですから、アセンブリだけなら日本よりも中国でつくったほうが安い。

そんなことをしていたら、ハードからは利益は出ない。うっかりするとハード1台売ると赤字が出る。

セガさんがそれで失敗した。PSはハードから黒字が出たわけですよ。我々はすべて中で設計して、中で付加価値を落としているから。
セガさんは日立やヤマハから買ってきて、何ら何まで外からとってきたから、苦しかったわけです。
メディアの人はそれがわからずに、「ゲーム機はハードで損してソフトで儲ける」とよく書く。
そんなこと私は1度も言ったことがないし、任天堂さんだってそんなこと言わないと思う。
567Socket774:2011/12/10(土) 19:03:34.74 ID:cYTou5iw
16bitCPU、16bit対応DRAM、16bitGPU、16bitSPU、24bitバス・・・
80年代に16bit機を出したら、安く抑えても販売価格が3万5000円を超えるかも。
568,,・´∀`・,,)っ-○○○:2011/12/10(土) 19:04:58.45 ID:DK7iOzHK
>>566
なにこの「お前が言うな」はwwww



京の何が駄目なのかはおごちゃんが2年も前に的確に指摘してるね
ttp://www.nurs.or.jp/~ogochan/essay/archives/2132

つか、コメント欄のこれが的確すぎる
> ついでに、米国はスパコンに年間1千億円以上つぎ込んでいるけど1品ものに1千億円もかけないとか、
> 勝ち目のないCPU事業から撤退の機会を逃した富士通は今後の技術競争で大きな遅れを取るだろうとか、
> 代替技術が多々あるのにそれに国費を投じないから全然育たないとか、
> あたりまで書いてもらえれば完璧かと思います。
> 2010/1/29 金曜日 22:15:53 | #11
569Socket774:2011/12/10(土) 19:08:25.54 ID:cYTou5iw
>>566
>半導体や部品を全部外から買うと、残るものはアセンブリだけですから、アセンブリだけなら日本よりも中国でつくったほうが安い。

>そんなことをしていたら、ハードからは利益は出ない。うっかりするとハード1台売ると赤字が出る。

任天堂だって、半導体や部品は外注だし、製造も最終組み立ても他社にやらせてるだろ。
任天堂とセガの違いって何?
570Socket774:2011/12/10(土) 19:14:51.89 ID:8XGosEEf
>>569
ゲーム機の売れる値段が大体決まって以上
高価な部品を使ったら赤字
571,,・´∀`・,,)っ-○○○:2011/12/10(土) 19:15:16.48 ID:DK7iOzHK
サターンはSH-2を1基だけ搭載予定だったのにPSが3D積むことがわかってから焦って2CPUに設計変更したからね。
DreamcastのSH-4は1プロセッサに戻している。

任天堂は64まではコストアップ要因だった光学ディスクドライブ搭載を見送った。
572Socket774:2011/12/10(土) 19:18:19.99 ID:cYTou5iw
>>570
低所得一般人は1万5000円以下、中所得層は2万5000円以下、
ゲームに理解がある家庭や平均よりも大目の所得があるところでも、
4万円以下にならないとゲーム機を購入しないが、
ゲームマニアやゲームオタクなら10万円以下なら買ってくれる。
573Socket774:2011/12/10(土) 19:21:56.81 ID:GP6lrb2P
>>572
その層は何人くらい居るの?
574,,・´∀`・,,)っ-○○○:2011/12/10(土) 19:28:03.28 ID:DK7iOzHK
いまどきのゲームの主要顧客って金にルーズで頭のネジの緩い20代女だと思ってるが
575Socket774:2011/12/10(土) 19:28:23.94 ID:+2qEBKmT
>>572
コアなファンがこぞってX68000を買っていたな
576Socket774:2011/12/10(土) 19:30:11.43 ID:8XGosEEf
>>574
どのゲームを想定してるんだ?
携帯あたりかね?
577,,・´∀`・,,)っ-○○○:2011/12/10(土) 19:35:13.11 ID:DK7iOzHK
携帯に限らずだけど、戦国BASARA(笑)以降、女性ターゲットの歴史物ゲームが増えたな
いまどきのアイテム課金ゲームに金落としてるのは大半は女だぜ
578Socket774:2011/12/10(土) 19:36:31.44 ID:liiZowda
おごちゃん()
579,,・´∀`・,,)っ-○○○:2011/12/10(土) 19:40:38.53 ID:DK7iOzHK
官僚の天下り先のITゼネコンに金垂れ流すための詭弁に耳を傾ける必要なんてなかった
580Socket774:2011/12/10(土) 19:56:16.00 ID:cYTou5iw
>>573
日本だけで、ゲーム機に10万円出せる人は200万人くらいかな?
海外は知らん。

今は不況が続いていて可処分所得が低下しているから、
昔よりは減っているだろうな。

>>575
ネオジオとX68000って、結局何台売れたの?
581Socket774:2011/12/10(土) 20:12:52.09 ID:liiZowda
信頼できるソースではないが、
X68k 12万台
ネオジオ 100万台
ってとこらしい
ネオジオCDは知らん
582Socket774:2011/12/10(土) 20:20:14.55 ID:cYTou5iw
>>581
ゲームに大金を出せる人口はだいたい100万ちょっと程度か。
こんな小さな市場ではサードもあまり参加してくれなさそうだしキツイね。

せめて、5万円以下に価格を落とさないと厳しいかな?
583Socket774:2011/12/10(土) 20:26:52.17 ID:liiZowda
ネオジオは息が長かったが、発売は1990年とバブルの頂点なんだよな
X68kは1987年
584Socket774:2011/12/10(土) 20:38:15.33 ID:cYTou5iw
しかもバブル当時は、ネットだの携帯だのPCだのに金を使わなくても生きていけたから、
その分ゲームに割けるお金はたくさんある。
585Socket774:2011/12/10(土) 20:51:55.33 ID:YkDzstFY
>>580
200万人だと、ゲーム以外に浮気もする人が入っている気がする。
他にどんな面白いものがあってもゲーム機に10万出す人は10万人くらいじゃないだろうか
586Socket774:2011/12/10(土) 21:05:24.03 ID:cYTou5iw
>>585
自宅でアーケード基盤を遊ぶ人、PCEのコア構想に最後まで付いていった人、
劣勢のセガの応援を最後までやめなかった人、
PCゲーの為にGPUを半年に一度買い替え、
PCを一年で買い換える人が居るから、
10万円のゲーム機を買う人はもっと多いだろうと思うが。
587,,・´∀`・,,)っ-○○○:2011/12/10(土) 21:05:44.06 ID:DK7iOzHK
PS3はあと5年売っても累積赤字は解消しないだろうし
製造原価5万オーバーのゲームハードは未来永劫ないだろう。

なんだかんだで携帯電話ってコンテンツホルダーには事業展開しやすいと思うよ。
ポストペイの決済システムが簡単に利用できるし。
588Socket774:2011/12/10(土) 21:05:55.63 ID:liiZowda
>>584
パソコン通信で電話代が月に数万円
589Socket774:2011/12/10(土) 21:14:25.43 ID:GP6lrb2P
>>586
そういうのは大体被ってるだろうな
590,,・´∀`・,,)っ-○○○:2011/12/10(土) 21:28:02.69 ID:DK7iOzHK
そもそも今の若い世代のホームエンターテイメントの中心ってテレビ・ビデオ・ステレオデッキじゃないから。
情報端末はPC、録画よりネット配信、音楽はiPodみたいな。
据え置きゲーム機ってそろそろ潮時じゃね?
591Socket774:2011/12/10(土) 21:43:20.51 ID:CiN3DMvv
>>590
据え置きゲームは確かにな

pcでFF13やりてー・・・
592Socket774:2011/12/10(土) 22:20:42.92 ID:MQojDygT
若者はPCすら持ってないような気も
家に一台くらいはあるだろうが
593Socket774:2011/12/10(土) 23:21:32.94 ID:9qh9xoXq
NPD November 2011 Sales Results
NPD Coverage: October 30 - November 26 (4 weeks)

Overall:

Total retail sales: $3 billion (+0.4%)
Total non-PC retail sales: $2.93 billion (-0.5%)
Total software: $1.74 billion (+16%)
Non-PC hardware: $982.4 million (-9%)
Non-PC software: $1.67 billion (+15%)
Accessories: $273.8 million (-34%)


PCゲーの市場小さすぎるだろ
新箱がでればPCゲー市場はもっと小さくなるんじゃないの
594Socket774:2011/12/10(土) 23:40:43.62 ID:3cuKvMK5
2011年の世界半導体売上高ランキング、IntelがSamsungに大差を付けてトップに
http://eetimes.jp/ee/articles/1112/06/news028.html
595Socket774:2011/12/11(日) 07:11:25.18 ID:Aegklnil
nvもteslaやtegraに力入れるわけだ
596Socket774:2011/12/11(日) 12:31:14.82 ID:D5f1a2Br
汎用機(PCや携帯)が安く、速くなったと
ゲーム専用機ってワープロ専用機なんだよ
597Socket774:2011/12/11(日) 14:17:24.59 ID:l7IVMupP
PCも携帯電話も、金の出所が娯楽費とは別枠なだけで、別に安くはないな
598Socket774:2011/12/11(日) 18:11:58.93 ID:vqzoRNCa
>>590
1本のゲームへ100億円かけても回収できる海外のAAAタイトルが
そう簡単に衰退するとは思えんな
NPD11月分みてもまだまだユーザーのAAAタイトルへの支持は落ちてないみたいだし
スマホと違って100W消費しても許されるコンソールビジネスはあと5年はもつだろ
MSの次期Xbox次第だが
599Socket774:2011/12/11(日) 20:03:39.53 ID:l7IVMupP
差別化が厳しい。
例えばCPUを3コアから6コアに増やしたら、ゲームの何が変わるのか?
差別化出来ないとプラットフォームの立ち上げもできない。
立ち上げられなければ、タイトルに100億円の投資も出来ない。
600Socket774:2011/12/11(日) 20:25:40.57 ID:l7IVMupP
そもそもIBMはPowerPCの改良と製造プロセスの微細化をどこまでやるのか
601Socket774:2011/12/11(日) 20:26:06.73 ID:vPvtDpTz
602Socket774:2011/12/11(日) 23:35:07.60 ID:hqcBfk1j
メガドラも結構アーケードっぽい作りになっていて、その成功体験がサターンにつながったんだと思う。
セガにだってコスト意識くらいはあったろうが、他社にくらべて甘かったんだろうね、やっぱり。

PC-FXは20世紀の七不思議の一つです。
603Socket774:2011/12/12(月) 00:50:17.84 ID:QwatcSx+
何を考えてゲーム機作ろうがCPUカスタム化からやってる相手と競争したら
ビジュアルで見劣りするのは目に見えてる。
ならマルチCPU化というのはわからん話ではないだろう。
当時セガが使えそうな組み込み向けでこれ以上高性能なのあっただろうか?
604Socket774:2011/12/12(月) 01:12:21.30 ID:qtFyDIml
>>591
>pcでFF13やりてー・・・
激しく同意。
10万くらいのGPU買ってもイイから、PCで超ハイクオリティなゲームを楽しみたいお。
605Socket774:2011/12/12(月) 01:20:25.07 ID:0iN4cg6V
ソニーのようにCPUに手を入れなかったのが設計思想の違い。
セガの設計思想が間違っていたというわけではないが、トータルではPSのほうが優れていたと言わざるをえない。
SSの2D性能は捨てがたいけどね。
606Socket774:2011/12/12(月) 12:31:26.48 ID:CeGMqDX5
>>604
ついでにテッセ使えるようにすればスノウのアゴヒゲのジョリジョリ感が増したり色々とメリットがありそうだ
607Socket774:2011/12/12(月) 18:39:42.18 ID:laiaFkfz
》602
PC-FXはGPUの開発が間に合わなかったため、JPEGエンコーダとPC-EのVDP(死語)だけを積んで出荷した
608Socket774:2011/12/12(月) 20:34:31.66 ID:ffNbz/7Y
>>605
どうやって玩具メーカーがCPUに手を入れられるw
609Socket774:2011/12/12(月) 20:54:21.18 ID:d+xkiBDD
ソニーの参入がなければセガの圧勝だったんだけどな。
610Socket774:2011/12/12(月) 21:06:38.29 ID:0iN4cg6V
ファミコンですらCPUコアに手を入れているというのに、なぜできないと思うんだろう
611,,・´∀`・,,)っ-○○○:2011/12/12(月) 21:12:53.73 ID:4uhnXjeQ
>>608
任天堂は64やGC(Wii)のCPUにカスタム命令追加してるけどね。
SH-4自体がDreamcastのために作られたようなもんだし、自社設計はしなくとも
設計に影響を与える程度の力は持ってる。

なんせゲーム機は同じ仕様でまとまった数が出せるし、ドリキャス撤退後も
SH-4はしばらくはアーケード基盤やパチスロなんかで使われた。
更には三菱のカーナビとか。

むしろVitaのCPUはARMのCortex-A9のIPそのまま使ってるじゃん。
612Socket774:2011/12/12(月) 21:32:13.29 ID:OZmRPWRD
今のモバイルCPUだと昔とはカスタム化の必要度が違うわな
613Socket774:2011/12/12(月) 21:43:40.59 ID:OZmRPWRD
アレはGPUとメモリ周り弄ってるらしいから
それが今時分の携帯ゲーム機の勘所なんだろうな
614Socket774:2011/12/12(月) 21:52:52.10 ID:0iN4cg6V
>>607
それについては岩崎啓眞がデタラメだと主張している
音源までPCエンジン並なので、根本的に間違えたハードと言わざるをえない。
615Socket774:2011/12/12(月) 22:26:38.57 ID:sMmkcs0Z
もっと信じられないプランもあったしなあ
616Socket774:2011/12/12(月) 22:42:06.94 ID:0AHNXHZs
>>615
どんなプラン?
617Socket774:2011/12/12(月) 23:13:25.75 ID:laiaFkfz
サターン開発時期って、Model 1か2あたりが出たばっかか開発中なくらいだろ?大雑把に言って
当時のセガは、3Dハードの試行錯誤期だったんだろうと思う
618Socket774:2011/12/13(火) 00:57:30.14 ID:HAULJrJx
SH-4はこのあいだまで使ってたケータイに入ってたな

今は8250スマホだが
619Socket774:2011/12/13(火) 01:03:08.55 ID:LXMNJ+lf
8255ならこのあいだまで使ってたパーコンに……

もう30年になるのか。
620Socket774:2011/12/13(火) 01:25:47.25 ID:Q0NRnS8P
HPに封印されたAlpha、復活しないかな。
中国あたりでデッドコピーが出たら面白そう。
621Socket774:2011/12/13(火) 13:37:01.61 ID:0MWMYGYQ
Alphaは元DECチームによる最新の実装に価値があるのであって
今更復活しても
622Socket774:2011/12/13(火) 15:18:47.65 ID:/rCF7sbo
>>611
SH4って4個のfloat値の加算がスループット1でできるんだよな
掛け算より簡単なのにIntelは徹底的に嫌がってるよな
623Socket774:2011/12/13(火) 15:41:35.33 ID:1msL1fQK
alphaは実装が優れてただけでなく、コンパイラも圧倒的に良かったらしい
624Socket774:2011/12/13(火) 16:29:23.78 ID:6NnaHN7z
>>622
LNIにはあるけどね、リダクション
625Socket774:2011/12/13(火) 17:47:08.05 ID:C1Sl0WYC
>>623
何がダメで終わったの?
626Socket774:2011/12/13(火) 17:55:42.71 ID:vl05UPFD
マーケティング戦略かな
627Socket774:2011/12/13(火) 17:57:43.40 ID:9Nf6Biux
>>625
性能上の問題ではなくDEC→Compaq→HPの買収に伴う企業戦略上の都合(Itaniumへの移行)。
Compaq→HPの買収以前の時点でCompaqの判断によりAlphaの終息は決定してた。
628Socket774:2011/12/13(火) 18:02:42.76 ID:1msL1fQK
>>625
欠点は売れなかったことくらいだね
629Socket774:2011/12/13(火) 18:13:25.37 ID:lTfLceq5
発熱もすごかったけどね
630Socket774:2011/12/13(火) 18:50:41.91 ID:YZmQJ8o2
初期のAthlonはx86版のalphaといってもいいんじゃないの
631Socket774:2011/12/13(火) 19:31:49.14 ID:TDws+8Cz
終盤のAlphaはAMDのチップセットと組み合わせた安めのモデルが売られたりしてたな
20万くらいだっけか
632,,・´∀`・,,)っ-○○○:2011/12/13(火) 20:19:02.16 ID:lKpxTvb2
>>622
水平加算のhaddps、内積のdppsなどあるけど何が嫌がってるって?
633Socket774:2011/12/13(火) 20:58:22.74 ID:1msL1fQK
技術的な詳細は頭が足りないので分からないが、ロードストアとALUがセットとか、大容量で2wayセットアソシエティブなL1キャッシュとかでAthlonはAlpha 21264的だ
634Socket774:2011/12/13(火) 21:07:08.67 ID:YZmQJ8o2
DECでAlpha造ってたアーキテクトがAMDに移籍して作ったんだっけ?
635Socket774:2011/12/13(火) 21:12:26.50 ID:vl05UPFD
インテルじゃね?
訴訟でインテルがalphaの工場買収することで和解したはず
636Socket774:2011/12/13(火) 21:14:08.50 ID:vl05UPFD
ちなみにAMDの高速化の原動力はNexGen
637Socket774:2011/12/13(火) 21:21:03.81 ID:/w2pmoIU
AMD旧CEOはDECの出身だろ
638Socket774:2011/12/13(火) 21:28:13.54 ID:2nTQbT9b
NexGenはK6じゃないの?
K7はダークメイアとか旧DECのメンバーの力が大きいと思ってた
639Socket774:2011/12/13(火) 21:33:44.90 ID:YZmQJ8o2
>>635
インテルが獲得したのは「Alpha」以外の全半導体の製造・販売の権利だべ
640Socket774:2011/12/13(火) 21:38:55.82 ID:9Nf6Biux
K7はバスがまんまEV6バス(元々Alpha21264用のものをDECからライセンス供与)
だったから>>631のように21264+AMD751/761とかが可能だったわけだしな。
641,,・´∀`・,,)っ-○○○:2011/12/13(火) 21:49:12.07 ID:lKpxTvb2
HyperThreadingもHyperTransportもDEC由来でおk?
642Socket774:2011/12/13(火) 21:51:01.14 ID:vl05UPFD
>>639
ググってみたけどAlphaも含んでたね
この訴訟は当時から不思議に思ったんだけど和解する大分前から
「DECが工場をインテルに売却して和解する」って道筋ができてるって報道されてたんだよな
何のための訴訟だったんだろう?なんで売却が和解になったんだろ?

>>638
AMDの躍進はK6から
それまではCyrixの後塵を拝する互換メーカーだったが
K6からインテルのライバルになった
643Socket774:2011/12/13(火) 22:19:45.76 ID:9Nf6Biux
>>641
HTTについてはどうだか知らんがHyper TransportはEV6バスの発展系だからDEC由来だな。
644Socket774:2011/12/13(火) 22:29:23.74 ID:1msL1fQK
半導体の製造、設計を辞めたかったらだろ
Alphaの投資を続ける気がなかった、
Intelに工場とチップデザインを買わせるのが、訴訟の唯一の目的だったと
Alphaを本気で続けてたら、Windows NT 4.0,Windows 2000 for Alphaが出てただろう
(Windowsの非X86への、実際の移植作業はMSでなく、各CPUベンダがやってた)
645Socket774:2011/12/13(火) 22:33:01.38 ID:lTfLceq5
>>633
21264で画期的だったクラスタが受け継がれなかった
646Socket774:2011/12/13(火) 22:38:14.74 ID:lTfLceq5
Alphaの設計者は散らばってしまい
Itaniumをやっている人もいる
647Socket774:2011/12/13(火) 22:40:02.21 ID:1msL1fQK
》645
クラスタじゃないの?
一つの整数レジスタファイルに3ALU,3ロード/ストアがぶら下がってんの?
だとしたら驚異的なクロック
648Socket774:2011/12/13(火) 22:55:22.48 ID:lTfLceq5
>>647
Reservation Stationは各実行ユニットについているが、整数レジスタファイルは一つだけ
データの多くはバイパスで供給されるから、見た目ほどレジスタファイルへのプレッシャーはない
バイパスの遅延もない

21264はレジスタファイルをクラスタごとに持っているし、クラスタ間はバイパスの遅延もある
649Socket774:2011/12/13(火) 23:46:32.17 ID:sfeGzwCP
なんかアーキテクチャスレっぽくなってきた
650Socket774:2011/12/14(水) 00:23:58.04 ID:dLlvaijL
ふむ、心地よい。
651Socket774:2011/12/14(水) 00:48:18.25 ID:OKUmeyHC
>>632
SandyBridgeのdppsってスループット1化してたのね
一方でhaddpsはスループット2だったりして不思議

haddps/dppsはCore2の頃は何のためにあるのかわからん命令だったけど
ちゃんと高速化されてるのね
652Socket774:2011/12/14(水) 00:49:41.79 ID:dLlvaijL
うおー、水平加算のスループット高いんか!
そりゃうれしい!

けど、適用したいところの処理、メモリアクセスがネックで有難味激減(涙)
653Socket774:2011/12/14(水) 01:30:18.09 ID:+UVX90Ap
プレス子になってやっと搭載だもんな
何考えて設計してるんだろ
654Socket774:2011/12/14(水) 01:47:21.66 ID:OKUmeyHC
シャッフルユニットが強化されたのもCore2 45nm以降だし
SOAが基本で水平演算は非推奨って姿勢だったんじゃない?

haddps,dppsにしても一応あるというだけで
Latency/Throughputは使い物にならなかったし

march haddps dpps
Prescott 14/6, NA
Core2 65nm 9/3, NA
Core2 45nm 7/3, 11/3
Nehalem 5/2, 11/2
SandyBridge 5/2, 12/1

しかし着実に速くなってるね
655Socket774:2011/12/14(水) 02:19:06.88 ID:qGCtpGwD
>>642
> 何のための訴訟だったんだろう?なんで売却が和解になったんだろ?

特許侵害ではIntelに勝てることが確実だったから
DECは、莫大な設備投資にもかかわらず稼働率が低くて重荷の半導体工場を特許と一緒に売りつける目的で
特許訴訟を提起したんだよ。

大量に売れる製品ラインを持っていないことには
巨額の設備投資を必要とする最先端半導体工場を作り続けることが
不可能な時代になったということです。
656Socket774:2011/12/14(水) 03:00:45.47 ID:kOUHSr7g
AMDなんかはブルドーザーでやっとサポートしてもマイクロコードで遅いな
657Socket774:2011/12/14(水) 06:48:56.54 ID:9YNqdr+K
>>643
HTTはP4に最初から搭載されながら無効となっていたとされるが、
Xeon用かなんかで有効になる前に、CompaqからEV6バスのライセンス得て
それと抱き合わせでHTTがokになったと記憶している。

しっかし、alphaってDESの付属品にあったっけ。
PCIブリッジとNICとStrongARMはオマケで付いてきたけど、
alphaは製造Samsungで、半導体工場とは別だったような気がする。
658Socket774:2011/12/14(水) 09:48:45.43 ID:0q7AsSdh
QPIの開発も元DECの人たちが中心だったんだっけ?
659Socket774:2011/12/14(水) 10:46:33.60 ID:tZboIVg8
元を辿れば全部ユダヤ人です

もう30年になるのか。
660Socket774:2011/12/14(水) 10:48:42.04 ID:WCx+5Jl1
>>646
AlphaのチーフアーキテクトだったRich Witekは最近AMDに帰ってきた。
元々DECでPRISMプロジェクトというRISCをDave Cutlerらとやってたが、DECはMIPS採用したので、これは中止。しかしそのあと、AlphaやStrongARMの設計をやって、DECが消えてからAlchemyってMIPSの会社を起こした。
このAlchemyがAMDに買収されてRichも移って来たけど、この部門も売られちゃった。その後、Microsoftに身を寄せてたようだけど、最近AMDに復帰したみたい。
Rich先生の次回作に期待したい。
661Socket774:2011/12/14(水) 11:09:33.92 ID:WCx+5Jl1
>>643
HypertransportはDECからスピンアウトしたAPI NetworksっていうHPCベンダーで開発始めて、その会社ごとAMDが買っちゃったンだよね。
662Socket774:2011/12/14(水) 14:25:39.09 ID:eSglyPBP
DECの遺産はでか過ぎてワロエナイ
こんな偉大な会社まで退場させられちゃうんだからほんと厳しい世界だわ
663Socket774:2011/12/14(水) 17:48:48.21 ID:FGSWq+oN
PCE、MD、3DO、SS、PC-FX、DC、XBOX360、PS3、wiiと、
技術の転換期に慌てて発売したハードは必ず失敗する。
664Socket774:2011/12/14(水) 18:06:38.86 ID:ekHOIx9N
技術の転換期じゃない時期っていつよ
665Socket774:2011/12/14(水) 18:19:39.53 ID:AX1Xrw+5
慌てて発売したハードがあったときだろ
666Socket774:2011/12/14(水) 18:20:29.50 ID:AX1Xrw+5
なかったとき、の間違い
667Socket774:2011/12/14(水) 18:54:53.70 ID:layJL2Ga
>>663
トップシェア取れなかったコンソールは全て失敗なんだなw
668Socket774:2011/12/14(水) 19:00:37.76 ID:FGSWq+oN
>>667
そういうわけじゃないよ
トップシェアを取っても失敗ハードは失敗ハード
669Socket774:2011/12/14(水) 19:03:12.37 ID:oLlC+02v
>XBOX360、PS3、wii
つまり今世代機はすべて失敗作、と
670Socket774:2011/12/14(水) 19:24:32.13 ID:FGSWq+oN
>>669
Yes

ゴミハードしかないときは覇権ハードも現れないし市場も縮小する
671Socket774:2011/12/14(水) 19:33:53.65 ID:layJL2Ga
PCEとかSSとかはハード設計的には別に間違ってないだろ。
むしろSFCの方が
>技術の転換期に慌てて発売した
には該当する。失敗してはいないけど。
672Socket774:2011/12/14(水) 19:41:18.22 ID:opLjYZj1
>>663
GCが入ってない時点で妊娠乙としか言い様が無いな。てか、ゲハでやれ。
MDと箱○はWWでは成功したハードだと思うけどな。
673Socket774:2011/12/14(水) 19:43:11.26 ID:zr3oiT79
メガドラが失敗作であることに異論はない。
だって色がにじむんだもの。
674Socket774:2011/12/14(水) 19:48:28.23 ID:TpIFEf1G
メガネをかけた女子高生がドラッカーを読んだら
675Socket774:2011/12/14(水) 19:51:29.44 ID:zr3oiT79
文字が滲んで見えるよ
676Socket774:2011/12/14(水) 19:53:17.69 ID:opLjYZj1
>>673
RGB化はデフォだろjk
677Socket774:2011/12/14(水) 20:17:56.44 ID:UxgwGI+y
PS3とXbox360は失敗っていうか、出さないと相手だけ出して自分は負けるから出さざるを得なかったんだろうな。
両方。
678Socket774:2011/12/14(水) 20:19:31.04 ID:PIp2U0P3
なんかアーキテクチャスレっぽくなくなった
679Socket774:2011/12/14(水) 20:25:15.36 ID:FGSWq+oN
>>677
PS3側が有利な立場にあったのに、cellだのRDRAMだの旧式GPUで墓穴を掘ってしまった
680Socket774:2011/12/14(水) 21:48:15.26 ID:dWb6Bw8K
アーキテクチャとかなんも知らん奴が語り出したな。
特にID:FGSWq+oNの無知っぷりは酷い。
681Socket774:2011/12/14(水) 21:59:42.89 ID:1LYuwv6H
結局、話題の行き着く先はゲーム機なんだよな
PCってなんだろうねw
682Socket774:2011/12/14(水) 22:01:33.68 ID:/A6zDvtO
>>681
きみにはいらないものだよ。
683Socket774:2011/12/14(水) 22:30:13.97 ID:FGSWq+oN
>>680
俺はアーキテクチャの話はしてないよ
死ねクズ
684Socket774:2011/12/14(水) 22:45:33.82 ID:qlYH46PB
くだらねースレチの話延々引っ張ってその態度とかエラでも張ってそうなくらい面の皮が厚いな
685Socket774:2011/12/14(水) 23:08:11.40 ID:7fqGX4rT
ゲーム機のCPUはその時代の最先端の技術が投入される
ハードウェアはコンソール機の10年間のライフサイクルにおいて唯一変更不可能なものだからだ
でっででーででででー
やんまーにやんまーにやんまーにやーいーやー
686Socket774:2011/12/14(水) 23:13:03.00 ID:dLlvaijL
http://pc.watch.impress.co.jp/docs/2003/0909/kaigai019.htm

>その意味では、Cellコンピューティングは、現在のコンピュータアーキテクチャに対する挑戦とも言える。
>Cellコンピューティングで、Wintel主流のコンピュータアーキテクチャをひっくり返そうというわけだ。
>そう考えると、PS3のためにCellコンピューティングがあるというより、Cellコンピューティングという大きな構想があり、
>その最大のアプリケーション(けん引車)としてPS3があると考えるのが正しいと思われる。

>インターネット上でCellコンピューティングが実現すると、最終的には、
>「地球シミュレータ(地球環境をシミュレートするスーパーコンピュータ)の1万倍とか10万倍」(久夛良木氏)の
>コンピューティングパワーも実現できるようになる。

>例えば、映画「マトリックス」の仮想世界のようなシミュレータを、いつの日か実現することも可能になるかもしれない。

687Socket774:2011/12/14(水) 23:19:57.64 ID:FGSWq+oN
>>686
現実を無視した机上の空論w
688Socket774:2011/12/15(木) 00:15:27.39 ID:cFc9FUSr
久夛良木は世のプログラマの多数派を過大評価していた。
Cell くらい使いこなしてくれるだろうと思っていたら、
大量の使いこなせないやつらがけなしまくって
短所だけクローズアップし長所はシカトされた
689Socket774:2011/12/15(木) 01:49:44.38 ID:ncIwxvah
使いこなしたらハックされまくったやん
690Socket774:2011/12/15(木) 01:55:47.21 ID:tsN99y/B
GameOSをクラックして乗っ取るのとCPUアーキテクチャを使いこなすこととは別だろ?
691Socket774:2011/12/15(木) 02:57:02.35 ID:HAJEMXry
当世代機の実機より速いエミュはAlphaの奇跡だったな
692Socket774:2011/12/15(木) 06:22:09.19 ID:nH/0BUh4
なんでこんなにスレ違いなん
693Socket774:2011/12/15(木) 06:30:49.22 ID:E1xjdn4S
>>692
コンソールゲーム機のハード技術を自慢したいゲハ板住人が紛れ込んでるから。
694Socket774:2011/12/15(木) 10:18:07.85 ID:+4WTiZIP
》691
21164 500MHz with FX32!はPenII 233MHzよりWin32アプリが速いということだけど、実際はそんなに速くないと思う
ちなみに今風に言うとエミュでなくCMSだな
695Socket774:2011/12/15(木) 12:13:31.94 ID:bQYQUiMu
>>688
誰も使いこなせないアーキテクチャは優れた部分も活かされないという証明になったな。
本来はCellでグラフィック処理も賄うつもりだったのにそれがまずできなかったし。
結局使いこなせたのはIBMくらいか? 3DバリバリのゲームでもSPEは1や2しか使ってないのが多かったし。
696Socket774:2011/12/15(木) 16:52:31.70 ID:FRXs8GnG
Cellみたいな何でも集中型のプロセッサは絶対に上手くいかない
世のトレンドは分散型
697Socket774:2011/12/15(木) 17:21:25.99 ID:tsN99y/B
Cellってアーキテクチャとして処理分散型じゃね
698Socket774:2011/12/15(木) 20:45:08.30 ID:IGbcHw+4
ゲームプログラマには超並列演算は難しかったんだろ。
699Socket774:2011/12/15(木) 20:47:52.84 ID:58AClVSD
Cellはちょっとエミュで触ったことあるけどC言語で開発するあたりがダメだな。
東芝が専用言語作ってたらしいが、それくらいしないと開発が死ぬ。
Itaniumと違って思想は悪くないし、開発環境を整えるとかもっとやり方はあったんだろうに。
700Socket774:2011/12/15(木) 20:51:02.49 ID:mhd08EDd
CellのプログラミングってCUDAよりも厄介?
701Socket774:2011/12/15(木) 21:02:48.65 ID:IGbcHw+4
スパコンでの経験があるやつに言わせればGPGPUのプログラムなんて簡単らしいで。
PCとかコンソールでの経験しかないプログラマには厳しいよな。
702Socket774:2011/12/15(木) 21:12:24.67 ID:qv8cnr/L
>>695
SPEは1や2しか、ってどんなだよw
703Socket774:2011/12/15(木) 21:25:00.63 ID:tCprdVGh
あれこれ小難しいことしてSPEに仕事投げなきゃならんCellよりは
普通に組んでコンパイラ任せのItaniumのほうがよほど使いやすくていい気がするけどなあ

あれこれ凝りすぎてクロック上がらないとか大規模過ぎて開発が遅延に遅延を重ねたとか
プロセッサそのものはアレだけど…
704Socket774:2011/12/15(木) 22:09:48.02 ID:ZQL9OCmR
【GTC AGIA 2011レポート】
“2019年のPlayStation”の姿を紹介
http://pc.watch.impress.co.jp/docs/news/event/20111215_498851.html
Ubisoftが製作した「Assassin's Creed Revelations」の予告編映像。
この映像は、現在のスパコンを使って1フレームあたり1時間をかけてレンダリングしたもので
、そのクオリティは実写と見まがうばかりだ。先に紹介したワットあたりの性能の向上当てはめ
ると、2019年には100W、すなわちPlayStation 3クラスのシステムに数十TFLOPSの処理能力
が備わる。つまりフアン氏は、「2019年のPlayStation」ではこれがリアルタイムでゲーム画面とし
て動かせるようになると述べ、聴衆から大きな拍手をうけた。



どうです凄い時代になるんですよ
705Socket774:2011/12/15(木) 22:10:57.79 ID:58AClVSD
>>703
もちろんItaniumがゴミなのは開発効率じゃなくて速度の話ね。
そもそもコンパイラ任せという考えからしてゴミだし。
Cellは少なくともヘテロジニアスマルチコアというトレンドにはマッチしてる。
706Socket774:2011/12/15(木) 22:26:52.40 ID:aDuCaP40
トレンドにマッチですか…
707Socket774:2011/12/15(木) 23:00:13.72 ID:8MrL4YUn
>>701
んなことない。ピンきりである。研究者の宣伝に騙されて、
スパコンに変な幻想抱きすぎ
708Socket774:2011/12/15(木) 23:44:52.28 ID:ja81C4rc
>>697
CPUの中にGPUもSPUもぶち込んだプロセッサだから集中処理型でしょ。
CellはUMAを採用して爆死した任天堂64並みの失敗作。
709Socket774:2011/12/15(木) 23:54:33.97 ID:IGbcHw+4
CPUの中にメモコンもGPUもぶち込んだintelとAMDのCPUは皆失敗作ってことになるが。
710Socket774:2011/12/16(金) 00:10:29.05 ID:kcT0dC64
>>709
それはモバイル用で、パフォーマンスよりも、
発熱や大きさ、消費電力などを優先してるんでしょ。

Cellとはちょっと分野が違うんじゃない?
711Socket774:2011/12/16(金) 00:15:15.62 ID:h9TLfMzW
完全体になり損ねたCellか・・・
712Socket774:2011/12/16(金) 00:16:30.89 ID:8wEFyJeY
>>710
デスクトップ用でも普通にGPUもメモコンも内蔵してるだろ。
お前最近のCPU知らんのか?
713Socket774:2011/12/16(金) 00:18:59.29 ID:kcT0dC64
>>712
メモコンは入っているけど、GPUやSPUまでは内蔵されてないでしょ
714Socket774:2011/12/16(金) 00:25:54.12 ID:nbvqi3vt
GPUや動画再生まで入ってる
ちなみにCellにはGPU内蔵されて無い
715Socket774:2011/12/16(金) 00:26:25.25 ID:mD+25pNJ
>>713
Nehalem(Clarkdale)のi5以下とSandyのLGA1155はデスクトップ向けでも
メモコンとGPU内臓だしLlanoも(特に上位モデルは)モバイル専用じゃないが

Intel HD GraphicsはGPUと呼ぶに値しないって俺理論かw
716Socket774:2011/12/16(金) 00:35:07.75 ID:gqk5pEsz
知らない(あるいは忘れた)ことは仕方ないけど、どうしてそう偉そうに断定するんだろう
717Socket774:2011/12/16(金) 00:43:37.83 ID:qppoeNy9
SPUってなんの事かと思ったらPSの音源チップか
CellのSPEと勘違いしてる?
718Socket774:2011/12/16(金) 00:54:50.40 ID:kcT0dC64
Ceiiってサウンドチップも内装されてるんじゃないの?

CPUが俺の知らない間にそこまで進化しているとは知らなかった。
専用のGPUの他に、CPUにも軽めのGPUを内装する時代なのね。
719Socket774:2011/12/16(金) 01:01:14.78 ID:4pImcZWJ
>>708
CELLにGPUが搭載されているならPS3の中のRSXは何のために入っているんだろうか。
720Socket774:2011/12/16(金) 01:08:37.21 ID:kcT0dC64
クタタンのCell構想の失敗の穴埋めの為じゃね?
721Socket774:2011/12/16(金) 01:11:36.29 ID:hM+3K5lS
>>718
軽めってアンタ……

Intelですらオンボードどころかローエンドグラボ以上の性能をCPUに内蔵済みですが。
過ぎのIvyではDX11対応に性能30%以上向上とかしてくるし。
722Socket774:2011/12/16(金) 01:21:02.96 ID:kcT0dC64
>>721
将来はGPUが廃れますか?
723Socket774:2011/12/16(金) 01:28:37.33 ID:7RhxFgkr
8面マルチとか4k2k解像度になるから廃れることはない
724Socket774:2011/12/16(金) 01:28:43.83 ID:SfzhVlVr
ID:kcT0dC64
この子おもろい
725Socket774:2011/12/16(金) 01:33:53.49 ID:kcT0dC64
>>723
4k2k解像度のディスプレイやスーパーハイビジョンテレビを8台並べて、
一つのマシンで表示しようとするおっさんや兄ちゃんなんてふざけている。

普通に考えて、精々多くてもGPU一機につき4面マルチまでだな
(それでも多いが)
726Socket774:2011/12/16(金) 08:19:28.17 ID:h9TLfMzW
Eyefinityという技術があってだな
727Socket774:2011/12/16(金) 09:46:13.47 ID:wxtcyxJb
おっと、Parheliaの悪口はそこまでだ。
728Socket774:2011/12/16(金) 17:44:45.09 ID:OUf0Ltrm
ベクトルスパコンは、ベクトルレジスタ間接アドレッシング&多wayインターリーブがあるから、GPGPUよりはプログラム楽だろ
情報処理試験の議事言語しか読めないから知ったかだけど

で、ベクトルスパコンでも、実際に動いてるコードのベクトル化率は50〜60%程度
SIMDってのは本質的に難しい
それが簡単だったら、今頃x86もPowerもSPARCも8wayくらいのFMAC SIMDを実装してるだろう
ベクトルからMPPやRISC WSに数値計算の主流が移行したのも、コストパフォーマンスだけでなく、ベクトル化率を100%近くに持ってくのが極めて困難だってのも大きい(らしい)
SIMDでなくMIMDが並列処理の主流なのですよ
729Socket774:2011/12/16(金) 18:42:37.71 ID:ya/nsaap
大容量ベクトルレジスタ、高byte/flopメインメモリの機種が少数派になったのは
LINPACKのFLOPS/$ が割高なことによって
ハイエンドプロジェクトの絶対価格が高くなりすぎて企画できなくなったからだよ

アカデミックなユーザーが欲しいのはMIMDじゃなかった。
しかたなくMIMDへ移行させられた。今はもうどっちでも
730Socket774:2011/12/16(金) 18:49:37.56 ID:ya/nsaap
つーか、ベクトル化できるかどうかは、変数間の
依存関係なんだから、依存関係が原因でベクトル化できない
アルゴリズムはMIMDによる並列処理システムでも待たされる
731Socket774:2011/12/16(金) 21:21:13.58 ID:gqk5pEsz
ベクトル機ではループの直前のイテレーションに依存する計算もそこそこ性能が出る
732,,・´∀`・,,)っ-○○○:2011/12/16(金) 21:38:42.24 ID:HbBHTL7R
>>728
> ベクトルスパコンは、ベクトルレジスタ間接アドレッシング&多wayインターリーブがあるから、GPGPUより
それCUDA対応以降のGeForce/Teslaで普通にサポートしてるからw
むしろスカラ対応のユニット・レジスタセットがないからそれしかできないけど。
733Socket774:2011/12/16(金) 23:33:33.57 ID:2i+yaKzl
>>654
努力は認めるが中途半端なCPUを何種類も出されても迷惑だよな
PowerPCのAltiVecなんてG4時代でもdpps16回分の4*4行列積が30サイクルで出来るんだから
手抜きでなかったらアホとしか言いようがない
734Socket774:2011/12/16(金) 23:37:47.88 ID:gqk5pEsz
自分以外はみんなアホ
735,,・´∀`・,,)っ-○○○:2011/12/16(金) 23:51:15.66 ID:HbBHTL7R
むしろ4x4行列積にdpps使うとかアホとしか言いようが無い。
736,,・´∀`・,,)っ-○○○:2011/12/17(土) 00:02:00.73 ID:HbBHTL7R
Pen4までならmulps+addpsで転置行列積を求めてshufpsでtransposeが常道です。
Core2以降なら3命令+Load同時発行できるからbroadcast+mulps+addでもOKだけど。
むしろAltiVecとかCellでも都度内積演算×16なんてやって速くなるわけが無いだろ?
アホほど自分のアホさ加減を棚に上げる。
737Socket774:2011/12/17(土) 00:04:52.31 ID:bkVFwDsI
コイツの読解力って凄まじいな
738,,・´∀`・,,)っ-○○○:2011/12/17(土) 00:30:57.90 ID:Yo2c/Fb2
>>737←こいつとりあえずコメントしとけば誰かから同意が得られると思う無能ぶりがにじみ出てるな
4x4行列積を求めるのになんでスカラ内積を使う必要があるんだ?
739,,・´∀`・,,)っ-○○○:2011/12/17(土) 00:37:16.57 ID:Yo2c/Fb2
AltiVecで水平演算なんて論外レベルの遅さですし
740Socket774:2011/12/17(土) 00:42:01.43 ID:bkVFwDsI
日本語理解できないなら黙ってろよ
741,,・´∀`・,,)っ-○○○:2011/12/17(土) 00:48:54.53 ID:Yo2c/Fb2
G4のAltiVecってレジスタリネーミングどころかアウトオブオーダ実行すらないし、なにより
FSB133MHz(笑)でPentium IIIの半分どまりだったから、いくらクロック当たり性能をアピールしようとも
実性能ではSSEに及ばない代物でした。これが現実。

MPC7450系コアで1GHz越えた頃にはFSB400MHzオーバーのPentium 4やPentium Mが出てて
足回りの性能は更に差がついてた。
742,,・´∀`・,,)っ-○○○:2011/12/17(土) 00:49:26.39 ID:Yo2c/Fb2
>>740
お前は小学校のあいうえおからやり直せ無能
743Socket774:2011/12/17(土) 00:51:11.01 ID:IPilCC/w
いいぞもっとやれ
744Socket774:2011/12/17(土) 01:02:26.52 ID:EAx33FVk
>>730
えー!
ってことは、マルチコアでスケールするのなら、原理的にはGPGPUでも速度出るってことなの?

>>732
メモリの多wayインターリーブがないから、GPGPUでベクトルレジスタ間接してもたぶんあまり意味がない
745,,・´∀`・,,)っ-○○○:2011/12/17(土) 01:12:54.04 ID:Yo2c/Fb2
> メモリの多wayインターリーブがないから、
え?
746Socket774:2011/12/17(土) 01:15:24.25 ID:EAx33FVk
》741
レジスタリネーミングはやってる(PowerPC7450のFPUはリネーミングレジスタ16本!たしか)
FPUとAltVecは限定的OoO
詳しくはフリースケールのホワイトペーパで
あと、おれにはわからんがSSE3よりはAltVecの方が洗練されてる、とされている
PowerPC G4のコア自体はPentium IIIと同等の実力だ
747,,・´∀`・,,)っ-○○○:2011/12/17(土) 01:22:28.85 ID:Yo2c/Fb2
製品レベルのクロックで倍の差がついてたのに同等ってのは無いだろ。
7450のほうは出るのが遅かったの一言につきる。

命令セットだけは綺麗に見えるけど実装にどこそこボトルネックがあって
使いにくいのがAltiVec
748Socket774:2011/12/17(土) 01:27:39.56 ID:jpphIg9K
高機能なのはいいのだが、欲張りすぎて将来の性能向上の足かせになるのがモトローラの伝統
749,,・´∀`・,,)っ-○○○:2011/12/17(土) 01:30:40.08 ID:Yo2c/Fb2
ロードマップに餅の絵を描くのも伝統だね
750Socket774:2011/12/17(土) 01:33:12.11 ID:jpphIg9K
6809も一見直交性があるが、プリバイトなんてのがあってレジスタに差がついていたりする
751,,・´∀`・,,)っ-○○○:2011/12/17(土) 02:02:40.41 ID:Yo2c/Fb2
AltiVecってPPCアーキ最大の害悪だろ。
クロック向上をもっとも阻害した要因。

ハードの実装コストが高すぎて180〜90nmプロセスの時期にはどう考えてもオーバーテクノロジー
752Socket774:2011/12/17(土) 02:55:48.72 ID:vjMWe4BG
別にAltiVecのせいでクロック上がらなかったとは思わないけどな。
G4+を出すのが遅すぎただけ
753,,・´∀`・,,)っ-○○○:2011/12/17(土) 02:59:01.96 ID:Yo2c/Fb2
初代G4からしてクロック50MHzずつ下げて出荷とか最悪の出だしだったけどな。
クロックが上がらない呪いはG5にも伝染してるし。
754Socket774:2011/12/17(土) 03:01:15.34 ID:jpphIg9K
モトローラ88000もいろいろおかしなところがあったプロセッサだが
浮動小数点演算を汎用レジスタ上で行うところが最大の謎
頭おかしいんじゃ、と言われていた
次の88110では独立した浮動小数点レジスタが増設された(80bit)
755Socket774:2011/12/17(土) 03:30:16.67 ID:1we6Foqq
>>744
往年のベクトルスパコン 数byte/flop
GPU(M2090) 0.27byte/flop。違いすぎ
756Socket774:2011/12/17(土) 03:49:31.86 ID:jpphIg9K
68040は25MHzで登場した。
順調にクロックを上げていったが、ある日突然33/66MHzという表記にかわった。
i486DX2の登場後だったので、モトローラも対抗して倍速版を出したのかと思ったが、
68040は最初から(一部)倍速とのことで、マーケティングの理由での変更だった。

むろん早期に倍速駆動させた技術はすばらしい。
しかし最初からトップギアだった68040はi486DX2に抜かされてしまうのであった。

以上の事情によりクロックあたりの性能の優劣はわからないのだが、
リリース当初では、68040/25のほうが80486/25より速かった。

68040は1.2M Tr、80486が1M Trと68040が多少規模が大きい。

キャッシュは68040の4+4KBの分離キャッシュに対して80486の8KBの統合キャッシュだった。
68040は分離キャッシュの上、invalidate cache命令が特権命令だったので、
命令の自己書き換えをするためにはキャッシュをinvalidateするシステムコールを呼ばなければならなかった。
(もちろんプラットフォームに依存するし、そもそもあるとは限らない)
JavaVMのJITコンパイラのkaffeのソースにも「68040はbrain damaged」と書いてあった。
インテルは今日にいたるまで命令の自己書き換えをサポートしている(はず)

68040のFPUは超越関数がごっそり削除されてしまった
インテルは今日にいたるまでx87の全機能をサポートしている(はず)

MMUについては68020+68851、68030、68040とどんどん貧弱になってしまった。
68851は5段の変換や最小1バイトのページサイズもサポートしていたのに。
NetBSD/Amigaのソースにも"68040 MMUはbrain damaged"と書いてあった。
(どこに悪態をついているのかは知らない。おそらく簡素化しすぎて面倒なことになったんだろう。)
もちろんインテルは今日にいたるまで386 MMUの全機能をサポートしている(はず)
757Socket774:2011/12/17(土) 04:06:28.76 ID:sjOkaibZ
要するに、PCやゲーム機の分野に於いては、
モトローラ、ARM、アップル、ソニー、NEC、日立、リコー、AMDのCPUは負け組みで、
インテルのCPUだけが唯一の勝ち組って事?
758Socket774:2011/12/17(土) 04:38:22.42 ID:p7GM8YXT
ARMはこの互換性保持無間地獄に耐えられるかな
759Socket774:2011/12/17(土) 08:50:04.10 ID:ADUV2mMK
>>744
ベクトル型にしてもGPU的な多スレッドにしても問題は
演算途中の実行コンテキストの総量が大きくなってしまうこと

普通のCPUであればスレッドあたりのテンポラリが数十kB程度であっても
L1か悪くてもL2は必ず入る
一方でGPUだと演算器のレイテンシを隠蔽するだけでSMあたり数十〜数百スレッドを
走らせる必要があるからそのままだとオンダイメモリには全く入らない

GPUでインフライトのスレッド数が多いというのは貴重なオンダイメモリを
寝ているスレッドの実行コンテキストの保持のために使ってしまうということ
そしてオンダイメモリに入りきらない分をDRAMに盛大に撒き散らす

ベクトル型はそれを広帯域・多ウェイインターリーブの主記憶でどうにかしようとしたが
メモリ帯域が相対的に高コストになってきたからすでに破綻している

GPUはDRAM量が小さいので比較的安価に帯域を稼げるがそれでもB/Fは非常に低い
GPGPUで速くなってるとされるプログラムの結構な数は
単純にGDDRの性能分だったりする
FPU性能を生かす事ができるのは一部のアプリケーションに限る
それもプログラマが気合で頑張る必要がある

トランジスタのメモリ帯域に対する相対的コストは年々安くなるから
(GP向けの)GPUも何でもかんでもマルチスレッドで隠蔽するんでなくて
分岐予測やHWプリフェッチを入れてく方向になってくんじゃないかな
760Socket774:2011/12/17(土) 09:00:45.87 ID:5WkjMHDK
おまえプロだろ。
自作板でもここまでのレベルのやつは久々にみた。
761Socket774:2011/12/17(土) 09:01:42.08 ID:5WkjMHDK
>>759
GPUのアーキを理解するのに一番おすすめの本教えてよ
762Socket774:2011/12/17(土) 10:22:46.54 ID:1we6Foqq
>トランジスタのメモリ帯域に対する相対的コストは年々安くなるから

IBMはCPUが活躍するために記憶域階層をお膳立てするのではなく
ストレージにCPUが群がっているような図を描いてるな。

ハードの設計もプログラミングも、
演算手順が主で記憶領域設定(配置・移動)が従から
データの配置、移動が主(パフォーマンスを決める)で
演算はデータが置かれるだけ、通過するだけでなされる従に
なっていかざるをえないのかもしれない
763Socket774:2011/12/17(土) 10:43:19.49 ID:7Bx9af34
近年その発想で汎用業務アプリのSEがHPC分野をやろうとするから失敗する
プログラミングの重要性が理解できない
764Socket774:2011/12/17(土) 12:28:13.92 ID:HbOBv3gD
>>762
それが言えるのは大規模行列演算やDBだけ
確かにアーキに与える影響は大きいが
ソフト側に与える影響はそれほど大きくないのでは
765Socket774:2011/12/17(土) 12:28:41.70 ID:n9i4aLR1
>>762
データフロー・アーキテクチャって何十年も前から概念は提示されてて一部DSPなんかじゃ
実現もされてるけど商用汎用プロセッサじゃまだ実現してないよな。
766Socket774:2011/12/17(土) 14:15:01.30 ID:1we6Foqq
>762 は略しすぎたが、エクサスケールとかそういう方面、
全てのコンピューティングがそうなるとは思っていない。
767Socket774:2011/12/17(土) 18:26:47.50 ID:AJ+gwxwD
>>765
OoOが限定的なデータフローモデルの実現じゃない?
データが届いたものから計算する訳だから
768Socket774:2011/12/17(土) 18:52:56.89 ID:jpphIg9K
>>767
昔はrestricted dataflowといってたな。
http://www.cs.clemson.edu/~mark/hps.html
> Modern superscalar processors like the HP PA 8000, IBM/Motorola PowerPC 604,
> Intel P6, and MIPS R10000 are built around a dynamically scheduled microengine.

ちなみにこの論文はCISC命令(ここではVAX)をuOPsに分解して実行することを西側で最初に提案した。
> This style of design has often been referred to as restricted data flow [PHS85]
769Socket774:2011/12/17(土) 18:54:36.52 ID:jpphIg9K
ありゃ、引用の途中に文を入れちゃった
770Socket774:2011/12/17(土) 19:23:38.39 ID:jpphIg9K
>>762
> データの配置、移動が主(パフォーマンスを決める)で

メモリ階層や分散メモリなどで、すでにそうなっている
771Socket774:2011/12/17(土) 20:03:36.19 ID:BZGJ80Vl
もし団子が756, 759くらいのことを言ってくれたなら
772Socket774:2011/12/17(土) 20:20:23.80 ID:sjOkaibZ
結局はインテルの一人勝ちで、世界中がインテルに土下座しないといけない状況でつまらない
773Socket774:2011/12/17(土) 20:31:05.43 ID:EAx33FVk
ARMがHPCやサーバーでも、将来的には2割程度のシェアを獲得するんじゃないかと思う
ARM V8はalphaやMIPSなみにシンプルな命令セットっぽいので、対x86で30%以上は高速化のアドバンテージがある(たぶん。楽観的予測)
最終的にはIntelの50%のTDPで50%の性能くらいはいくんじゃないか?(希望的観測)
マルチベンダーのARMが、シングルベンダーのx86に対抗できない理由はない
IBMはPowerを捨てて、ARMで行くべき
774Socket774:2011/12/17(土) 20:34:28.36 ID:bb4U+LuI
スマートフォンやタブレットPCでは逆にインテルがARMに土下座しなきゃいけない状況
775Socket774:2011/12/17(土) 20:40:19.17 ID:CvG1TfNM
>>771
少なくとも命令セットとかアセンブラの話してる時だけはまともだろ

これが他の話になると主観入りまくって言うことがコロコロ変わるか予想を外すだけで
1年ぐらい前はCUDAディスりまくってたのにいつの間にか手のひら返してるし…
776,,・´∀`・,,)っ-○○○:2011/12/17(土) 20:47:35.92 ID:Yo2c/Fb2
Power(PPC)よりARMが優れてる理由はどこにも無いですよ。
組み込み向けの実装ではむしろPPCのほうが電力効率いいこともありますし。
777Socket774:2011/12/17(土) 20:48:07.62 ID:EAx33FVk
あと、未来のコンピューティングでARMの他に外せないのは量子コンピュータだ
量子bitの大型化、低価格化、量子コンピューティング適用可能なアルゴリズムの発見で、数値計算カーネルの多くをオフロードするだろう
量子コンピューティングは車輪の再発名っはない、破壊的イノベーションだ
ノイマンアーキテクチャに、ひょっとしたら全面的に取って代わるかもしれない、そんな革命

酔ってるときにカキコすると気持ちいいな
778Socket774:2011/12/17(土) 20:52:59.83 ID:EAx33FVk
コンディショナルレジスタ操作+分岐より、比較条件分岐一発の方が、たぶん性能出る
じゃなかったらMacro opsフュージョンなんかやらない(良い比較じゃないか?)
779,,・´∀`・,,)っ-○○○:2011/12/17(土) 21:01:56.17 ID:Yo2c/Fb2
ARMベースのISAでx86並みのパワーレンジにスケールアップしたとしてPowerPC G5の二の舞だと思ってる。
デコードコストの高さは1命令のオペレーションの密度で十分ペイしてる。
オペレーション密度の低さをクロックを上げたりIPCを上げたりしてカバーするアプローチは破綻してるし。

まさかARMの64ビットISAってプレディケートビットが大幅に削られたの知らないのか?
780Socket774:2011/12/17(土) 21:07:02.39 ID:EAx33FVk
分岐予測の強化とコンディショナルムーヴで、プリディケードのほとんどをカバーできる
781Socket774:2011/12/17(土) 21:19:43.82 ID:EAx33FVk
一番破綻してるのは、C2Dで極みに達したのに、なおIPCを上げようとしているIntelのアプローチだ
おれは直感する
デコードコストは命令密度ではカバーできない
命令密度が問題なら、L1キャッシュを増やしてフェチのレイテンシを伸ばせばいい
この方が複雑な命令を多段デコーダで解読するよりずっと簡単なソリューションだ
命令密度がIPC向上に寄与するなんてのはIntelの詭弁だ
教科書的というかalpha的命令セットが、コード密度や速度の最適解(たぶん)
じゃx86の何が速度的に有利なのか?
L1キャッシュの効率性は、フェチ&デコードで相殺されるよ
782,,・´∀`・,,)っ-○○○:2011/12/17(土) 21:23:22.58 ID:Yo2c/Fb2
CMOVならそれこそP6以降のx86でもサポートしてるし

オペレーション密度の問題って知らないのかな?
たとえばある値と32ビット即値(たとえば0x12345678)との論理積をとる場合
x86ならand eax, 0x12345678で一発だ。命令長もせいぜい6バイト程度ですむ。

これがRISCの場合
32ビットの上位16ビット(0x1234)をセット→下位16ビット(0x5678)とORをとる→AND命令で3命令だな。
命令長を6バイトとか8バイトにすれば32ビット即値くらいは表現できるがコード格納効率が極端に下がる。
これが固定長命令形式の限界。

メモリ間接操作まで含めると圧倒的な差がつく。
故にx86のパワーレンジでx86以上のシングルスレッド性能を発揮できるRISCなど皆無。
ARM本家はx86のメリットが生かしにくいベンチのスコアでだけx86と同等としか言わないからな。
783,,・´∀`・,,)っ-○○○:2011/12/17(土) 21:25:07.71 ID:Yo2c/Fb2
> 命令密度が問題なら、L1キャッシュを増やしてフェチのレイテンシを伸ばせばいい
> この方が複雑な命令を多段デコーダで解読するよりずっと簡単なソリューションだ
> 命令密度がIPC向上に寄与するなんてのはIntelの詭弁だ
その方法のまずさはItaniumを推してたIntelが一番理解してる。
784,,・´∀`・,,)っ-○○○:2011/12/17(土) 21:26:42.09 ID:Yo2c/Fb2
本題だが、プレディケートの無くなったARMってPowerPCのISAと何が違うの?
785Socket774:2011/12/17(土) 21:32:18.94 ID:EAx33FVk
x86とRISCの命令密度比は2程度
現在のCやFortranコンパイラでね
RISCの即値が不足してる可能性はあるが、将来64bitフォーマットを導入すればいい
おそらく導入するだろう
CISCで効果のある命令、アドレッシングモードってスケールド・インデックスだけだよ(これの効果は絶大で、ColdFireが68000を超える命令密度を実現し、68020が初期のポストスクリプトプリンタに使われた要因)
786Socket774:2011/12/17(土) 21:33:04.24 ID:GNiP3eZo
内部結合で命令圧縮は出来ても
x86フェッチレベルで命令密度の高い命令を放り続けるって
IntelCPUは苦手じゃなかった?
787,,・´∀`・,,)っ-○○○:2011/12/17(土) 21:34:35.51 ID:Yo2c/Fb2
> CISCで効果のある命令、アドレッシングモードってスケールド・インデックスだけだよ
よくわかってるじゃないか。
それをRISC命令でやると3〜4命令かかる。
クロックを上げてペイすればいい?PowerPCがどうなった?将来5GHzや6GHzのARMでも出てくるのか?
788,,・´∀`・,,)っ-○○○:2011/12/17(土) 21:36:19.93 ID:Yo2c/Fb2
>>786
メモリオペランドをとる命令でフロントエンドのペナルティがあったのってPentium Pro時代の話で
Pentium M以降では解決してます。
789Socket774:2011/12/17(土) 21:40:44.96 ID:GNiP3eZo
>>788
レジスタスタックが絡む命令はどうなん?
790Socket774:2011/12/17(土) 21:42:16.58 ID:jpphIg9K
>>778
分岐予測ミスのペナルティを小さくするには、比較の結果をなるべく早く確定させることが効果的だが
(つまり命令流の中で比較命令が分岐命令のなるべく遠く前に出てくるのがよい)
比較+分岐を一命令でしてしまうと、そのチャンスがない

Alphaのように汎用レジスタと0を比較するか、POWERのようにCCを複数個持つのがよいとされている
791,,・´∀`・,,)っ-○○○:2011/12/17(土) 21:46:19.59 ID:Yo2c/Fb2
PowerPCでx86を倒せなかったIBMがARMならできるという理由がまず無いし
そもそも半導体屋である前にSI屋なのでx86に敵対する必要自体ない。
792Socket774:2011/12/17(土) 21:48:25.60 ID:vQmaOV3B
オペレーション密度が低いならデコーダ部分で合成すればいいじゃないか。
μOPsに分解しなくていい分、x86に比べたら負荷や規模は小さくなるだろうしね。

ただx86と比較してそこまで効果があるとも思えんが。
793,,・´∀`・,,)っ-○○○:2011/12/17(土) 21:51:29.56 ID:Yo2c/Fb2
融合するには依存関係を調べなきゃいけないのにデコーダで処理できるの?
それこそx86以上に肥大化したデコーダになるな。

IntelがMerom以降採用したcmp+jccのμOPs fusionは命令が隣り合っていないと機能しない。
794Socket774:2011/12/17(土) 21:52:50.04 ID:jpphIg9K
>>785
x86とRISCではレジスタの本数が違うのでループアンローリングなどの段数も異なる。

スケールドインデックスは手書きの時は便利だけどね。
Luna88kのコンパイラもあんまり使っていなかった。
795Socket774:2011/12/17(土) 21:55:35.42 ID:jpphIg9K
もっとも、スケールドインデックスはrematerializationとして考えれば興味深くはある。
796Socket774:2011/12/17(土) 21:59:17.04 ID:sjOkaibZ
そのうちL4キャッシュまで作られるんじゃないのか?w
797こばやし:2011/12/17(土) 21:59:42.13 ID:5WkjMHDK
十分に検討された場合のCISCは、RISCよりも速いんじゃないかな。
開発に金かけられない場合には、手っ取り早いしRISCが手頃ではあると思うが。
アマチュアがCPUの命令セット考えようとすると普通RISCっぽくなるしね。

CISCで最適化考えるのは恐ろしいほどの検討がいるし、メンテナンスもコストがかかるけど
現代のハイエンドチップのハードウエア資源の豊富さと、
コンパイラ技術に十分に金かけられる前提を考えるならRISCよりすでに上でしょう。
798Socket774:2011/12/17(土) 22:02:35.62 ID:jpphIg9K
rematerializationの例、だな

>>781
> 命令密度が問題なら、L1キャッシュを増やしてフェチのレイテンシを伸ばせばいい
> この方が複雑な命令を多段デコーダで解読するよりずっと簡単なソリューションだ

ライン上に分岐命令がある場合には、次は分岐先からフェッチするようにしなければならない。
つまり依存関係のサイクルがあるから、命令キャッシュのレイテンシはここに効いてくる。
レイテンシを大きくするとフェッチバンド幅が大幅にするので、受け入れられない。
799,,・´∀`・,,)っ-○○○:2011/12/17(土) 22:03:01.03 ID:Yo2c/Fb2
ループアンローリング(笑)

そもそもループアンローリングしなきゃいけないほど>>782のコード例ではx86ではレイテンシ1サイクルだが
PPCなどのRISC実装では3命令分の3サイクルだ。

即値などのパラメータの読み込みに難があるからレジスタを増やして再利用しないといけない。
とんだマッチポンプだな。
800Socket774:2011/12/17(土) 22:05:43.58 ID:jpphIg9K
>>797
80年代初頭は有効なアイデアだった遅延スロットやレジスタウィンドウが、今日では癌扱いされているように、
使える技術にによって最適な命令セットはことなる。
重要なのは、目先にとらわれて将来の足を引っ張ったりしないこと。
801こばやし:2011/12/17(土) 22:10:07.32 ID:5WkjMHDK
x86は命令密度高いからキャッシュのサイズ節約効果でデコーダの複雑さは殆どカバーできていると思う。
ARMのデコーダパイプのレイテンシの比率って実際調べてみるとx86とほとんど変わらんのよ。
それでいて命令密度はx86の方が上。

P5のときはデコーダの面積はダイの30%も占めていたが、
P6以降は数%にまで落ちた。アウトオブオーダー実行が前提だとあまり差がでないんじゃないかな。
P5以下の規模にまでx86抑えようとしたら、ARMと比べて明らかに不利だと思うけど。
802Socket774:2011/12/17(土) 22:10:11.06 ID:GNiP3eZo
>>793
内部であとから結合するくらいなら
最初から結合x86でいいんじゃないかと思うんだが。
でもその手のパターンはIntelよりAMDの方が得意そうなんだよな。

x86の優位性を語っても肝心のIntelCPUのデコーダーに制約が多そう。
803,,・´∀`・,,)っ-○○○:2011/12/17(土) 22:13:26.46 ID:Yo2c/Fb2

> 最初から結合x86でいいんじゃないかと思うんだが。
> でもその手のパターンはIntelよりAMDの方が得意そうなんだよな。
つまらない思い込みや願望だけで語るなよ。現実は逆だ。
AMDのBulldozerがcmp+jccの融合に対応したのはIntelのMeromの5年遅れだ。

IntelはSandy Bridge更にadd/sub/inc/dec/and/or/xorでも使えるように拡張している。
804Socket774:2011/12/17(土) 22:19:31.66 ID:jpphIg9K
>>801
Sandy BridgeでまたuOPsキャッシュを載せた。
まあ、デコーダがフルに動けば電力的にも不利だが、
先に書いた通り、どういう命令セットが最適か?というのは実装によるとしか言えない。
805こばやし:2011/12/17(土) 22:22:39.01 ID:5WkjMHDK
>>800
個人的には命令セットの設計に将来のことを考えすぎるのは実は最近良くないんじゃないかと思っていたり。

命令セットは命令デコードやアドレス変換のための回路規模に影響するわけだけど、
プロセッサ内の他のブロックとまったく同じで、時代と共に使えるトランジスタ数がふくれあがっていくと
結局最適点が変わっていく。命令セットの拡張を拒んだり、デコーダが複雑になるのは哲学に反するとかの信仰で
拡張しないでいると命令セットはプロセッサ全体の中でどんどんボトルネックになっていく。
だから適当な比率で拡張するのが正しいし、これは避けられない現実。
RISCもマーケティング上はあくまでもCISCをこきおろしながら、密かに命令セットの機能不足を時代ともに補って
きたわけだし。

むしろ最初から将来のためっていう考え方自体が長寿のアーキテクチャとしては実は不適切なんじゃないかな。
その結果が、IA64みたいに考えすぎて最初からなんでも盛り込もうとしちゃった命令セットだろう。
806Socket774:2011/12/17(土) 22:31:22.51 ID:jpphIg9K
>>805
いや、だから、拡張の余地がないような最適化はしちゃだめだよって話ですよ。
古い話だと、オペコードフィールドを使い切ってはいけないとか。
遅延スロットみたいなのもダメですね。
807Socket774:2011/12/17(土) 22:35:28.73 ID:hWWnWFrd
MACオタはどうしたんだ?
もしかしてジョブズの後を追って殉死したのか??
808,,・´∀`・,,)っ-○○○:2011/12/17(土) 22:40:04.43 ID:Yo2c/Fb2
RISCの発想自体がファイルシステムでいう ファイル名は 8文字.3文字 までだとか 14文字まで だとか
そのレベルで古臭いもの
809Socket774:2011/12/17(土) 22:45:22.21 ID:UWAI5FtL
core2
ttp://news.mynavi.jp/special/2006/conroe/004.html
>>さて、次はDecode段である。先に4命令/Cycleのデコードと紹介したが、
>>実際には全ての命令をデコードできるのはDecoder 0のみ(Photo06)。
>>Decoder 1〜3はSingle μOpのみがハンドリングできるとしている。つまり
>>1つのμOpsに変換できるx863 件/x64命令ならば4命令/Cycleが維持できるが、
>>2つのμOpsに変換される命令では1命令/Cycleに落ちてしまうことになる。
>>このあたりはプレゼンテーションでも多少説明があった(Photo07)が、要するに
>>デコード段そのものというよりも、renaming / allocationの制約ということらしい。
k7-bull
ttp://pc.watch.impress.co.jp/docs/column/kaigai/20091217_336298.html
>>K7/K8/Hound(K10)では、6パイプでピークで6uOPsを1サイクルで実行できる。全てのMacroOPが
>>2個のuOPに分解されるとしたら、3個のMacroOP分に相当するオペレーション(6uOPs)を
>>1サイクルで実行できる。命令デコーダからスケジューラへは、1サイクルにピークで
>>3MacroOPsが発行されるため、命令デコード&発行の帯域と実行帯域がマッチしている。

団子が散々吠えてるのは「Fusionで結合した後」の話
「x86のコードレベル」だと本家Intelは制約だらけ。AMDのほうが
本来のCISCを発揮しやすい。

それで今これだけ性能差があるんだから
「CISCとしてのx86のメリットは後処理でなんとでもできるレベル」ということだ。
810,,・´∀`・,,)っ-○○○:2011/12/17(土) 22:48:27.45 ID:Yo2c/Fb2
大原のその記事間違いだらけだしそんなの引用してる時点で話にならない
811Socket774:2011/12/17(土) 22:53:17.46 ID:UWAI5FtL
>>810
大原の文章を読まなくても普通に
「デコード1から3はシングル命令だけよ」
ってCore2のスライドに書いてあるんだが
812こばやし:2011/12/17(土) 22:58:11.32 ID:5WkjMHDK
IntelのPentium M以降のデコーダの強化方針は、いかに多くのx86命令を1つのuopしか生成しないようにする
(=Simple Decoderを拡張して極力命令をComplex Decoderに回さないようする)かだけどね。
uopという単位がIntelとAMDではそのまま比較できないよ。
813,,・´∀`・,,)っ-○○○:2011/12/17(土) 22:58:40.83 ID:Yo2c/Fb2
Decoder1-3はシングル命令だけだけど、ALU+AGU操作の命令もSimpleデコーダでデコードできます。
Pentium Mからだね。


それからK10だけど
>>K7/K8/Hound(K10)では、6パイプでピークで6uOPsを1サイクルで実行できる。全てのMacroOPが
>>2個のuOPに分解されるとしたら、3個のMacroOP分に相当するオペレーション(6uOPs)を
>>1サイクルで実行できる。命令デコーダからスケジューラへは、1サイクルにピークで
>>3MacroOPsが発行されるため、命令デコード&発行の帯域と実行帯域がマッチしている。

Load/Storeユニットは2つしかないのに6オペレーションも同時にに実行?ありえないだろ。
分散RS方式は車線変更の出来ない1車線道路が3つ並んでるのと同じこと。
他の車線(実行ユニット)があいてても他の車線から乗換えができない。
レーン変更ができないからユニットを冗長に持ってるだけで、全部が同時に並列に動くわけではない。

なにより問題なのは、デコード前にディスパッチしてパイプラインを縛ってしまうことで
バックエンドパイプラインの充填率を下げてしまっていることだ。
むしろレーン縛りのせいで実効性能は低い。

その結果が4コアなのにSandy Bridgeの2コアに負けるという事態。
まあ、効率が悪かったからBulldozerで2ALU・2AGUに落として(代わりにIntelと同じ集中型スケジューラ)
を採用してもIPCが落ちなかったわけなんだが。
814,,・´∀`・,,)っ-○○○:2011/12/17(土) 23:03:22.17 ID:Yo2c/Fb2
大原はデコード前にディスパッチするのがエレガントだとか言ってるが現実は全く逆。
815こばやし:2011/12/17(土) 23:04:52.68 ID:5WkjMHDK
まあ、このSimple Decoderの強化の件が色々調べていると、先の話と関連していて
つきつめると現代ではRISCよりもCISCの方が速いという実際の証拠の一つでもあるな
816Socket774:2011/12/17(土) 23:08:13.54 ID:jpphIg9K
>>815
x86だけ調べてその結論とは恐れ入る
817,,・´∀`・,,)っ-○○○:2011/12/17(土) 23:10:35.63 ID:Yo2c/Fb2
32ビット固定長のRISCで64ビット即値をレジスタにセットするのって4命令くらいかかるの?
しかもORで足し合わせて・・・だから依存関係チェインが発生する。
命令セットそのものがボトルネック。クソ過ぎる。
818Socket774:2011/12/17(土) 23:14:34.16 ID:UWAI5FtL
>>Load/Storeユニットは2つしかないのに6オペレーションも同時にに実行?ありえないだろ

え?K7からK10は3ペア構造だろ。
819こばやし:2011/12/17(土) 23:15:05.55 ID:5WkjMHDK
>>815
結論じゃなくて証拠といってるだけだが。

RISCは、数万トランジスタ時代のハードウエア技術とコンパイラ技術で
1チップにCPUの機能を収めよう的な発想でまとまっているものだよ。
それを現代でも最適解だといいはりつづけるのはRISC屋のマーケティング活動に洗脳されすぎだろう。
実際にAlpha以降のISAで、RISC命令セット採用しているプロセッサの方が少ないしね。
820,,・´∀`・,,)っ-○○○:2011/12/17(土) 23:17:25.53 ID:Yo2c/Fb2
>>818
ちゃんと資料読んでからレスつけろ馬鹿
AGUはアドレス生成ユニットで、更にバックのLoad/Storeユニットに連なってる。
Load/Storeユニットは2基しかないから3つのAGUが全部が同時に動くことなんて現実的にはありえないの。
821Socket774:2011/12/17(土) 23:19:25.13 ID:9U4lflXw
AMDのMacroOPというのはALUとAGUのLIWみたいなものなのか?
822Socket774:2011/12/17(土) 23:19:37.61 ID:jpphIg9K
>>819
洗脳ですか…
アマチュアにしてもその発言はどうかと
823Socket774:2011/12/17(土) 23:22:48.52 ID:EQ31+4ne
>>818
http://www.es.ele.tue.nl/~heco/courses/et2-010/k7slides.pdf
AMDの資料ね。
5ページ目にロード・ストア・ユニットが二つだと書いてある。
824こばやし:2011/12/17(土) 23:25:25.33 ID:5WkjMHDK
RISC屋も商売だし、基本はその時に都合の良いマーケティング文句いっているだけだよ。
RISC周辺は、アカデミアの世界を抱き込んで活動している分、洗脳のたちが悪い。

パイプライン、スーバースカラ、アウトオブオーダーも
RISC起源説でマーケティングしまくってたでしょ。
80年代にアウトオブオーダー実行周辺の研究していた奴は
RISCの研究者から複雑過ぎて成功しないと馬鹿にされてたらしいが。
825Socket774:2011/12/17(土) 23:29:47.14 ID:jpphIg9K
>>824
80年代のマイクロアーキテクチャの論文はそこそこ読みましたが、誰が誰をバカにしてたんですか?
Yale PattやGuri SohiがHennessyやPattersonにバカにされてたんでしょうか。
826Socket774:2011/12/17(土) 23:36:20.88 ID:jpphIg9K
ちなみに、アカデミアで認められている起源は

・パイプライン IBM Stretch, ILLIAC II
・スーパースカラ CDC6600, IBM ACS
・アウトオブオーダー CDC6600, IBM S/360 model 91

RISC起源だと吹聴していた奴なんてただの一人にも会いませんでした
827こばやし:2011/12/17(土) 23:42:57.27 ID:5WkjMHDK
>>825
専門家の人ですね。
Yale PattらがRISCの研究者に、このコンセプトは現物化できないと馬鹿にされたようだが、
具体的に誰が馬鹿にしたのかはわかりません。
828こばやし:2011/12/17(土) 23:51:08.38 ID:5WkjMHDK
>>826
アカデミアでもまともな人しかあってないからじゃない?
RISCプロセッサメーカーがマーケティング用にRISC技術として利用していたのは
今ではだいぶ忘れられているが、事実だから仕方がない。
実際にはRISC以外の技術の潮流も70年代以前はもちろんのことだが、80年代以降でも多くあって、
90年代以降でそれらの研究成果が複合して今のプロセッサが成り立っているのに
RISC中心の世界観がこれだけ浸透しているのはいかがなものかと。
829Socket774:2011/12/18(日) 00:17:28.62 ID:nrN7rKcy
x86 vs ARMをCISC vs RISCという風に「ARM = RISC」だと洗脳されている人が多いよね
830Socket774:2011/12/18(日) 00:17:42.59 ID:2k5eUFrh
> RISCプロセッサメーカーがマーケティング用にRISC技術として利用していたのは

CISCの80486や68040なんかもそうですね。しかしさすがにその時代は過ぎたんじゃないかと。

> 実際にはRISC以外の技術の潮流も70年代以前はもちろんのことだが、80年代以降でも多くあって、

90年代以降のOoOの実用化は、precise interruptが実装できるようになったからですし。

> RISC中心の世界観がこれだけ浸透しているのはいかがなものかと。

なるほど。ここが認識の違いかな。
自分自身はx86大好きっ子なのですが、RISCが過小評価されていると常々思っていました。
831Socket774:2011/12/18(日) 00:23:59.19 ID:nrN7rKcy
>>830
十分に評価されていると思うよ >RISC
今でもx86がCISCだからARMには勝てないとか言われているぐらいだぞ。

ただ個人的には時代が移ってCISC、RISCという考え方・分類方法が無意味だと思う。
832Socket774:2011/12/18(日) 00:24:36.75 ID:wR4zWIli
スーパースカラやOoOをRISC技術って言ったのはintelじゃなかった?
自らCRISC(恥ずかしい)とか逝ってたし
intelのマーケティングコピー

833,,・´∀`・,,)っ-○○○:2011/12/18(日) 00:29:15.92 ID:Wnd/G1+M
言ってない
CRISCってのはRISCのロード・ストアアーキテクチャに倣って内部オペレーションレベルで
ロード・ストアとALU操作を分離することと

スーパースカラはCRISCと言われる前の初代Pentium(P5)時代から実装してるし
アウトオブオーダ(Intel用語でいうダイナミックエグゼキューション)に関しては
Intelは「RISCより先行した」と言ってる
834Socket774:2011/12/18(日) 00:31:19.00 ID:XjC9NwLS
>>830
過大評価、過小評価の問題いうより、RISC vs CISC論がいやになったんですよ。
RISC vs CISCは議論のネタとしては今でもとても面白いんが、
あまりにそればっかりになりすぎて、大半RISCがハイエンド市場から撤退してからも
何の議論をしていても二言目には"RISC"の文字がくることにだんだん
うんざりしたというのが自分の場合。
835Socket774:2011/12/18(日) 00:32:56.08 ID:wR4zWIli
CRISCってのはP5のときだ
P6までには、この恥ずかしい用語をやめていた
836Socket774:2011/12/18(日) 00:37:29.29 ID:wR4zWIli
ARMの良いとこの本質は命令セットでなく、多数のメーカーにライセンスされてるところ
もちろんv8からは命令セットも悪くない
で、ここから今日の流れに、、、
837,,・´∀`・,,)っ-○○○:2011/12/18(日) 00:38:52.60 ID:Wnd/G1+M
P5(Pentium)はμOPsに分解しないし純CISCだろ?
ついでにPentium 4は更に内部RISC化したが、結果的にはCISCのコード効率の
高さを生かす方向で進化させたPentium M系統のアーキテクチャが生き残った
838,,・´∀`・,,)っ-○○○:2011/12/18(日) 00:43:22.01 ID:Wnd/G1+M
> もちろんv8からは命令セットも悪くない
むしろ他の64ビット化されてるRISCと何が違うの?
1バイト・2バイト単位のロード・ストアもできなくなったから文字列操作は弱そうだし
そんなもん1から仕切り直すならわざわざ高いライセンス料払ってARM使うより
既に64ビット化しててライセンス料の安いMIPSでも使ったほうがマシだよね?
839Socket774:2011/12/18(日) 00:46:51.91 ID:wR4zWIli
uops fusionの肝はコード効率じゃなく、一種のLIW
依存関係の明示化だろ
ただしこれはロードを大幅に先行させることができなくなるなどデメリットもある

命令セット的にはitaniumが正しい
あれの間違いは6-issue 4 L/Sにして、くそ多いレジスタポートや、クワッドポートのL1Dキャッシュとかでクロックがあげらなかったってとこだ、たぶん
840,,・´∀`・,,)っ-○○○:2011/12/18(日) 00:51:14.17 ID:Wnd/G1+M
> ただしこれはロードを大幅に先行させることができなくなるなどデメリットもある
Sandy BridgeやBulldozerの世代ではμOPs Fusionを辞めてその分RSの並列度上げてるけどね。
841Socket774:2011/12/18(日) 00:54:36.38 ID:wR4zWIli
ARM v8に、重箱の隅をつつくようなことを言ってるが、まずx86 64bitとv8のコード密度は2倍以下の違いしかない
32〜64bitの即値やbyte・word L/Sもあんまいらない
命令セットってのは直感でなく、コンパイラと対で考えて決めるもの
842Socket774:2011/12/18(日) 00:54:55.92 ID:nrN7rKcy
>>838
そうしたらARMv7コードが動かないじゃないか!
843Socket774:2011/12/18(日) 00:56:06.07 ID:2k5eUFrh
>>831
境界ははっきりしないが、CISC,RISCという両極はあると思う

>>832
80486や68040でワイヤードロジックを採用して、両社は「RISC技術を取り入れた(いいところどりで最強)」と主張していた
844,,・´∀`・,,)っ-○○○:2011/12/18(日) 01:03:48.66 ID:Wnd/G1+M
>>841
リテラルプールってL1D側からロードするからその分性能面では不利だけどね。
Atomに毛が生えた程度の性能しか目指さないならそれでも十分だが。
845Socket774:2011/12/18(日) 01:09:50.74 ID:XjC9NwLS
Intelはどっちかっていうと486、PentiumはRISC技術とりいれたっていってたんだよね。
命令も内部形式のuopならぬmicroinstructionに変換されるしね。もちろんload/storeアーキではないけど。
P6の方がいってない。
846Socket774:2011/12/18(日) 01:12:27.63 ID:XjC9NwLS
このあたりのIntelの主張は実はかなり正しくて、
486はRISCの技術をパクろうとしたんだけど、P6は実はRISCパクろうとしたんじゃないんだよね。
847Socket774:2011/12/18(日) 01:17:53.92 ID:wR4zWIli
P6は、4-issue ooo RISCと同期でパクりようがない
Dynamic Executionとか今日数年ぶりに見た気がするな
intelだけoooって言わなかった
848Socket774:2011/12/18(日) 01:22:38.59 ID:2k5eUFrh
>>834
なるほど。

CISCが速いといっても、80x86だから速いのか、680x0やトロンチップでも気合入れれば速いのか、ちょっと興味はあります
486〜Pentium世代ではx86が優位だったと言えそうだけど。
849,,・´∀`・,,)っ-○○○:2011/12/18(日) 01:28:49.19 ID:Wnd/G1+M
GPUすらVLIWを辞めてしまった。
大学教授に一人くらいはいたよなこれからはVLIWの時代とかドヤ顔で言ってたのが。
850Socket774:2011/12/18(日) 01:33:16.30 ID:uLD7vFr+
学者が好きそうって意味では理解できる。
効率化を極めるにはコンパイラの時点で効率化しておくしかない。
だけど、それに伴って捨てなきゃならないものの大きさを見誤るというか。
851Socket774:2011/12/18(日) 01:36:00.87 ID:2k5eUFrh
もうCISCでもRISCでもどっちでもいいというのが正直なところ。CISCには多少ロマンがあるが。

それより例えばTracing JITのサポート命令とかそういうのを入れてほしい。

もしかしたらスピルも専用命令を用意できるかも。レジスタリネームだけ変更するとか。
レジスタウィンドウの一般化的な。にゃにゃ。
852Socket774:2011/12/18(日) 01:43:52.60 ID:48j0w+yB
RISCとCISCとが対立する概念だとして、RISCの極にMIPSか何かを置くのはいいとしても
じゃあCISCの極はx86が相当するのかと言えばちょっと違うんじゃないかという
853Socket774:2011/12/18(日) 01:46:47.90 ID:2k5eUFrh
>>852
68kでもVAXでもNSでもなんでもいいと思うよ。
さすがに432とかRekursivみたいなのは命令セット以外のところが大きくアレかと思うけど。
854Socket774:2011/12/18(日) 01:48:12.07 ID:2k5eUFrh
というか、リニアアドレス以外のプロセッサはさすがに除外していいでしょう
855,,・´∀`・,,)っ-○○○:2011/12/18(日) 01:50:04.77 ID:Wnd/G1+M
現存の最大勢力って意味ではx86でいいと思う。
856Socket774:2011/12/18(日) 01:56:45.69 ID:2k5eUFrh
>>846
P6の開発陣はその前はRISCのi960やっていたわけで
パクるというより自家薬籠中のものとしていたでありんす
857Socket774:2011/12/18(日) 04:09:39.20 ID:ffHQdQ7H
>>843
で、P5の頃に更にスーパースカラだからCRISC(笑)と言っていたよな確か。
858,,・´∀`・,,)っ-○○○:2011/12/18(日) 09:38:22.97 ID:Wnd/G1+M
RISC・CISC命令セットアーキテクチャの区分で良いんじゃないの?
マイクロアーキテクチャの実装方法の良い所を取り入れるのは当然だし
859Socket774:2011/12/18(日) 10:49:09.93 ID:yE5f1rM+
>>728
アムダールの法則からして、ベクトル化率60%だと話にならない。さらにSX系だとスカラー演算がすごく遅いから。
860Socket774:2011/12/18(日) 10:58:34.67 ID:nCfpjFhO
メモリアクセスが遅いの、どうにかなんないんスかね?
861Socket774:2011/12/18(日) 11:42:24.03 ID:Fr3YxJXZ
CPUにメモリを混載すればいいじゃない
862Socket774:2011/12/18(日) 11:48:06.51 ID:9PhoquFA
intelなんて15MBも積んでるからなあ
863Socket774:2011/12/18(日) 11:57:13.91 ID:nrN7rKcy
TSVが低価格化&普及すればGBレベルのL4キャッシュが内蔵されるだろうから改善されるよ!
864Socket774:2011/12/18(日) 13:27:03.77 ID:ZOQb0YY8
TSVでDRAM混載すれば広帯域かつ低消費電力にはなるけど、レイテンシはあまり変わらないかもなあ
つまりマルチコアやGPUにはいいけど、シングルスレッド性能にはそれほどはインパクトないかも
865Socket774:2011/12/18(日) 13:46:10.58 ID:DiyuNCOk
あれほどRDRAMにしろと・・・・
値段が高すぎてダメだった事を除けば悪くないメモリーだった
RIMMに移行するべきだったんじゃないかなあの時(Pen4)に
DDRはそろそろ限界が見えてきたしDDR4はなんかグダグダだしさ
ハイエンドだけでいいからXDRDRAM2しないものかね?
866Socket774:2011/12/18(日) 13:48:42.07 ID:DiyuNCOk
メモリーだけが高速性能から取り残されている。DDRにもうあまり伸びしろは無い。例え
DDR4が出てもその次に今の技術の延長でDDR5が出るとは到底思えない。
業界のラムバス嫌いはしょうがないけど、ここらでRIMM移行を見据える時だと思う
867Socket774:2011/12/18(日) 14:20:37.06 ID:6M6PrFfi
メモリ遅いぞって最初に言われたのは486で中だけ倍速になった頃かな
868Socket774:2011/12/18(日) 14:29:12.10 ID:TKNDDNh7
メモリが遅いったってそれを意識させるだけのプログラムが殆どないだろ
自分で書けるならば別だけど
869Socket774:2011/12/18(日) 14:47:27.42 ID:ncmntrmU
まずXDR2がGPU向けで量産されるみたいだし
そっちに期待
870Socket774:2011/12/18(日) 14:51:33.63 ID:Fr3YxJXZ
メモリセルにDRAM使ってる限り大して変わらないって。
871Socket774:2011/12/18(日) 20:49:28.12 ID:lWhmd0FX
XDR2来てほしいね
872Socket774:2011/12/18(日) 21:19:40.85 ID:dx4n0W4U
XDR2って次のNVIDIA向け?
AMDに乗るって噂は否定されたらしい
873Socket774:2011/12/18(日) 21:21:29.03 ID:nrN7rKcy
あなたは高速なメインメモリのために数倍の値段を払えますか?

サーバ用途でサポートしてもビジネス・ホビー用途ではサポートしそうにないよね。
奇跡的に市販PCに載るくらい普及・量産化されてもDDR3と比べて倍近くは高く付くわけで。
874Socket774:2011/12/18(日) 21:50:01.19 ID:QFJ/jwf2
XDR2が実際に出るのはDDR4やWild I/Oよりも後
世界的に釣りネタとして流行ってるから良く目にするだけ
875Socket774:2011/12/18(日) 22:01:00.55 ID:Y1qmNS4n
チップ単価は同容量のGDDR5よりほんの少し高いだけで帯域当たり単価なら大幅に安くなるだろ
ミドルやローならともかくハイエンドクラスのGPUになら使える値段
876,,・´∀`・,,)っ-○○○:2011/12/18(日) 22:21:19.83 ID:NJjWUaPe
ゲーム機はどうだろね?
877Socket774:2011/12/18(日) 22:38:26.92 ID:nCfpjFhO
高くてもイイから速いのが欲しい!!
878Socket774:2011/12/18(日) 22:45:25.22 ID:Y1qmNS4n
>>876
メインメモリとVARM共有する箱後継機でなら採用の目はあるんじゃね
チップ数削減できるWideIOとかもありそうだけど速度の伸びが限界に来てて消費電力削減もできそうもないGDDR5よりはアリじゃね
879Socket774:2011/12/19(月) 00:01:09.09 ID:huGtFnIa
>>873
今の相場なら3倍でもおk
880Socket774:2011/12/19(月) 02:43:20.63 ID:a8RC6MxZ
グレイ共がホモサピエンス・サピエンスの改良をDNAレベルで未だに進めているのも納得が逝くわ。
つまりヒトの脳自体が
881Socket774:2011/12/19(月) 02:48:26.42 ID:cqzVgxtw
選別落ち品程増殖するみたいだがな
だから時々戦争して選別落ちを処分してるんだろう
882Socket774:2011/12/19(月) 05:38:21.59 ID:Eqmx5QR/
戦争は優秀な人間が死んで無能が生き残るから選別にならない
883Socket774:2011/12/19(月) 05:59:30.28 ID:+3jd/UBc
またそうやって…
どっちも死ぬだろ、アインシュタインが相対性理論発表した後
戦時下の塹壕でその特定条件における方程式の解を発見したという(これは寓話だと思うw)
シュワルツシルトは戦死した
884Socket774:2011/12/19(月) 09:25:19.65 ID:DRzpkVgn
XDR系はチップ数と電力減らしたいモバイルで使われるのではないかな、使われるとしたら。
GPUの場合、ハイエンドならピン増やしても許されるわけで、微妙なのではないか。
885Socket774:2011/12/19(月) 09:31:34.55 ID:DRzpkVgn
しかし標準規格の次世代メモリも見えているのでRambusは売りにくいだろう。どうするのかな。
886Socket774:2011/12/19(月) 14:22:15.82 ID:l5xmkZ2f
モバイル向けはWideIOからTSVにでも向かった方がいいような気もするが、
ノート用だとどうかな。
887Socket774:2011/12/19(月) 14:57:26.27 ID:Bpv6Rk3P
メモコン増やしてXDR2も採用するのが真のハイエンド
888Socket774:2011/12/19(月) 16:38:01.41 ID:Q3cj4Gwi
Rambus自身もDDRやSDRAMが使えないせいで失敗したDRDRAMで反省したから
GDDR3とGDDR5にも対応したXDR2メモリコントローラライセンスしてんだよな
コレ採用された話は聞かないけどAMDは使おうと思えば使えるハズ
889Socket774:2011/12/19(月) 20:32:54.27 ID:dF4cX5OB
さっき初代MIPSのパイプラインの図を見てたんだが
http://upload.wikimedia.org/wikipedia/commons/9/9e/Pipeline_MIPS.png
こいつのデータパスを74シリーズで置き換えると7,80個でできそうなんだよな。
配線は死ぬけどな。
890Socket774:2011/12/19(月) 20:37:21.93 ID:dF4cX5OB
ちなみにこの絵にはバイパスが抜けている。
バイパスは太古の昔から今日にいたるまでずっとクリティカルパスの一つなのでこれはいくない。
891Socket774:2011/12/19(月) 21:10:10.30 ID:dF4cX5OB
32ビットバレルシフタは論外に大きい。80386のフロアプランでもかなりの領域を占めていた。
32+32ビットから任意の32ビットを取り出すためには、16,8,4,2,1ビットシフトを組み合わせるわけだが、
74シリーズの2対1セレクタは4ビットしかないので、ICは
12+10+9+9+8=48個必要
これに加えてバッファもいる。
892Socket774:2011/12/20(火) 00:10:55.70 ID:kpu1HsfR
ちなみに、有名なALUの74181は1960年代の登場
893Socket774:2011/12/20(火) 00:41:49.28 ID:kpu1HsfR
6800はミニコンライクです。
こいつが似ているのはHP2100のようなアキュームレータマシンの初期のミニコン。
初期のミニコンはだいたいトランジスタ以降だけど、素子が高いので汎用レジスタはあっても少なかった。

68000はPDP-11やVAXのような後期ミニコンに似ている。
これらは汎用レジスタマシンで、命令セット的にはS/360か、それより前にさきのぼる。

http://www.st.rim.or.jp/~nkomatsu/mc680x/MC6800.html
> MC6800は、PDP-11のようなミニコンピュータを徹底的に簡略化して1個のICの中につめ込んだという面が強く、
> インデックス修飾などのアドレッシングモードが考慮された命令体系になっていました。

この人なんかはそのあたりを混同している典型的な半可通ですね。
894Socket774:2011/12/20(火) 02:57:14.03 ID:ax8+tesU
日本語でおk
895Socket774:2011/12/20(火) 03:14:46.19 ID:kpu1HsfR
>>894
verilogならわかる?
896Socket774:2011/12/20(火) 04:06:07.70 ID:D6+TBhmK
ビッグエンディアンが命取り
897Socket774:2011/12/20(火) 04:44:27.19 ID:kpu1HsfR
16032は、命令バイトはビッグエンディアンでデータがリトルエンディアンの変態だった
898Socket774:2011/12/20(火) 09:34:50.03 ID:Zn6+dEQi
変態レベルの話になってきてうれしい。
899Socket774:2011/12/20(火) 10:02:17.09 ID:Vp1f+K8l
>>765
GPUだと〜NV40あたりがデータフロー・アーキテクチャだよね
特許でかなり詳細まで出てるよ
http://www.google.com/patents/about/6724394_Programmable_pixel_shading_archi.html?id=J-4RAAAAEBAJ
NV30のパフォーマンス悪化の原因の一つは物理レジスタの不足(float4で2本!)だったけど
これはまさにデータフロー・アーキテクチャの弱点が露呈したもの
スレッドコンテキストをパイプライン中全部持って回らないといけないからね
NV30では入りきらない分はFIFOに預けられるが
ここがボトルネックになった

テクスチャフェッチが主体で計算はおまけ程度の時代では
コンテキスト切り替えのコストが0なデータフローアーキテクチャが有利だったけど
シェーダの高機能化が進むにつれて不利な点の方が多くなってしまった
900Socket774:2011/12/20(火) 19:58:10.48 ID:kpu1HsfR
>>893
1960年代半ばだとICですね。DTLとかも。
1960年のPDP-1とかはトランジスタだけど、あんまりミニコンって気がしないんだよな。
901Socket774:2011/12/20(火) 20:02:36.80 ID:kpu1HsfR
来年はAlphaの20周年だな。
たとえ生きていてもあと5年の寿命か。
902Socket774:2011/12/20(火) 20:52:05.64 ID:5syVdkhH
>>888
XDR2が採用されるといいな。
メモリーの進化が止まっている現状を打破して欲しいものだ
なぜ初期Pen4はDDRと共用できるようにしなかったのか?していれば
ハイエンド限定として今も残っていたかもしれないのに。
せっかくPS2のおかげで製造原価が下がって激安になった時にはインテルは撤退した後だったのが
悔やまれる
903Socket774:2011/12/20(火) 20:56:26.28 ID:zu65pRic
1980年、1990年のCPUのキャッシュメモリーの容量は?
904Socket774:2011/12/20(火) 21:11:04.65 ID:jCoY9NUd
90年代、PentiumはL2外付けだったな
EV5の外付けはL3だっけ
905Socket774:2011/12/20(火) 21:53:46.73 ID:RA1Gf8kV
1980年 キャッシュなし(メインフレームで128kBくらい?根拠なし)
1990年 L1 8kB L2 128kB
くらいだ
906Socket774:2011/12/20(火) 22:32:47.60 ID:zu65pRic
>>905
キャッシュ無しって・・・
まさかメインのDRAMを今で言うキャッシュみたいに扱ってたの?
907Socket774:2011/12/20(火) 22:34:27.34 ID:4rvH78H2
CPUが遅かったからキャッシュなしでも良かったんだろ。
908Socket774:2011/12/20(火) 22:40:26.39 ID:kpu1HsfR
3090VFのキャッシュは64KBとあるな…

>>906
命令フェッチが遅いので、一命令の高機能化->お化けみたいなCISCになった
909Socket774:2011/12/20(火) 22:52:59.92 ID:zu65pRic
>>908
しかしCPUクロックの増加でそのCISC路線が間違っていると気付いて、
RISCにしようとしたがとき既にお寿司って事で今のCPUの基礎になったんだな。
910Socket774:2011/12/20(火) 22:54:48.15 ID:Zn6+dEQi
>とき既にお寿司
ワロタw
911Socket774:2011/12/20(火) 23:03:10.36 ID:UXP5Uu2P
>>906
DRAMでもノーウエイトって宣伝してた時代だしな
912Socket774:2011/12/20(火) 23:06:18.48 ID:raiMvAZR
2バンクのインターリーブ・アクセスでもメインメモリのノーウェイト動作が困難になったのが
386時代の中盤くらいからで、ハイエンドマシンにはM/B上にSRAMキャッシュを搭載
するようになった。
486時代になるとAT互換機では安物M/Bでもキャッシュ(L1がCPU内蔵になったのでL2扱い)
積むのが当たり前になりP5時代でも同様だったが。P6時代になるとL2もCPU内蔵になり
M/B上のキャッシュは廃れた。
913Socket774:2011/12/20(火) 23:09:21.14 ID:DhY18Vbm
マジレスだけど、お寿司っつ〜かグローブ曰くコンパックの社長から過去資産が駄目になるから
riscにするなっつ〜ことだったはず
914Socket774:2011/12/20(火) 23:10:35.54 ID:kpu1HsfR
メインメモリがCCDだったコンピュータもありました
915Socket774:2011/12/20(火) 23:21:20.04 ID:RA1Gf8kV
キャッシュは60年代の末期から既に使われてる
CISCの複雑な命令はフェチ帯域のためじゃない
セマンティックギャップ解決
人間がアセンブラを読みやすくするため
VAXの初代、VAX 780/11は複雑な命令セットだけど8kBキャッシュを積んでた
916,,・´∀`・,,)っ-○○○:2011/12/21(水) 00:00:24.33 ID:fIu/fBrq
VAXといえば学校新聞や町内会ご用達のパーソナル編集長のイメージが・・・
917Socket774:2011/12/21(水) 00:04:06.52 ID:kpu1HsfR
キャッシュはウィルクスの発明なのでもっと古いんじゃないの。
日立もやってたし。

セマンティックギャップは普通はプログラミング言語と命令セットのギャップのことを言うと思う。
セマンティックギャップを埋めることこそ高性能化の鍵みたいな言われ方をしていた。
その結果、高級言語マシンがたくさん作られたが、そのアセンブラは必ずしも人間が読みやすいというわけではなかった。

で、なぜセマンティックギャップを埋めると速くなると思われていたかというと、
一命令でたくさんの処理ができるから。
918Socket774:2011/12/21(水) 00:04:30.01 ID:807NW1l1
ないわ
919Socket774:2011/12/21(水) 03:22:00.28 ID:iipqCBbx
x86はSSEやAVXなど強力なSIMD命令があり実装でもその複雑なSIMD命令を1クロックなど高速に実行できるけど
逆に言えばSIMD命令を多用しなければただの宝の持ち腐れの部分が多いということかな
920Socket774:2011/12/21(水) 04:05:59.54 ID:7grsQPxM
むしろx86以外の方がシングルスレッド-スカラ性能が低い分
SIMDだのCMPだのに大きく依存してる印象が強いが
921Socket774@組み続けて12年:2011/12/21(水) 10:54:23.66 ID:9HcaMBrU
レジスタ32本・3オペランド(5*3=15bit)に相応しい長さということで
3バイト単位の変態可変長命令ISAを妄想してみた。
3バイトのうちの先頭2bitで3/6/9バイト長を識別する。
1オペランドで済む単純な命令なら3バイトの中に2命令をパックできるようにすると尚よい。
32bit即値は6バイト命令で、
任意の64bit即値も9バイト命令でレジスタロードできる(若干苦しい)。
単純化のために1命令が64バイトアライメントを跨がない規約とすると、
命令を63バイト並べて、余る末尾1バイトで何かユニークな仕掛けができる……
922Socket774@組み続けて12年:2011/12/21(水) 14:29:32.21 ID:uFxotIeJ
VHDLで頼むお
923Socket774@組み続けて12年:2011/12/21(水) 19:20:37.03 ID:uhzK/Cgk
将来はララビーとGPUを両方内蔵して
高負荷処理はララビーが
低負荷処理はGPUがそれぞれ担当するように内部で切り替えしてくれるといいな
省電力にも繋がりそうだしさ
924Socket774@組み続けて12年:2011/12/21(水) 20:26:03.91 ID:rOhl6PCA
DRAMは構造上アドレスラインアサートしてから電荷出るまでのレイテンシが避けられないから、いっそSRAMを安価にするほうがいいんじゃね?
925Socket774@組み続けて12年:2011/12/21(水) 20:45:51.64 ID:faW2rcTq
>>921
アーキテクト認定。
926,,・´∀`・,,)っ-○○○:2011/12/21(水) 21:32:12.34 ID:fIu/fBrq
3バイト単位は駄目だろw
x86だってセグメント境界は2のべき乗だぜ?
927Socket774@組み続けて12年:2011/12/21(水) 21:38:13.98 ID:RLojzmkR
頭固いなあ
928,,・´∀`・,,)っ-○○○:2011/12/21(水) 21:38:24.57 ID:fIu/fBrq
というかARMの64ビットモードは「Thumb64」的なものだと思ってたんだけどな。
Thumb2を更に拡張し、4バイト命令(PC相対アドレッシング)の後続ワードに32ビット・64ビットの
即値を埋め込んで8バイト・12バイト命令を表現するというものだ。
なんだかんだで命令ストリーム側から値をロード出来るx86の即値モードのメリットはでかい。
929 忍法帖【Lv=40,xxxPT】 :2011/12/21(水) 21:38:48.39 ID:BkZ18VsI
>>923
それに似た話は(多分)後藤氏の記事にあった気がする

もし、CPU、ララビ、GMAの3構成なら
GPGPU部分はララビ(MIC)が
純粋なグラフィック部分はGMAが担当することで
それぞれの絶対性能を上げやすくできる
とか何とか書いてあったような
930Socket774@組み続けて12年:2011/12/21(水) 21:38:58.27 ID:faW2rcTq
Dango Micro Architecture はどんなものになるんだろう
931Socket774@組み続けて12年:2011/12/21(水) 21:42:08.85 ID:LRASNhqu
>>924
DELLは80286の時代にSRAMをメインメモリにしたPCを造ってたな。
932Socket774@組み続けて12年:2011/12/21(水) 21:44:05.92 ID:faW2rcTq
>>931
現代でもSRAMをメインメモリにすることは技術的に可能?
金はいくらでも払う。
933Socket774@組み続けて12年:2011/12/21(水) 21:51:42.92 ID:ew1+bFRy
>>926
63バイトだけ命令を並べたら
1バイトのパディングを置く

変態だ
934,,・´∀`・,,)っ-○○○:2011/12/21(水) 21:52:58.95 ID:fIu/fBrq
>>930
学生時代に考えた「ぼくのかんがえたさいきょうしーぴーゆー」は
基本4バイト命令(+0・4・8バイト即値)で、1ワードは2オペランド演算を2操作パックしたLIWあるいは
3〜4オペランドの1操作で構成。汎用レジスタは16本。

>>932
てか昔のメインフレームが数十GBのSRAM+バッテリバックアップだったでしょ。
SRAMをストレージにするくらいだから当然メインメモリもだな。
935Socket774@組み続けて12年:2011/12/21(水) 21:59:01.27 ID:faW2rcTq
>>934
おお、さすが団子氏、理想があるんすね。
IPCの向上に重点を置いた思想ですか。
そういえばTransmetaってどうなったんだろう・・・

>てか昔のメインフレームが数十GBのSRAM+バッテリバックアップだったでしょ。
ひょぇ〜、メインメモリなんて余裕だw
極限の低レイテンシで、デスクトップコンピューティングはどんな変貌を遂げるんだろう・・・興味津々
936sage:2011/12/21(水) 22:03:15.37 ID:XdH9JNZT
DRAMとSRAMの集積度の比は数倍程度なんだから、一定量の需要があれば
DRAMの数倍の価格で同容量とか同価格で数分の1の容量とかは可能になるんだよな。

ソフトの要求により年を経る毎にどんどんメモリの実装要求量が増して行くって状況に
ぼちぼち翳りが見えてきたから、SRAMメインメモリに現実性が出るかも知れない。
937Socket774@組み続けて12年:2011/12/21(水) 22:04:24.25 ID:ew1+bFRy
レジスタ16本では少ないのじゃ
938Socket774@組み続けて12年:2011/12/21(水) 22:08:14.07 ID:LRASNhqu
intel様に喧嘩売ってんのか
939Socket774@組み続けて12年:2011/12/21(水) 22:09:19.23 ID:XdH9JNZT
ぼくのかんがえたさいきょうしーぴーゆーは
スタックトップから数KBをゼロウェイトのCPU内蔵メモリ(レジスタバンク)に置く
スタックマシンだった。
940Socket774@組み続けて12年:2011/12/21(水) 22:11:27.43 ID:UbSogcN9
SRAMがメインメモリになったら最高だな
941,,・´∀`・,,)っ-○○○:2011/12/21(水) 22:25:45.39 ID:fIu/fBrq
>>937
別に少なくないよ。
RISCは定数をL1Dから読んだり組み立てたりしてレジスタに溜めておくから足りなくなる。
ぶっちゃけPPCの汎用レジスタ32本よりx64の16本の方がよっぽど余裕があるよ。
942Socket774@組み続けて12年:2011/12/21(水) 23:06:55.58 ID:9VzTzX2T
>>936
DRAMはキャパシタの容量がもう限界だから微細化だけがこのまま進んでいけばありうる。
実質的なメモリセルの面積でSRAMが逆転すればDRAM使う理由はないからな。
943Socket774@組み続けて12年:2011/12/21(水) 23:13:55.34 ID:TRdTPiOh
ああ、バカだったが有用な情報は提供してくれたMACオタが懐かしい
944Socket774@組み続けて12年:2011/12/21(水) 23:19:26.49 ID:TRdTPiOh
Z-RAMをDRAMに含めるなら戦えるかもよ
945Socket774@組み続けて12年:2011/12/21(水) 23:29:15.89 ID:iipqCBbx
64bitの即値は8バイト
64bitの即値を多用したら命令フェッチの16byteの半分も
その即値のデータに取られてしまうから速度落ちるんじゃないか?

x86 CPUの弱点が浮き彫りになったNehalemマイクロアーキテクチャ
ttp://pc.watch.impress.co.jp/docs/2008/0428/kaigai438.htm


946,,・´∀`・,,)っ-○○○:2011/12/21(水) 23:36:26.08 ID:fIu/fBrq
多用すればね。
その記事、別に後藤さんはx86に比べてRISCが優位だとは言ってない。
32ビット固定長のRISCでは即値フィールドはせいぜい2バイトだから、その16ビットを4回重ねて
ロードする方法だと、4命令=16バイト食う、あるいはリテラルプールから読むことになる。

>>934のアイディアは命令境界が必ず4バイト単位になるようにすることで命令の切り出しを容易にする
目的がある。根本の思想はRISCとCISCのいいとこ取り。
947Socket774@組み続けて12年:2011/12/21(水) 23:38:46.31 ID:iipqCBbx
>>946
即値なんてコンパイラがよく使うのはベースアドレスの読み込みだろうし
アウトオブオーダーに対応してるCPUならあらかじめリテラルプールから読み込んでおく方法もあるんじゃない?
RISC CPUはレジスタが多いしそれならそれほど速度おちないでしょう
948,,・´∀`・,,)っ-○○○:2011/12/21(水) 23:41:18.40 ID:fIu/fBrq
> RISC CPUはレジスタが多いしそれならそれほど速度おちないでしょう
オペランドのフィールドが大きくなるので表現できるオペレーションを縛り、結果オペレーション密度が下がる。
949Socket774@組み続けて12年:2011/12/21(水) 23:42:53.39 ID:iipqCBbx
ちなみにメモリアクセス時のインデックス値の指定だと
PowerPCでは16bit、ARMでは12bit(シフト演算も可能)だから
通常のメモリアクセスに困ることは少ない
x86の場合このインデックス値が8bitもしくは32bitのどちらかしかない
950,,・´∀`・,,)っ-○○○:2011/12/21(水) 23:44:01.37 ID:fIu/fBrq
> x86の場合このインデックス値が8bitもしくは32bitのどちらかしかない
かえって性能落ちるからあんまり使わないけど16ビット即値も可能
951Socket774@組み続けて12年:2011/12/21(水) 23:45:04.96 ID:iipqCBbx
即値の読み込みではなくアドレッシングモードで即値でインデックスを指定する方法のこと
コンパイラが吐き出すコードのうち即値を良く使うのはアドレス指定だから
952,,・´∀`・,,)っ-○○○:2011/12/21(水) 23:48:35.36 ID:fIu/fBrq
なんにせよ固定長命令に可能性を感じないね
よく使うオペレーションは1〜2バイト+αで十分だ。大半のケースで3オペランドも必要ない。
953Socket774@組み続けて12年:2011/12/21(水) 23:52:45.60 ID:d1zoG8H8
即値がつくときだけ命令長が伸びるのはNECのV800がやってるよね
あれは2Byte単位だけど

>>950
今時のコードを考えると正直disp32にするよりdisp16のまま方が有利だったと思う
954Socket774:2011/12/22(木) 00:01:01.39 ID:3xVFjYmH
>>932
技術的には可能だと思うが、
意味のある実装は困難だと思う。

CPUに内蔵のメモリコントローラがDDR3SDRAM用という理由で、
SRAMコントローラはCPU外部に設置する必要があるわけで、
メモリバスより帯域の狭いDMIやらPCIexやらHTなどを経由してアクセスする必要があるから。
955Socket774@組み続けて12年:2011/12/22(木) 00:04:03.37 ID:ev7SLT8g
即値の98%は13ビットに収まると指摘したのがご存知タンネンバウム
むろん即値の使われ方は時代とともに変化する
しかし64ビット即値の高速化が性能にクリティカルな影響を与えるのは未来永劫団子の妄想の中だけだ
956,,・´∀`・,,)っ-○○○:2011/12/22(木) 00:04:56.85 ID:fIu/fBrq
別に16ビット即値で収まるのが32ビット使ってもそれほど無駄とは思わないけどな
SuperHの開発者いわく「Cの関数のほとんどは変数が14個以内で収まるからレジスタ16本で十分」
この割り切った設計によりコードサイズをコンパクトに保つことができARMのThumbモードにも
影響を与えた。

一般的なコードでレジスタが16本で足りなくなるって根本的に設計がおかしいと思うんだ。
957,,・´∀`・,,)っ-○○○:2011/12/22(木) 00:08:11.19 ID:fp200XlI
>>955
別にx64でも殆どの命令は8/32ビット即値で足りるけどな。
むしろ1回しか使わない値に対してもわざわざ論理レジスタにロードすることを強いるRISCの設計が
ハード的に無駄。
958,,・´∀`・,,)っ-○○○:2011/12/22(木) 00:09:23.71 ID:fp200XlI
> ご存知タンネンバウム

「Linuxは時代遅れだ」とか言ってメーリングリストを荒らした厨房教授ですね
959Socket774@組み続けて12年:2011/12/22(木) 00:09:37.52 ID:ev7SLT8g
キングオブ無知の団子の言いそうなことだ
今日びインライン展開やループアンローリングのコストが下がり、ライブな値はますます増える一方だ
ISAは何十年と使われるものなので、将来を見越して設計しなければならない(見込みが外れることはある)
今この時の生を謳歌する団子には縁のないことだがな
960Socket774:2011/12/22(木) 00:10:08.54 ID:FFrc9d/z
いっそのこと、即値を全面禁止にして、
ベースアドレスレジスタによる相対アドレシングで、
オペランドテーブルから読み込むことに決めてしまってはどうなんだろうか。
これなら命令サイズの肥大は防げる。

テーブルサイズが4kB程度ならdisp12でカバーできるし、
4kBで足りなかったらテーブルを複数個使えばいい。

と書いたら、なんかSHあたりを思い出した、ような気がした。
961,,・´∀`・,,)っ-○○○:2011/12/22(木) 00:13:42.39 ID:fp200XlI
> 今日びインライン展開やループアンローリングのコストが下がり、ライブな値はますます増える一方だ

また妄言をww
Sandy Bridgeよりクロック当たり性能の高いRISCでも出てくるなら見てみたいものだが
5IPC以上になると依存関係追うのがきつくなるんだよね。
962Socket774@組み続けて12年:2011/12/22(木) 00:15:00.29 ID:kfHa230d
過去との互換性を一切考慮せず、まっったく新しいISAを作れるなら、どんなものになるだろう。
団子さんが強調する、コード密度を上げるアプローチだろうか。
よく使われる命令のビット長を短くするって、エントロピー圧縮みたいで良さげだね。
963Socket774@組み続けて12年:2011/12/22(木) 00:16:34.48 ID:kfHa230d
>>961
IA64がコケたのはIPCの限界が5くらいだから??
964,,・´∀`・,,)っ-○○○:2011/12/22(木) 00:17:30.64 ID:fp200XlI
x86だけでなくPowerまでもがわざわざ命令同士を内部的に融合してオペレーション密度を上げる
アプローチを取ってることから考えても最初から高密度設計にしといたほうがいいね。
とっくに定年迎えて退役の恩師の言ってた「これからはVLIWの時代」は半分は当たってると思う。
965Socket774@組み続けて12年:2011/12/22(木) 00:18:23.52 ID:ev7SLT8g
Sandy Bridgeは気持ち悪いくらいよくできているが、
ISAの評価を「特定の」実装でしか考えられない団子は抽象的なものの考え方ができないんだな
それはそれで幸せかもしれん
966,,・´∀`・,,)っ-○○○:2011/12/22(木) 00:21:08.86 ID:fp200XlI
>>963
Itaniumの何が駄目って、1ワード128ビットだぜ。Itanium 2の2バンドルで1サイクルあたり256ビットフェッチ。
L1I帯域食いすぎ。
L1Iのレイテンシを小さくするためにL2までIとDに分けて・・・とにかくいろいろおかしい。
967Socket774@組み続けて12年:2011/12/22(木) 00:22:36.65 ID:Mpuc64Yp
itaniumの問題は4 lord/storeとかOoOがないとかで、次期itaniumはそのへん改善される
968,,・´∀`・,,)っ-○○○:2011/12/22(木) 00:23:36.43 ID:fp200XlI
> 特定の実装
SPARC(笑)の実装で当たりなんてありませんでしたが?
いずれにせよ4バイト固定長に将来はない。

ARMはThumb命令セットを実装してから当たった。
969Socket774@組み続けて12年:2011/12/22(木) 00:25:06.93 ID:Mpuc64Yp
L1が小さいのはQuad Portだからだろ
帯域とレイテンシはたぶん関係ない
970Socket774@組み続けて12年:2011/12/22(木) 00:25:10.07 ID:ev7SLT8g
どういうISAが最適なのかは、その時代そのテクノロジによって異なる
あるときは優勢にみえたISAがその後落ちぶれることもあるのは皆さんご存知のとおり
団子は80386がクソSPARCにすら圧倒的に負けていたことを見ないふりをしているね
971Socket774@組み続けて12年:2011/12/22(木) 00:25:31.26 ID:kfHa230d
勉強になった!
ってか次期Itaniumって出るのか。
Itaniumがこの先生きのこるには。
972Socket774@組み続けて12年:2011/12/22(木) 00:28:08.21 ID:ev7SLT8g
俺には理解できないのだが、
特定の実装にばかり目がいくと非難されて

> SPARC(笑)の実装で当たりなんてありませんでしたが?

と、特定の実装を引き合いに出して反論した気になっているのは、やっぱり知恵遅れか何かなのか?
973Socket774@組み続けて12年:2011/12/22(木) 00:29:16.62 ID:Mpuc64Yp
thumbの前からARMは売れてる
あと、速度が重要な携帯じゃthumb使ってるわけないだろ
ARMはv8で普通のRISC ISAにした
ああいうISAが、かなりの範囲で最適解なわけだ
974Socket774@組み続けて12年:2011/12/22(木) 00:29:48.56 ID:icVKOZob
>>968
Thumbは性能を犠牲にしてまでコードをコンパクトにするための命令セットだから
パフォーマンス優先な用途にはつかわれないんじゃない?
975,,・´∀`・,,)っ-○○○:2011/12/22(木) 00:30:20.80 ID:fp200XlI
> 団子は80386がクソSPARCにすら圧倒的に負けていたことを見ないふりをしているね
それは1コアに使えるトランジスタに制約があった時代だからだな。

今はこれ以上クロックもIPCも頭打ちになってる今できる高速化のアプローチは
1命令のオペレーション密度を高めて専用回路を追加すること。
だから今はCISCでないといけない。幸いにも1コアに使えるトランジスタはふんだんにある。

おまいさんがRISCの時代の再来を夢見てる老害だとわかったよ。
ループアンローリング(嘲笑和良
976,,・´∀`・,,)っ-○○○:2011/12/22(木) 00:31:56.61 ID:fp200XlI
>>974
ARMステートとの切替にオーバーヘッドがあるからだよ。
ARMの性能の要であるバレルシフタやプレディケートビットのフィールドもないしね。
977Socket774@組み続けて12年:2011/12/22(木) 00:32:28.83 ID:ev7SLT8g
人生最大のプログラムが4x4の行列演算ならループアンローリングの必要はないが…
978Socket774@組み続けて12年:2011/12/22(木) 00:33:57.07 ID:icVKOZob
x86が性能が向上したのは億単位出荷がそれを支えてるからでしょうね
それだけ開発費を投入できるから。
結局ISAよりもマイクロアーキテクチャの問題の方が大きい
今、ARMが注目されているのもスマホやタブレット用途で億単位で出荷されてるし
今後しばらく需要が伸び続けると予想されるからでしょう
979,,・´∀`・,,)っ-○○○:2011/12/22(木) 00:34:25.50 ID:fp200XlI
ゲームに使うのは単精度4x4で十分だけどな。
世のプログラムの99%は整数演算主体だ。
980Socket774@組み続けて12年:2011/12/22(木) 00:35:12.52 ID:ev7SLT8g
え?マジだったの?
981,,・´∀`・,,)っ-○○○:2011/12/22(木) 00:36:22.06 ID:fp200XlI
>>978
省電力が要求されるスマホ向けのIPとハイパフォーマンスPC向けのIPは共通化できない。
PC向けは別にARMである必要が無い。
982Socket774@組み続けて12年:2011/12/22(木) 00:36:41.89 ID:Mpuc64Yp
命令を追加し、そのための専用回路を積むのは正しいがCISCは間違ってる
だからuopsキャッシュに効果がある

ちなみにSPARCはMMXライクなSIMDを採用した最初のCPUだ(i960は無視)
SUNはSIMDと3D RAMでポリゴンをやり、GPUを積まないグラフィックスWSを出してた
983Socket774@組み続けて12年:2011/12/22(木) 00:36:47.91 ID:OTsTDsGJ
今成功しているアーキテクチャを見てしたり顔で持ち上げるだけなら簡単なんだけどな
アーキテクトは将来を予測して設計しないといけないから大変だ
984Socket774@組み続けて12年:2011/12/22(木) 00:38:45.42 ID:iru+Z0GZ
> Cの関数のほとんどは変数が14個以内で収まるからレジスタ16本で十分
たいてい関数は関数を呼び出すので、caller-save registerは使いづらい。
OSとかシステムもなんだかんだでレジスタを何本か持っていく。
仮に使用するのが14個なら、全本数が16本ではちと足りない気がする。
おそらくスイートスポットは24本あたりではないだろうか。
そこでやや足りないのを我慢して16本側に振るのが組み込み、
32本側に振るのがサーバの発想だと思う。
http://japan.renesas.com/products/mpumcu/rx/child_folder/feature.jsp
985Socket774@組み続けて12年:2011/12/22(木) 00:38:48.72 ID:kfHa230d
うん、アーキテクトは未来を設計してるよね。
986,,・´∀`・,,)っ-○○○:2011/12/22(木) 00:39:21.39 ID:fp200XlI
>>980
お前こそマジで言ってるのか?www

ちなみにテンプレートメタプログラミングはよく使うよ。
それでもレジスタが足りなくて性能が下がるケースなんて遭遇したことが無い。
無闇なループアンローリングはL1キャッシュヒット率を下げる害悪だと思え。
メインストリームのCPUにおけるL1キャッシュのサイズなんて20年近くも変わってない。
987,,・´∀`・,,)っ-○○○:2011/12/22(木) 00:41:19.49 ID:fp200XlI
>>984
いまそういうのあるんだ。
SuperHのページって消されたのかな?
988Socket774@組み続けて12年:2011/12/22(木) 00:43:19.74 ID:iru+Z0GZ
>>974
ThumbとThumb-2は違う。2の方はかなりいけてる子なので、使わない理由はない。
989Socket774@組み続けて12年:2011/12/22(木) 00:43:51.68 ID:Mpuc64Yp
命令フェチアドレスを予測してL1からでなく、L2から命令を読めばいい
無闇にサイズがでかいループアンローリング(笑)なら、分岐もあまりないから問題ないだろう
990,,・´∀`・,,)っ-○○○:2011/12/22(木) 00:43:57.25 ID:fp200XlI
2はThumb-ARMのステート切替がないからね
991Socket774@組み続けて12年:2011/12/22(木) 00:45:29.48 ID:h8jDPH5g
まあでも事実アセンブリを書いてみるとx86-64の16本は、ARMの16本と比べるとかなり余裕を感じる。
992,,・´∀`・,,)っ-○○○:2011/12/22(木) 00:46:19.05 ID:fp200XlI
> 命令フェチアドレスを予測してL1からでなく、L2から命令を読めばいい

ItaniumがL2を2つに分けたのってなぜか知ってる?
分けないとデータの分の帯域を食っちゃうからだ。
993Socket774@組み続けて12年:2011/12/22(木) 00:49:35.26 ID:Mpuc64Yp
>>992
キャッシュ容量や階層は実装の問題でISAの問題じゃない
994Socket774@組み続けて12年:2011/12/22(木) 00:50:48.59 ID:icVKOZob
>>981
今後、企業でワープロなどのビジネスソフトを使う情報端末がモバイル化していくと想われる
今でさえクアッドコアのCPUを搭載したPCは市場に流通するPCの10%未満らしいし
一部の用途を除いてCPU性能は満足のいく性能に達しているからね
995,,・´∀`・,,)っ-○○○:2011/12/22(木) 00:51:35.35 ID:fp200XlI
>>993
1ワード128ビットでどうしろと?なんだかんだでISAは実装を縛る。
996Socket774@組み続けて12年:2011/12/22(木) 00:53:31.98 ID:ev7SLT8g
>>982
> ちなみにSPARCはMMXライクなSIMDを採用した最初のCPUだ(i960は無視)

i960じゃなくてi860
で、SPARC V9の前は88110のグラフィックスユニット
997,,・´∀`・,,)っ-○○○:2011/12/22(木) 00:54:29.19 ID:fp200XlI
>>994
スマホの小さい画面で事務作業できるか?
ウィルス等の対策のためにソフトの配布元を制限してるiPhoneみたいな端末が
ビジネスプラットフォームとしてPCを置き換えるというのは苦しいな。
そもそもAppleやGoogle自身がPCが別にある事を想定している。
998Socket774@組み続けて12年:2011/12/22(木) 00:55:50.16 ID:Mpuc64Yp
>>995
x86の可変長デコードど比べると些細な問題だと思うのだけど。。。
固定長RISC比3割増しのコードに何か問題でもあるの?
ちょっとコードサイズがでかくなるだけだ
999Socket774@組み続けて12年:2011/12/22(木) 00:56:41.53 ID:icVKOZob
>>997
デスクトップ仮想化の流れも進んでいる
アプリの実行はサーバ上で実行した仮想PC上で動かす
そうなると端末はx86である必要性はない

三菱東京UFJ、海外支店にデスクトップ仮想化ソリューションを導入
http://www.itmedia.co.jp/enterprise/articles/1107/26/news060.html

三菱東京UFJ銀行、3000台の仮想デスクトップを配備
http://www.itmedia.co.jp/enterprise/articles/1005/31/news066.html
1000Socket774@組み続けて12年:2011/12/22(木) 00:57:12.38 ID:iru+Z0GZ
1000なら次スレが立つ
10011001
1台のマシンが組み上がりました。。。
新しい筐体を用意してくださいです。。。。

         自作PC板@2ch http://anago.2ch.net/jisaku/