[RISC]CPUアーキテクチャについて語れ![VLIW]2

このエントリーをはてなブックマークに追加
1Socket774
2Socket774:04/11/21 21:46:51 ID:uzwVTaF3
2
3Socket774:04/11/21 21:47:35 ID:2HUks886
前スレ >>1 より

お前らいい加減、無能なAMD房・Intel房に振りまわされず、
エンコ時間がどうとかPIがどうとかじゃなく、
CPUコアのアーキテクチャについて語りましょう。

x86/RISC/CISC/スーパースカラ/VLIW/MIMD/SIMD
等について語ってもよし、

フリップフラップ回路が小さいPentium Mマンセー、
CISCなのに内部はRISCなPentium 4マンセー、
x86なのに32/64bitコンパチなOpteronマンセー、
昔々8086の時代は(以下略・・・等もよし。

さあ、不毛な争いを止めてCPUアーキテクチャについて語ろう!
4Socket774:04/11/21 21:48:12 ID:GHw4v2cq
ぺ4様
5うさぎ会長:04/11/21 21:53:03 ID:gXyhp2yg
            ,.-t、,/ _ ̄~~`'ー- 、,  (__
            f  ,l.  ̄r< ̄ >- 、  ` く  l,__
          ,.〜',/ `ー'‐'^ヽ,__j,.ィ_ nヽ  \ ,.゙ヽ
         / / /     ,.    `y' \   ',  )
          ヽ//'// /' / ,.   ノ L._  ヽ  ト、 ,)
.         // / 'ム ノ / /'彡イイ| イ ノ fヾ!  | 'ー,
         l/l l  〃 //' 彡〃 |川.|.了ヽ__!|ヾ |. /{!
.         |从 //-く ム-彡'"二゙!从レ' i |`ー`)ーレ'  _j ポンポコ
      r、r、  |l V/' lr'。!     'スヽ',从 ,!└-- ァ,r=,ゴ      ポーン♪
     ヾヽヽ\. nl 、l゚ソ     /ー'。ミY/ /  ア / |_,ノ    。              |ヽ
      ヾヽヽヽ'、{. ',   .:    ゞニン^'j. / //ノ,! ハ   ー┼‐  ___ ヽ    ._| )
       \\^ `!ヾ、. ヽ‐1       /./ノ  / l. ハ L,  ノ | ヽ       _,ノ   (_|
        ヽ ヽ   }.ヽ, !ノ     |/   ./ l |-! | )
        /.)    ノ、ヽiゝ、、、--‐='7 ノ  ,ノ"7-v'--'く
      、'ー===i. /.  ス、 ( f  ハ.  / / / /   )  \
      /ヾ;、,_ゞ==イ ミ 〈{ 7イ. | ./  / ) l r‐'"     ヽ
.     /   `ー'  |〈 \ | |. | |. | /,ノ 〉 | _j       レ┐
    /      ,イ,〈 ミ、 ゙K、j ,. l | /ノ  Vメ、      ノ- ,ゝ
    /     /)>L>、 {、7゙,、j y'  / く.( )ヽ,    「  _ノ、_
    (      ノ /\ヽ〈ヽ,).l }   //ノ   ヽ _∧,r‐'   `ヽ、
6MACオタ:04/11/21 21:59:58 ID:UivSGDNJ
結局>>1じゃx86をマンセーしてるだけなのがイタいんすけど。。。
7MACオタ@訂正:04/11/21 22:00:37 ID:UivSGDNJ
上の>>1じゃなくて>>3すか。。。
8うさぎ会長:04/11/21 22:04:08 ID:gXyhp2yg
マックおた、きもいよ。
9Socket774:04/11/21 23:01:49 ID:M9dOfz9W
フリップフラップ直さなかったのか。
しかし今日のMAXオタ必死だな。
10Socket774:04/11/22 06:19:32 ID:nS08Uo9b
なんかここだけ板で浮いてるな
エロくない私にはさっぱり内容がわかんね・・・
11Socket774:04/11/22 07:14:44 ID:vI8Sk/JF
>>前スレ911
32bit固定命令長プロセッサでは大抵32レジスタ3オペランド(5bitx3=15bit)
16bit固定命令長プロセッサでは大抵16レジスタ2オペランド(4bitx2=8bit)
どちらも命令長の約半分がオペランドを指定するフィールドで占められているが
その辺何か意味があるのかもしれない。
12Socket774:04/11/22 08:10:24 ID:8oLg5JUn
遅いとバカにされるけどSPARCが大好きです♪
13Socket774:04/11/22 08:18:56 ID:1fAbwAyv
前スレ前半はSPARC信者が多かった。
が、後半からは何故かx86マンセー野郎が増加して、
さらにMACオタが乱入。

そして、レジスタ数とレジスタ待避のトレードオフという素人には
無謀すぎる話題に突入。
14Socket774:04/11/22 08:27:19 ID:1fAbwAyv
で、MACオタはx86 ISAのスケーラビリティの悪さについては
どうおもってるわけよ?
15MACオタ>14 さん:04/11/22 17:45:31 ID:285Id57b
>>14
ISA的にわ、ついこないだまで64-bitアドレスをサポートしていなかったという以外、別に問題
無いと思うす。ただ、実装自体わ携帯電話に入るような小さなチップも無く、サーバー用の
ハイエンドチップも無いというのが事実す。
16Op使い:04/11/23 01:45:56 ID:xi8/vTjg
前スレの後半見てて思ったけど、
レジスタがありすぎるとコンパイルに時間かかりそう..

#最近、Power5に興味もってきたりして..(^^;
17Socket774:04/11/23 02:50:57 ID:tSQJafcQ
>>11

>16bit固定命令長プロセッサでは大抵16レジスタ2オペランド(4bitx2=8bit)

そうか? ARMやMIPSの16bitISAでは8レジスタ3オペランド(3bitx3=9bit)だぞ。

まぁ、いずれにせよレジスタ指定に割り当てられるビット数はその程度が
妥当だろうね。もっとも、思い切ってイミディエイトやディスプレイスメントの
ビット数を削ってしまえば多レジスタISAというのも可能ではある。
例えば128本3オペランド(7bitx3=21bit)なんていうCPUも過去にはあった。
まぁ、自分で命令ビットパターンを考えてみるのもなかなか面白いものではあるよ。
18Socket774:04/11/23 03:38:23 ID:qYpOJoCv
>>16
>レジスタがありすぎるとコンパイルに時間かかりそう..
すべてのコンパイラに該当するものではありませんが
GCCでは擬似レジスタが無限にあるものと想定して
コード生成をした後現実のレジスタ,メモリ参照に
変換するという手法をとっていたようなので
レジスタ数が多いことはコンパイラに対して
デメリットにはならないのでは。

>>17
>例えば128本3オペランド(7bitx3=21bit)なんていうCPUも過去にはあった。
Itaniumって既に過去のものなのか......orz
19Socket774:04/11/23 11:52:09 ID:Hm+00xLI
>>17
そういえばそうですね。
こちらは32bitMCUの類のネイティブな命令セットをを想定していました<16x2
使い勝手としては16x2のほうが8x3よりよいかと思います。
#8x3のISAはどちらも32bit長命令セットの縮小命令セットであるのは注目すべきでしょう。
20Socket774:04/11/23 22:53:50 ID:tSQJafcQ
>>18

Itaniumって32bit命令長だったんだぁ。
# VLIWは全く頭になかったよ。

>>19

確かに8x3は32bitの縮小ですね。
実はMIPS16の命令セットを決めた人間に話を聞いたことがある。
色々と理屈は言っていたが、結局は勘で決めているとしか見えなかったよ。
21Socket774:04/11/23 23:34:21 ID:qYpOJoCv
>>20
Itaniumの命令長は41bit長×3+付加情報5bit=128bitです。

>>17が過去に32bit命令長で128レジスタのCPUがあったという
ことでしたらこちらの早とちりです。
2217,20:04/11/24 10:07:20 ID:rAqyQNcI
>>21

ご丁寧にすいません。
17で「32bit命令長」って明記しなかった私が悪うございました。
Itaniumのスロットが41bitというのは確認してたのですが、
20ではちょっと遊んでボケてみました。申し訳ないです。
ちなみに、17で書いたのはAm29000のことです。
23Socket774:04/11/24 17:50:18 ID:pn/WswmT
Am29000はオペコード、オペランド3つそれぞれ8bitです。
レジスタは192個まで実装されてたんだったかな。
2417,20:04/11/25 00:32:35 ID:gL2DuRux
>>23

ガーン、完全に記憶違いでした。ありがとうございます。
少し休養します。
25Socket774:04/11/27 13:14:16 ID:5fwPPFwE
877 名前:名無しさん必死だな[] 投稿日:04/11/27 12:50:53 ID:nmcyavCi
日本は猿マネでここまで来たんだよ。結局はアメリカ西洋が無いと
何も出来ないのはペリーが来た頃からわかってただろ。

加工は得意だが発想が無いんだよ。今じゃ製造関係の信用すら無くなった。
今までやってきた事も結局はまねごとじゃん。
コンピューターって物を開発した訳でも無く、コンピューターって物を
遊びに使ったって事で当たっただけであってさ

あっちの評価が上がったのは軍事関係にコンピューターを使ってるから
技術が上がればもの凄い物は作れるんだよ。日本はそれを加工しただけ
26Socket774:04/11/27 22:37:55 ID:LYfNsstS
インテルのCPUの産みの親は、日本人ですが、何か。
27Socket774:04/11/27 22:47:03 ID:DexpoBAT
インテルの起源は韓国にあり。。。プギャーっと
28Socket774:04/11/28 18:18:07 ID:EcNT5VtM
中森章は半可通なので判っていないのはいいとして
http://www.cqpub.co.jp/intrface/toku/2003/200311/toku2.htm
嶋正利まで
「ただ,IBM の失敗は自分の成功に価値を見いださなかったことである.」
なんてことを言っているので失望した。
http://www.ieice.org/jpn/books/kaishikiji/199910/19991001.html

実際はIBMはRISC技術を極めて重要視していたわけだが。
http://www.cs.clemson.edu/~mark/architects.html
29Socket774:04/11/28 21:05:50 ID:KOiwSMD3
IBMみたいな超大企業の場合、重要視といっても、本当に重要視されていたのか
わからない見たいな部分があって…。いかんせん重役の数が多すぎて…(笑)
30Socket774:04/11/29 03:31:56 ID:PD0Wt7F8
かなり早い時期に手を出していたのは確かだけど結局日の目は見なかったわけで。
持ってるリソースが大きいので片手までやった仕事でもたいした仕事だったというだけの話だと思うね。
31Socket774:04/11/29 10:47:11 ID:XoEGDlfe
>>30
中森章登場
32Socket774:04/11/29 14:55:36 ID:C8KVE+li
>>28
おせっかいかもしれんが

http://www.cqpub.co.jp/interface/toku/2003/200311/toku2.htm
中森の記事は↑こっちだな。interfaceのeが抜けてる。

この記事は以前本で読んだが、
「紙面が尽きた」とか言ってSHシリーズの文章がなかったのが、
個人的には腑に落ちなかった。

今でこそARMがRISCマイコンの最大勢力かもしれんが、
数年前なら「世界でいちばん売れている32ビットマイコン」とも言われていたらしいSHシリーズ。
何か書けることもあっただろうに…

誰かSHシリーズについて熱い想いを語ってくれる人キボンヌ
33Socket774:04/11/29 16:35:55 ID:2CV3J99/
>>32
きちんと評価したわけではないが、あんまり好きではない。
34Socket774:04/11/29 17:43:33 ID:cPGo4NHy
>>32

HOTCHIPSか何かで日立が発表したとき、パターソンが
「そいつの何処がRISCな訳?」と突っ込んだってな逸話は有名だな。
確かに純粋RISCの立場からすれば、16bitに圧縮されたコードセットは
邪道でRISCとは言い切れないだろうよ。
だが、その後SparkやMIPSが追従した訳で、受け入れられた訳だが。

そしてセガと共に滅んだ…じゃなくて、結局、現ルネサスもそうだが
SHとH8の棲み分けでかなり悩んでるんだろうな。
さっさとH8を縮小してSHに一本化してた方が良かったと思うんだがねぇ…。
35Socket774:04/11/29 18:54:21 ID:PD0Wt7F8
>>32
中森たんはNの人間だから。
Hのプロセッサの話はあまり詳しくないからできなかったというところでないかな。
VR4131の手抜きスーパースカラとか、V850の怪しい話とかは書けるみたいだけど。
36Socket774:04/11/29 19:38:27 ID:AKwZ2gwS
>>34
パターソンってそんなドキュンだったんだ。なるほど。
工学にろくな教授がいないことをまたしても証明してしまったな。
37Socket774:04/11/29 19:57:47 ID:IgItYhdA
パーシャルレジスタストールってメモリアクセスでも起こるんだな
北森だと30クロックぐらいカラ回り
AthlonXpだと全然平気なのに
38Socket774:04/11/29 20:21:06 ID:2CV3J99/
>>37
なんでそんなかかるんだろうね。
AMDにがっつり特許おさえられてるとか?
39Socket774:04/11/29 21:26:16 ID:C8KVE+li
>>34
そんな事言ってたんだ。

漏れはSHシリーズは使ったことないんだが、
定数のロードは確かにアレだとオモタ。
て優香、無理して命令コードを16ビット長にしなくても良かったんじゃないのかなあ。

ルネサスの場合、
旧日立のプロセッサだけでなく、旧三菱のプロセッサもあるから、
ホント大変だろうね。

>>35
>>28>>32の中森の文章では、国産のプロセッサは軒並み割愛されてるんだよね。
富士通がSPARCと絡んでるとかは除いて。

御前、それでも日本人かー!!ってオモタヨw
40Socket774:04/11/29 23:08:35 ID:5vUievo3
>>39
32bit長命令だとメモリを16bitバスにぶら下げた場合、
フェッチの時間が倍になって、とっても悲しいからのう…

かといって32bitバスにすると基板でかくなってお金がかかるので、
これまた困る。

まああの時代では16bit長つーのがそれなりに最適な選択だったと思うですよ。
問題は互換性のためにそれをひきずりまくった事ではないかと。
41Socket774:04/11/29 23:30:58 ID:ayc9vRYd
>>40
命令キャッシュなかったの?

まあコード密度は高かった(MIPS比1.5倍くらい)

ISAはSH5になってかなりマトモというか普通になった。
42Socket774:04/11/30 00:05:28 ID:HfGMv9PV
>>36
SYMBOLだのレジスタウィンドウだのロクな発明してないしな。

マトモなのはRAIDくらいなもんか?
43Socket774:04/11/30 03:27:17 ID:tPaXcyDA
SHはコード密度優先でキャッシュも少ない量しか搭載してない…。
っていうかダイサイズや消費電力を減らすためにそうなってる訳だが。
逆にキャッシュの効きは良いんだから、沢山積めば良いのにとも思う訳だが、
絶対性能を求めるようなもんでも無かった訳で…。

まぁそういうプロセッサだからMIPSや(Thumb無し)ARMとは趣が違う…。
44Socket774:04/11/30 06:46:29 ID:6S9OFngO
>>34
H8は小ロットとアマチュアの強い味方です。やめないで。
45Socket774:04/11/30 08:29:20 ID:y7FKGhY5
Cellは4.6GHzで動作 - ISSCC2005の開催概要が明らかに
http://pcweb.mycom.co.jp/news/2004/11/29/011.html

>>44
はげどう。ただ個々のチップのライフサイクルは短いような
気がする。もうちょっとラインナップを整理してほしい。
46Socket774:04/11/30 12:35:02 ID:tPaXcyDA
>>44

ただ単に、フラッシュ内蔵したH8ピンコンパチで焼き方も
一緒で安価なSHが出てくりゃ良いだけの事だ罠。
47Socket774:04/11/30 18:40:48 ID:+WLIdXE1
フラッシュ内蔵したH8ピンコンパチで焼き方も
一緒で安価なItaniumが出てきたらどうしますか。
48Socket774:04/11/30 19:54:50 ID:wwqlsrSa
>>47
コードデンシティが低いし、自分でバンドルをつめるのも面倒だから嫌。
49Socket774:04/12/01 21:34:08 ID:0BB4e3rB
>>48
そしてIA64-16が
50Socket774:04/12/03 21:13:14 ID:5vYLW2xV
あはは

ほんとにオープンアーキ化しちゃうのね
http://power.org/
51Socket774:04/12/03 23:40:23 ID:nEj1Tdb4
自分らの実装能力に絶対の自信があるっていう意味だろうなあ
52Socket774:04/12/14 04:19:40 ID:5c7i4jnp
「遅延スロット」ってRISC系CPUで主に実装されているんですか?
53Socket774:04/12/14 22:54:45 ID:GWYZv8mL
遅延かーサターンのPAR弄ってたときに勉強したな。
RISCアーキ出る前には既にあった。
目新しい技術ではないです。

えーと、コンパイラにコード吐かせると遅延有効活用できないときはNOP入れられるんだっけ?
ウロオボエンガー
54Socket774:04/12/14 23:12:11 ID:dJc2kTqU
ウホッ、久しぶりのカキコw
みんなどうしたのかと思ったyo!
て優香、みんなもっと書き込みщ(゚Д゚щ)カモォォォン!!!

…っていうくらいなら自分で書き込めよ、ってオモタ('A`)

「遅延スロット」っていうのは、
RISCというよりパイプライン構造のプロセッサに関係のある概念だな。
まあ通常、RISCプロセッサ=パイプライン構造なんで、
RISCに関する書籍とかを読んでれば自然と出てくる言葉だけどね。
55あってる?:04/12/15 04:27:09 ID:V1fHRb0d
>>52
実装というか副作用というか
分岐ステージ分割して高速化狙いしたCPUだと
分岐条件成立がわかるまでに分岐命令直後の命令が(分岐するから本当なら後の命令なんか実行する必要がない場合でも)パイプラインを抜けちゃう(=実行完了)

何も考えないでインラインアセンブラ組むと誤動作の原因になる
分岐命令直後にNOP詰めとけば間違いないけどそれじゃ性能上がらないんで問題ない命令を何とか詰め込む
まぁコンパイラの方がうまかったりするけどw
56Socket774:04/12/15 20:45:37 ID:KBDIg/YO
盲腸だな。
57Socket774:04/12/15 21:34:49 ID:HEe63dcd
RISCは CPUとコンパイラがピッタリ協調して 初めて意味がある。
なのに、バイナリコンパチとか言い出した時から、RISCはRISCでなくなったね。
58Socket774:04/12/16 06:12:56 ID:akKGXhup
CPUのOOOって凄いね。

PalominoコアのAthlonを相手に、コードの最適化やってるんだけど、
手で命令の順序を入れ換えてあげても、処理速度が変らない。
つまり、すでにCPUのOOOが適切に入れ換えてくれてた、ということ。

まぁ、漏れの技術力がないだけなのかもしれないけどね・・・・
59Socket774:04/12/16 11:00:06 ID:rk7dDlBe
>>58
Intel系でやってみそ
実行ユニットもデコーダも中途半端だからNOPはさんだ方が速くなったりするぞ
NetBurstになるとストールしまくるのでフラグを使った小細工は禁止
60Socket774:04/12/16 17:21:15 ID:dFqLIY8J
>>58
AMDからダウソできる CodeAnalyst は、使ってみた?
6158:04/12/16 22:31:51 ID:akKGXhup
>>59
Pentium4で走らせてみたらびっくりしましたよ。

Athlonで、
A1→A2→A3→B1→B2→B3
というような処理(それぞれ前段の処理結果を使うので並列に処理できない)を、
命令単位で細かくやったりせず、C言語で数行ごとに切替えるだけで、
A1→B1→A2→B2→A3→B3
のように並べ替えたら、処理時間が62%に縮まりました。
ところがPentium4では、116%に延びてしまいました。

MMXを使った部分では同じコードの調整で、
Athlonで88%に縮まったのに対して、Pentium4では72%にまで縮まりました。

インテルのCPUは、ちゃんとスケジューリングしてあげないといけないんですね。
Pentium4はまだいいほうで、Itaniumに至ってはコンパイラの性能差出過ぎですよ。

>>60
使ってないです。
インテルのVTuneに相当するものがあるのですか。しかもフリーですか。素晴らしすぎる。
ありがとうございます。試してみます。

いまはVC++用のプロファイラを使って当たりを付けて、処理時間を測りながら試行錯誤してます。
インテルとAMDのドキュメントに書かれている、パフォーマンス上の注意点の多さと、
自分で書くよりも、コンパイラに任せたほうが結果が良かったりして、凹んでいたところです。
62Socket774:04/12/16 23:59:54 ID:yun3hOMM
ItaniumはVLIWなのでコンパイラで性能差が出まくるのはしゃーない
63Socket774:04/12/17 02:40:59 ID:jVgBWPiT
Itanium2に最適化してると、ただでさえ遅いItaniumは、さらに若干遅くなるんだよね。
そういう宿命なんだけど、なんだかさみしくなる。
64Socket774:04/12/18 20:17:19 ID:Cq4vwZkE
HPはItanium共同開発から撤退らしいし…。
65Socket774:04/12/19 15:09:05 ID:5Rpk3xqZ
Longhornが予定通り出れば.netが普及するからチャンスがあるが、
このままだと消えてゆく運命かもな・・・Itanium/2
66Socket774:04/12/19 17:08:20 ID:dhza31VC
.netとItaniumとどういう関係が?
67Socket774:04/12/19 20:17:45 ID:dpJQftSS
全面的に.net化すると、OS以外はCPUアーキテクチャから独立するから。
68Socket774:04/12/20 13:28:12 ID:mDtQlZMl
>>66
おまい、自分の興味ある記事しか見ないタイプだろ。
6960:04/12/21 13:34:16 ID:7tCq/vEC
>>61
何を作ってるかはあえて聞かないが
手でスケジューリングは、涅槃が待っているのでがんがれ。
7058:04/12/21 21:43:20 ID:6sXn4cAW
>>60
CodeAnalystを試してみました。

速く走るコードはパイプラインが整然と流れていて美しかったです。
もうこれ以上速くはならないよ、ということを突きつけられたのでもあるのだけど。

少し遅いコードでも、ストールしまくってるわけではなく、手でスケジューリングする余地はないように見えました。

インテルもこういうツールをフリーで出してくれればいいのに。
NetBurstのパイプラインストールが激しいのを見てみたいです。
71Socket774:04/12/21 23:32:49 ID:/lvy1TZp
>>68
そうでもない。
レス返さなかったのは、スレ違いだと思ったから。
# OSやJava,Ruby,.netの話しても詰まんないでしょ。
72Socket774:04/12/22 00:09:07 ID:Katp9BdD
>>60>>70
私も早速DLして試してみました。CodeAnalyst。
所々パイプラインが切れているのは、Br mispredictやBank Conflictです。
L1データキャッシュはセット・アソシエイティブ数が少ないので、L2からの再ロードが
ここで起きているようです。L2でもバンクがぶつかった場合はメモリからロードするので、
相当ストールがかかっていますが、これは極たまにです。

Br mispredictは初回のCALLや、条件分岐で起きていますが、後の方に行くと
学習してしまい、CALLされてもパイプラインが途切れていません。

それにしてもAthlonのパイプラインは優秀です。クロック数が低くても速度が速い理由
が一目瞭然です。
73Socket774:04/12/22 00:21:27 ID:Katp9BdD
しかし、x86 FPUを使ったら赤枠にピンクのストールだらけ!さすがに厳しいか・・・・
x86 FPUはRISC FPUに比べて性能が悪い傾向がありますが、これはXMMでも
使えば少しは改善されるのでしょうか。
74Socket774:04/12/22 00:54:13 ID:qQtY6n6I
>>70
>NetBurstのパイプラインストールが激しいのを見てみたいです。
プのストールを想像するとハァハァ
それにしてもなんでこんなCPUが開発できたんだろ
75Socket774:04/12/22 01:06:12 ID:hE+LsD90
http://pc.watch.impress.co.jp/docs/2004/1221/kaigai143.htm

本文二行目・・・

ん?PenMの開発ネームは何だって?w
76Socket774:04/12/22 07:21:55 ID:GV3eNjEw
ドタンだと問題でも?
77Socket774:04/12/22 15:30:38 ID:rfl26WIM
78Socket774:04/12/22 16:18:46 ID:KMaNCYpM
thの音に対する日本語表記はしょうがねぇじゃん。
ドタンでもドサンでもお好きなように。
79Socket774:04/12/22 19:01:54 ID:Katp9BdD
土炭
80Socket774:04/12/22 19:26:21 ID:p6xjsn/P
弩タン・・・
81Socket774:04/12/23 01:13:14 ID:jpYo8+9o
土産?(違
82Socket774:04/12/23 01:45:32 ID:6TF54xuU
いまさらぶり返すようなネタか?>Dothan
83Socket774:04/12/23 02:11:18 ID:GO8Z7CeH
ドウサンだと思ってた。つかアーキの話か?これ。
84Socket774:04/12/23 02:42:18 ID:NpZXFRys
まあいいや。

それはともかくインテルのPARROTってどうよ。
俺はもうイリノイの連中のタワ言を信じるのはやめるべきだと思うのだが。
85Socket774:04/12/23 04:51:51 ID:6TF54xuU
PARROTは後藤たんの記事を読んだだけだけど、
現在の技術の流れからいっても
まあ妥当なテクノロジだと思ったよ。
記事を読んだら0.1秒でtransmetaの朴李だと分かったけどw

て優香、イリノイってなんか悪い噂があるの?
86Socket774:04/12/23 10:13:23 ID:GC04LHy6
AMDをパクったあとはトランスメタでつか。
Intelもプライドってもんが無くなってきたなぁ。ブランドは技術に裏付けされたプライドと努力から
生まれるもんだと思うが・・・('A`)
87Socket774:04/12/23 14:13:19 ID:xhdoZgC7
プライドがあったらプなんて出てこんだろ
31段スーパーストールアーキテクチャ
88Socket774:04/12/23 14:49:02 ID:hjDFgQpX
CodeAnalystを使ってみたいから、AMDベースのマシン組みたくなってきた。
89Socket774:04/12/23 17:20:48 ID:NpZXFRys
ホットスポットに最適化したアーキテクチャは、うまくいけば
たしかに性能はいいのだが、外乱(割り込みとか)に弱いのよ。

論文でやってるような性能評価はアプリケーションレベルの
シミュレーションなので、外乱が一切ない状況なので、
実際は論文のようにうまくいかないことは、すでにPentium4と
Itaniumで懲りたんじゃないのかと小一時間。。
90Socket774:04/12/27 00:16:10 ID:Ro24r0cI
>>86
パクリメーカはAMDだろ。
編厨にはIntelの技術は何でもパクリにみえるんだね。
編厨の脳みそのエラッタ誰か改善してくれ。
91Socket774:04/12/27 00:42:42 ID:Ro24r0cI
PARROTはTransmetaのアーキに似てはいるが、
技術的トレンドから言って、Transmetaと似たようなものになってしまった
と見るのだ妥当だと思われ。
これはP6とNexGen開発時期が重なっていて同じようなアーキに
落ち着いた状況と似ている。

それからイリノイじゃなくてイスラエルチームの技術なんだけどね。
ちゃんと論文見て確認してくれ。
92Socket774:04/12/27 01:01:10 ID:Ro24r0cI
実はこの手の動的コード最適化技術は、盛んに研究されていて
特にいちはやく目をつけていたのはTransmetaではなく、実はIBM(1997)。
ttp://www.research.ibm.com/vliw/isca31/Daisy%20-%20Dynamic%20Compilation%20For%20100%20percent%20Architectural%20Compatibility.pdf

マイクロアーキの開発にはそのときどきのトレンドってものがあって、
動的コード最適化やトレースキャッシュ系の技術は最近さかんに研究されている
分野のひとつで、IntelのPARROTもそのトレンドにのったもの。

すぐに"パクリ"という表現で片付ける香具師はまったくこの分野のトレンド
がわかってないと思う。
93Socket774:04/12/27 14:32:00 ID:NbqIW9XY
だからPARROTはイリノイのrePlayその他が元になってるんだってば。
http://www.cs.ucsd.edu/users/calder/classes/spring04/240B/papers/PARROT-ISCA04.pdf
ほれ。
94Socket774:04/12/27 15:15:13 ID:LnMMFek3
>>90
IntelとAMDはアーキテクチャ分野で技術提携してますが
拡張アーキテクチャの相互利用、相互開発でしょ。
95Socket774:04/12/27 18:59:44 ID:Tm1XnSq7
故・ノイマン博士>>>>越えられない壁>>>>CPUベンダ

これ定説。
96Socket774:04/12/27 23:19:07 ID:F14fk8x3
>>89にも書いたが、
インテルはprecise interruptをどうやって実装するつもりなんだ。
特許ネタだから出てこんのか。
97Socket774:04/12/28 01:26:32 ID:LvfgMejP
>>96
DaisyやらCrusoeやらが採用している方法では
問題があるんですか?
98Socket774:04/12/28 18:37:52 ID:vEjDIYkw
>>91
まぁ最適化がおまけだとするとwww
エミュレータをソフト〜ハードのどこに実装するかではあるよね

ソフトだけ:
OS組み込みで完全にソフトでやるのが
PPCで68kコードのMacOSとか
Itaniumでx86実行するIA-32EL(Itanium自体にx86ハードエミュもあるけど早くも互換性のためだけ?)

ソフト+ちょっとハード:
OSからもBIOSからもただのx86互換チップにしか見えない(Transmeta以外はVLIWコードを直接走らせることはできない)
けれどCMS=ソフトでx86エミュレート(?)してるクルーソー・エフィシオン

ハード(+ほんの少しソフト?)
PARROT? リコンフィギュアラブルが最近の流行だから
ある意味でソフト的な要素ってことになるのかな?
99Socket774:04/12/28 18:50:47 ID:vEjDIYkw
>>95
故・ノイマン博士 ってフォン・ノイマンのこと?
EDSACの論理担当をやってただけなのに
(すでにノイマンは高名な数学者だったのでプロジェクトの箔付けの意味で開発してた大学の意向?)実装担当者が考えたプログラム内蔵方式(いわゆるノイマン式)を
自分の名前で研究発表しちゃったもんだから実装担当者は怒ってプロジェクトやめちゃったらしいよ
100Socket774:04/12/29 00:30:51 ID:QPBpOjIX
エビのうんこたれ
101Socket774:04/12/29 02:56:46 ID:rg3FfbST
>>99
そんなのどこでも聞く話じゃないか(涙
102Socket774:04/12/29 06:08:34 ID:InW08WYh
>>93
その論文の具体的にどこがイリノイのが元になってるのか?
無理に自分の意見押し通そうとするなよ。
103Socket774:04/12/29 14:46:09 ID:QPBpOjIX
>>102
2ページ目のおわりのほうに
Our results complement and strengthen the rePlay study
showing the significant contribution of dynamic optimizations
to IA-32 based processors.
(略)
とあるだろうが。

英語読めないんなら言ってくれ。翻訳してやるから。
104Socket774:04/12/29 15:09:01 ID:InW08WYh
>>103
結構だが、それで>>84がイリノイ大学の論文は信用できないって言う理由は何故
なんだろうか?
105Socket774:04/12/30 09:44:12 ID:1h2GwW+E
プロセッサの性能向上には
1.性能が出ない場合をなんとかカバーする
2.もともと性能が出ているところをさらに速くする
と二通りの方向性があって、victim cacheなんかは1なんだけど、
イリノイ大の研究はほとんどが2なのよ。

rePLayとかPARROTみたいなトレースの最適化が有効になるためには
そもそもトレースキャッシュのヒット率が高くないといけないわけだが、
論文でやってるようなアプリケーションレベルの性能評価環境に比べて、
実機は割り込みやらコンテクストスイッチやらがあるので
同じ容量でもヒット率は(俺感覚では、かなり)下がる→
思ったほど性能が出ない、という破目になる。

もっとも実環境での性能評価は大学レベルでは極めて難しいので仕方がない
のではあるのだが、それはいいとして、
どうもネタが最大限有効になるようなパラメータチューニングやってるっぽい。

というわけで、論文にでている性能評価を鵜呑みにするのは危険じゃねーの。
106Socket774:04/12/30 15:16:03 ID:CrjJUiah
その「俺感覚」について詳しく。
割り込みの影響なんて、たいして効かないと思ってた。
107Socket774:04/12/30 20:53:48 ID:kWYdBiJt
>>106

105ではないけれど、論文発表だと大抵のキャッシュヒット率は90%台にのせてるのだな。
で、例えキャッシュを倍にしても、少なくとも数字の上では数パーセントもヒット率は
変化しないんだ、これが。

ところが、実際にキャッシュが増大されたCPUを使ってみると…
体感出来るぐらいには変化しちゃうんだなぁ…(^^;;;
108Socket774:04/12/30 21:02:47 ID:CrjJUiah
90%台のHit率が数%変わったら大違いだと思うよ。
Miss率で考えたら分かる。
109Socket774:04/12/30 21:10:23 ID:1h2GwW+E
Rotenbergの論文
http://www.tinker.ncsu.edu/ericro/UW/papers/TC_micro29.pdf
の最後のほうにも出ているが、トレースキャッシュは一般的にヒット率が低い。
理由は、本文2.2に出ているが
Specifically, a trace cache hit requires that
(1) the fetch address match the tag and
(2) the branch predictions match the branch flags.
ついでに、トレースキャッシュは同じアドレスの命令を複数ラインに
コピーするため、実効的な容量はさらに減る。

ところで、割り込みが起きると普通のキャッシュと同様に有効なキャッシュ
ラインが追い出されるが、実は分岐予測テーブルのほうも分岐履歴が乱され、
予測率が低下する。
トレースキャッシュの場合は、2があるので普通のキャッシュに比べさらに
不利になるわけ。
110Socket774:04/12/30 22:37:42 ID:aN/iCZ2/
キャッシュって何msecも保持し続けないと効果が薄いなんてことはないと思う。

毎秒1万回、コンテキストスイッチする場合でも、
1GHzのCPUなら0.1msecに100kクロックもある。

それにコンテキストスイッチしなくても、
同一コンテキストでキャッシュから追い出したりすることもある。
111Socket774:04/12/31 14:47:55 ID:qkmwWzDS
パーシャル・パイプラインストールって何?おしえてprz
112Socket774:04/12/31 15:06:27 ID:Q8PsfqlS
>>111
まじめに作るのめんどくせーし、誰も使ってなさそうだから適当に作っちゃえ、
ってこと。細かいことを飛ばすとそういうことだ。
113111:04/12/31 15:46:12 ID:qkmwWzDS
>>112
細かいこともよろしく(うまくググれないんで)
114Socket774:04/12/31 17:41:31 ID:Q8PsfqlS
>>113
パーシャル・ストール
パーシャル・レジスタ・ストール
パーシャル・フラグ・ストール
パーシャル・メモリ・ストール

ググれたけど。要するにレジスタをつなげた時のために、まじめに(ry
115Socket774:04/12/31 18:46:30 ID:qkmwWzDS
>>114Thanks

どうも「パーシャル・パイプラインストール」では中心をついてなかったようです(´・ω・`)ショボーン
パイプライン全体っていうよりも主に演算ユニット関係みたいですし
116あけおめ:05/01/07 01:52:52 ID:PHKtVMq8
バイトコード直接実行型JAVAチップとか(FPUだけど)x87とか
昔一時スタック構造レジスタ・アーキテクチャがなんで流行したの?
今からするとわざわざ(偽)依存性作ってるだけにしか思えないんだけど
メリットくわしく教えてprz
117Socket774:05/01/07 02:27:32 ID:euve/a5b
>>116

スタックマシンに関してはちょっと調べれば一杯出てくると思うけど…。
っていうか逆ポーランド記法との相性が良くてコンパイラの設計がしやすいって
のが古典スタックマシンでの最大のメリットだったような…。
スタック操作は基本操作の一つな訳で、関数コールなんかでも頻繁に登場したり
する訳だから、ネイティブで操作できるってのは大きなメリットになりうる。
forthなんて専門に扱える言語もある訳だし。後でデメリットも判明した訳だが。

で、x87やJAVAはその手の流行からは後の話で、そういう都合では無いだろう。

x87は命令コードの節約とか色々な都合からそうなってるんだと思うね。
JAVAバイトコードに関しては当初から色々と言われているけど。
なんかの学会でパターソンだかが「なんで今更スタックマシン?x86ネイティブ
コードの方が良い。なんたって十分普及してる〜」と突っ込んだらしいぞ(笑)
正直JAVAは設計者の趣味でそうなってるんだと思う訳だが(^^;
118Socket774:05/01/07 04:22:26 ID:PHKtVMq8
>>117THX
なるほろ
119Socket774:05/01/07 10:52:48 ID:Zs1yttfw
Javaのバイトコードがスタックマシンになっている理由は
・コード密度
・検証のしやすさ
・スタックマシンのほうが性能のよいインタプリタが実装可能
ってところ。

年寄りはひっこめってカンジ>パターソン
120Socket774:05/01/07 20:55:08 ID:HGzA2hK+
ハードで実装するときは高速化が難しいんだけどね<スタックマシン
121Socket774:05/01/07 21:27:42 ID:J8BhqoX0
時代が違うからね。CPUにパイプラインもスーパースケーラも実装されてなく、
メモリアクセスがノーウェイトだった頃は十分に存在意義があったと思う。
122Socket774:05/01/07 21:47:11 ID:29DTjhte
そういやJAVAは、最初はアプレットで売り出したんだよな。
コード密度は重要な気がする。

Sunの奴らはFORTH大好きだからスタックマシンになったんじゃないのか…
123Socket774:05/01/07 22:37:49 ID:Zs1yttfw
トロンチップをスタックマシンにしたかったが産業界から猛反発を食った坂村さん
124Socket774:05/01/08 00:01:51 ID:UA5T6RIA
それはともかく、今日日ヘネパタは教科書としては二流だな。
読まなくていいよあんなの。
125Socket774:05/01/08 00:33:33 ID:bolYybsj
じゃあパタヘネは?
126Socket774:05/01/08 00:51:10 ID:UA5T6RIA
パタヘネは学部向けとしてはわりといい本だと思う。
127Socket774:05/01/08 01:53:18 ID:UA5T6RIA
128Socket774:05/01/08 04:58:04 ID:dpxcTJV2
英語の勉強のために、表紙に白地にそろばんが書かれている本を古本で買いました。
再生紙に、しょぼい装丁、いまどきMIPS R2000/3000かよ、でも500円なら英語の勉強には安いな、と。

読んでみてビックリ。
こりゃ面白い。
結局、英語の勉強にはなりませんでしたが・・・。
129Socket774:05/01/08 17:19:41 ID:UA5T6RIA
130Socket774:05/01/08 19:05:09 ID:UA5T6RIA
131Socket774:05/01/08 20:05:16 ID:UA5T6RIA
132128:05/01/08 20:55:55 ID:dpxcTJV2
漏れが読んだのはパタヘネの1st editionだったのかな・・・

amazonにある、2nd editionや3rd editionとも表紙が違うから。
133Socket774:05/01/16 23:18:36 ID:JQ/0slsG
age
134Socket774:05/01/17 05:58:33 ID:Yxna+U2t
ヘネパタ
135Socket774:05/01/17 17:48:29 ID:JGQJjDy3
Googleで「ヘネパタ」を検索したら、Amazon.co.jpがトップに出るね。
136Socket774:05/01/22 14:20:17 ID:auvbNaSz
.neのCLIもスタックマシンなんだよね
この手のはスタックマシンのが良いんだろう
137Socket774:05/01/22 21:41:51 ID:LZpdGkkX
>>136

PASCAL世代(アメリカでは一時期、教育にPASCALが使われていた)は
スタックマシンに愛着があるんだろ…。
コード密度って意味だけなら、CISCの権化である所のx86は高い訳だし〜。
138Socket774:05/01/23 01:46:57 ID:G65KHM+Z
コンパイラ作るのらくだからねぇ<スタックマシン
でもハードウェア実装の方を高速化するのはかなりきつい。

まぁ中間コードならありだとは思う。
.netとかはそういう感じだろう。javaもそんなところ。
139Socket774:05/01/25 12:25:10 ID:IYDEq4Xa
ム板の興味深いスレ紹介しておきますね。

x86命令の所要クロック計測スレ
http://pc5.2ch.net/test/read.cgi/tech/1103609337/l50
140Socket774:05/01/25 20:40:10 ID:LbiVXQOt
前にも書いたことがあるが、
スタックマシンはコードの検証がコードサイズnにたいしてO(n)。
レジスタマシンだと全パスをたどって検証しないといけない。
141Socket774:05/02/07 18:08:55 ID:k9ilUfpH
ここは自作板で最もコアなスレだと思う
142Socket774:05/02/07 22:54:02 ID:lTKXkp/b
このスレ読む前にまずヘネパタ
143Socket774:05/02/08 15:50:47 ID:Dl13tU5Z
144Socket774:05/02/08 22:43:57 ID:/PvOt/6o
立ち上がれ
Z戦士達
145Socket774:05/02/12 16:29:36 ID:ii4lgVsN
CellのSPEおもろいね
Itaに対抗できる
146Socket774:05/02/14 23:12:06 ID:IYxDAQvy
前スレみて感動しました。
そろそろ、うんこねたで「良くわかるマルチスレッド」とか
お願いします。
147Socket774:05/02/15 03:54:27 ID:1dY290kp
待ち行列理論の説明は、普通は銀行の窓口でやるんだけどな・・・
148Socket774:05/02/15 08:58:09 ID:6I2si/iU
TLBフラッシュのロスを減らすために、一つのCPUに同一プロセスのスレッドを
なるべく張付けておきたい、こういうのも待ち行列理論であっさり解決するの?
149Socket774:05/02/15 13:01:48 ID:XuMjKZEV
富士通研究所、4つの「FR-V」プロセッサーコアを1チップに集積した
デジタル民生機器向けCPUを発表
――世界初の8way VLIW CPUによるクアッドコアCPU

ttp://ascii24.com/news/i/tech/article/2005/02/07/654086-000.html
150Socket774:05/02/16 17:37:35 ID:47JxOk08
超亀レス
ttp://pc5.2ch.net/test/read.cgi/jisaku/1082357989/236(前スレ)
>236 名前:Socket774[sage] 投稿日:04/05/14 04:17 ID:o8pcTKwR
>x86の有利な点を無理に言えと言われれば、レジスタが少ないので
>コンテクストスイッチが少し速くなる可能性がある事かいな。

>x86-64なんかでは、増えたレジスタをスイッチの度に全部待避する
>んだろうか?


(時間的には前だけど236は多分見てない)
http://pcweb.mycom.co.jp/articles/2004/03/10/64bitwindows/002.html
>DivX Video Compressionのスコアが64-Bit Editionで半減するのは興味深い。
>DivX Codecはマルチスレッドを利用しているため、シングルCPUではコンテキスト切り替え(スレッド切り換え)のオーバーヘッドが表面化している可能性がある。
>64ビットCPUはレジスタサイズが大きい上に、レジスタ数も増えており、32ビットWindowsよりもコンテキストの切り替えに時間がかかるためだ。

x86-64程度でこんなことになるんなら外から見えるレジスタ増やすのもメリット・デメリットあるね
クライアントとは比較にならないマルチスレッドに違いないItaniumはどうしてるんだろう?
151Socket774:05/02/16 18:44:24 ID:k/VIsFPJ
>>150
「レジスタ・スタック」について調べてみるといいですよ。

Itanium以外にも多くのレジスタを持つCPUはあって、
SPARCのレジスタ・ウィンドウがとても有名です。

ちなみに、
DivXのスコアが半減する理由が、レジスタ数増加による云々は、なんか違う気がします。

64ビット版のWindows(しかも当時のベータ)で、
32ビットのDivXを走らせた場合の話なのですから。
152Socket774:05/02/16 18:48:53 ID:DhREKjjA
うんこねたで「良くわかる***」を書いた方は、
もうこのスレみてないのかな…
153Socket774:05/02/17 18:46:14 ID:NpFvNTby
パタヘネ2使って教えてるんだけど、3章と5章でつまづくやつがいっぱい。
メモリとレジスタの関係とか、アセンブリ言語の文法的なこととか、
なんであのデータパスで命令が動くのかとか、ごちゃごちゃになる人種が多いのよ。
どうにかわかってもらえるような、
うまいモデルとか、ビジュアルなシミュレータとかない?
spimはいまいち。
154Socket774:05/02/17 22:35:48 ID:kLjSne2T
Alpha21364最強
155Socket774:05/02/18 23:19:39 ID:F54CCw8j
>>153
そんなんで つまずく学生には単位やらなくていいよ。

俺が学生の頃は、これ読んでおいてください。
とてもよい教科書なので、読めばわかります。
授業は読んでいることを前提に、話をします。

っていう先生だったよ。
んで、授業では本に書かれていない難しいことや新しいことが中心。
でも、試験の内容は本に書いてあることだけという、優しい先生だった。
156Socket774:05/02/18 23:29:59 ID:XX2qbL5p
このスレはやけに詳しそうな発言をするやつが多いが、
会話になってないし、最新のトピックに弱い気が。
みんなホントは制御用のマイコンとかしかさわってないだろ?
157Socket774:05/02/18 23:35:09 ID:F54CCw8j
本当に語れるような人は、2chやってないと思う。
だってさ、誰が話についていけると思う?
158Socket774:05/02/19 00:05:23 ID:T9bWodVH
>>157
書き込まないだけだと思われ
159Socket774:05/03/04 00:30:33 ID:O/dsxusn
最新のトピックを判りやすく噛み砕いてトイレモデルで説明するには
校正の時間がたりない。ってゆーか最新の研究なんておっかけるだけで
精一杯ですよ…。>>155のセンセイはとてもスバラシイ人だとおも。
160Socket774:05/03/04 02:31:06 ID:ElG0q8QC
>>155はその業界にいる現役のライターとみた。
161Socket774:05/03/08 09:22:00 ID:3rtP4fCC
MIPSだぞ!

東芝、64bit MIPSアーキテクチャマイコン
http://pc.watch.impress.co.jp/docs/2005/0307/toshiba.htm

デジタル情報機器向けMIPSアーキテクチャ64ビットRISCマイコンの発売について
http://www.toshiba.co.jp/about/press/2005_03/pr_j0701.htm
162Socket774:05/03/08 15:38:01 ID:s/VE6xp7
ふと思ったんですけど、CMSの対応があればIA64→VILW変換して、
IA64のCPUとして使うことも技術的には可能だったりします? トランスメタのCPUって
163Socket774:05/03/08 21:27:41 ID:jBO1fX5j
>>162
けっこーいろんな部分が、x86 対応のために作られてる感じ。
バイトコード程度だったらまだしも、他アーキテクチャを
うまく真似れるよーな構造じゃないと見受けた。

Crusoe Exposed というドキュメントを読んだことある?



ていうか、痛ニウムの Bundle が、IA64 に最適化されてるよーな希ガス
164Socket774:05/03/08 21:59:32 ID:s/VE6xp7
>>163
流石に汎用とは行きませんか。
そのドキュメントは読んだこと無いです。他の技術系ドキュメントも・・
165Socket774:05/03/09 00:58:27 ID:sxMEfpIw
CMSをバイパスして、ネイティブコードで走るLinuxって、どうして誰も作らないのかな。

BIOSやCMSが隠蔽してるけど、メインメモリのCMS領域をCPUからではなく、
PCIバスなどから書き換えれば、CMSを乗っ取れるような希ガス。
166Socket774:05/03/09 00:58:56 ID:sxMEfpIw
・・・労力の割に、得るものが少ないからか。
167Socket774:05/03/09 16:33:32 ID:cpEl32e1
>>165
Crusoeはメモリコントローラ内蔵だから、PCIバスからのアクセスをできないようにもできるだろう。
その程度の保護はしていると思われ。
168163:05/03/09 17:54:35 ID:HyJmiNzN
>>164
Crusoe Exposed: Reverse Engineering the Transmeta TM5xxx Architecture
http://www.realworldtech.com/page.cfm?ArticleID=RWT010204000000
http://www.realworldtech.com/page.cfm?ArticleID=RWT012704012616

>>165>>167
挙げたドキュメント読んでわかると思うけど、
PCIバス側から抜いた、と書いてある。
TM5x00 では可能、ということだね。
イヒでできるのかどーかはまだ知らない。
169MACオタ>163 さん:05/03/09 19:15:41 ID:d2oI39da
>>168
その文書読んで理解できなかったんなら絶望的すけど、Clusoeわ命令MMUを持たないので、コードモーフィング
ソフトウェア「しか」動かないようになっているす。
170165:05/03/09 20:23:17 ID:sxMEfpIw
MMUないのか。

じゃぁコンパイラがネイティブ命令を吐き出しても、
実行する前に動的に手直ししなきゃいけないのか。
171Socket774:05/03/11 15:03:58 ID:CtWQy0eS
172Socket774:05/03/11 16:00:27 ID:w7nh1iVY
仮想化技術の
↓これってなんて読むの?
xen
173Socket774:05/03/11 16:50:23 ID:mwJWQVvw
ゼン
174Socket774:05/03/19 03:03:16 ID:82LQ7K1Q
最新のCPUアーキテクチャを勉強するにはなんの本を読めばよいですか?
175Socket774:2005/03/22(火) 12:38:01 ID:2P/IyxIR
.          \                /
.           \             /
.             \          /
.              \ ∧∧∧∧/
.               <    俺 >
.               < 予 し  >
.               <    か  >
. ─────────< .感 い  >──────────
.               <    な  >
.               < !!!! い  >
.               /∨∨∨∨\
.              /         \
.            /            \
.           /     (-_-)       \
.         /       (∩∩)        \
176Socket774:2005/03/22(火) 20:34:36 ID:M86fCwjc
なんか日付のファーマットが変わってるよ!
177Socket774:2005/03/24(木) 10:56:20 ID:1J7J3WZN
ファーマット?
178Socket774:2005/03/24(木) 15:52:20 ID:PVznCR9x
毛皮でしょう
179Socket774:2005/03/27(日) 15:19:30 ID:KwupgcMW
180Socket774:2005/03/27(日) 15:27:06 ID:KwupgcMW
>>179
うわ、めちゃくちゃいいなこれ

Computer Organization and Design: The Hardware/Software Interface, Third Edition
http://www.amazon.com/exec/obidos/tg/detail/-/1558606041/

(´-`).。oO(こういう本が日本で出ないのはなぜだろう..)
181Socket774:2005/03/28(月) 00:05:07 ID:Tk5pAprv
>>180
釣りですか?
182181:2005/03/28(月) 00:17:36 ID:Tk5pAprv
ちなみに、類似本が出ないのは、ヘネパタ・パタヘネの2冊があるのに、
同じような内容の教科書を書く無駄をする教授がいないためだと思われ。

何冊もCPUのアーキテクチャの教科書を書いた教授でさえ、
ヘネパタ・パタヘネを教科書に指定しているくらいだからさ。

#漏れが学生の頃は、日本語訳なんてなかったから、原著でした。
輸入で一冊8千円くらいしたよorz
183180:2005/03/28(月) 07:44:47 ID:CpaHPWhz
>>181
このスレがあまりに閑散としてるから釣ってみた。

>>182
アーキテクチャの技術ってさ「なまもの」みたいなものじゃん?賞味期限みたいな奴?
だからさ、最新のCPUアーキテクチャが載ってる書籍がバンバン出る米国はいいなって思っただけ。
それだけが言いたかったのさ。

まぁ、それに対する返事はきまって「原書読め」って言われるんだけど..
184Socket774:2005/03/28(月) 12:08:09 ID:9eKgd4lS
ま、パタヘネ3だって、MIPS対抗馬としてPowerPCやめてIA-32しかなくなった。
185180:2005/03/28(月) 13:20:23 ID:CpaHPWhz
>>184
えっ? パタヘネ3って以下のアーキテクチャを解説してるんでしょ?
+ Intel IA-32
+ Power PC 604
+ Googles PC cluster
+ Pentium P4
+ SPEC CPU2000 benchmark suite for processors
+ SPEC Web99 benchmark for web servers
+ EEMBC benchmark for embedded systems
+ AMD Opteron memory hierarchy
+ AMD vs. 1A-64

あと、ハードウェアで、
+Using logic design conventions
+Designing with hardware description languages
+Advanced pipelining
+Designing with FPGAs
+HDL simulators and tutorials
+Xilinx CAD tools

ソフトウェアで、
+How compilers Work
+How to optimize compilers
+How to implement object oriented languages
+MIPS simulator and tutorial
+History sections on programming languages, compilers, operating systems and databases

ってに関する事が書かれてるらしい。

#ついでに言うと1A-64でなくてIA-64だと2ch経由でつっこんどく
186Socket774:2005/03/28(月) 16:01:17 ID:t0yyhceg
>>183
PCIバスの技術書もアメリカ発のしかなくて、
落胆した人もいたらしいとか聞いたことがある。
本があってその出来がどうのこうの以前に、
日本からこういった本が出ないあたり、
この分野でアメリカを追い抜けないのは当然な感じがする。
187Socket774:2005/03/28(月) 16:33:18 ID:Tk5pAprv
>>186
んなことはないよ、PCIバスの解説書は、CQ出版とかから出てるよ。
規格によっては、JISで制定するという名目で、日本語訳が行われていたり・・・

でも昨今の、国が無駄な支出してるとか叩かれているので、
そういう日本語化しましょうプロジェクトは縮小の方向かもね。
188180:2005/03/28(月) 16:47:03 ID:CpaHPWhz
>>187
>んなことはないよ、PCIバスの解説書は、CQ出版とかから出てるよ。
PCI-Expressの解説書も出てたっけ?
日本語での文書があったら読みたいんだけど。

>でも昨今の、国が無駄な支出してるとか叩かれているので、
>そういう日本語化しましょうプロジェクトは縮小の方向かもね。
( ・∀・) ヘェー  ソンナ プロジェクト アルナンテ シラナカッタヨ

そこで、出版社の出番ですよ。どこか出して♥
189Socket774:2005/03/28(月) 21:03:01 ID:Tk5pAprv
>>188
PCI-Expressはクローズドな規格だから・・・。

インテルにあったPCIの規格書のページもなくなって、PCI-Express用になっちゃっててorzですよ。
190Socket774:2005/03/28(月) 21:23:34 ID:acokHm0/
日本規格協会(?)から入手できるいろいろな規格書の翻訳版。
いまも意味不明の翻訳、レイアウトもぼろぼろ、値段は英文の
2倍以上ですか?
191180:2005/03/28(月) 21:38:00 ID:CpaHPWhz
>>189
とりあえず書籍は出てるみたいだからなんとかなる。(と値段を考慮せずに言ってみるテスト)
http://www.amazon.com/exec/obidos/tg/detail/-/0321156307/
http://www.amazon.com/exec/obidos/tg/detail/-/0971786194/
http://www.amazon.com/exec/obidos/tg/detail/-/0970284691/
http://www.amazon.com/exec/obidos/tg/detail/-/0976086514/

>>190
>日本規格協会(?)から入手できるいろいろな規格書の翻訳版。
>いまも意味不明の翻訳、レイアウトもぼろぼろ、値段は英文の
>2倍以上ですか?
ワロタ

誰かこんなアプリ作って!
$ cat 英語文書 | jptranslate > 日本語文書
192Socket774:2005/03/29(火) 14:35:37 ID:JvOLAzHo
>>190
笑うということは、いまだにそうだ!と思っていいのかな、日本規格協会…
193Socket774:2005/03/29(火) 14:36:00 ID:JvOLAzHo
>>191だった…orz
194Socket774:2005/03/30(水) 11:08:52 ID:sGYxa6tA
ま実際読む側にとってみれば、笑うところというか、苦笑いするところ
195Socket774:2005/03/30(水) 14:16:03 ID:e8JjiX+W
原文を想像しながら読むこともあり。
で、結局、原文で確認することもあり。
196Socket774:2005/03/30(水) 20:31:19 ID:Fcy9FrFA
【結論】
最初から原文を読んでいれば原文と翻訳文の間に
コンテキストスイッチが発生しない分、パフォーマンスが上がる。
197Socket774:2005/03/30(水) 21:33:12 ID:gsxO/tZE
なるほど
198Socket774:2005/03/30(水) 22:50:56 ID:Fcy9FrFA
>>196
でも、実行可能状態になれるかどうかは脳内コンパイラの出来しだいだなw
199Socket774:皇紀2665/04/01(金) 01:35:44 ID:JXCmTpKd
5/31の情処SIGARCの研究会で、究極のスーパースカラプロセッサアーキテクチャが発表されますよ。
200Socket774:PC/AT21/04/01(金) 12:52:48 ID:CNYZyTAs
至高のスーパースカラプロセッサアーキテクチャも発表されますか?
201Socket774:2005/04/04(月) 07:51:04 ID:IVUl745v
ページングよりも効率のいいメモリ管理方法を研究してる人っているの?
あっても誰も使わないだろうっていう話はさておいてさ。
202Socket774:2005/04/04(月) 14:07:04 ID:26JHJ8oJ
どの効率にもよるかだが。
大容量二次記憶と併用するならば、TLBツリーによるページングはベター。

もちろんいちばんパフォーマンス的に効率のいいのは、仮想記憶に頼らず、
積めるだけメモリを積むことだってのは、わかるよね?

i386 のセグメントモデル、調べてみ? OS/2 は多用してるんじゃなかったかな。
203Socket774:2005/04/04(月) 20:09:10 ID:HnXeW0/5
このスレで話すからには、
仮想アドレスから実アドレスを生成する効率の話だよね?
204Socket774:2005/04/07(木) 19:01:00 ID:fKsucoM2
>>203
それはMMUの事か?
205Socket774:2005/04/08(金) 11:21:19 ID:csFKiqom
>もちろんいちばんパフォーマンス的に効率のいいのは、仮想記憶に頼らず、
>積めるだけメモリを積むことだってのは、わかるよね?
二次記憶を使わないモデルでも、
仮想記憶を用いて実ページを共有するのは効果的ですよ。
206Socket774:2005/04/08(金) 15:04:55 ID:2YDUZyMW
CPUのアーキテクチャのスレで、OSの仮想記憶の実装について語りますか・・・。
207Socket774:2005/04/08(金) 21:27:07 ID:Q0ReJvCj
使われ方を理解しないでどうするのさ?
208Socket774:2005/04/09(土) 20:23:39 ID:08wv+Yrj
CPUが例外を出した後の処理なんてOSの仕事だからどうでもいいよ。
どのページから捨てるかといった、そういった処理なんてCPUは関係ないから。
209Socket774:2005/04/09(土) 21:01:58 ID:dcwvQhVL
こいつはOSの動かないCPUを作りそうだな。
210Socket774:2005/04/09(土) 21:20:11 ID:IwTmNaNn
まるでMC68000のようですね
211Socket774:2005/04/09(土) 23:48:23 ID:EnLf8kAF
鶏が先か卵が先かっていう話。
212Socket774:2005/04/10(日) 06:10:29 ID:eEhEQBsh
>>205のような話が、CPUのアーキテクチャと関係があるとでも?
213Socket774:2005/04/10(日) 13:01:14 ID:y8c3jphn
あるに決まってるじゃん。
214Socket774:2005/04/10(日) 13:16:17 ID:kM2cQRCo
なにも仮想記憶だけがCPUアーキテクチャの重要な機能というわけでも無いだろ。
215201:2005/04/10(日) 15:32:41 ID:C1mbhpXm
>>203-204
そういうことです
216Socket774:2005/04/10(日) 23:23:44 ID:kM2cQRCo
(・∀・) RISC!
217Socket774:2005/04/11(月) 01:11:53 ID:miDUdNrL
TLBトラバースをMMUで行わないアーキテクチャ、あったよね?
R3kとかだっけ?
218Socket774:2005/04/11(月) 12:54:59 ID:5refip3Y
80286に実装されたセグメンテーションによるメモリ保護機能は、
CPUアーキテクチャの重要な機能です。
外部PMMUからのバスエラーによる例外処理より遥かに効率的でした。
219Socket774:2005/04/11(月) 13:25:23 ID:QyxS7Tz4
他のプロセッサは集積度の問題でワンチップにならなかっただけでは?
220Socket774:2005/04/11(月) 14:05:00 ID:5refip3Y
ページマップ方式とセグメント方式ではあきらかに仮想記憶の実現方法
(というかメモリの管理方法)が異なり、むしろこれはCPUアーキテクチャに
よってOSの実装が決まるパターンです。OSだけじゃなくてアプリケーション
にも影響を与えますね。C言語系とは相性悪いはず。
221Socket774:2005/04/11(月) 14:06:22 ID:5refip3Y
ごめん、「だから、チップ実装の問題だけじゃないはずですよ」
と続きます^^;
222Socket774:2005/04/11(月) 15:21:41 ID:QyxS7Tz4
>>220
だとすると
>外部PMMUからのバスエラーによる例外処理より遥かに効率的でした。
これは余計な気がします。
必ずページマップ方式では外部からのバスエラーで例外処理をしないといけないわけではないでしょう?

通常のレジスタを持つFPUは、外部から命令を横取りして動作するx87より効率がよい。
といっているようなものです。

ねじれているというかはぐらかされているというか問題はそこじゃないだろというかなんというか。
223Socket774:2005/04/11(月) 17:05:50 ID:5refip3Y
あー、ごめんなさい、確かにそのくだりは余計ですね。
言いたかったのは、ソフトウェアのトレンドによってCPUアーキテクチャも
大きく影響をうけるんで、「CPUは関係ない」なんてこたぁないって事です。
224Socket774:2005/04/11(月) 22:11:31 ID:jmvmX1ZY
あのさ今ふと思ったんだけどさ、
Amazonとかのレビュー評価とかあるじゃん?
あれさ、結構たくさんの人が5や4とか付けてる書籍がたまにあるけどさ、
それってレビュアー自身から見た相対評価なんだよね。絶対評価じゃなくて。
そうなるとさ、そのレビュアーのレベルが低くってむちゃくちゃ褒めてたりしてた場合に
中級者や上級者がそれ見て買った場合、地雷を踏むことにならないか?

結局、買う前に内容を調べられたらいいなと思う今日この頃。
225Socket774:2005/04/11(月) 22:18:27 ID:Tq0OJnF4
amazonのレビューなんか全部提灯と思え
226Socket774:2005/04/12(火) 00:07:42 ID:TlDl7QOU
P4がしょぼいのはさておき、
なんでこんなにSunFire 6800は効率が落ちないの?
おしえてエロイ人!
ttp://compression.ca/pbzip2/
227Socket774:2005/04/12(火) 00:56:44 ID:0Eefkxq8
>>224
むしろ、誰もレビューしてない時がとってもリスキーという罠。
228Socket774:2005/04/12(火) 03:52:44 ID:0Eefkxq8
>>226
なんだよおい、SunFireだけCPU数が無茶苦茶多いじゃねーか。

Athlon MP-2600+   = 2
Oteron 240       = 2
Pentium4 3.06 Xeon  = 2
Itanium2 900      = 2
SunFire 6800      = 24
229Socket774:2005/04/12(火) 04:32:29 ID:F3JFlJs/
SPARCヽ(´ー`)ノバンザーイ
230Socket774:2005/04/12(火) 08:47:38 ID:UJgd9aql
>>228
>226
>なんでこんなにSunFire 6800は効率が落ちないの?
>SunFire 6800は効率が落ちないの?
>効率が落ちないの?
231Socket774:2005/04/12(火) 08:55:01 ID:JYXL7wI0
>>226
bzip2 が並列向きなアルゴリズムというのは知ってたが
実装を見つけることができなかった。あとで会社でさっそく試してみるよ thx.
232Socket774:2005/04/12(火) 11:02:32 ID:prxmCOms
>>226
良く並列チューニングされてるアルゴリズムなんだなぁ。
というわけで、質問まちがっとるで?

×なんでこんなにSunFire 6800は効率が落ちないの?
○なんでこんなにP4 Xeonは効率が悪すぎるの?

さておいちゃダメだぞ、これ重要(笑)
SharedBusの弱みでちゃって帯域たりてないんだろうなぁ…。
233Socket774:2005/04/12(火) 15:27:34 ID:MQB1e9Jd
2プロセッサのグラフで最も効率が良かったItanium2 900MHzも共有バスですよ。

初代Itaniumで、FSB帯域が大ネックになった反省からか、
Itanium2ではバス幅とクロックが引き上げられたからね。

初代ItaniumはDDRのPC2100のメモリが出まわるよりも昔、
PC66の0.5GB/secの頃に設計されたものだから、
あれでも十分にFSBが広かったのだけど、まぁそれはいいや。

Xeonの場合、Pentium4と共通設計なので、バス幅を変えられない。
そういう縛りがある場合、共有バスよりも一対一接続がいいよね。
234Socket774:2005/04/12(火) 20:34:08 ID:k9YF7yc+
1) SunFireの方が高いから。
2) SunFireは1CPUが遅いから。
235Socket774:2005/04/13(水) 10:24:21 ID:qjy68M9F
全てのメモリが全てのCPUから透過的に扱えるけど尋常じゃないバス帯域を要求されるのと、
NearLocationとFarLocationで速度変わっちゃうけどCPU増えれば総大域が増えるのと、
システム全体として扱いやすいのはどっちなんでしょうね。

ManyCore/MultiCPUなSMPへと今は向かってるんで、後者が有利な気もしますが、
効率的に使おうと思うとOSのメモリ管理機構のチューニング抜きじゃ
お話できないわけで…。
236Socket774:2005/04/13(水) 16:45:03 ID:N6T2vr5/
Opteronはcc-NUMA。
237Socket774:2005/04/13(水) 20:49:32 ID:tqDss7Ew
扱い易いのはSMP。ただし大規模なものが作れるかが問題。
238Socket774:2005/04/13(水) 22:57:16 ID:hs7y2jxU
DECのAlphaが常に先端した技術を開発していたのに無くなっちゃうとはなぁ..
まぁ結局、元Alphaの開発者達はIntelやAMDに四散して、
その後に出たPen4のSMTやOpteronのHyperTransportとかにその技術が引き継がれたわけだが。
ていうか、買収した会社がその恩恵得ていないという罠。w
239Socket774:2005/04/14(木) 00:15:40 ID:KudkPrR2
>>238
K7ことAthlonも元Digitalのエンジニヤが深く影響してるよな。
240Socket774:2005/04/14(木) 01:05:34 ID:2ywfQf8L
>>239
そう考えるとDECのアーキテクチャ研究開発部門って凄かったんだな。
241Socket774:2005/04/14(木) 02:26:53 ID:fVFF3Yph
Alphaはすごかったなあ・・・
IntelのPIIとならべてNT4.0上でベンチマーク競争させたときに、
ぶっちぎりの性能たたき出してた・・・
あと、ギネスブックにも載ってたはず。
世界最高速の単体CPUとして。
初期の受注生産で研究者向けのAlphaAXP150が100万だったかな?
とにかくすごいCPUだった。
242Socket774:2005/04/14(木) 02:42:05 ID:H3ooLEQE
>>241
値段がすごいな。
243Socket774:2005/04/14(木) 14:38:19 ID:hA5XAIc9
>>242
値段かよ!
244Socket774:2005/04/14(木) 16:22:26 ID:VduMvsa3
>>243
受注生産でぶっちぎりの速さで100万円だったらすごい値段の安さだと思うが?
245Socket774:2005/04/14(木) 16:57:05 ID:Y0cvArnd
http://en.wikipedia.org/wiki/DEC_Alpha
http://ja.wikipedia.org/wiki/DEC_Alpha

当時の DEC Alpha processor は史上最強だったというお話。
246Socket774:2005/04/14(木) 17:14:29 ID:eMfsVqL2
まぁ今の状態でたとえていえば、10GHzのプロセッサを出しているような状態だからなぁ。
電力消費は1kWって感じだが。
247Socket774:2005/04/14(木) 18:31:12 ID:Y0cvArnd
つうか、技術的にも当時の流行の先を行ってた感じだな。
Alpha AXP is cool !!
248Socket774:2005/04/14(木) 19:30:00 ID:qB449zGE
しかし自分でソフトを書かない人々や、書いてもそれを他人に売る人々は、
CPUの速さよりも、バイナリ互換のほうが重要だと考えたわけで・・・。

x86がデファクトになった時点で、つまらなくなったよね。
しかも今は並列化すりゃいいじゃん、という時代の流れ。
249Socket774:2005/04/15(金) 13:01:58 ID:aVh94cwW
27年間通用するアーキテクチャを謳ったAlphaも半分に満たない12年で息切れ…。
悲しいものですなあ。

>しかも今は並列化すりゃいいじゃん、という時代の流れ。
これ以上CPUのクロックアップ難しいから並列化しようそうしようってのは
15年前もおんなじこと唱えてたわけで。その度にBreakThroughがあったわけだけど。
当時25MHz駆動(選別品で33MHz、後にNECから33MHz品出荷)だったR3000のロジックを
ECLで組みなおして「うりゃぁ、66MHzの超々高速CPUだぜ!」って鳴り物入りでだした
R6000が民生品の安CPUなPentiumにあっさり抜かれたりね。

21064って確か3.3V駆動で48Wとか食ってさ、ぉぃぉぃCMOSで10A以上流すのかよ
馬鹿じゃねーの?とか笑ってた当時パソコンがこんななるとは想像だに…。

ギネスの名目は、世界で初めての単体CPUでCray1の性能をだしたプロセッサ、
だったはず。時系列問題なので記録の更新不可能。
250Socket774:2005/04/15(金) 20:22:40 ID:lGVZ8eoK
初代Pentiumも凄かったな。なんたって5V単一電源なんだから。
251Socket774:2005/04/15(金) 22:11:34 ID:5YK0c1Mg
初代Alphaってクロック当りの性能がそれほどでも無いような気がしたが。
Pentium4みたいなもんか。

>>250
今見るとヒートシンクがpoorで笑える…出してみようと思ったらヒートシンクは
捨てちまってた。orz
252Socket774:2005/04/16(土) 06:55:00 ID:QM3fczvA
>>251
初代もその次の世代もそんな感じだった気がする。
「止まっている時間の方が長い」なんて言われてた。
Pentium4も今10GHzオーバーの石があればねぇ。
253Socket774:2005/04/16(土) 10:03:24 ID:Qz51gNl1
>>252
21064で同クロックのPentiumの半分。21164で同クロックのPentiumIIの半分といったところかな。
しかしクロックは3倍だったわけで。それはそれで圧倒的。
254Socket774:2005/04/16(土) 12:36:26 ID:rT/qYqb8
効率が悪くてもいいからクロック上がるようにして、
ガンガン回せば問題なしというポリシーに関しては、
Alphaに比べれば、Pentium4なんて、かわいいな。
255Socket774:2005/04/16(土) 13:51:16 ID:Qz51gNl1
21264で化けたけどね。
256Socket774:2005/04/16(土) 15:15:33 ID:FAlkpz+D
>>254
RISC対CISC論争全盛の頃か?
257Socket774:2005/04/16(土) 23:15:59 ID:rT/qYqb8
>>255
そうそう。
クロック上げるのが難しくなってきて方針転換したね。

そして、クロックだけではインテルに追い抜かれるという・・・。
258Socket774:2005/04/17(日) 15:35:19 ID:InvoqAWV
サムソンがAlpha/strongARMで学んだから云々というけれど。
結局連中が学んだのは「人海戦術で回路最適化」だけだったりする。

alphaも人海戦術で手でちまちまと最適化したんだよね。
259Socket774:2005/04/17(日) 16:33:08 ID:BkwL7sEV
>>245のリンクに書いてある。
260Socket774:2005/04/17(日) 17:23:56 ID:gTeOj/GR
人海戦術なのは高速LSIではどこもいっしょじゃないの?
IntelやAMDが人海戦術でなかったら、そっちの方が驚き。
261Socket774:2005/04/18(月) 01:37:52 ID:HfE5S/aj
インテルは、演算器のところには人つぎ込んでるらしいね
262Socket774:2005/04/18(月) 20:46:53 ID:Vls4tRz+
他は合成・自動配置なの?それとも比較的人が少ないだけ?
263Socket774:2005/04/19(火) 02:11:02 ID:h5HzytJy
知らんがな
264Socket774:2005/04/19(火) 06:33:43 ID:hNQkWE+m
演算器というかクリティカルパスつぶしだな。
265Socket774:2005/04/19(火) 06:53:56 ID:hNQkWE+m
とはいえ21264のクリティカルパスはALUだったらしいけどな。
266Socket774:2005/04/19(火) 11:32:30 ID:gCdINbQf
今のsynopsysの解析ツールはかなり優秀だけどな。
インテルのALUは無茶やってるみたいだから人海戦術と内製ツールだろうけど。
267Socket774:2005/04/19(火) 20:52:50 ID:wrKUMDso
具体的なところは想像するしか無いわけだね?
268Socket774:2005/05/04(水) 22:32:12 ID:Lq4NKZcN
あまりこのスレで話題にならないが、
PowerPCの潜在能力はどうよ?
http://www-6.ibm.com/jp/servers/aix/developer/tech/power4/
269Socket774:2005/05/04(水) 22:41:29 ID:Lq4NKZcN
270Socket774:2005/05/05(木) 01:11:15 ID:K1QmWq/W
>>268
>あまりこのスレで話題にならないが、
>PowerPCの潜在能力はどうよ?

もっと詳しく。
あなたの言葉で。
271Socket774:2005/05/05(木) 02:41:30 ID:5SOVjtnH
>>270
PowerPC 970MPとかの概要見てて、直感的に感じる何かがあるのだ...
それに、デュアルコア(マルチコア)なPowerPC 970MPが欲しいなと。
けど、手に入れるにはMAC買うしか無いのかのぅ。 普通に自作できればいいのぅ。

スラドにもそんな話があった。
PowerPC 970MPの概要
http://slashdot.jp/article.pl?sid=04/07/30/0830228
272Socket774:2005/05/06(金) 10:46:55 ID:k31bYJNI
>>271
IBMの鯖とワークステーションでPOWERプロセッサ搭載のがあるみたいだから、
それも検討してみては?
273Socket774:2005/05/06(金) 16:48:08 ID:ZmjgMJMG
たけーよ
274Socket774:2005/05/06(金) 19:30:58 ID:Jw2OhQCl
>>271
個人が970MPを所有するにはMAC買うしか選択肢が無い。
275Socket774:2005/05/06(金) 20:49:39 ID:8muQEMoD
>>271

一番安い物なら箱2だ。
無論ゲームしかできんがw
276Socket774:2005/05/06(金) 21:46:25 ID:KTjfQpw6
>>275
970MPは無い
ゲーム機に乗せれる消費電力じゃないからな
277Socket774:2005/05/06(金) 22:40:04 ID:Jw2OhQCl
>>275
ゲーム機はちょっと違うだろ。
278Socket774:2005/05/12(木) 22:33:35 ID:lH6rsusU
 
279Socket774:2005/05/13(金) 02:21:17 ID:E2C/w5z/
POWER POWER
上昇します
280Socket774:2005/05/13(金) 02:21:51 ID:E2C/w5z/
281Socket774:2005/05/13(金) 10:36:36 ID:Yyohw+pF
おまいら何故PowerPCの話題だと引くんだよ。w
PowerPCもRISCアーキテクチャです。
282Socket774:2005/05/14(土) 00:19:03 ID:ckqbReSB
SPARCもRISCアーキテクチャです。
283Socket774:2005/05/14(土) 02:16:21 ID:de+CuHUb
>>281

ネタが尽きて人が離れていった後で、
PowerPCの話題を出してスレ再生しようとしても、

もはや読む人が減りきった状態をいかんともできず。

たぶんPowerPCだから引いたって理由じゃない。
284Socket774:2005/05/14(土) 02:19:08 ID:Qo0oG/GL
まえみたくトイレネタ(?)かなんかでのわかりやすい講座
やってほしいよ。
285Socket774:2005/05/14(土) 03:21:06 ID:2b3nIxGq
前スレが神スレすぎたからな。
市販の技術書レベルの話題になってたし。
面白いCPUとか出たらまた盛り上がるだろう。
286Socket774:2005/05/14(土) 13:04:07 ID:GFtR6V9h
PowerPCはRISCが流行った後で出てきたんじゃなかったっけ?
RISCの近視眼的要素を排除していたような気がしたが…
287Socket774:2005/05/14(土) 13:16:25 ID:DnLFQZBD
RISCの近視眼的要素って何
遅延分岐とか?
288Socket774:2005/05/14(土) 13:28:09 ID:2b3nIxGq
Power系統って後発だっけ?
もう記憶が曖昧・・・
Alphaはあまりに衝撃だったから良く覚えてるけど。
実物もCPUのパッケージにヒートシンク固定用のボルト生えていたり。
初期のPowerPCはまだ試作品的なレベルの、
完成度が低いものだったような・・・
Appleが調子こいて宣伝しまくったのは頭に焼き付いてる。
289Socket774:2005/05/14(土) 14:21:31 ID:QJ+TpIM0
POWERがあってのPowerPCだから、後発といえば後発だがw
290Socket774:2005/05/14(土) 15:55:11 ID:MCNwgt3p
>>289
POWER自体もRISC界ではやや後発なほうだったかと
291Socket774:2005/05/15(日) 00:42:37 ID:0iFxhpId
>>288

うん、appleのpowerPC初期の売り方はむちゃくちゃだったなあ。

・二次キャッシュがオプション
・廉価モデルは、オプションですら二次キャッシュを増設できず(=なし)
なんて、RISCの使い方を理解できていない愚行を繰り返した。

メモリバスがむちゃくちゃ遅いのに、
二次キャッシュをメモリバスの速度に合わせたり、とか。

そういった、アップル特有のマイナス要素が
CPUの性能を無駄におとしめないようにしただけの、
内部的には603と大差がなかったG3で「劇的に高速化」

ここまで来てやっと、アップルの設計のafoさがばれたのか、
マシな設計のハードが出始めるようになった。

ああ、604は、不幸なCPUだったんだなあ...
604+バックサイドキャッシュのCPUが出てたら、
きっと、G3以上の速さだったろうにね。(G4とは方向が全然違うけど。)
292Socket774:2005/05/15(日) 00:46:02 ID:0tDpSwDY
PPCの初期は不遇だね
無駄dualのBeBoxとか
293Socket774:2005/05/15(日) 11:35:11 ID:JidGepug
>>292
>無駄dualのBeBoxとか

あれはひどい代物だったね。というかなんで603で作ったのかと。
キャッシュスヌープできないからキャッシュ殺してます。てへ。とかひどすぎ。
294Socket774:2005/05/15(日) 23:51:42 ID:8E1ufP1K
>>284
自分で本読めよ。

トイレネタで素人向けに説明してらんないくらい
もっと面白いことがたくさんあるぞ。
295Socket774:2005/05/16(月) 00:33:25 ID:Ug2zEkxe
>>294
自分で本読んでるよ。
ただ真面目な記述の本だけじゃなく、たまには面白おかしく
ためになるものを…って思ったんだけど。
296Socket774:2005/05/16(月) 02:39:58 ID:s0dBRiux
ttp://soundblaster.com/products/x-fi/technology/
CREATIVEの新しいオーディオプロセッサがVLIWだそうな。
297Socket774:2005/05/16(月) 15:38:55 ID:bJISmwfC
>>295
ごめん。

本物の解説書を読んでると、
面白すぎて、
トイレの話を考えるもしないのは、漏れだけ?
298Socket774:2005/05/16(月) 17:52:05 ID:K1qAsmzg
>>296
"Thread Interleaved Multiple Data (TIMD)"だそうでつ
(左の"Cutting Edge Architecutual Design"のサブメニューから)



漏れ違いがいまいちよくわからないんだが
まぁどっちかって言うとDSPっぽいってことなんだろう・・・!?
(つーか今気づいたけどそこの小見出しが"DSP"だwwwww)
299Socket774:2005/05/16(月) 22:13:01 ID:j4CQH/BR
一瞬、TIのOEM?とか思ってしまった訳だが。
300Socket774:2005/05/18(水) 12:38:45 ID:AxrqpeEP
>>295
こんなのどうだ。
http://www.uplo.net/www/vip5701.zip
301Socket774:2005/05/20(金) 21:48:00 ID:nveLVMhS
CPUアーキテクチャについて語れ!
↓さあ語れ!
302Socket774:2005/05/20(金) 21:54:22 ID:49AvuEHy
RISC
CISC

そしてそのハイブリッドに、
どちらとも言えないモノまで・・・

もはや区分けの概念が通用しないねえ
303Socket774:2005/05/21(土) 04:50:22 ID:sbs8KUjq
正直、値段がそこそこ安くて、高性能で、ソフトが豊富なら、RISCだろうがCISCだろうが
どうでもいいよもう。
304Socket774:2005/05/21(土) 11:27:32 ID:x4Ld0l4y
どうでもいいなら、こんな過疎スレくるなよw
305Socket774:2005/05/21(土) 11:48:10 ID:mfrvSZ1P
日本メーカーの富士通ががんばってるのにSPARC関係は無視ですか?

富士通、2GHzを超えるSPARC64 Vを搭載したSolarisサーバー
http://enterprise.watch.impress.co.jp/cda/hardware/2005/05/17/5266.html
306Socket774:2005/05/21(土) 13:04:50 ID:lSr/dfDQ
SPARCはSunのおかげで"遅い"ってイメージがついてしまったからなぁ
そういうおいらはSPARC応援してるよ、うちに何台かあるし…
307Socket774:2005/05/22(日) 01:33:13 ID:Tu7vZF29
>>306
そうか?
研究室にいた頃同一プログラムを動かしてmicroSPARC 80MHz=Pentium 120MHzで
案外早いと思ったが
308Socket774:2005/05/22(日) 01:56:06 ID:5e24PEuG
>>307
その辺の年代は、Sunって実はCPUの設計へたくそじゃないと
噂が出始めたころでしょ…
問題はその後だぁ!!
309Socket774:2005/05/22(日) 11:56:51 ID:lb1aZF5i
>>307
馬鹿みたいに浮動小数点演算のトロくさいIntel x86と比較されてもなぁ。
研究室ってことは浮動小数点演算の必要なプログラムを走らせていたんでしょ?
310Socket774:2005/05/22(日) 12:11:36 ID:/tX8L/JY
馬鹿みたいに浮動小数点演算のトロくさいIntel x86と比較できてしまうSPARC。
Intだと486で十分。
PC UNIXが流行るわけだよな。
311Socket774:2005/05/22(日) 13:17:37 ID:XaZxsvVp
Ultra/1(UltraSPARC 137MHzくらい?)よりも、
Pentium90MHzの自作PCのほうが速かった希ガス。

SS/5や20は486マシンで対抗できた。

312Socket774:2005/05/22(日) 20:17:54 ID:Tu7vZF29
>>309
いや単純なパターンマッチングのプログラムだから殆ど整数演算だけ
313Socket774:2005/05/22(日) 20:24:17 ID:Tu7vZF29
>>311
比較を行ったのはSun SS5(microSPARC)とEPSON Direct AT-6500だが
314Socket774:2005/05/23(月) 00:47:51 ID:Fvyzis99
IOMMUが必要かどうかの件について
315Socket774:2005/05/23(月) 00:52:48 ID:729aHu3R
>>312
>いや単純なパターンマッチングのプログラムだから殆ど整数演算だけ
大量のデータを扱うなら、バスの太さに助けられた可能性はあるな。
その当時ならだいぶ差があった。

316Socket774:2005/05/23(月) 01:12:39 ID:mzHkX7q6
>>314
仮想化ではあったほうが便利
317Socket774:2005/05/29(日) 19:25:12 ID:Wbn5What
age
318Socket774:2005/06/01(水) 04:16:36 ID:4sewqUab
CELLって8個(PS3では7)のサブコアそれぞれに256kbのメモリがあって
メインメモリ間とはDMAで転送するってことになってるらしいけど
単に256kbx8=2Mのキャッシュ載せてメモリは共通にした方が
使い勝手もいいしパフォーマンスもさほど落ちないような気がするんだけど
そこらへんどうなの?
319Socket774:2005/06/01(水) 06:24:43 ID:HJaApKI9
>>318
キャッシュx8のコヒーレンシーとってたら結構パフォーマンス落ちそう

あとソフトウェア・セル
(↑よくわかんないけどコード&データひとまとめにしてネットワークで送るものらしい)の都合もあるんじゃない?
320Socket774:2005/06/01(水) 07:48:02 ID:ZPpwW6mR
CISCからRISC命令へ変更するときの効率はIntelとAMDどちらがいいのかな?
321Socket774:2005/06/01(水) 14:08:59 ID:Fh55ZlNv
ユニファイドキャッシュといえばCyrix
322Socket774:2005/06/01(水) 18:36:50 ID:d3H3JKOt
256KBのメモリをキャッシュではなくメインメモリとしてしまえば、キャッシュ機構が省けるよ。
タグメモリの容量だって馬鹿にならないしさ。

あーでも、むしろキャッシュを意識し制御するのが面倒だという理由のほうが大きいかもなぁ。
323Socket774:2005/06/01(水) 19:22:56 ID:g34witPE
それだけならSH4みたいにアドレスの上位フラグいじってキャッシュをスルーする機能で十分なような。
324Socket774:2005/06/01(水) 23:19:13 ID:ht6TzCKm
PA-RISC, Crusoe。ばいば〜い!!
325Socket774:2005/06/02(木) 01:33:27 ID:whckTEYs
キャッシュだと、メモリからの読み込みのレイテンシが変動するじゃない。
326Socket774:2005/06/03(金) 02:06:17 ID:ynkTGqoj
>>320
変換効率が高いのはトランスメタでは?
...同時発行数が少ないので遅いけど。

>>321
イソテル486や、PowerPC601もだ。
327Socket774:2005/06/11(土) 18:07:43 ID:8kP/893z
保守
328Socket774:2005/06/14(火) 14:36:37 ID:O7ZIZbkm
.NETが普及して全てのアプリがターゲットCPUに対してJITで高度に最適化されたとしたら
out of orderとかいらなくなったりするの?
329Socket774:2005/06/14(火) 17:10:06 ID:LPxF955K
>328
そりゃないんじゃね?
330Socket774:2005/06/14(火) 20:38:55 ID:/uyAL1UX
リンゴもIntelに屈したか。
PowerPCの今後はどうなるやら。
331Socket774:2005/06/15(水) 10:42:32 ID:P/qJHEuk
しばらくはゲーム機で食いつなげるんではないかと。
その先はどうなることやら。
332Socket774:2005/06/19(日) 02:51:42 ID:Uau6U1am
CPUコードネーム一覧表はPCWatchにあったのですが、
CPUリングネーム一覧表がありません。
教えてください。
333Socket774:2005/06/19(日) 03:42:39 ID:5x5ckqFg
>>332
源氏名一覧表も必要だな
334Socket774:2005/06/20(月) 21:16:34 ID:j/0xD42W
>>332
リングネームの前に入れるキャッチフレーズなら、いくつか思いつくんだけどな。
「口だけ番長」とか、「瞬間湯沸かし器」とか。
335Socket774:2005/06/20(月) 21:32:17 ID:LxRgf/xM
「眠ったままのスリーピングビューティ」とか「燃え尽き症候群」とか。
336Socket774:2005/06/22(水) 04:31:43 ID:p6PjCX4y
>>334
「プ」と「ロバ」だなw
337Socket774:2005/06/25(土) 16:14:05 ID:zhGnUPlw
えーと、すみません。質問です。
pentium系CPUの分岐予測にやさしいコードの研究をする事になったんですが、
pentium4の分岐予測のアルゴリズムをどなたか御存知ありませんか?
IIとIIIは資料を探し出せたのですが、4はさっぱり見つからんのです。
338Socket774:2005/06/25(土) 18:51:48 ID:efjQdVwS
ftp://download.intel.co.jp/jp/developer/jpdoc/24896606_j.pdf

まあ、P6と似たようなもん。
ループのオーバーヘッドが0にできるなど、色々強化されてるが、
普通の動的分岐予測はパターンマッチングでやっている。
339Socket774:2005/06/26(日) 02:38:44 ID:exrx8hok
>>338
ありがとうございます。
P6とかの場合、BTBの各エントリにつき4bit16ヶのカウンタがあって
過去四回の履歴からカウンタを一つ選んで云々という構造だと思うのですが、
pentium4の場合も同じくカウンタは4bitなんでしょうか?
340Socket774:2005/06/26(日) 03:24:38 ID:fp1bVDqZ
>>337
宿題は自分でやりませう。
そういうのを調べるのも研究のうちですよ。

分岐予測のヒット率を上げるよりも、
分岐のヒントを与えるアーキテクチャのCPUに、
いかにヒントを与えるかの研究のほうが・・・。
341Socket774:2005/06/26(日) 04:07:00 ID:exrx8hok
はーい。
ヒント辺りになるとますますサッパリだけど。
342Socket774:2005/06/26(日) 12:52:18 ID:GAj1+1TU
日本はもうまともなCPUは開発できないから学ぶだけ無駄
おとなしくPentium買っとけ。
343Socket774:2005/06/26(日) 12:57:36 ID:hO0lIagR
>>342
コンパイラを作るための勉強だと思うけど。プロセッサを作るためではなくて。
344Socket774:2005/06/26(日) 15:04:16 ID:9nokd9+W
ただ、そこまでやるなら自分で低級言語で書いて実験せねば。
345Socket774:2005/06/28(火) 00:34:37 ID:O6puUi53
80bitの精度を持つFPU(x87)と、64bitのSSE2では、
ハードウエアの負担はどのぐらい違うもの?
346Socket774:2005/06/29(水) 22:01:51 ID:7R3z84rb
>>342
富士通のSPARC64 VはまともなCPUだと思うが・・・
347Socket774:2005/06/30(木) 00:48:15 ID:uj2DJzne
まともなCPUだ!と言い切れw
348Socket774:2005/06/30(木) 01:15:13 ID:5yaDKM/i
VRもTXもそれなりに元気だけど、独自アーキはぱっとしないよね。
FRVとかどうなるのかねぇ。
349Socket774:2005/07/01(金) 02:14:09 ID:G20kzk6q
SPARCっていつから富士通のものになったのさ。
350Socket774:2005/07/01(金) 07:00:00 ID:Uq03nn3k
太陽が沈みかけたからw
351MACオタ>349 さん:2005/07/01(金) 12:41:44 ID:kxUint/1
>>349
SPARCの命令セットや仕様わオープンす。
http://www.sparc.org/japanese/faq.html
  ------------------------
  ・ SPARCの命令セットはIEEE 標準1754-1994 として公開されている。

  ・ SPARCは,誰でもでもどのような会社でもライセンスを受けることが出来,自分自身に適したものを
   作れる柔軟性と自由度があ る。

  ・ SPARCアーキテクチャの決定権は,独立した非営利組織であ るSPARCインタナショナルが持って
   おり,誰でも会員になって仕様決定に参画できる。
  ------------------------
352Socket774:2005/07/01(金) 19:05:34 ID:Uq03nn3k
>>351
国際スパーク株式会社。w
たのむから日本語のページは紹介しないでくれw
353Socket774:2005/07/01(金) 20:25:37 ID:il8N4rvA
富士通、2GHzを超えるSPARC64 Vを搭載したSolarisサーバー
http://enterprise.watch.impress.co.jp/cda/hardware/2005/05/17/5266.html

IBM eServer p5 595 (1900 MHz, 1 CPU)
http://www.spec.org/osg/cpu2000/results/res2005q1/cpu2000-20050207-03774.html

Fujitsu Limited
PRIMEPOWER900 (2160MHz)
http://www.spec.org/cpu2000/results/res2005q2/cpu2000-20050419-04024.html
354Socket774:2005/07/04(月) 15:09:58 ID:hIVQSzBb
Itanium 2 is obsolete.
good bye, Itanium series.

LOL
355Socket774:2005/07/18(月) 01:25:29 ID:oJPwbFHN
lol
356age:2005/07/18(月) 02:29:13 ID:Jb8woOuV
Intel迷走中
357Socket774:2005/07/18(月) 12:41:35 ID:63B9YiaX
もう迷走はしてないでしょ
着地点(PenM系)はわかってるわけだし
着地するまで、どうごまかしてPen4系を売るかってだけ
358Socket774:2005/07/27(水) 22:59:13 ID:VywuF5hR
LoL
359Socket774:2005/07/27(水) 23:10:24 ID:yKse69dX
↑って何?
360Socket774:2005/07/28(木) 00:23:42 ID:TeMyC6T4
Lack of Love

てゲームがあったな。
361Socket774:2005/07/28(木) 01:10:21 ID:XtfZr9cj
LoL
362Socket774:2005/07/31(日) 09:59:23 ID:PyOY58Sb
>>357
それに加えてPentium M系がEM64T対応ではないことをどうごまかして売るかってのもある
来年、Meromが出荷されたとたんEM64Tマンセーの宣伝しそうで怖い
363Socket774:2005/07/31(日) 13:13:32 ID:mSGfXCuq
MeromのEM64Tはまともな実装になってるのか?
364Socket774:2005/07/31(日) 14:12:40 ID:0wGqPjDc
Meromはコアが2個あるので64bit級!!!
365age:2005/07/31(日) 20:17:57 ID:5tDriXKS
>>364
S○GAのSSみたいだな。
366Socket774:2005/07/31(日) 20:45:38 ID:g4ElSpe+
コア二つなら2倍でしょ?
33bitじゃん
367Socket774:2005/07/31(日) 21:02:18 ID:0wGqPjDc
32bitCPUが何個集まろうと32bitだろうがばーか
368Socket774:2005/07/31(日) 21:07:08 ID:X29KdiLk
369Socket774:2005/07/31(日) 21:21:49 ID:00eAeZGj
Transmetaも
「32bitVLIW実行ユニットが4個あるから128bit」
なこと言ってなかった?
370Socket774:2005/08/01(月) 11:19:13 ID:pW0x/agg
あれは命令幅のことだろ。
371Socket774:2005/08/09(火) 01:53:01 ID:pUSmb4LI
「製造プロセスルール」って言う場合、
「描画チャネル長」と「実効チャネル長」のどちらを言ってるのでしょうか?
372Socket774:2005/08/09(火) 02:43:42 ID:7bLTSME3
ちゃんと決まってはいない。

○○ミクロンっていうのは、
その工場のデザインルールを識別するためのタイトルみたいなものだから。

A社の90nmのデザインルールと、
B社の90nmのデザインルールは、
まるで違っていると思ったほうがいい。
へたしたら、A社の90nmはB社の130nmに近かったり・・・。
373371:2005/08/09(火) 16:05:50 ID:gik7J98P
>>372
thx。驚きました。
ってことは異なる企業が90nmプロセスルールと言ってても比べる事できないって事ですね。
でも推測くらいはできるのかな??
374age:2005/08/09(火) 19:57:03 ID:eQ2JgaMp
貴重なスレだ
勉強になるので上げます
375Socket774:2005/08/10(水) 00:02:57 ID:QqxTC8ER
>>373
ttp://www.atmarkit.co.jp/fsys/keyword/015silicon_basic/015silicon_basic.html

普通はリソグラフィをいうから、比べられないってことにはならんと思うが。
比べたらいろいろ違うけどね。ウエハサイズ、素材、実効ゲート長、速度、
リーク、などなど・・・。
376Socket774:2005/08/20(土) 14:22:55 ID:5UKmmvIc
保守
377Socket774:2005/08/24(水) 23:41:49 ID:SidhEu1L
VLIWについて、聞きたいです。

知ってる方 何かもってる情報・知識を話してください。
378Socket774:2005/08/25(木) 00:03:01 ID:r3oOBIvV
いくらなんでも漠然としすぎ
379Socket774:2005/08/25(木) 03:33:52 ID:+CPA8G/J
>>378
それを承知で言ってます。
380Socket774:2005/08/25(木) 04:11:44 ID:yuCFk0dY
VLIWについては教科書にも書かれているくらい歴史のある技術だから、
まずは学校の図書館にでも行ってみよう。
381Socket774:2005/08/25(木) 07:28:00 ID:3yZ5lggj
382Socket774:2005/08/25(木) 12:36:50 ID:+CPA8G/J
>>380,381

寒っ。。
話題ねーから、話題ふってやったのに。
383Socket774:2005/08/25(木) 16:33:08 ID:3yZ5lggj
>>382
>378
384Socket774:2005/08/25(木) 16:40:50 ID:+CPA8G/J
>>383
>379
385Socket774:2005/08/25(木) 16:59:49 ID:/6/hrw1R
話の振り方が下手くそだったんで誰も食いつかなかっただけだろ。
次はがんばれ。面白いのを期待している。
386Socket774:2005/08/25(木) 17:10:56 ID:w3ah+h9z
前スレのトイレ解説だっけ?
そんな感じでVLIWについて書いてくれw
387Socket774:2005/08/25(木) 17:11:12 ID:+CPA8G/J
所詮 自作PC板って事だな。
一般的なアーキテクチャの話ができず、メーカー厨の煽りあいしか できねーってことがよくわかったぜ。
糞だな

388Socket774:2005/08/25(木) 18:25:59 ID:3yZ5lggj
つまんないオチだな。
389Socket774:2005/08/25(木) 19:55:58 ID:eVhobJxe
>>387
データフローマシンについて語ってください。
390Socket774:2005/08/25(木) 23:29:36 ID:yuCFk0dY
マルチメディア処理をなんとかしろ! といいたいよ。
ハードウェアエンコーダ・デコーダとの性能差がありすぎ。

GPUでやりましょうっていう話もあるけど、
普通のプログラムから気軽に使えないので嫌なんだよね。
391Socket774:2005/08/25(木) 23:53:28 ID:S8ksatFn
>>382
宿題は自分でやろうな。

>>387
語りたいなら存分に語ればいいよ。
それを聞く香具師はいくらでもいる。
おまいのはメーカー厨の煽り以下だってこと分かってる?
392Socket774:2005/08/26(金) 00:46:53 ID:GsSFm8Q0
糞スレええ うぜええええええええ!!!!

ふきだまりだなああ
まともな奴でてこいよおおお

393Socket774:2005/08/26(金) 00:59:34 ID:jIxN5rMc
まぁ、夏休みも残りすくないしなぁ…。
お子様うざいなぁ…。
394Socket774:2005/08/26(金) 06:15:49 ID:2Y7Ru3Dt
>>392
>385
395Socket774:2005/08/27(土) 01:09:35 ID:mxFQ9jE4
ほんとに糞だなw
会話またとまっちゃったよw
自作スレじゃLV低すぎて何も話できないから、終了だな。もう保守するなよ。

モンクあるやつは、スレタイにあるように何かアーキテクチャ語ってからモンク言えっ!!

396Socket774:2005/08/27(土) 01:24:57 ID:A2RSkTEJ
>>395
オマエモナー
397Socket774:2005/08/27(土) 01:34:10 ID:mxFQ9jE4
>>396
>モンクあるやつは、スレタイにあるように何かアーキテクチャ語ってからモンク言えっ!!
398Socket774:2005/08/27(土) 02:43:13 ID:YEAWLYeH
>>397
>397
399Socket774:2005/08/27(土) 07:47:17 ID:/6t/AN7R
>>395
じゃ、シストリックアレイについて語ってください。
400Socket774:2005/08/27(土) 13:00:50 ID:P+Z19tR2
400
401Socket774:2005/08/28(日) 17:46:20 ID:hpuhoBZG
>>396 >>398>>399
おまえら、頭低すぎ、釣られすぎww
402Socket774:2005/08/28(日) 23:22:20 ID:/5iihENP
んじゃ Merom か Yonah では?
403Socket774:2005/08/30(火) 21:32:18 ID:oYzKcivp
>>401
この板に来るような奴がメル欄に気付かないわけないだろw
吊られてるって
404Socket774:2005/08/30(火) 22:28:56 ID:PmyjXVLf
あーあ、言っちゃった
お前の負け>>403
405Socket774:2005/08/30(火) 22:41:17 ID:/dDaovI5
>>404
いいから、スタックマシンについて語れや。
406Socket774:2005/08/30(火) 22:45:41 ID:gIjVpYu7
push >>404
407Socket774:2005/08/30(火) 22:59:13 ID:gyVB6JAT
もう釣りごっこは要らね。
話題が無いなら無いで構わん。
良スレつぶすのは勿体ない。
408Socket774:2005/08/31(水) 01:23:01 ID:xIj/vopf
Meromのパイプラインやけに短いけどあれで2GHz超えって
かなり頑張ってるんじゃあるまいか
409Socket774:2005/08/31(水) 08:18:41 ID:L5J2Vfle
2GHz超えのドターンよりは長いだろw
410Socket774:2005/08/31(水) 16:51:34 ID:iXjjqEne
>>408
14段がやけに短いって?
4段で2GHz超えしてるCPUもあるんですがw

14段深すぎだろwwwwww
411Socket774:2005/08/31(水) 22:30:59 ID:LNl6w4/x
>>410
ちなみにその4段のCPU名は?
x86系はデコーダ(及びアウトオブオーダ)が複雑な関係で段数が長くなることが宿命付けられてるけど
412Socket774:2005/08/31(水) 23:34:11 ID:MMMx5ObO
http://pcweb.mycom.co.jp/news/2002/10/28/16.html
http://web.archive.org/web/20041123080253/http://ne.nikkeibp.co.jp/NE/2002/021202/gp.html
halla ARM V5 samsung 1.2GHz

日経エレクトロニクスの記事は
> ARMのシフトと加算を同時に行う命令を、1クロックで実行する必要がある(ライセンスの関係でパイプラインを変更できない)
> ので演算ユニットが倍速で動いている。
という内容だった.。

演算ユニットは2GHzを超えているが,、CPUとしては1.2GHzだ。

#K8がfetchからL1キャッシュアクセスまでで12段なので、14段は特に短いとは思わない。
413Socket774:2005/09/01(木) 03:59:59 ID:B+RcZj3F
>>412
K8だって浅い訳じゃないだろ。
12段だってかなり深い。

Netburstのせいで、感覚が麻痺してきてるんじゃないのか?
414Socket774:2005/09/01(木) 10:49:06 ID:Te3vy7Tv
ちなみにPentiumIIIが12段、Itanium2が8段。

Itanium2はOOOやらないので、他よりも段数少な目。
Itaniumでは10段だったのが、2段減ってクロックが若干上がった。
これはどう見るべきだろう。

415Socket774:2005/09/01(木) 22:38:14 ID:P/29cqnb
IA64はまず実機が存在しないところから始まったので、Itaniumは出来るだけ
早期に実機環境を整備することを目的に工程最優先で開発したため、設計の
最適化は手付かずだったということだと思うけど。
実際Itanium2はItaniumの改良ではなく、平行して開発が進められたという話
だったはず。
416Socket774:2005/09/02(金) 01:03:47 ID:Gyg4GUt2
Itaniumのスケジュールが遅れたから、
Itaniumの出荷前にItanium2の話が出てたような気がするし、
Itaniumの出荷からわずか1年後にItanium2が出荷されたよね。

Itaniumはサンプルが出てから出荷まで数年かかってて、
トラブルの対処に関係ないスタッフは次の仕事に取り掛かれたはず。
417Socket774:2005/09/07(水) 23:04:53 ID:9hL8i7Dl
>Itaniumの出荷前にItanium2の話が出てたような気がするし、
>Itaniumの出荷からわずか1年後にItanium2が出荷されたよね。
これって常にIntelにある話で、且つIntelのCPUの値段を吊り上げてる原因の一つなんだよね
418Socket774:2005/09/08(木) 00:11:02 ID:/rD8T99y
出荷前に、
ソケットが変わる
内部ユニットの構成が変わる
なんてアナウンスしたら、そりゃぁもう。

Windowsを動かすデモしてから、出荷まで何年かかったんだっけ?
419Socket774:2005/09/15(木) 15:19:52 ID:3qx5dZUp
学校の宿題なんですけど・・・

IBM System 360

特徴  

Model 30 Processor cycle time 1.0 Relative speed 1
------------------------------------------------
Model 75 Processor cycle time 0.2 Relative speed 50

問題
    Model75 のパフォーマンス(Relative speed )が 
    Model 30の50倍であるのに対し、
    Model75 の Processor cycle time は たったの5倍である。
    この矛盾をどう説明しますか?

  という問題なんですけど。

この矛盾説明できますか?
  
420Socket774:2005/09/15(木) 15:37:46 ID:aCDUaMy8
矛盾つーかパラメータが足りないだけじゃん



スーパースケーラとかベクタライズとか
421Socket774:2005/09/15(木) 15:58:12 ID:T9nqgnft
基礎中の基礎だな。CPI
422Socket774:2005/09/15(木) 16:12:58 ID:H5VJPH4R
>>420
360だぞ
423Socket774:2005/09/15(木) 16:41:39 ID:4Y7qc6rU
>>419
そうしないと売れないから
424Socket774:2005/09/15(木) 16:42:10 ID:PM4DatQM
>>419
宿題は自分でやれ。

425Socket774:2005/09/15(木) 20:06:36 ID:hHxsuCER
どっちかのタイマが狂ってる。
426Socket774:2005/09/15(木) 20:24:13 ID:ZKFn7HPs
>>419
宿題なら、「IBMの広報が一流だったから」と書いて提出汁。

自信が無かったら、
http://www-03.ibm.com/ibm/history/exhibits/mainframe/mainframe_FS360B.html
このあたりの数字を適当にいじって提出汁。

ところで、サイクルタイムだが、
   model30 750ns
   model75 195ns
その差3.846倍。5倍ってどこから出た数字なのだろう。
427Socket774:2005/09/15(木) 21:12:41 ID:PJyH3rCp
Processor cycle timeだからクロックでない?
428Socket774:2005/09/16(金) 15:01:03 ID:135RI4xR
パタヘネ2上 出版社在庫切れ、重版予定なしだと
欲しいやつは今のうちに本屋の在庫買っとけよ
429Socket774:2005/09/16(金) 22:27:26 ID:fJlh+z+e
>>428
こういった本を打ち止めにするとはなあ。
出版社のやる気の無さが日本のCPU技術を衰退させていく。
430Socket774:2005/09/17(土) 01:27:55 ID:H4OTDZmg
第二版の翻訳本が絶版になるのは構わない。
第三版の翻訳本が出ればね。
431Socket774:2005/09/17(土) 08:20:34 ID:Yt77igEc
CPU技術を担って行くような奴が翻訳本なんか必要とするわけがない。
432Socket774:2005/09/17(土) 15:52:47 ID:H4OTDZmg
だな。

原著で読めない大学生なんていないだろ。
俺が学生の頃は翻訳本なんてなかったけど、問題なかった。
シンドイのは英語を読むことではなく、洋書の値段が高く、入手しにくいことだった。
433Socket774:2005/09/17(土) 22:14:48 ID:Z2i084RR
>>432
学生時代、関数群とかやったが、参考になる本がなくて
教授から渡された本は英語…('A`)…という事は確かにあった(藁
434Socket774:2005/09/24(土) 17:07:15 ID:/XhSE/2n
CPUサイクルタイムが5倍って遅くなってないか?

っていうネタは置いといて、
パタヘネ上下買うぐらいならヘネパタ買ったほうがいいんじゃないか?
435Socket774:2005/09/24(土) 21:16:58 ID:UOIe+h+Z
>>1 質問だがこのスレはプロレス板と、
どういう関係があるのですか? 全く関係ないと思いますが…
436Socket774:2005/09/24(土) 21:39:30 ID:BCeBtfyH
プロレス板?
437Socket774:2005/09/25(日) 03:39:21 ID:0HBNWsUt
>>435 質問だがこのレスはこのスレッド及び自作板と、
どういう関係があるのですか? 全く関係ないと思いますが…
438Socket774:2005/09/25(日) 11:37:26 ID:LNzgeHGu
なんか、このコピペ流行ってるみたいだね
なにが面白いんだろ?
439Socket774:2005/10/09(日) 20:01:24 ID:E2PbbWp7
「ItaniumとXeonの価値を提案」−インテルが語るエンタープライズ戦略
http://enterprise.watch.impress.co.jp/cda/topic/2005/10/06/6292.html
440Socket774:2005/10/11(火) 15:54:26 ID:jSI/VgbZ
ほす
441Socket774:2005/10/15(土) 23:37:00 ID:RKwgVCm2
ジーオンはなうなるかもしれないよ。
あんなぼったくりCPUなんていらないよ。
442Socket774:2005/10/17(月) 12:18:06 ID:xv5Nfhmu
市場調査会社米Current Analysisが10月14日発表した統計によると、
米国のデスクトップPC向けプロセッサで9月にAMDが過半数のシェア
を確保し、Intelから首位を奪取した。

9月に米国で小売り販売されたデスクトップPC向けプロセッサのシェアは
AMDが52%となり、Intelの46%を上回った。
AMDはこれまでにも一時的にデスクトップ用プロセッサで
Intelをしのぐことはあったが、月間を通じてIntelの売り上げを上回ったのは
この9月が初めてだという。
http://www.itmedia.co.jp/news/articles/0510/15/news002.html
443Socket774:2005/10/18(火) 15:12:13 ID:yx1lnXid
前スレ見たいなぁ。
誰かログうpできませんか・・・
444Socket774:2005/10/18(火) 15:26:17 ID:JvU7YR33
金払え or 検索しろ
445443:2005/10/18(火) 22:08:36 ID:LyPnlG7Y
検索してトイレの例え話を読んでから金払った。

すげぇ面白い。
89年頃に雑誌で研究中として紹介されてた技術が
民生品として出てきてるのか・・・。

これからレス見ながら検索等して個人的お楽しみとして勉強するわ。
446Socket774:2005/10/24(月) 17:12:17 ID:U3o1VC3v
Power.orgはちゃんと機能してるみたいだね

低消費電力型Powerチップ、米新興企業が開発へ
http://japan.cnet.com/news/ent/story/0,2000047623,20089470,00.htm
447Socket774:2005/10/26(水) 19:55:00 ID:CmKqWGwy
Itaniumのスレってなくなっちゃったの?
448Socket774:2005/10/26(水) 21:18:07 ID:Nw+mVuq+
【IA-64】Itanium2専用スレ・その4【アイテニアム】
http://pc8.2ch.net/test/read.cgi/hard/1126713905/
449Socket774:2005/10/26(水) 22:43:05 ID:ZcCAZdIf
ARM、ハイエンドプロセッサコアの技術内容を公表
ttp://pc.watch.impress.co.jp/docs/2005/1026/fpf02.htm
450Socket774:2005/10/26(水) 23:05:42 ID:PIxgLczz
このスレもハードウエア板向けなんだけどね。
451Socket774:2005/10/26(水) 23:16:11 ID:+Gd8lemq
電電スレでは?
452Socket774:2005/10/26(水) 23:17:51 ID:+Gd8lemq
いや、電電板だった
453Socket774:2005/10/27(木) 19:06:56 ID:DO4kRwIx
旬の過ぎた平成電電のことか?
454Socket774:2005/10/27(木) 21:40:16 ID:FHBZZqk7
ほす
455Socket774:2005/10/28(金) 04:32:42 ID:wY3d+lhF
どうしてNECがx86互換CPUを作らなくなったのはアメリカ政府から圧力をかけられたからだよ。
456Socket774:2005/10/28(金) 05:04:16 ID:Dr0CA605
どうして455が変なのは文法的におかしいからだよ。
457Socket774:2005/10/28(金) 08:10:22 ID:1hVWfNPh
どうしてNECがx86互換CPUを作らなくなったのはアメリカ政府から圧力をかけられたのはなぜ?
458Socket774:2005/10/28(金) 21:16:25 ID:aIHeKfVx
どうしてなのッ?
どうしてx86互換CPUを作らないの───ッ!?
459Socket774:2005/10/29(土) 02:38:18 ID:6AN4PXud
NECエレクチオニクスに改名する。
460Socket774:2005/10/29(土) 23:10:13 ID:b+rDWhXj
>>457
イソテルのロビー活動
461Socket774:2005/11/06(日) 15:33:36 ID:OCOA8DNo
さぁCPUアーキテクチャについて語れ
462Socket774:2005/11/07(月) 22:27:09 ID:WxY+UCUE
atya-
463Socket774:2005/11/11(金) 23:29:20 ID:5wvLx+Tp
アーキテクチャってなんですか?
464Socket774:2005/11/12(土) 02:50:26 ID:+QK3ZuLG
agetoku
465Socket774:2005/11/12(土) 02:51:40 ID:+QK3ZuLG
466Socket774:2005/11/12(土) 03:01:54 ID:kkxe0kSs
このスレはメンテナンスモードに移行しました
以後、保守書き込みを禁止します
速やかにDat落ちするようご協力願います
467Socket774:2005/11/12(土) 03:56:08 ID:4AZ//uLa
m9(^Д^)プギャー
468Socket774:2005/11/12(土) 09:05:28 ID:xhM96J/H
トイレネタ思いついたときに書き込めなくなるのは嫌だからAge
469Socket774:2005/11/12(土) 17:32:25 ID:+QK3ZuLG
前スレから神的内容だからな
保存してある
470Socket774:2005/11/12(土) 19:12:07 ID:G0GMXH2X
MACヲタが出てくるスレは廃れる。
471Socket774:2005/11/13(日) 09:32:46 ID:VH++Fbqw
最近RISCのシンプルなコアを8個集積とかがはやってるが、こーゆーのも
命令セットだけはEfficeonみたいな可変長VLIWにしたほうが、メリットあ
るんじゃないかな。
1:可変スロット長の遅延ロードや遅延分岐とみなせる
2:データフォワード回路抜きで、直前の命令で使ったレジスタを使える
3:IPCの高いバージョンを出すときに、スーパースカラより有利
472Socket774:2005/11/13(日) 12:24:10 ID:1L7IJ+2U
>>471
VLIWは今までの資産が使えん。コンパイラも難しい。

>2:データフォワード回路抜きで、直前の命令で使ったレジスタを使える
インターロックはするよ。

>3:IPCの高いバージョンを出すときに、スーパースカラより有利
issueが変わるとバイナリ互換性がなくなるって知ってる?
#いやまぁ、8issueのマシンで4issueのバイナリは動くけど、
#残りの4issueは"常に"遊ぶことになるからねぇ。それじゃ増やした意味はなし。
473471:2005/11/13(日) 13:20:44 ID:/dSFtzLK
>472
1:資産はCELLの9個のSPEの方にも無い。最適化コンパイラはIA-64以外でもTIのDSPで実用化ずみ。
2:インターロックは費やすトランジスタが同等なら、RISC比で多少は減らせるはず。
  節約に回すか、高性能を目指すかは目的次第。
3:最初からRISCの8命令相当の命令セットで最適化してコンパイルしておくので、
  8命令相当のVLIW命令なら、8issue機なら1クロックで実行、4issue
  なら2クロックで実行になる。3命令相当命令ならどっちも1クロックだが、
  1issue機なら3クロックになる。
474Socket774:2005/11/13(日) 13:46:58 ID:1L7IJ+2U
>>473
>1:資産はCELLの9個のSPEの方にも無い。最適化コンパイラはIA-64以外でもTIのDSPで実用化ずみ。
CELL限定の話をしていたのですか?知りませんでした。

ちなみにVLIWのマルチコアプロセッサというものもあるのはなんででしょうね。

>2:インターロックは費やすトランジスタが同等なら、RISC比で多少は減らせるはず。
>  節約に回すか、高性能を目指すかは目的次第。
意味不明

>3:最初からRISCの8命令相当の命令セットで最適化してコンパイルしておくので、
>  8命令相当のVLIW命令なら、8issue機なら1クロックで実行、4issue
>  なら2クロックで実行になる。3命令相当命令ならどっちも1クロックだが、
>  1issue機なら3クロックになる。

1.8issue用の命令を3回にばらして実行したも同じ結果になりません。
#1VLIW命令を実行するたびにレジスタにライトバックするからね。
2.8issue用の命令列をいくつにばらせば2issue用になるのか、命令の
詰め具合によって違います(ばらさないですむかもしれないし8つにばらさないと
いけないかもしれません)。それを実行中に判定するというのは、パッキングを
動的にやりなおすのと等価です。
実行時にそんな重いことをしたらVLIWの意味がありません。
3.8issue用命令をアーキテクチャとして定義し、2命令同時発行マシンでもそれを
実行できるように作ったとしましょう。単純に8issue版の1/4の速度で動く8issue版の
1/4よりはるかに大きいコアが出来上がるでしょう。
ついでに将来16issueなプロセッサが出たときに破綻します。
475Socket774:2005/11/13(日) 16:33:36 ID:m7tUnFn/
質問だがPen4やらAth64の一次データキャッシュ、二次キャッシュは共に
256bit/cycleで、周波数=CPUの周波数でOK?
帯域は一次も二次も同じだけどヒット率とレイテンシで重視する方が違うから分けている、という認識でよいのだろうか?
476Socket774:2005/11/13(日) 16:40:23 ID:V+6TqhWA
>>475
違う。説明するよりググった方が早いかも。
477Socket774:2005/11/13(日) 18:56:24 ID:m7tUnFn/
>>476
いろいろ検索してみたけどキャッシュの容量ばかりで帯域とかなかなか見つからないorz

Pen4のL2が256bits/cycleで周波数がCPUと同じという記述は見つけました
L1については256bits/cycleらしいですが、初期のデータでロードレイテンシが2クロック時のです。
確かNorthwoodまでが2クロックでPrescottになって4クロックになったんで帯域が今のと合ってるのかは分かりませんでした。

Athlon64についてはL1データキャッシュがTwo 64-bit operations per cycle,らしいのですがPen4の半分の128bits/cycleということでしょうか?
L2帯域の記述は見つけられませんでした。

訂正、補足お願いします。

478Socket774:2005/11/13(日) 20:42:00 ID:V+6TqhWA
>Athlon64についてはL1データキャッシュがTwo 64-bit operations per cycle,らしいのですがPen4の半分の128bits/cycleということでしょうか?
>L2帯域の記述は見つけられませんでした。

うん、そうだよ。等速のL2がK7の64BitからK8で128Bitになった。
479Socket774:2005/11/13(日) 21:50:32 ID:m7tUnFn/
>>478
サンクス!!

Pen4とAth64でクロックも考慮するとキャッシュ帯域で3倍近い差があったのか・・・・
Ath64ってかなり効率のいいなぁ
480Socket774:2005/11/15(火) 17:53:23 ID:dMUqnCar
米Sun、8コアの省電力最新SPARCプロセッサを発表
http://enterprise.watch.impress.co.jp/cda/foreign/2005/11/15/6605.html

Spring Processor Forum 2005レポート 〜Sun Niagaraともう1つのメニイコア
http://pc.watch.impress.co.jp/docs/2005/0531/spf07.htm

>UltraSPARC T1は「Niagara」という開発コードネームで呼ばれてきたCPUで、
>90ナノメートルプロセスで製造し、単一チップ上に8個のコアを持つ。
>それぞれのコアは4つのスレッドを同時実行可能で、計32のスレッドを同時に実行できる。
>4つのメモリコントローラをオンチップで搭載した。
>動作周波数は 1.2GHzだがパフォーマンスは9.6GHzに匹敵するという。
481Socket774:2005/11/16(水) 17:45:19 ID:Xp9cmZ17
Niagaraはメモリのレイテンシを隠蔽するからこそ、
メモリのレイテンシより帯域幅を優先するために、
Out of Orderのメモリアクセスとか、できるんだよね。
482Socket774:2005/11/16(水) 17:47:32 ID:Xp9cmZ17
なんか>>480の下の記事、文章が変だなと思ったら、書いたのは大原かよ。

大原は知ったかぶりライターで、↓のスレで叩かれてるぞ。

知ったかぶり雑誌ライターの間違いを正すスレ
http://pc7.2ch.net/test/read.cgi/jisaku/1130742036/
483Socket774:2005/11/18(金) 18:35:45 ID:KNV39e8O
Niagara売り込み用のキャッチーなフレーズではあるけど
Sunの中の人がこんなこと言う時代になったんだー

マイクロプロセッサに死が迫っている?
http://www.itmedia.co.jp/enterprise/articles/0511/16/news030.html
484MACオタ>482 さん:2005/11/18(金) 20:02:30 ID:fj95fQGU
>>482
大原氏わ、しっかりした経歴のヒトす。
http://www.yusuke-ohara.com/profile.htm
しったかぶりとか叩いてるのわ、技術的内容よりAMDを褒めてるかどうかで記事の質を判断してるアム虫位す(笑)
485Socket774:2005/11/18(金) 20:13:38 ID:+ogsP1/x
経歴だけで知ったかぶりで無いと判断するのは、問題ありだろ。
「しっかりした」経歴の基準もわからんしな。
良ければ基準を明らかにしてけれ




486Socket774:2005/11/18(金) 20:28:25 ID:hZE+i+os
>>483
いや。Sunはjavaの売り文句とかみてわかるように昔からそういう煽りをかます会社なんだってば。
487Socket774:2005/11/19(土) 00:09:34 ID:wwxKlakB
大原がクロックスキューのことディレイって書いてたときは、ちょっとあきれた
ただ、たまにそういう間違いやらかすだけで、書いてることはわりとまともだと思う
488Socket774:2005/11/19(土) 01:34:26 ID:katBARFG
>>484
>技術的内容よりAMDを褒めてるかどうかで記事の質を判断してる
>>487

禿同
489Socket774:2005/11/19(土) 11:39:42 ID:Yg8eiyK6
PapadopoulosがNiagaraを持ち上げてるのか。
感慨深いものがあるな。
490Socket774:2005/11/19(土) 17:26:18 ID:/OVHAvrg
>>487
まともじゃないよ。
491Socket774:2005/11/20(日) 01:42:07 ID:FD+CiP4e
Niagara
 先は流れて
  落ちるだけ
492Socket774:2005/12/02(金) 03:44:07 ID:SlhMxjYT
大原氏は自分で書いてる通り実験系で,ハード/ソフト共にきちんとした教育/勉強を
してないのが弱点.その代わり頭でっかちな机上の空論をかますことはない.
493Socket774:2005/12/02(金) 16:17:35 ID:hUt4DfxN
理論をしっかり学んでいないやつに未来はないよ。
494Socket774:2005/12/02(金) 21:16:16 ID:Zgy0bspF
素人の実験ほど、迷惑なものは無いな。
495Socket774:2005/12/02(金) 21:19:46 ID:Zgy0bspF
素人の実験で迷惑な例としてはさ
原子力発電所の近くの海岸でとった岩海苔にガイガーカウンターあてる実験
というのがあるんよ。

日本全国で取れる岩海苔に含まれる放射能の量の分布を知らないので、
原発のせいだと大騒ぎするわけだけど、海水を濃縮する海苔に放射能が
含まれているのは、原発ができる前からのことなわけで・・・。
496Socket774:2005/12/03(土) 02:28:35 ID:CDyvI+PR
プロになると確信犯で都合のよい結果が出るように実験設定をするようになるがなw
疎水性の毒物の土壌中濃度を測るときに、わざわざ土壌サンプルを深くまでとったりとかな
で、体積あたりの量は少なくなって環境基準クリア。
ターゲットになってる物質はごく表層にしかないんだから面積あたりで評価すべきなのに。
497Socket774:2005/12/09(金) 00:27:54 ID:6ptknu7F
確信犯の意味間違ってない?
498Socket774:2005/12/09(金) 00:42:49 ID:hYs/NlcD
ハイハイワロスワロス
小学校で国語でも教えたら?
499Socket774:2005/12/09(金) 00:55:28 ID:y7eupUV/
ソースコード付きで実験をやってくれれば
こちらで判断できるから、その方がいいな。

アセンブリのコードが晒されてないベンチなんて
何が作用してるかわかったもんじゃない。
500Socket774:2005/12/09(金) 15:58:51 ID:ET4SF9Cn
「バイナリが再現できない」
「ベンチ結果が再現できない」
騒ぎにハッテンする罠
501Socket774:2005/12/10(土) 01:17:44 ID:qPiT+X+9
SPARC以来のブレークスルー、エコ・チップ搭載「Sun Fire CoolThreadsサーバ」
http://www.itmedia.co.jp/enterprise/articles/0512/07/news049.html
502Socket774:2005/12/10(土) 09:07:21 ID:iyONgbvr
WinChip C6コアを32個搭載したCPUキボンヌ。

503Socket774:2005/12/10(土) 18:05:27 ID:FdnfP50F
ハイハイワロスワロスの使い方間違ってない?
504Socket774:2005/12/23(金) 17:35:42 ID:zlu/Pl1U
まぁなんだ、下がりすぎ。
505Socket774:2005/12/27(火) 18:02:47 ID:de5D9DXp
952 :Socket774:2005/12/27(火) 17:00:21 ID:de5D9DXp
議論に負けると、逆ギレですか、インテルの工作員さん?

969 :Socket774:2005/12/27(火) 17:27:49 ID:nHaFDWcF
>968
スマンw IP2つで遊んでみたw
ID:nHaFDWcF
ID:de5D9DXp

猿のオナニーじゃあるまいし。 ずっと読んでりゃ流れは分かるんだから。
すごく読みにくい。スレ汚し。

979 :Socket774:2005/12/27(火) 16:49:26 ID:nHaFDWcF
>ID:de5D9DXp
工作員って言うか、俺とお前はペアだろ。俺が居てのお前、
お前が居ての俺だからな。俺はそう心得てる。

974 :ゲイツ ◆G6Ju/wt08s :2005/12/27(火) 17:32:30 ID:de5D9DXp
>>969
似非ジョブズ ID:nHaFDWcF 君!
ジサクジエーン ハケーン
オレと同じトリップ出して見せてくださいw

976 :ジョブス ◆CSZ6G0yP9Q :2005/12/27(火) 17:33:58 ID:nHaFDWcF
やだね。

978 :ジョブス ◆CSZ6G0yP9Q :2005/12/27(火) 17:35:55 ID:nHaFDWcF
Intelの暗躍とアム厨の死亡

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

インテル工作員墓穴を掘る、嘘つき。
506Socket774:2005/12/30(金) 19:15:16 ID:P/RKNikc
RISCの方がいいのになぁ。
やっぱWindowsの力が強すぎなんだ。
Dvorak配列が一般化しなかったように良いものが残っていくとは限らないのか。
507Socket774:2005/12/30(金) 19:22:19 ID:zclsTlze
>良いものが残っていくとは限らないのか。

だから君も残っていられるんだし。
508Socket774:2005/12/30(金) 19:35:33 ID:lKVhvI0Q
x86信者乙
というか、世界が広すぎて、井戸から出られないカエルか
509Socket774:2005/12/30(金) 21:12:20 ID:0YeCbI0V
無知な漏れに教えてください
CISCの代表がPentiumやAthlon
RISCがPowerPCやARM SH
であってます?
510Socket774:2005/12/30(金) 22:02:07 ID:7+EBgUmJ
RISCもCISCもねぇよ
511Socket774:2005/12/30(金) 22:10:33 ID:P/RKNikc
今のCISCはRISC的要素を採用してきているから大分変わっている。
Windowsのおかげでたっぷり開発費をかけられる分、
CISCは発熱等問題点も多いのにもかかわらず独占状態になっている。
512Socket774:2005/12/30(金) 22:26:04 ID:ZfAp8WdZ
>>509
>CISCの代表がPentiumやAthlon
内部でRISCに変換してるよ。
513Socket774:2005/12/30(金) 22:38:17 ID:7+EBgUmJ
自称RISCもCISIC並にアドレッシングモードや命令が増えてるけどな
514Socket774:2005/12/30(金) 22:51:28 ID:P/RKNikc
とりあえずMeromは期待大。
やっぱり省電力、低発熱じゃないとダメだわ。
515Socket774:2005/12/30(金) 22:53:56 ID:P/RKNikc
>>513
しかしパイプラインたくさん使ってRISC的処理をするCISCに変更してるんじゃ効率悪い。
516Socket774:2005/12/31(土) 00:43:22 ID:eUGltmLp
そこでトレースキャッシュですっぜダンナ!
分岐予測が外れると禿しくorz
517Socket774:2005/12/31(土) 01:22:19 ID:M19g7jHE
ARMやPowerPCはRISCにしては複雑な方だね。特にARMはRISCとは思えないぐらい。
まだMIPSやSPARCの方がRISC的
518Socket774:2005/12/31(土) 03:13:55 ID:+3ifSEPl
今や、RISC、CISCの枠付け自体が意味をなさなくなってきてるのだよ。
519Socket774:2005/12/31(土) 03:40:05 ID:M19g7jHE
まぁPowerPCもG5ではさらに内部RISC命令に分割して実行していたりするしね。

それでも歴史的には意味があるだろう。あるいはISA的に。
520Socket774:2005/12/31(土) 05:39:00 ID:T73XPckJ
後藤さんのコラムに書いてあったけど
今まで高速化のCISC→RISC的なアプローチから
今度は効率化のRISC→CISC的なアプローチへ
先祖返りするかも?みたいな事が書かれていて面白かった。
μOPsフュージョンとか確かにそうだよな。
それとアシンメトリックなマルチコアを組み合わせるとどうなっていくんだろうね。
521Socket774:2005/12/31(土) 09:10:42 ID:jg7HPvvE
結局、CISC、RISCなんて線引きはRISC派のディベート戦術みたいなもので、
実際の設計としてはCISCとRISCの間にいくらでも解があるわけよ。

RISCと称する設計ですら今じゃ複雑な命令の実装にはマイクロコードを
使ってるわけでさ。最初にMIPSやSPARCをやり始めた連中がみたら(つか、
生きてるから見てるだろうが)怒るのか苦笑するのか見てみたいよ。

>>520
希望的妄想としてはエミュレーションマシンが来ないかと。
マイクロコードでアプリケーションに特化した命令を皆がガンガン書くと。
522Socket774:2005/12/31(土) 10:16:23 ID:MH70qmoT
ARMがCISC化していってるのはプログラムサイズを抑えるためだし。
用途によって手段は変わっていくもんだねぇ
523Socket774:2005/12/31(土) 11:58:08 ID:8+2W4zG0
ゆり戻しなんて良くある話。
524MACオタ:2005/12/31(土) 17:59:00 ID:1jmYOXy/
>>513 さん
  -----------------------
  自称RISCもCISIC並にアドレッシングモードや命令が増えてるけどな
  -----------------------
アドレシングモードが増えてるって話わ初耳すけど。。。
>>519
  -----------------------
  まぁPowerPCもG5ではさらに内部RISC命令に分割して実行していたりするしね。
  -----------------------
POWER4/PPC970でcrackingやmillicodingが行われている命令わ,非常に初期(603時代)
とかのマニュアルから「将来この命令わ実装が変わって高速で実行できない可能性が
ある」と予告されていたモノが多いす。
>>520
uOPs Fusionのような命令のペアリングとRISCわ概念的に随分違うモノす。つーか,
文系ライタの後藤氏に技術に関する定見わ無いってことを頭に置いておいた方が良いかと。。。
525Socket774:2005/12/31(土) 22:33:56 ID:sqIrqxko
VLIWはどうよ。

526Socket774:2005/12/31(土) 22:56:27 ID:M19g7jHE
>>525
コンパイラしだい。
527Socket774:2006/01/01(日) 01:26:39 ID:MfyNpu8M
っていうかWindowsがついた者勝ち
良さよりも優先されますから
528Socket774:2006/01/01(日) 01:48:32 ID:AQ7k0krL
>>527
腐れ縁だよな
529Socket774:2006/01/01(日) 08:57:07 ID:tXV5Hwdf
IA-64はWindowsがついたのに負けましたよ。
530Socket774:2006/01/01(日) 09:31:12 ID:5fKfKajm
そりゃあ、Windowsは他にもあるからなw
POWER版Windowsがまた復活しないかな…
531Socket774:2006/01/01(日) 10:14:18 ID:EFyc/fZ8
Alpha版とAlphaAXPの復活キボン。
532Socket774:2006/01/01(日) 11:36:33 ID:GvEiL7+s
Mips版も忘れないでください…

でもWindowsCEじゃソコソコ
533Socket774:2006/01/01(日) 12:14:17 ID:K4PPaBA3
Windows無くてもいいです
534Socket774:2006/01/01(日) 12:23:17 ID:cZlmMmJM
MACヲタも文型ヲッチャー
535Socket774:2006/01/01(日) 12:28:13 ID:tXV5Hwdf
>>532
もはやWindowsCEでもARMなマシンばかりですよ、一般に手に入るのは。
なんせPocketPCではARM以外はダメという縛りがあるから。
536Socket774:2006/01/02(月) 00:04:36 ID:MOEbYded
>>509
CISCの代表っつったら、VAX、HP3000、TRONプロセッサ、javaプロセッサ
なんかに決まってるだろ
IA-32なんて古典CISCから見たらシンプルな命令
x87のスタックは真のRISCらしけど

537Socket774:2006/01/02(月) 05:40:06 ID:x+S9IW7V
RISCといえば、i960とMC88000。
538Socket774:2006/01/02(月) 10:38:13 ID:uPhTvyc5
>>536
RISCとスタックマシンは違う。
539Socket774:2006/01/02(月) 11:39:46 ID:79GjQpjy
>>538
真のCISCの間違い
540Socket774:2006/01/02(月) 15:26:54 ID:VaXwyr76
CISCといったら68000だろ。
541Socket774:2006/01/02(月) 17:19:16 ID:x+S9IW7V
>>540
VAX!
542Socket774:2006/01/02(月) 17:50:32 ID:Hi6TW5p3
6502
543Socket774:2006/01/02(月) 20:01:09 ID:NSwT8VF9
>>542
世界一普及した石かもしれん。
544Socket774:2006/01/02(月) 20:35:09 ID:DgwVMAru
↑?
大量採用されたのってなんかあったっけ。
ファミコンはRICOH RP2A03、PCエンジンはハドソンHu6280だよな。
545Socket774:2006/01/02(月) 20:53:11 ID:NSwT8VF9
>>544
ファミコン6502じゃなかったっけ
546Socket774:2006/01/02(月) 20:56:44 ID:NSwT8VF9
ファミコンの石は6502改で、正式名称RP2A03で良いのか?
547Socket774:2006/01/02(月) 21:16:45 ID:5QaF2UxR
GameCubeのGekkoはPPC G3ベースのカスタムCPUで、FPUで32bit浮動小数×2のSIMDに対応、だったっけ。
548Socket774:2006/01/02(月) 21:59:45 ID:wg4kAG6z
製造元の名称ではPowerPC750CXベースと言われている
549Socket774:2006/01/02(月) 22:28:19 ID:Hi6TW5p3
>>546
そうなんだろうけど、改も含めていいんだったら
4004とか8086とかあのあたりが一番、と言い張られるんだろうな。
550Socket774:2006/01/02(月) 22:50:20 ID:n5Wa+k0Z
>>549
4004がそんなに売れているとは...。
8086にしてもPCに(基本的に)一個づつでしかないしな。たいした数じゃない。

Intelなら8048〜51互換の方がよほど多く使われていると思うが。
551Socket774:2006/01/02(月) 23:09:54 ID:Hi6TW5p3
>>550
改も含めて、と断っているんだからどういうネタか汲んではくれまいか……
552Socket774:2006/01/02(月) 23:23:37 ID:n5Wa+k0Z
>>551
改を含めてもそんなものだといっているのが理解できないのだろうか?

4004がセカンドソース(あったっけ?)を入れてもバカ売れとは思えないし。
組み込みで使われる数量と比べたらPCの販売数なんてたいしたことないし。
Intel製の8048-51がそんなに使われてるわけもないし(→当然コンパチ品を含めての話)。
553Socket774:2006/01/03(火) 00:00:49 ID:8yldXC3x
>>549
改を含めてというネタなら8080のが6502より売れてるでしょ。
8085・Z80・64180およびそれらの組み込み用やASIC Cellまで入ってるし。
NTTのグレ電にもZ80コンパチ入ってたし。

でもそれらよりも携帯に使われてるCPUのが数はでてんじゃないかなぁ。
ARMは6502だって言われたら知らないw
554551:2006/01/03(火) 00:33:02 ID:N2q1PP2Z
>>552
いや、ネタだと言っているのでツッコむにしろ面白い方向に誘導して欲しいのだが。
累計総生産数のデータをこっちは持ってないので間違ってても全然不思議じゃないが。
>>553
ほう……Z80がそんなところで使われているとは。
メガドライバーやネオジオな人もさぞ喜んでいる事だろう。
555Socket774:2006/01/03(火) 00:39:24 ID:+y9Oc2Bj
>>554
>いや、ネタだと言っているのでツッコむにしろ面白い方向に誘導して欲しいのだが。

面白い面白くない以前の問題なんだが。
自分がどれだけ間抜けでデタラメなことを言ってるかわかってる?
己の無知さ加減を自覚してほしいね。

端的にいうと「バカは引っ込んでろ」だ。
556551:2006/01/03(火) 01:01:42 ID:N2q1PP2Z
>>555
デタラメなこといってる奴がいるならそれこそ面白くしようがあると思うが。

で、話を戻すとCISCの代表の話だっけ?
俺は勉強がてらこのスレ来てるだけだから555にCISCの代表を選んで欲しい。
こんな無駄レスでスレ消費しても仕方ないし、少なくとも俺より知識がありそうだし。
557Socket774:2006/01/03(火) 03:48:39 ID:8yldXC3x
ちなみにだけど、
6502改のファミコン世界累計販売数が約6300万台、
Z80改(アドバンスはARM+Z80)のゲームボーイ世界累計販売数が約一億2千万台。
携帯電話は種類豊富で6億台突破
558Socket774:2006/01/03(火) 03:57:34 ID:d4Vp+hff
4004って古いマウスやキーボードのなかに使われたたんじゃないの?
半分想像だけど
携帯電話や携帯ゲーム機と、その他の組み込み
どちらが多いか気になるところ
559Socket774:2006/01/03(火) 04:15:35 ID:yitCRFCv
>>556
CISCの代表と言うなら、S/370やVAXあたりの、
旧世代(マイクロプロセッサ以前)の代表的な香具師、
じゃないのかな。年寄りは引っ込んでろ!的な主張を
当時は感じた。それで行くと、RISCも年を取り、CISCも
若者ファッションを取り入れて若返った、ような気がする。
560Socket774:2006/01/03(火) 04:24:05 ID:d4Vp+hff
販売台数と命令セットの複雑さからいって、VAXで鉄板だろ
68000がシンプルに見えるくらい、複雑怪奇な命令体系だからな
マイクロプロセッサでCISCといえば68000だけど、これより複雑な命令のものは
いくつかあった
しかし、全て黒歴史の闇に葬りさられてる
iAPX432なんかが黒歴史CISCの代表だろうな

>>559
IA-32は複雑な可変長フォーマットと、レジスタの極端な少なさを除けば
遅くなるような命令体系じゃないからな
μops変換で十分対応できる
561Socket774:2006/01/03(火) 04:58:12 ID:+y9Oc2Bj
>>556
バカはバカだってことにも気がつかないし、バカだって言われてもわからんものなのか?
面白い面白くないって問題じゃないってことすらわかってないんだからなぁ

もう一度いうわ。
「バカは黙って引っ込んでろ」
二度と出てくるな。
562Socket774:2006/01/03(火) 05:10:04 ID:yitCRFCv
>>561
おまえモナー。

どこがどうでたらめか、説明してみ?
どうせできないんだろ?w
563Socket774:2006/01/03(火) 05:11:48 ID:+y9Oc2Bj
>>558
4004はふるーーーーい電卓用プロセッサ。

>4004って古いマウスやキーボードのなかに使われたたんじゃないの?
そんな新しいものには入っていない。

>半分想像だけど
君はでたらめの事を「想像」というのか?

>携帯電話や携帯ゲーム機と、その他の組み込み
>どちらが多いか気になるところ

そりゃその他の方が多いに決まっているだろう。

>>559
CISCなんてRISC陣営が「RISC以外のプロセッサ」につけた名前なんだから
代表とか何とかいうのはナンセンスだと思うけどね。

>>560
>IA-32は複雑な可変長フォーマットと、レジスタの極端な少なさを除けば
>遅くなるような命令体系じゃないからな

それ以外にISA的に遅くなる要因があるなら教えてくれ。
564Socket774:2006/01/03(火) 05:13:36 ID:+y9Oc2Bj
>>562
>550 >552 で説明済。

煽るならちゃんと読んでから煽れ。
565Socket774:2006/01/03(火) 05:24:24 ID:wjLMoKcG
改も含めてってこういうのも含めたらどうなっちゃうんだろう。
http://www.silabs.com/tgwWebApp/public/web_content/products/Microcontrollers/en/index.htm
566・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/03(火) 05:48:38 ID:ZRYYfIQh
ルネサス(三菱電機+日立)って半導体世界3位だけど、ここって組み込みプロセッサ専門だよね。
M16Cとかって個数ベースならIntel超えてることない?

過去の資産なしで考えるならPowerアーキテクチャが現状最強なのかな。
CellのSPEの命令セットや内部アーキテクチャ(演算ユニットのパイプライン構成とか)は
PPC970をかなり手本にしてるっぽいし。
567Socket774:2006/01/03(火) 05:50:44 ID:+y9Oc2Bj
>>565
8051と書いたときにはそういうのも念頭にあった。
ほかにもUSBカードリーダにコントローラに埋め込まれていたりもする<8051互換

>553辺りは川鉄のバカみたいに速いZ80コアなんかも考えているのではないかと思った。

このクラスの石だと命令セットの拡張なんて無駄なことはしなかったりするね。
どうせ独自拡張なんかしても誰も使わないから。
#64180なんかも結局拡張命令(掛け算とか)なんて使われてなかったようだし。
568Socket774:2006/01/03(火) 05:57:19 ID:+y9Oc2Bj
>>566
>CellのSPEの命令セットや内部アーキテクチャ(演算ユニットのパイプライン構成とか)は
>PPC970をかなり手本にしてるっぽいし。

そうか?
レジスタの本数も命令セットもぜんぜん違うようにしか見えんのだが。
ttp://pc.watch.impress.co.jp/docs/2005/0212/kaigai156.htm
#を読むと内部アーキはPPCのVMX似だとはあるけど。
#それをPPC970似というのはミスリードだと思うが。
569・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/03(火) 06:07:15 ID:ZRYYfIQh
>>568
いや、命令のフォーマットもかなり似てるよ。手元にSONYとIBMそれぞれから落とした資料あるけど。
まぁ、レジスタをあらわすビットは確かに2bit分多くなってるね。
直に叩けるメモリ空間がローカルストアの分しかないから、その分レジスタ増やせたんだと思う。
逆に言えばローカルストアの容量は結構ギリギリ。

あと、VMXとSPEのSIMD命令は、完全ではないけどほぼ1:1で対応してる。
ビット置換系の命令がややプアになってるけど。
570・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/03(火) 06:16:16 ID:ZRYYfIQh
似てるといっても6種類あるけどねw




ごめん、こりゃ別物に近いwww
ニーモニックレベルでは近いんだけど。
571Socket774:2006/01/03(火) 12:38:09 ID:N2q1PP2Z
>>561
だからさぁ、知識が足りなくて一度間違えたヤツと、
ユーモアを解さずセンスのないツッコみしか出来んヤツとどっちが馬鹿なのよ?
>>568-570
IBMが入ってるからPowerPC系だとばかり思ってた。魔改造ってこと?
どうでもいいけどEEの時も展開考えてるみたいなこと言ってたけど全然でしょ。
今回もよそに売る気は無いだろうね。
572Socket774:2006/01/03(火) 13:37:45 ID:CsuG8YVX
POWERの中なら、Freescaleのe600コアが最強だな、現状では。
e600は延命されてまだまだ新製品が出るらしいから、e700はずっと後か
573Socket774:2006/01/03(火) 13:52:35 ID:LiStS0bv
>>571
>だからさぁ、知識が足りなくて一度間違えたヤツと、
>ユーモアを解さずセンスのないツッコみしか出来んヤツとどっちが馬鹿なのよ?

どの辺りがユーモアなのかさっぱりわからないんだけど。
自分の無知を「ユーモアだから」とかいってずーっとごまかし続ける奴が一番バカだと思うね。
自分の間違いを訂正してくれた人に向かってめちゃめちゃ失礼だと思う。
574Socket774:2006/01/03(火) 14:32:45 ID:+y9Oc2Bj
>>572
POWER ≠ PowerPC

何を持って「最強」といってるのかわからんけどFreescaleは組み込みにシフトしてるから
パワー的にはそこそこで踏みとどまってるね。
#とはいっても1GHz台半ば3000MIPSレベルだからたいしたものだけど。
575MACオタ>574 さん:2006/01/03(火) 15:02:22 ID:uCHMe4hS
>>574
残念ながらPOWER = PowerPCす。
本家IBMですら、POWERアーキテクチャわPOWER2で滅亡してPOWER3以降わPPC ISAなんすよ(笑)
http://www.decisionjapan.co.jp/dj/unigram/442p1.html
576MACオタ:2006/01/03(火) 15:06:47 ID:uCHMe4hS
正月で暇なら、IBM公式のPowerPCの歴史を読むのも一興かと思うす。
都合の悪いことは書いてないので、これが全てって訳じゃ無いすけど。。。
577MACオタ@リンク追加:2006/01/03(火) 15:09:34 ID:uCHMe4hS
578Socket774:2006/01/03(火) 15:10:21 ID:N2q1PP2Z
>>572
最近別の所からPWRficientというのも出てきたようだが
あれが予定通り8コアで成功すれば勝てる? かも。
>>573
恩着せがましい。
579Socket774:2006/01/03(火) 15:34:54 ID:YRSN/hLc
AM2900シリーズはどうなったの?
昔仕事で使い始める予定で勉強をしてたんだけど
客先がつぶれてそれきりんなった。
580Socket774:2006/01/03(火) 15:56:05 ID:+y9Oc2Bj
>>575
>残念ながらPOWER = PowerPCす。
>本家IBMですら、POWERアーキテクチャわPOWER2で滅亡してPOWER3以降わPPC ISAなんすよ(笑)

リンク先の記事を見てもそうは読めないが。

たしかにPOWER3はPOWER2/PowerPCどちらのアーキテクチャにも互換があるが、
同一なわけではない。

まぁ少なくともe600はPOWERじゃない。

>>578
>>>573
>恩着せがましい。

ハァ?誰に向かっていってるの?
なんか勘違いしてない?
581MACオタ>580 さん:2006/01/03(火) 16:25:57 ID:uCHMe4hS
>>580
  -----------------
  リンク先の記事を見てもそうは読めないが。
  -----------------
読解力が無いか、POWER ISAが何なのか知らないかのどちらかすね(笑)
http://www-06.ibm.com/jp/servers/aix/developer/feature/power10/c01.html
  =================
  Power3はPowerPC 620のプロセッサコアとバスインタフェースを受け継ぎ、これに2つめのFPUとLSUを
  追加し、また命令キューとリネームレジスタを増やした。サポートされるアーキテクチャーはPowerPCの
  フル仕様である。POWER2からの発展として見ると、Power3はP2SCの持つ2重化されたパイプラインと、
  PowerPCの持つ64ビットアドレスモードや多重プロセッシング機能を合わせもつ形となった。

  これによってPOWERからPowerPCへの移行が完了し、2つの系統が一本化された。
  =================
現在でわ"POWER"ってのわ命令セットの名称でわ無く、単なる商標なのでMotorolaのPowerPCわPOWER
でわ無いすけど、現行の全てのPOWERアーキテクチャを名乗るチップわPowerPCす。
582MACオタ>579 さん:2006/01/03(火) 16:28:19 ID:uCHMe4hS
>>579
プリンタ等組込分野で結構なシェアが合ったのに、x86寄生虫路線に集中することを決定したAMDが
顧客ごと切り捨てたす。
AMDを優良企業と持ち上げるアム虫の馬鹿っぷりを示す好例すね(笑)
583・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/03(火) 16:46:12 ID:ZRYYfIQh
まあ、PPEと共通なのは命令のフォーマットが op src1 src2 dest の順で32ビット固定長なことくらいですな
RISCだからレジスタ間オペレーションね。

4オペランドな命令ももちろんあるから、オペコード部が最短なんと4bit。
レジスタ部をあらわす部分が7bit×4の28bitですもん。
これ以上拡張しようがないでしょ、これ。

AltiVecの命令セットを改造したものが独立コアになってるって言ったら
大体近い気もする。実際に、サポートされる演算はかなり酷似してる。
Cの組み込み関数ベースでAltiVecのコード書いてた人なら簡単に移植できるハズ。

AltiVec(IBMでいうVMX)はもともとMotorola(今のFreescale)の独自拡張だからね
やたらリッチなVPERM命令まわりとか、暗号とかのアクセラレーションに使うつもりだったんじゃないかと。
俺はVMXさえなければG5は爆熱にならなかったんじゃないかと本気で思ってたりするわけだが。
584・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/03(火) 16:52:27 ID:ZRYYfIQh
>>571へのレスね。
585Socket774:2006/01/03(火) 16:57:10 ID:GcGtfuZh
>>559-560
マイクロプロセッサに限定しようよ。
586Socket774:2006/01/03(火) 17:08:03 ID:tMDny5g9
話の途中で割り込んですいません。
名スレと評価の高い前スレってどこかに保管してませんか?。
当方、●無しなんで読みたくてもだめなんです。
587Socket774:2006/01/03(火) 17:09:37 ID:+y9Oc2Bj
>>581
やはりPOWER = PowerPCとは読めないなぁ。

>現行の全てのPOWERアーキテクチャを名乗るチップわPowerPCす。
だからといってPOWER = PowerPC とはならないわけだが。
POWER3はPowerPCとしての要件を満たすからといってPowerPCがPOWERになるわけではないでしょ?

まぁ、元レスの「POWERのなかでe600は」というのはナンセンスってのには
同意してもらえそうだからもういいけど。
588571:2006/01/03(火) 18:18:49 ID:N2q1PP2Z
>>583,584
そうなのか……それだけ違えば全然違うとも言えそうだ。
残ってるのは面影のみというか……
やっぱりAltivecみたいなのは熱だすか。PS3は爆熱になりそうだな。
589Socket774:2006/01/03(火) 18:35:10 ID:0CfbOySJ
名称に異常に拘るMACヲタ。付き合うだけ無駄だよ。
590Socket774:2006/01/03(火) 20:16:02 ID:lEiRC6WF
つうかさ、MACオタってなにがしたいの?
話が建設的な方向に全く向かわないんだがいい加減にしてくれ。
特定の企業が気に入らないってのはあんたの勝手だが
それをいちいち表に出して、他人を不快にさせるような発言を
繰り返すなんてレベルの低いことやってるんじゃないよカッコワルイ。

嫌味を言って満足してるだけのオナニー野郎は
社会の屑としか思われていないからね。
知識が幾らあっても、今のあんたは言葉を自慢げに羅列するだけで
何の尊敬にも値しない。いや、むしろ終わってる。

大体その日本語の使い方からしてお寒い。
「わ」とか「す」とか、自分なりにイイと思ってるのかもしれないが
はっきり言ってキモ過ぎ。周りがどう感じているのかに鈍感だから
空気読めてないんだよ。
自尊心が肥大しているから、裸の王様という現実に全く気づいてない。

これだけ改善すべき点を言っても、どうせ「これだから〜は〜なんだよな」と
関係ない論点へすりかえて、逃げ道を作ろうとするだろうから先に言っておく。
CPUよりまずお前の対人コミュニケーション能力を先に見直したほうがいい。
ただ人に嫌われるだけの人生で終わりたくなければね。
人に好かれたことがあるのか疑わしいよ、こんなクソ。

以上スレ違いでした。
591MACオタ>590 さん:2006/01/03(火) 20:22:18 ID:uCHMe4hS
>>590
単なる事実の提示に対して火病を起こして長文書き連ねるより(笑)、私の書き込みのリンク先でも読んだ方が
よっぽどあなたにとってもタメになると思うすけどね。。。

そうやって身に付けた基礎知識の上にたって、あなたの知見をここで書くようになればスレッドそのものも
活性化するってモノす。
592Socket774:2006/01/03(火) 20:48:46 ID:GcGtfuZh
>>586
2chは●の売り上げなどで運営しています。
大した金額ではないのですから●くらい買いましょう。
593Socket774:2006/01/03(火) 21:03:20 ID:+y9Oc2Bj
>>589
まぁ、名前は大事よ?
でも嘘はいかんわけですが。
594Socket774:2006/01/03(火) 21:10:15 ID:+y9Oc2Bj
>>583
>まあ、PPEと共通なのは命令のフォーマットが op src1 src2 dest の順で32ビット固定長なことくらいですな
>RISCだからレジスタ間オペレーションね。

これで共通といってしまうとほとんどのRISCは共通になっちゃうよ。
#SHとかの16bit命令長2オペランドRISCコントローラは狭義のRISCではないだろうしね。

>俺はVMXさえなければG5は爆熱にならなかったんじゃないかと本気で思ってたりするわけだが。

どうなんだろう。
G3+AltivecなG4があれぐらいで済んでいるなのだから、やっぱりVMXを落としてもそこそこ熱いプロセッサにはなったと思う。
595Socket774:2006/01/03(火) 22:36:16 ID:/JNkOyQk
8051といえば...

むかし、X1で、I/Oコントロール部分に1つとキーボード内で1つ
合計2つ使ってたっけ
X1ターボでは、もう一つ増えて3つだっけか。

そいや、8801とかはFDDコントロール用にZ80積んでたって?
(既出ネタだが。)

こういう、PC内部に使われてる組み込み用プロセッサって、
他に何があるの?

キーボードやマウスは使ってるだろうが、他にもあるよな。
一部HDDではSuperH使ってるとも聞いたっけ。
596・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/03(火) 23:08:07 ID:ZRYYfIQh
>>594
G4は当初クロック伸び悩んだでしょ。それでパイプラインの細分化を余儀なくされたわけだけど。


まぁはっきり言ってキワモノですなこれ。
SPEは4オペとそれ以外をどうやって区別してるのかと思えば、どーやら最初のビットが立ってるのが4オペランド命令で、
それ以外の命令は全て0になってる。
実質3bit、たかだか8種類の命令しかサポートできない。
かなり厳しいなこれ。

あとの5種類の命令フォーマットもビットが立ってるか否かで区別してるっぽい。
なんか凄まじいアーキテクチャですな。

可変長のx86よりはマシだろうけど。
AthlonはL1命令キャッシュにフェッチするときに命令長を予め計算して先頭に付加するから高速に
デコードできるとなんかの本で読んだけど、Pentium Mあたりでも同じことやってるんだろうか。
597Socket774:2006/01/04(水) 01:09:27 ID:fC3tHI40
PenMはPIIIコアをほとんどそのまま流用してあるだけじゃないの?
598Socket774:2006/01/04(水) 01:33:10 ID:KxDFFMQO
まあキャッシュだの分岐予測だの、一部命令追加だの以外の
の処理コア自体は大差ないという噂はあるな。
599Socket774:2006/01/04(水) 03:00:05 ID:h1Nh9rBU
>>571
>どうでもいいけどEEの時も展開考えてるみたいなこと言ってたけど全然でしょ。

どっかの板で、GS+EEの石採用考えて問い合わせてみたら
10万個単位で注文おながいしますとか言われてorz、って話を見た。
600Socket774:2006/01/04(水) 03:37:45 ID:+zykwugS
ハン板のITスレだな。
あれでもパチにつかわれているって話があったと思うんだけど。
601Socket774:2006/01/04(水) 03:43:14 ID:h1Nh9rBU
あー、多分それだ。意外と住人いるんだな・・・

パチ屋の場合、ハードは共通でソフト違いなのが多いだろうから
(コンピュータ周りね。台そのものでなく)
そういう用途なら大量の需要が見込めるから使えるんだろうね。
ドリキャスそのものが使われてたこともあったし。
602Socket774:2006/01/04(水) 11:04:40 ID:PloVTP7a
>>595
X1は
本体:8049
キーボード:8048
じゃなかったかのう。
turboはキーボードも8049だっけ?

8051はX68kのキーボードだったような気がするが。

ノートPCの電源制御&KB処理でH8つーのは結構あるようですな。
603Socket774:2006/01/04(水) 11:12:00 ID:9uxERrkT
>>601
>ドリキャスそのものが使われてたこともあったし。

NECの黒歴史VGAチップ、PowerVRでは。
ドリキャス丸ごと組み込んでるとして、パチンコでSH4何に使うか思いつかん。

GS+EEって、プレステ2のEmotionEngineとGraphicSynthesizer?
パチンコにそれは豪華過ぎかつ熱過ぎジャマイカ。
604Socket774:2006/01/04(水) 11:38:12 ID:S/022Z3u
パチンコは結構処理能力使いそうだが。EEはともかくSH4ぐらいは。
サミーならSH4+PowerVRは使うだろ。ノウハウが余ってるわけだし。
605Socket774:2006/01/04(水) 16:12:15 ID:fbubWg+X
>>574
だいたいPowerPCが作られて時にPOWERから削られた命令はなくても支障のない命令ばかり
POWERだから高性能だと思ってるのはPowerPCやPOWERの命令セットについて何もしらないやつ
606Socket774:2006/01/05(木) 00:36:20 ID:fsJ5+gA9
>>595
i960がRAIDコントローラに使われてる。
HDDのコントローラでもARMが勢力伸ばしてる。
SeagateがMaxtorを買収したので、またARMが増える。
607Socket774:2006/01/05(木) 00:43:43 ID:r+JraAQS
パチンコはサブCPUは豪勢だな。最初に32bitCPU(SH)を使ったのは華観月らしい。VRも人気だったよ。

>>563
> それ以外にISA的に遅くなる要因があるなら教えてくれ。
なんにもないのでOpteronなんかは速い。
レジスタのパーシャルライトは特許の関係上いろいろめんどうくさいが。

>>579
製造終了、だと思った。
Am2900シリーズのプリンタなんて聞いたことねえぞ。Am29kじゃねえのか。29kは先細りそうになって消滅したんだよ。

AltiVecはモトローラか。欲張って高機能化した挙句に後で高性能化の障害になるのは昔からだ。
中学生の考える最強CPUだな。
608Socket774:2006/01/05(木) 01:06:51 ID:r+JraAQS
>>596
> あとの5種類の命令フォーマットもビットが立ってるか否かで区別してるっぽい。
命令エンコーダはずいぶん楽になるよ。

>>607
680x0だとオートインクリメントあたりと例外処理がかなり足をひっぱりそう。
滅びてしまったのでもはや比較もできないが。

いずれにせよ、ISAはよほどクソ(例:SPARC)でないかぎりは性能には大して影響しない。

究極のCISCとしてはRekursivを挙げておくよ。iAPX432とは甲乙つけがたい。
609Socket774:2006/01/05(木) 01:08:11 ID:r+JraAQS
>>608
デコーダだな。吊ってくる。
610Socket774:2006/01/05(木) 04:25:27 ID:+1BZXzDj
>>603
うんにゃ、サミーの猛獣王でDC採用と書いてあったよ>パンフ
あんときはセガがDC撤退でだぶついていた部材をサミーが引き取ったかと。

北斗も使ってたし、もう無くなってきたかな、部品
611Socket774:2006/01/05(木) 04:27:13 ID:+1BZXzDj
>>603
あー、それとたしか山佐の鉄拳が使ってると聞いたことがあります>GS+EE
612Socket774:2006/01/05(木) 06:39:11 ID:a4FgJucO
最近のx86はCISC命令をプロセッサ内部で複数のRISC命令に分割して実行する。
と言うような事がどこかに書かれていましたが、
これって相当無駄な作業なんじゃ?
なぜ最初からRISC命令にしないのでしょうか?
Windowsが動かなくなるからですか?
613・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/05(木) 06:58:24 ID:2/hOjCXb
>Windowsが動かなくなるからですか?

まぁ簡単にいえばそう。
マイクロアーキテクチャはCISCよりRISCのほうが性能面で優れてるんだよ、結局のところ。
でも、x86には莫大なソフトウェア資産がある。これは性能より大事な強みだ。

その作業のおかげで、ソフト側からは従来のx86アーキテクチャに見せ互換性を保ちつつ、
高速なRISCアーキテクチャの恩恵を受けられるわけよ。

もちろん、「無駄」を省くための試みは行われてきてるんだけどね。
TransmetaのCrusoe/Efficeonはx86→マイクロアーキテクチャネイティブコードへの変換を
ソフトウェアで行い、リコンパイルされたVLIWを実行するCPUだ。
Pentium 4もデコード済みの命令を一定量キャッシュすることで、デコードのコストを削減す
るアーキテクチャになってる。
両方とも結果的に従来型CRISCのPentium Mに敗れたわけだが。
614Socket774:2006/01/05(木) 10:17:56 ID:a4FgJucO
PowerPCの方が同じクロックで比べると速いと言うのもこの違いからの差なんですね。
例えば新しく出るmelomやconroeなんかはその無駄な作業による無駄を少なくするようにたくさん工夫されてると思うんですが、
無駄があるのとないのとで何パーセントくらい差があるものなのでしょうか?

AppleがIntelのx86に移行する事で、
今までその無駄が必要なかったのにわざわざ無駄のある方を選んで、
その無駄に合わせるというのが勿体ないと思えちゃいます。
IBMのG5移行に期待できないからとか理由はあるのだろうけど…

これはAppleの妥協なのでしょうか…
615Socket774:2006/01/05(木) 10:55:59 ID:s0uSAlic
>>606
PCI-PCIブリッジにも入ってるのがありましたな。
最近はXscaleコアになっちまったようですが。

616Socket774:2006/01/05(木) 12:18:46 ID:r+JraAQS
>>614
> PowerPCの方が同じクロックで比べると速いと言うのもこの違いからの差なんですね。
違う。
単にマイクロアーキテクチャの差。

> 無駄があるのとないのとで何パーセントくらい差があるものなのでしょうか?
1%くらい(AMD談)。

x86のCISC-RISC変換といっても、昔からあるマイクロ命令となんも変わらん。
617Socket774:2006/01/05(木) 14:07:13 ID:84Zu0l+q
無駄が1%というのはパフォーマンスの面で、という気もする。
組み込みなんかは性能比以上に消費電力が低いだろうし。
PowerPCに関してはあっちもデコードしてると聞いたが。
618Socket774:2006/01/05(木) 14:34:54 ID:+RFVi6hw
実行時の変換コストは低かろうけど、分岐予測やレジスタリネーミングなんかの
機構を考えるとx86命令を維持するのにかかったコストはかなりのもんだろうな。
今後はSMTの導入などでまた悩まされる。
619Socket774:2006/01/05(木) 14:41:06 ID:yNQDEWaL
>>614
以前どっかで読んだ、AMDのアーキティクトへのインタビューでは
x86互換によるペナルティーは、レジスタが少ないことで10%、
可変長命令で10%、ただしコード密度が高いことでキャッシュ効率が
良くなって10%相殺で、同規模ロジックならRISC比90%の性能って
言ってた

>>617
1%ってのはダイサイズで
Opteronのデコーダ面積が全ダイのなかでその程度
パフォーマンスでは、少なく見て10%、多く見て20%程度の
損失なんじゃないかな?
620Socket774:2006/01/05(木) 14:44:04 ID:yNQDEWaL
命令長を無駄に大きくしても、SSEのレジスタ数を
32〜128本にしておくべきだと思った
整数演算では、x64の16本の汎用レジスタで
あんま困ってないっぽいし
だから速いわけで
621Socket774:2006/01/05(木) 14:44:44 ID:owDY6MS6
かなり色々やってるEfficeonでも、変換ロスは1%程度と言ってた記憶。
622Socket774:2006/01/05(木) 14:47:41 ID:yNQDEWaL
>>613
コードモーフィングも、トレースキャッシュも
プログラムの局所性が高くないと、効率悪いんだよな
P4のL1命令キャッシュじゃ、スレッド切り替えの度に
ゆっくりと再デコードだもの
623Socket774:2006/01/05(木) 15:49:21 ID:kYvMcgOQ
>>614
>PowerPCの方が同じクロックで比べると速いと言うのもこの違いからの差なんですね。

それはアップルお得意の誇大広告だよ。
624Socket774:2006/01/05(木) 16:05:43 ID:pTZ/tzIk
>>623
プギャー
625Socket774:2006/01/05(木) 16:11:19 ID:pTZ/tzIk
連カキすまんが、PowerPC(色々あるけど、x86の同世代と比較して)が同クロックでも速くないと思ってる奴いるのか?
消費電力あたりの性能差はx86が気の毒なほどあるし

Athlon64の方が同じクロックのPentium4と比べると速いというのもこの違いからの差なんですね。
それはAMDお得意のモデルナンバーマジックだよ。

と言われても否定できないな
626Socket774:2006/01/05(木) 17:02:40 ID:84Zu0l+q
「プギャー」のレスの直後に連カキコでまじめなレスつけても信頼出来ん。
まあPowerPCは十分高性能だろ。どっちが凄いかはわからんが。
PowerPCが劣っているのはノート用とかそっちのほうが……
627Socket774:2006/01/05(木) 17:08:09 ID:kYvMcgOQ
x86がむちゃくちゃすばらしいとかPowerPCがむちゃくちゃうんこだ
とか言いたいわけではなくて
常にどんな状況であろうとも同一クロックならx86よりPowerPCが
速いんだ的内容はアップルお得意の誇大広告だよということだよ。
628Socket774:2006/01/05(木) 17:36:38 ID:vc5+fmBl
spec95,2000、実アプリベースの各種ベンチマークテストを見ると、
同世代のPPCとx86の、クロック当たりの速度は、同等かx86がちょっと上
くらいだろ
消費電力あたりの性能は、G4が圧倒してるけど
速度的に1世代前だから当別なもんでない
GeodeNX見ればわかるように、クロックを下げれば
既存x86コアでも、10〜20w程度のTDPは達成できる
629Socket774:2006/01/05(木) 17:43:37 ID:vc5+fmBl
同価格帯で、チップセットやメモリサブシステムで差を
つけられないんだから、CPU速度がたいして変わらないのは
当然なんだけど、それがわかるまで何年もかかったよ、orz
alphaも外付けキャッシュをなしにして、メモリをFP-RAM 1chに
すると、同条件のx86以下の速度しか出なかった
630Socket774:2006/01/05(木) 19:06:14 ID:GZaUladl
>>607
最初にヤラカシたのって、68040のときだっけ?
6800系8ビット時代にも、そいうコトあった?

いや、68000だって充分、その部類かも知れんけど。
631Socket774:2006/01/05(木) 19:26:03 ID:GZaUladl
>>614

P4はクロック当たりの性能が悪すぎ。
x86系CPUの多くは、P4よりも
クロック当たりの性能が何割か高い。

P4は、
「P4に適した処理を、P4用に最適化したアプリで実行した場合にだけ速い」
って感じで、

たいていの処理は、クロックで劣るAthlon64とかPentiumMと同等以下

>>620
それをすると、クロックを上げれなくなる。
モトローラがいつも繰り返す失敗が、それ。

>>623
いや、おれは「PowerPCの方が同じクロックで比べると速い」という話は信じてる。

ただ問題は、コンパイラの質が悪かったり、
OSのオーバーヘッドが大きかったりして、
それらの性能上の優位点を、すべて相殺していること。

PowerPC自体は速いけどPowerMacは速くないわけ。

ま、それで相殺される程度の、ちょっとした差しかないんだろうけど。
632Socket774:2006/01/05(木) 19:56:56 ID:o+nTppbk
>>630
6800、6809は命令が強力だったが、アキュームレータ、メモリ-メモリ間演算
アーキティチャで、レジスタが極端に少なかった
モトローラは複雑で遅いってのは70年代からの伝統
でも68000〜68030は、当時の実装レベルにマッチした
いいCPUだったのではないか?って思う

633Socket774:2006/01/05(木) 23:32:46 ID:fsJ5+gA9
>>607
記憶が怪しいのだけど、
プリンタにAm29000が使われていたのは、
AdobeのPostScriptのエンジンがAm29000用だったから?
634Socket774:2006/01/06(金) 07:32:22 ID:P9utIW3O
>>633
逆に言えば,Am29000がその当時としてはレジスタが多くて
演算性能がそこそこの素直なRISCプロセッサだったので
ターゲットにしやすかったというのもあるだろうね。

…ワークステーション崩れで組込用途というパターンの先駆けか。
635Socket774:2006/01/06(金) 11:51:05 ID:0bE9aNpj
>>634
割り込みまわりがよく出来ていたことやハードウェアコストも理由だと思う。
最初からどちらかというと組み込み向けだったぽい。
636Socket774:2006/01/07(土) 01:41:38 ID:Qc7eQxU1
>>614
ttp://pcweb.mycom.co.jp/column/sopinion/005/
> で、内部でx86→RISCの変換を行って処理するのと、RISC命令をそのまま実行するのと、どちらが
> より効率的かといえばそのまま実行する方が高速に決まっている。ちょっと前の話だが、
> AppleのCMで、400MHz動作のPowerPC G3搭載マシンと1GHz動作のPentium IIIマシンを並べ、
> Photoshopのフィルタ処理を実行させるとPowerPC G3マシンの方が高速といった話があった。

マッコイオタが必死にPenMマンセーしようとするのも頷ける。ジョブズは何が悲しくて
x86デコードの泥沼に足を踏み入れるんだか。
637Socket774:2006/01/07(土) 03:12:56 ID:jNCFzroK
Windows信者がx86を使い続けるのとはちょっと違う理由だよな
アポにはPCに全力投球するx86(他に使い道がないからw)と、インテルの供給能力が欲しくて、それがPPCのメリットを捨てる価値があった、と。
638Socket774:2006/01/07(土) 03:24:15 ID:zqwX3naP
>>632
うーん、68000の非同期バスや68020のリッチなPMMUなんかは、
バランス感覚を疑うな。
68030はわりとバランスは取れていたと思う。

>>636
> より効率的かといえばそのまま実行する方が高速に決まっている。

根拠のない決め付けをしてPOWER4が出てきたときに恥をかいたわけだが。

POWER以外にも、SPARCやAlphaもuop変換やってるよ。
639Socket774:2006/01/07(土) 07:39:30 ID:4juLjDJ6
> より効率的かといえばそのまま実行する方が高速に決まっている。
その点については程度はともかく間違いないだろうけど、
そこだけみればということであってIntelの方が良い面も沢山あるわけだから、
全体をみて良い方を選んだって事。
640・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/07(土) 07:47:37 ID:62LVNHfc
AppleがおしてるオープンソースソフトにしたってPowerPCってどうしても後回しにされがちだからね。
641Socket774:2006/01/07(土) 10:28:25 ID:vOhVdKeX
>>638
>POWER以外にも、SPARCやAlphaもuop変換やってるよ。
やってねーよ。
642Socket774:2006/01/07(土) 10:58:07 ID:zqwX3naP
>>641
やってる。
SPARC64Vの資料見てみ。
21264は少なくともメモリアクセス命令は分解してる。
643Socket774:2006/01/07(土) 11:22:30 ID:U0+iynxW
>>641
alphaは、uopとはちょっと違うけど、超越関数とVMS向けのメモリ保護を
マイクロコードでやってる
ワイヤードロジックだけで、全部処理するってのも非現実的だからな

>>636
K7って、メモリ-レジスタ演算も1uopで発行して、ALU直前のバッファで
レジスタ演算とロード/ストア命令に分解するっていう、
uop fusionみたいなことをやってたんだな
x86だと、スタック操作をパイプライン出せるとか↑で
スケジューリングを楽にできる部分もあるんで不思議だよな

最近知ったんだが、itaniumってレジスタウィンドウ対応だったんだな
33〜128本目が回転レジスタなの
itaniumがSMTやOOOに対応しない理由のひとつって、
あほみたいに覆い、論理レジスタがあるでしょ?
EV8みたいにレイテンシ長くして、巨大なレジスフアイルを
回すって方法もあるけどさ
レジスタウィンドウなんだから、論理レジスタ減らしといたほうが
幸せだったと思うのはおれだけ?

644Socket774:2006/01/07(土) 11:33:58 ID:U0+iynxW
さて、久しぶりに空想のCPUでも考えてみるか
CPUはアリスちゃんにしとこう
で、まず現代のマイクロプロセッサに足りないものはなんかっていったら
それはベクトル命令だ
数値計算を効率的に処理しようと思ったら、ベクトル式以外ありえない
このベクトル演算を実装するにあたって、何がネックか?
っつーと、巨大なレジスタファイルだ
NECのSXシリーズは、ベクトルレジスタが144KBもある!
これではチップがレジスタだけで埋まってしまう
そこでベクトルレジスタには、L1キャッシュを同じロジックを使用する
速度が問題だが、itanium2のL1キャッシュはなんとレイテンシ1クロックだ
32KB、3読み込み、1書き込み、各ポート512bitでレンテインシ2くらいにすれば
低コストでベクトルレジスタを実現できる(かな?)、やったぁ!
ベクトル演算ユニットは、レジスタポートが512ビットなんで8wayだ
2Ghzで動けば、32Gflopsである

645・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/07(土) 11:34:23 ID:62LVNHfc
>>643
みたいな、っていうより、PenMのが後発。

ただ、ALUとAGUを各パイプごとにペアにしたK7に対して、PenMでは従来のPentium III同等の
演算ユニット構成でそれを実現しているのが凄い。
YonahではSSEの128bitパックド演算にもそれを適用したことで最大4RISC命令
(QWORD Load×2とQWORD演算×2)を1opで扱えてる。

AMDのパイプライン構成ではSSEμOPsフュージョンは原理的にかなり難しい気もするけど
646・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/07(土) 11:36:18 ID:62LVNHfc
>>644
ItaniumのL1のレイテンシが短いのは厳しい選別と低クロックのおかげだったりするわけだが。
647Socket774:2006/01/07(土) 11:47:45 ID:U0+iynxW
>>645
ALUとL/SUがセットで、SSE/FPUから離れてるからね

>>646
低クロックはともかく、itaniumって選別してるの!?
ただでさえダイサイズがでかくて高コストなのに・・・
648・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/07(土) 12:03:57 ID:62LVNHfc
少なくともCeleronなんかの選別基準と同等ではないと思うけど。
Pentium IIIでもXeonやS(Tualatin)はL2容量の割りにレイテンシが短かった。

あと、キャッシュのアソシエイティビティ落とせば容量を増やせるかレイテンシを小さくできると思う。
649Socket774:2006/01/07(土) 12:13:26 ID:ObjJl+Rz
L2のレイテンシはCoppermineとNorthwoodが異様に小さかった希ガス。
650Socket774:2006/01/07(土) 12:13:30 ID:U0+iynxW
>>648
IA-32は、駄目なチップだったらceleronで売ればいいけど
他はそうはいかないから、選別してないとオモテたよ
RISCチップとかはみんな選別品なんだろうな

>>あと、キャッシュのアソシエイティビティ落とせば容量を増やせるかレイテンシを小さくできると思う
それだ!
6502のゼロページみたいなもんを用意し、そこにのみキャッシュを
おけば、ライン検索を短くできる!
ってレジスタそのものですね、はい
651Socket774:2006/01/07(土) 12:14:50 ID:U0+iynxW
>>649
northwoodは短かったけど、大容量化できなかったんだよね
だからnorthwoodのXEONは、オンチップL3キャッシュだった
652Socket774:2006/01/07(土) 12:28:52 ID:zqwX3naP
>>643
ItaniumではOoOやらないと決めてから論理レジスタの本数を決めたんじゃない?

SMTはこれといった障害はなさそうだけど。物理レジスタがコンテクスト数ぶん
増えるだけだし。
レジスタファイルがでかくなって大変だけど、P4でも条件は同じ。

>>644
メインメモリどうするんだよう。
あとベクトルはモダンなOSと相性悪いよ。
コンテクストでかいとかベクトルロードでページフォールトするとか。
653・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/07(土) 12:39:29 ID:62LVNHfc
次期Itanium2はCGMTだっけ?レジスタファイルが二重化されててI/O待ちになると即待機中のスレッドがアクティブになる。
つーか、6命令同時発行のEPICアーキテクチャで128本って決して潤沢すぎるとはいえないと思う。
654Socket774:2006/01/07(土) 13:22:17 ID:4juLjDJ6
IBMのサイトにあるPowerPCのBookVers2.02ってやつ読もうとしたけど、
さっぱりわからなかった。
655Socket774:2006/01/07(土) 15:02:38 ID:LPmgdZWX
>652
古い記事だけどitaniumにもOoOをやろうとしてるみたいだよ。
一番下のほうを参照
ttp://pc.watch.impress.co.jp/docs/2002/1115/kaigai02.htm
656Socket774:2006/01/07(土) 15:49:26 ID:MZOV0Hhf
ちゃぐちゃぐうまっこ(・∀・)
657Socket774:2006/01/07(土) 19:26:46 ID:Qc7eQxU1
>>638
大丈夫か? 「内部でx86→RISCの変換を行って処理する」か「RISC命令をそのまま実行する」かの
二択を見比べたときに「そのまま実行する方が高速に決まっている」以外の結論が出ちゃだめだろ。
CISCのほうが命令長的にキャッシュの効率が良いとかそんな理屈?
658Socket774:2006/01/07(土) 20:28:33 ID:4uTFi291
>>643
> alphaは、uopとはちょっと違うけど、超越関数とVMS向けのメモリ保護を
> マイクロコードでやってる
> ワイヤードロジックだけで、全部処理するってのも非現実的だからな

これをuopと言うなら、インテルの486もuopと言わないといけないわけで、
uopと言うのは不適切ですな。
659Socket774:2006/01/07(土) 21:21:28 ID:ZQ19Q64/
ワイヤードロジック、マイクロコードなんて言葉がまだつかっているなんて。

JavaがCのラッパー言語だとまだ信じてるんだろうな。
660Socket774:2006/01/07(土) 21:58:20 ID:ZQ19Q64/
どう?

ここのみんなは薄々きがついているんだろ?
日本のマイコン、プロセッサ業界が未だにヘネパタ本洗脳から抜け出せず、
技術者のレベルをさげていることを。

日本の情報処理の試験なんていまだに

RISC ワイアードロジック パイプライン処理
CISC マイクロプログラム制御

で正解だからなw
これが許されるのは80年代中盤までだよねぇ。キモーイ。

大体ワイアードロジックなんて殆ど教科書用語じゃねぇか?
デジタル回路でもつかわねーし。
せめてhardwiredにしてくれよ。
661Socket774:2006/01/07(土) 22:29:39 ID:zPUZBiMQ
>653
ALUが6基もあるもんな
128本くらいいるよな
>658
ごめん
実装の仕方なんて些細なことだし
今時マイクロコードとか死語だよね
662Socket774:2006/01/07(土) 23:08:42 ID:Ni1EWIGG
Windowsをx86と同じだけ力を入れてPowerPC版を作ってくれてたら、
かなり変わってただろうに。
663・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/07(土) 23:18:03 ID:62LVNHfc
エクースボクース360搭載のXP組み込み版はNT4PPCとはまったく別の設計らしいね。
664Socket774:2006/01/08(日) 01:55:57 ID:wDEd0YKr
>>657
x86-RISC変換とは言われるものの、uopはマイクロアーキテクチャにべったり依存していて
外部プログラムの表現にそのまま使えるようなものじゃないので、
「RISC命令をそのまま実行する」というのはナンセンスなんだけど。

>>658
似たようなもんだけどね。俺も違いはよくわからん。
逐次処理されるのがマイクロ命令で、動的スケジューリングされるのがuopってとこ?
665Socket774:2006/01/08(日) 02:21:29 ID:foha59eU
>>664
細かい定義はどうなんだろうね?
ちなみにマイクロ命令には、一命令に複数の命令が入ってる
水平型マイクロコードと、そうでない垂直型マイクロコードに別れる
マイクロ命令っていっても、レジスタをアキュムレータに接続するっていう
レベルのものから、普通のマイクロプロセッサの命令のようなものまで
実装はさまざま

666Socket774:2006/01/08(日) 03:20:11 ID:LgexM41b
>>662
NT4.0までは、同じだけ力をいれて作っていたけど、ちっとも売れなかったんだよ!
667Socket774:2006/01/08(日) 03:24:25 ID:7hd0dPc3
>>664
俺は667ではないが、RISC命令そのままでなくても基本的な考え方は同じだろ。
例えば、
ADD [m32], r32
(r32で示されるregister値をm32のregister値が示すアドレスで示されるメモリ
上の値に加算して、その加算結果をm32のアドレスで示されるメモリに格納する)
という命令がx86にあるけど、一般的なRISC CPU用の等価なプログラムでも
IntelやAMDのx86 CPUの内部uop処理でもload,add,storeの3命令で表現するのは
明らかで、RISCとCISCの違いはRISCがソフトから見えるアーキテクチャレジスタ
で表現できるのに対し、x86は、CPU内部のに閉じた物理的なレジスタであると
いうだけ。
したがって、外部プログラムの表現にそのまま使えるものではないというのは
そのとおりなんだけど、657が言っていることに関しては本質的な問題ではない。
RISC CPUであれば、この例ではload latency(例えばL1-hitで2-4cycle程、
L1-miss,L2-hitで10-20cycle程度)を考慮してloadと後続のadd,storeを引き離して
配置することができる等、コンパイラチューニングの余地が多く、RISCの方が性能
を引き出すのに本質的に有利であるということを>>657は言ってるんでしょう。
668Socket774:2006/01/08(日) 06:19:46 ID:B1Yso/Er
> この例ではload latency(例えばL1-hitで2-4cycle程、L1-miss,L2-hitで
> 10-20cycle程度)を考慮してloadと後続のadd,storeを引き離して配置すること
> ができる等、コンパイラチューニングの余地が多く、RISCの方が性能を引き出
> すのに本質的に有利であるということを>>657は言ってるんでしょう。

load と add,store を引き離すことはCISCでもできるよ。
RISCの方が有利なのは、コード変換に必要な分のパイプライン段数を
省略できることで、パイプラインが乱れた場合のオーバヘッドが少ない
点でしょ。
トレースキャッシュで、このオーバヘッドをある程度は隠蔽できるが、
キャッシュをはずした場合には駄目なので、完璧に隠蔽するのは無理。

ただし、Prescottみたいに32段もパイプラインがある場合は、コード
変換に必要な段数は、割合としては少なくなるので、どうでもいい面は
あるかも。でも RISC系 プロセッサの場合、それほどは段数が多くない
(6段とか8段しかパイプラインが要らないものまである)ので、差は大き
めに出る筈。

あと、CISC対RISCには関係ないけど、x86対RISCだと、レジスタ数の違いも
大きい。8レジスタは少なすぎる。x86_64だと、まあそれほど問題ないレベル
だけどね。
669Socket774:2006/01/08(日) 08:49:57 ID:7EJ5qQcJ
>>666
でも95や98とサーバ用途じゃなく一般向けはx86だけだったよね?
この流れは大きかったのはある気がするし、
PowerPC乗るのがMacのみになっていったのもあると思う。
670Socket774:2006/01/08(日) 08:54:45 ID:LgexM41b
>>667
> コンパイラチューニングの余地が多く、RISCの方が性能を引き出すのに本質的に有利

ソースコードから自前でコンパイルする世界なら、それでもいいだろう。
しかし、
バイナリ配布の世界なら、そういうわけにはいかないだろう。
671Socket774:2006/01/08(日) 08:56:56 ID:LgexM41b
>>669
MS-DOSというシガラミがないPowerPCに、どうして95や98なんかが必要なのよ。
672Socket774:2006/01/08(日) 11:35:34 ID:7hd0dPc3
>>668
>RISCの方が有利なのは、コード変換に必要な分のパイプライン段数を
>省略できることで、パイプラインが乱れた場合のオーバヘッドが少ない
>点でしょ。
RISC対CISC論で真っ先に言われるこれだけでもないということです。
>load と add,store を引き離すことはCISCでもできるよ。
register operandなRISC的命令だけでプログラミングできるということ
ならたしかにそうだけど、memory operndな命令を多様せざるを得ない理由が
まさに以下のことです。(CISCとx86を混同してしまったのは認めます。)
>あと、CISC対RISCには関係ないけど、x86対RISCだと、レジスタ数の違いも
>大きい。8レジスタは少なすぎる。x86_64だと、まあそれほど問題ないレベル
>だけどね。
まさに8レジスタでは命令間引き離しはおろか、work用registerが不足して
メモリへのspill/fillまで多発させてしまいます。
命令間引き離しをまともにやったらRISCで一般的な32レジスタでも不足とも
言われていますね。

>>670
>ソースコードから自前でコンパイルする世界なら、それでもいいだろう。
>しかし、
>バイナリ配布の世界なら、そういうわけにはいかないだろう。
CPUの実装に依存しない一般的な範囲での最適化ならバイナリ配布でも
意味があることです。
673Socket774:2006/01/08(日) 14:00:18 ID:9OFKINuQ
RISC対CISC論で重要だったのは、実際のアプリケーションでRISCの方が速いということだ。
>>657みたいな全否定には定量的な結果が必要だな。
674Socket774:2006/01/08(日) 14:46:25 ID:4EjPbnzX
>>673
おれは定量的な結果とやらの前に
おまいがきちんと文意をつかむことの方が先だと思う。
675Socket774:2006/01/08(日) 21:24:37 ID:LgexM41b
>>672

667> コンパイラチューニングの余地が多く、RISCの方が性能を引き出すのに本質的に有利

670> バイナリ配布の世界なら、そういうわけにはいかないだろう。

672> CPUの実装に依存しない一般的な範囲での最適化ならバイナリ配布でも意味があることです。

おかしいぞ。
676Socket774:2006/01/09(月) 01:05:27 ID:QAYZ1A6b
>>675
>670からしてすでにおかしいが?
677Socket774:2006/01/09(月) 01:16:12 ID:yqM2IUwN
マジレスするとRISC, CISC論争なんて今さらいらね。

数万ゲート以下では、ゲートを節約するためにマイクロプログラムなどを使う必要がある。
大体、数万から数十万ゲートの時代にRISC命令セットは生まれた。

それから、数百万ゲートの時代へ。
スーパーパイプライン、スーパースカラ、アウトオブオーダー、
数百万ゲートの世界ではRISC, CISCも大差がなくなり、
どちらの命令セットでもも似たような機能、高速化技術が導入される。

数千万ゲート、数億ゲートの現代では、
大容量のオンチップキャッシュ、非常に高速なIO、マルチスレッド、特殊ハードウエア、
リコンフィギュアラブル、周辺チップの統合といったRISC, CISCを超えたところでの勝負になっている。

使えるゲート次第で特に突飛なことを考えない限りとれるアーキテクチャはほぼ決まってくるので、
RISC, CISCの優劣比較なんて空論でしかないでしょ。
678Socket774:2006/01/09(月) 01:19:57 ID:yqM2IUwN
で、uopについてだが、>>664は良いことをいった。
uopは命令と制御信号の仲介役を担う非常に低レベルな命令であって、
RISCと割り切って考えることももはや出来ない。
はっきりいって、マイクロアーキテクチャに都合の良いエンコーディングをその都度採れる
uopの方が、古参RISCアーキテクチャの命令セットなどよりずっと進んでいるだろう。
679MACオタ>678 さん:2006/01/09(月) 01:30:40 ID:GaC5e/pI
>>678
面白い意見でわ、あるす。ただ、その定義だとPOWER4/PPC970のcracking/millicodingわuopとわ呼べないという
ことになるすね。あれ、普通に2入力1出力の通常PPC命令の並びに置き換えるだけすから。。。
680Socket774:2006/01/09(月) 02:08:52 ID:PVykVz2d
ttp://mypage.odn.ne.jp/www/k/8/k8_hammer_trans/files/Hammer-Info.html
> AMDでは、x86はRISCの頭に載せられると思ってる人が多いです。29K RISCプロセッサを
> 作ってたときも、ちょっとハードを付け足せばx86が動くようにできると思ってました。
> K5以降K8に至るまで、この考えは取り入れられています。
681Socket774:2006/01/09(月) 02:20:41 ID:XagklPXc
なんてーか、x86はもはや中間言語だよな。
682Socket774:2006/01/09(月) 06:42:59 ID:e5zad+3d
>>657(´・ω・) カワイソス
変換するのと元から変換してあるのでどっちが速い?という話で、
後者が速くなければおかしいだろ、というつっこみをしただけなのに。
683Socket774:2006/01/09(月) 08:27:59 ID:nV0bl42J
>>682
どっかのトーシロがPowerPCのx86に対する優位性を主張するためには、
RISC命令を直接〜というのはナンセンスな仮定だと言ってんの。
684Socket774:2006/01/09(月) 12:54:43 ID:WpWebtBT
>>671
開発費の問題
685Socket774:2006/01/09(月) 14:40:13 ID:QAYZ1A6b
>>684
却って高くつくが?
686Socket774:2006/01/09(月) 14:43:47 ID:V6obICiV
移植するだけなら安い。
むしろ互換性だろうなぁ。アプリケーション使い回せないんだったらOS移植しても意味なさそうだし。
687Socket774:2006/01/09(月) 15:43:10 ID:QAYZ1A6b
>>686
x86べったりの9xの移植が簡単だとマジで思ってるのか?

...ひょっとしてx86エミュレータの上で動かせばいいとか思ってるのかな。
688Socket774:2006/01/09(月) 16:27:05 ID:YzinI3Q3
>>682
CISC ISAはおろかRISC ISAすら老朽化しはじめている現代、
かならずしも直接実行する方が速いとは言い切れなくなってきているわけで。
689Socket774:2006/01/09(月) 17:00:27 ID:QAYZ1A6b
>>688
そりゃ変換しない方がいいに決まってるがな。
ただもはやRISC ISAだからといって変換せずに実行できるとは限らんというわけで。
どうせ変換するならCISCだろうがRISCだろうが関係ないわな。

なら変換しないですむISAをつかえば?となるだろうが、問題はISAはそうそうころころ
(追加するならともかく)変更するわけにはいかんということなんだよな。
690Socket774:2006/01/09(月) 17:15:23 ID:YzinI3Q3
そういう意味でIA-64の明示的なんとかは、
変換せずにここまで詰め込みました。というISAだと思う。
(Intelスレで書いたら理解されなかったが…)

今プロセッサアーキテクトが新しいISAのプロジェクトを立ち上げるとしたら、

1.想定されるソフトウエアの対応力、トレンド
2.想定されるハードウエアの内部実装(マイクロアーキテクチャ)
3.将来への拡張性

を考慮して最適な集合・エンコード形式を選択するだけでしょう。
1.RISC 2.CISC 3.VLIW のどれか?という分類論に今さらどれだけの価値があるのか…。

電気・電子板で、CPUを造ろうというスレが立ったときには、
ISAはCISCか?RISCか?という議論に終始しててやっぱ日本人は…とおもてしまた。
以上戯言でした。
691Socket774:2006/01/09(月) 17:33:21 ID:sOyt1yQt
> どうせ変換するならCISCだろうがRISCだろうが関係ないわな。

全命令変換するなら、たしかに関係ないけど、RISC系プロセッサ
の場合、いまだにまったく変換なし (Niagaraとか) とか、一部の
命令だけ変換して、多くの命令は変換なしといったものが多いから、
まだ関係あると思われ。
692MACオタ>690 さん:2006/01/09(月) 17:44:43 ID:GaC5e/pI
>>690
  -------------------
  ISAはCISCか?RISCか?という議論に終始しててやっぱ日本人は…とおもてしまた。
  -------------------
新アーキテクチャ実装の際にISAで揉めるのわ、日本人だから。。。って訳じゃ無いす。
以下、ゲーハー板で紹介されたCELL開発ストーリーから引用す。
  ===================
  2000年11月ニューヨーク郊外のホテル。APUの命令セットの
  基本方針を決める合宿。VLIWかSIMDのどちらを選ぶか?
  それぞれ一長一短。中々結論は出ない。
  「汎用性の高いVLIWの方がいい」
  「いや、オブジェクト・コード効率を考えたらSIMD以外は有り得ない」
  ===================
693MACオタ@補足:2006/01/09(月) 17:47:12 ID:GaC5e/pI
引用元の記述足りなかったすね。これ日経エレクトロニクス誌の記事の一節す。
  
694Socket774:2006/01/09(月) 17:50:50 ID:sOyt1yQt
> そういう意味でIA-64の明示的なんとかは、
> 変換せずにここまで詰め込みました。というISAだと思う。

同感。速くするための工夫がたくさん詰まってる。
でも、ソフト屋からすると、CISCとは別の意味で複雑だなあと
思ってしまうんだよなあ。

> ISAはCISCか?RISCか?という議論に終始しててやっぱ日本人は…とおも
> てしまた。

新しいISAを設計するのに、いまさらCISCはないでしょう。
売れるためには x86 完全互換であるべきだってなら、まだ分かるが。

> 日本人だから。。。って訳じゃ無いす。
> 基本方針を決める合宿。VLIWかSIMDのどちらを選ぶか?
> それぞれ一長一短。中々結論は出ない。

これならまだ合理的な議論だろ。
新しい ISA に CISC を選ぶってのは、それとはだいぶレベルが違う。(w
695Socket774:2006/01/09(月) 18:05:02 ID:W+nIsrPJ
全命令変換でも可変長と固定長じゃ電力消費量が違うんじゃない?



ところでx86にも680x0のサブセットColdFireみたいなのはできないのかな
696Socket774:2006/01/09(月) 18:07:56 ID:sOyt1yQt
> 全命令変換でも可変長と固定長じゃ電力消費量が違うんじゃない?

確かに固定長命令の方が作るのはかなり簡単だろうなあ。
697Socket774:2006/01/09(月) 18:36:34 ID:QAYZ1A6b
>>690
>そういう意味でIA-64の明示的なんとかは、
>変換せずにここまで詰め込みました。というISAだと思う。

のはずだったんだが、パフォーマンスが出ないのでISAを(あまり)いじらず
どうにかしようとしたら、ごてごてと余計なことをするようになってしま
いました。
という感じなのでは?

まぁVLIWは難しいと思うっすよ。バイナリ互換を要求される用途だと特に。

>を考慮して最適な集合・エンコード形式を選択するだけでしょう。
>1.RISC 2.CISC 3.VLIW のどれか?という分類論に今さらどれだけの価値があるのか…。

ある実装方針(たとえば柔軟性重視とかコードサイズ優先とかだな)を考えた時に
VLIWになったりRISCになったりRISCコントローラ(16bit固定命令長2opな奴らは原始RISCと区別したい)
になったりする訳で。
目標→形式っていう方向で議論するなら意味があると思うよ。
#CELLがSIMDにするかVLIWにするかでもめたというのはこういう方向。だから意味はある。

方針が決まれば分類がおのずと決まるわけで。
#ハイブリッドなISA連中っていうのは、拡張した結果「そうなってしまった」でしかない。

>電気・電子板で、CPUを造ろうというスレが立ったときには、

CPUを作ろう。だけで進めるとそうなるだろうね。
「どんな」CPUを作るのかが重要なのに。
698Socket774:2006/01/09(月) 18:46:39 ID:sOyt1yQt
> ごてごてと余計なことをするようになってしまいました。
> という感じなのでは?

ごてごてって何?
キャッシュをやたら載せる以外になんかやってたっけ。
foxton のこと?
699Socket774:2006/01/09(月) 20:13:58 ID:7vx8D/Xx
>>636のようなことになる理由をx86デコード以外の要因に求めてみる

1.今後のIntel CPUの礎たるPen3は純粋性能でみても他社製品に
クロックあたり2.5倍の差を付けられるダメダメだ。

2.フォトショの一部または全部のフィルタ処理はWindows(x86)向けには十分に
最適化されていなかった。その点を利用してマシン(CPU)性能差が偽装
された。中指欠損の腐れマカー共が企てた陰謀に過ぎない。

3.L2キャッシュ容量が局所的に有効だったため明暗を分けた。

4.CPU以外のハードウェア性能

5.ライターの妄想

6.Windowsプラットフォームって…うんち?
700MACオタ>699 さん:2006/01/09(月) 20:17:20 ID:GaC5e/pI
>>699
で、1-6の中であなたの妄想以外が根拠になっている話わ有るすか?
701Socket774:2006/01/09(月) 20:18:36 ID:7vx8D/Xx
>>700
すごいレス早いね。
702Socket774:2006/01/09(月) 20:20:13 ID:6seGuLJe
Cell開発はもめてたところに、
IBMエンジニアの鶴の一声でいまの路線になったとか。
正直、最近のCPUはハイブリッド化しすぎてて、
特定の方式、アーキテクチャの名前付け自体が困難と思われ。
703MACオタ>702 さん:2006/01/09(月) 20:24:03 ID:GaC5e/pI
>>702
しかしCELLの場合は、完成品のISAを見る限り命令エンコーディンが詰まり過ぎで汎用性やら拡張性やら
わゼロと言い切って良いくらいす。あんな風になるくらいならVLIWの方が良かったような気がするす。。。
704Socket774:2006/01/09(月) 20:39:40 ID:nV0bl42J
CELLの場合はローカルメモリ少ないしコード密度のほうを重要視したってことだろ。
後々禍根を残すかもしれないことくらいは当事者のほうが実感しとるんじゃねーの。
スタートアップでこければそれもない。

VLIWにしたってやたらめったら拡張できるわけでもないしな。
705Socket774:2006/01/09(月) 21:33:03 ID:BevSTWMG
>>698
プリディケーションとかキャッシュを制御するヒントとか
レジスタスタックのことだろ
IA-64の命令は厳密には2000くらいある
でも高速化には役に立ってるんじゃないかな?
現在のIA-64が、コア面積の割りに速くないのは
演算器が無駄にリッチだからだろ
ALU6が同時実行されるときとか、レジスタの18ポートが埋まるときとか
どれだけあるのかと

>>703
PS3にしか使われないんだから、オペランド部が狭くても良かったんだろ
2issueだからVLIWにする必要もないし
706MACオタ>705 さん:2006/01/09(月) 21:49:31 ID:GaC5e/pI
>>705
  ----------------------
  2issueだからVLIWにする必要もないし
  ----------------------
件の記事でわ、
  ======================
  00年秋基本アーキテクチャがまとまった。 APUには演算ユニット、LocalStoreと呼ぶ専用メモリ、
  DMAコントローラを備えていた。
  ======================
とあるすから、マイクロアーキテクチャが(2-issueに)決まってからISAを決めたと思われるす。VLIWで有効
という成算わ あったんじゃないすかね?明らかなメリットわレジスタ指定に28-bitも喰われる積和演算や
permute命令がevenパイプとoddパイプで重なる可能性わ低いすから、合計64-bitとすると命令数の制約
わ非常に楽になったと思うす。
707Socket774:2006/01/09(月) 21:59:13 ID:BevSTWMG
>>706
あぁそっか
32bit+32bitじゃなくてよくなるんだ
VLIWで、中の命令長変則のほうが素直になるな
708Socket774:2006/01/09(月) 22:01:16 ID:sOyt1yQt
> プリディケーションとかキャッシュを制御するヒントとか
> レジスタスタックのことだろ

なるほど。
これは後からごてごて拡張したというよりは、最初からその
つもりでごてごてつけたって印象なので、そういうのとは
別に何かあるのかと思ってしまった。

> IA-64の命令は厳密には2000くらいある

IA64 が複雑だってのは >>694 でも書いたとおり、同感。

> でも高速化には役に立ってるんじゃないかな?

これも同感。

> 現在のIA-64が、コア面積の割りに速くないのは

どうなんだろ。
キャッシュがほとんどで、コア面積自体はそれほど大きくは
ないというか、x86 に比べると遥かに小さいけど。
SPEC の結果で IPC を計算すると、Pentium M に比べて 20% 以上
も良くて、既存コアの中ではトップだし。もちろんキャッシュの
おかげもあるけど。
709Socket774:2006/01/09(月) 22:10:18 ID:BevSTWMG
>>708
itaniumのコアサイズは小さくない
130nmMadsionで、130mm2くらい
90nmのmontecitoで、60mm2くらいだ
それにたいして、x86はyonahとかopteronで、40mm2(90nm)程度だ
IPCは、たしかに抜群だけど、レイテンシ1の超高速L1と
さりげに大容量のL2の効果もあるし
もちろん同面積でも、X86にIPCで負けることはないだろうけど
もっと性能出て欲しいよねぇ、うん
710MACオタ>709 さん:2006/01/09(月) 22:15:23 ID:GaC5e/pI
>>709
  ----------------------
  itaniumのコアサイズは小さくない
  ----------------------
小さいと言われているすけど。。。
http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2598&p=4
711Socket774:2006/01/09(月) 22:17:15 ID:BevSTWMG
ところで、itaniumのFPUって
L1データキャッシュにはアクセスできなくて、
L2キャッシュにデータを読み書きするんだよな
で、そのL2キャッシュのレイテンシは5
EPICとかレジスタの多さが効いてるんだ
712Socket774:2006/01/09(月) 22:24:09 ID:BevSTWMG
>>710
madisonコアが130mm2ってのは、タグとかL2キャッシュも含めた面積かな?
>>710の比較だと、opteronと同等の80mm2
これが正解だな、ごめん
ダイ面積はともかく、コアのトランジスタが少ない
可能性のあるアーキティクチャだった・・・

713Socket774:2006/01/10(火) 00:15:35 ID:mTwqPPi2
Windowsがどーたらってのなら、CE系があるんだけど…
標準プラットフォーム(ちょっと語弊があるが)として生き残ったのはARM版だけ。
PowerPCもSHもMIPSも追いやられてしまった…
営業力と(携帯電話での)普及率の差はここでも大きいな…
714Socket774:2006/01/10(火) 00:45:40 ID:Z7F1GOPf
Windows NT も MIPS, Alpha, PPC があったけど、いまや。。。。
715Socket774:2006/01/10(火) 01:59:05 ID:zr3XD1n0
>>705
IA-64は第2世代で、ユニットを増やしてますよ。
メモリまわりの改善とも相まって、
同クロック比で1.5倍くらいは速くなってる。
716Socket774:2006/01/10(火) 02:01:42 ID:zr3XD1n0
>>709
大容量なのはL3。
L2は256KBしかない。
717Socket774:2006/01/10(火) 22:18:51 ID:KciWCiuF
>>713
あまり表にでてないけど実質CEが最新アーキテクチャのWindowsだしねぇ
古いNT系とは違うのだよ・・・
718Socket774:2006/01/11(水) 00:20:43 ID:mMVC1O9v
ムチとバルカンがついただけにも見えるが
719・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/11(水) 00:22:19 ID:JJfcTGBV
ARM普及の要因はIntelが互換プロセッサ作ってるのが大きいかも。
てか日本メーカー製のPDAってXScale搭載機普通に多いし。
720Socket774:2006/01/11(水) 00:23:16 ID:SgCDYMOG
実は中身がTRONだったり……
そうか! リアルタイム処理が優れているから格闘戦向きなんだ!
721Socket774:2006/01/11(水) 00:49:21 ID:mMVC1O9v
>>719
マーケティングじゃね?
組み込み用としてはMIPSよりちょっと優れているとは思うけど。
(回路規模、コード密度、割り込みまわり)

全ARMコアの中でXScaleが占める割合は小さいと思う。年に10億個以上出てるとか。
722Socket774:2006/01/11(水) 01:13:23 ID:jAgd/cxs
>>719
伝統的な低消費電力とコストだろ
723Socket774:2006/01/11(水) 01:24:50 ID:hZvQ2NzB
PocketPCがARMを指命したからでしょ。
724Socket774:2006/01/11(水) 01:26:57 ID:hZvQ2NzB
指名だ・・・orz
725Socket774:2006/01/11(水) 01:49:25 ID:jAgd/cxs
ママ「ARMちゃん、ご指名よ

MSさんはホント、いいお客さんだからがんばりなさいよ」

ARM「はい!」
(MSさんって確かに素敵だわ、あたしなんか釣り合わない」

MIPS「なに? あのCPU? あとから出てきた癖にシャシャリでちゃってさ?
あたしのほうが速いんだから」

SH「そうよ クロックが速さじゃねーんだよ」

MIPS「あんた一番クロック遅いからって何いってんの?」

マネージャ「SH、セガってわかるだろ? おまえの一番太い客だよ
破産したよ CSKに身売りしたらしい」

SH「え!?」
(ARMばっかいい思いしやがって。ひとつ締めてやんねぇとな)
726Socket774:2006/01/11(水) 01:54:41 ID:jAgd/cxs
68000の日記
palmさんは、あたしのこともう要らなくなったんだって
ARMちゃんがいいんだって
あたしはNo.1・・・・
No.1そうだった
でも、引退かしら?
V70とか先輩たちはもういなくなっちゃった
この前もXX商事のお客様が言ったわ
「今時ね、アドレシングモードとか流行らないんだよ?
わかる?
もうさ、うちの若いやつでもアセンブラとかできなくてさ
コンパイラのほうが速いし、メモリの節約に
命かける時代でもないしね
だから、わかるよな?
おれが貰ってやるからさ・・・」
SUNとappleさんに拾われて、そのあとはセガさんとか
いいお客さんがいっぱいついて、
組み込みでは、あたしが華って呼ばれてたのに・・・
727Socket774:2006/01/11(水) 02:00:04 ID:jAgd/cxs
ARMの日記
今日は会社の忘年会
ママにマネージャに、SHさんにMIPSさんにお店の人はみんないる
行く先はどこかしら?
マネージャ「ARMちゃんはここはじめてだっけ?」
知らないお店・・・
ARM「はい・・・なんだか怖いわ」
マネージャがドアを開けて、店に入る
マネージャ「itaniumはいるか?」
itanium「あ! WinCEのマネージャさんじゃないですか〜?
店に来てくれるんなら、電話のひとつくらいくださいよ〜
今席つくりますからね、ちょっと待ってくださいね」
itaniumさんって言うのかぁ
スマートな顔立ちだわ
itanium「おい、席つくれ
あとボトル探せ ネックはWinCEさんな」
itaniumさんは、若い人たちに指示を出してる
728Socket774:2006/01/11(水) 02:04:00 ID:jAgd/cxs
itanium「へぇ〜、ARMちゃんって言うんだ
かわいいな、ってごめん!
初対面なのにさ!」
ARM「かわいいだなんて、言われなれてなくて・・・
itaniumさんって人気なんでしょう?
すごく素敵 お仕事できそう」
itanium「そうでもないよ
っていうかさ、おれ才能あるって言われてこの業界入ったんだけど
なんかパフォーマンスでなくてね
頑張ってはいるんだけど・・・」
itaniumさんの顔が曇った
itanium「この商売、正直自分の実力だけじゃ駄目なのかな?
って思うことがある
コンパイラとかが足を引っ張って・・・
あぁ、ごめん
こんなつまんない話しちゃって」
729Socket774:2006/01/11(水) 02:05:21 ID:jAgd/cxs
すまん、アゲる
続きはなしでつ
糞レス書いてすみません
730Socket774:2006/01/11(水) 02:12:17 ID:Hh71tC+x
ARMって、PDAよりもっと小さい機器が主戦場じゃないの?
731Socket774:2006/01/11(水) 02:15:36 ID:jAgd/cxs
>>730
携帯とか、それ以下が主戦場だな
PC関係だと、エントリクラスのNASとかルータとかみんなARM
MIPSとかPPCはないんじゃないかな?
732・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/11(水) 02:20:59 ID:JJfcTGBV
うちのケーブルモデムはモトローラ製なんで中の石はfreescale製だろうな。いや、分解してみる気は無いが。

ゲームボーイアドバンスがARM7、あとNintendo DSはARM7とARM9のデュアルプロセッサ構成だったっけ。
PSPに比べて電池の持ちがいいのは単純にスピンドルの有無やクロック差だけじゃないだろうな。
733Socket774:2006/01/11(水) 02:25:46 ID:jAgd/cxs
>>732
水をさすようで悪いが、PSPとNintendoDSの消費電力の差は
単にパフォーマンスの差からきてるんだろ
PSPはMpeg-4デコードできたり、PS2クラスのグラフィックス
ロジックの周波数も150〜300Mhz
NintendoDSは、PS1世代のスペック
比較できる製品同士でない
734・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/11(水) 02:31:58 ID:JJfcTGBV
性能いいのかやっぱり。DS馬鹿売れでPSP不振に、うちの知り合いのGK候補が嘆いておりました。
レボに使われる石ってPPC系で確定?PC(Intelアーキテクチャ)対ゲーム機(PPC)って構図も面白いかも。
735Socket774:2006/01/11(水) 02:35:29 ID:jAgd/cxs
>>734
PS2やGBAより販売ペースいいらしい、NintendoDSは
で、レボの石はPPCベース確定だろ
ハードウェアベースで、GameCube互換らしいから
(今では変更されてるかも)
736Socket774:2006/01/11(水) 07:36:22 ID:3DMnC+D9
PSPはR4000の2コア構成でクロックは最大333MHz。
DSはARM9-66MHzとARM7-33MHz。
737・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/11(水) 07:44:57 ID:JJfcTGBV
それなんだけど、最大222MHzで普段111MHzまでスペックは落とされてた筈だお。
738Socket774:2006/01/11(水) 09:09:05 ID:Fth0Ox2m
>>731
>PC関係だと、エントリクラスのNASとかルータとかみんなARM
>MIPSとかPPCはないんじゃないかな?

その辺はMIPS。ARM7/9はもうちょい下。
ルータとか通信系はMIPS強いよ。
NASに使うにはARM7/9はちとパワー不足。XScaleがそろそろ降りてくるぐらいか。
739Socket774:2006/01/11(水) 11:13:53 ID:tJiIRpSF
ルータはMIPSが多いけどOptとかSHらしいな。持ってないけど。
エントリクラスのNASは家庭用NASの代表格とも言える玄箱、Linkstationが
PPCを採用してたと思う。
740Socket774:2006/01/11(水) 11:53:04 ID:7I6KMsrn
玄箱系はMPC8241。実質PowerPC603eやね。
LinkStationだとMIPS採用機も有。石はAMDのアルケミらしい。
白箱はSH-4、新型でXscaleになった。
741Socket774:2006/01/11(水) 11:54:58 ID:pvuB2NsT
ごめんアルケミ嘘。混ざった。IDTのR3000互換。
742Socket774:2006/01/11(水) 22:40:35 ID:hZvQ2NzB
AppleがIntel CPU搭載のMacを出して、
コード変換していてもPhotoshopがこんなに高速に動くよ、とデモをしたそうな。

もうね、CPUアーキテクチャは何だっていい、という時代なのかな。
あんまり面白くないな。
743Socket774:2006/01/12(木) 00:51:08 ID:28dUPSls
CPUアーキティクチャがどうでもよくなった一番の原因は
コアが複雑になったことじゃなくて、
CPUパワーの割りに狭いメモリ帯域幅と
異常に長いメモリ・レイテンシだろ
DDR2 128bitで、限界が決まってる
744Socket774:2006/01/12(木) 01:15:13 ID:QlwGMV1K
インストラクションセットアーキテクチャといっても、
ようはただのインターフェイスでしょ?
745Socket774:2006/01/12(木) 01:18:59 ID:28dUPSls
>>744
カッコいいこというなー!!
746Socket774:2006/01/12(木) 07:09:29 ID:uqr1GVQX
>>743
Niagara みたいなのを作ろうとすると、x86 だと 8 core も
入らないんじゃない? だとすると、コアの複雑さは、やはり
まだ関係していると思われ。
single thread 性能を追求すると、どうしてもコアが複雑に
なるから、ISA は余り関係ないだろうけどね。
747Socket774:2006/01/12(木) 07:43:52 ID:V027OoMc
>>746
かといってNiagaraが面白いアーキテクチャかというとそれもどうか
748Socket774:2006/01/12(木) 09:18:55 ID:bqnchAhW
俺はNiagara面白いと思うが。
ま、486の8発みたいなモンだからつまらんという意見も理解できるけれど。
749Socket774:2006/01/12(木) 12:21:03 ID:SM6LBsIb
>>746
PS3のcellと、PentiumVの各々のロジック規模って
なんとほとんど同じ
IA-32で8コアでも、あんま問題ないと思う

>>747
アイディア自体は素晴らしいが、Sunの実装だからね・・・
Sunでさえniagaraで、これだけの性能が出るんだから
IBMやintelがやったら、どんなのが出来るか興味ある
750Socket774:2006/01/12(木) 21:17:32 ID:FmDJms49
いまだにCyrixが死んだのが惜しく思う漏れ・・・
もし生き残ってたら、
今の混迷としたCPU業界で、
どんな突拍子もないアプローチをしてくれただろうか・・・
751Socket774:2006/01/12(木) 21:23:26 ID:k2qhD5or
んー、Cyrixは突拍子もないアプローチというより反則技という印象があるな。
FSB最速66の時代に75を要求したり。
752Socket774:2006/01/12(木) 21:28:13 ID:C9Qe3Leo
いまだにCrayが死んだのが惜しく思う漏れ・・・
もし生き残ってたら、
今の混迷としたスパコン業界で、
どんな突拍子もないアプローチをしてくれただろうか・・・
753Socket774:2006/01/12(木) 21:30:33 ID:rqteLpkl
>>750
Cyrixの血自体は生きているが…
だが、NSやAMD、VIAは活かし切れてないというか?

ま、例えばMediaGX系はCE.NET(WindowsMobile)と同様に
世の中で求められている様で求められていない様で…立ち位置は微妙だね…
この手のデバイスってのは、即効性の利益を求めるメーカーにとって
美味しくないのかも知れないけどさ。
754Socket774:2006/01/12(木) 22:09:56 ID:F0m2uszV
高IPCどうの言うなら実はCyrixが最強だったわな。
そのぶんクロックもあげにくかったみたいだが。
755Socket774:2006/01/12(木) 22:26:05 ID:V027OoMc
>>754
x86ならmP6じゃね?
756Socket774:2006/01/12(木) 22:50:13 ID:kB98tpId
>>755
mP6はむしろx87だった…
757Socket774:2006/01/13(金) 00:08:36 ID:ZOTpTO+3
>>750
どれだけ狭いCPU業界だよw
758Socket774:2006/01/13(金) 00:41:00 ID:f9INafVZ
>>753
Cyrixは死んでるよ
VIAのC3は今じゃIDT系になってるからな
759Socket774:2006/01/13(金) 00:45:42 ID:RumlTSp1
今おもえばインテルのネットバーストは
Cyrixのリニアバースト(時代のチップ)を
パクッたかのような豪熱路線だったな。
760Socket774:2006/01/13(金) 01:37:04 ID:q2rfQ6OK
NexGen 最強。
761Socket774:2006/01/13(金) 02:08:58 ID:vF9h3liU
いっそのこと、
Microsoftの.NETのCLRの中間コードに特化したCPUを作ってしまえ・・・

・・・ってそれはJavaチップだっけ?
762Socket774:2006/01/13(金) 02:41:23 ID:q2L44qEq
未だに死んで惜しいと思えるのはAlphaじゃないの?
763Socket774:2006/01/13(金) 03:24:54 ID:daHPIJmz
UltraSparcT1のブロック図どっかにないかな?
最近arch系の雑誌入手できなくてTT。

8coreは良いとして4並列SMTで性能出ると
思えない。キャッシュも足りてなさそうだし。
764Socket774:2006/01/13(金) 08:32:16 ID:OFClyCpP
Pentium系は133までしか無く、P-Pro200が最強と信じて疑わなかった頃、
既に300MHzもの動作速度を実現していたAlphaAXP。

まさに異次元の怪物を見る思いだったよ。
765Socket774:2006/01/13(金) 09:07:32 ID:JKDghtfb
>>764
たしかにAlphaもすごいんだけど、大改造されつつもいまだに現役なP6コアこそ怪物といえる。
当時はさんざん叩かれていたが。
766Socket774:2006/01/13(金) 10:39:11 ID:vF9h3liU
AlphaってPentium3(河童)に対するPentium4(藁)みたいなものだよ。
熱くて、高速なメモリシステムがなければ速度を発揮できない。
767Socket774:2006/01/13(金) 11:15:43 ID:huJdpYfF
21164以前と21264を比べるならPentium4→PentiumMだけどな。
768Socket774:2006/01/13(金) 11:32:19 ID:OFClyCpP
>21164以前と21264
Out of order導入だっけか。
21364で予定していた4コア統合も凄いと思ったが…。
769Socket774:2006/01/13(金) 12:32:14 ID:ybRTmp0a
> UltraSparcT1のブロック図どっかにないかな?

フロアプランだったら
ttp://www.aceshardware.com/read.jsp?id=65000293
にあるけどね。
パイプライン構成なら
ttp://pc.watch.impress.co.jp/docs/2005/0531/spf07.htm
にもある

> 4並列SMTで性能出ると思えない。

Niagara は SMT じゃなくて、FGMT。
メモリバンド幅については、DDR2 を4チャンネル用意して
カバーしている。1.2GHz×8コアなので、周波数あたりの
メモリバンド幅でみると、デュアルコア Opteron (DDR を
2チャンネル) の倍のメモリバンド幅があることになる。
SMTの場合、さらにこれをスレッド数で割らなければいけない
計算になるけど、FGMT/CGMT だと同時実行はしないから、そこ
まで厳しくはないんじゃないかなあ。
スレッド数で割ったとしても、Athlon 64 X2 をシングルチャネル
で使ってるのと同じ程度のメモリバンド幅は確保されている計算。

> キャッシュも足りてなさそうだし。

全然関係ないスレッドを32個とかだと、まったく足りないだろうね。
Webサーバだったら、かなり共有できそうだから大丈夫な気がする。
Java アプリケーションサーバはメモリどか食いすることが多いので
キツいかな。SPECjbb の特性に助けられた? あるいは、最近の
Java で使われている世代型GCの場合、C++やCでnewやmallocを使って
書くよりも、むしろキャッシュフレンドリなので、うまいこと、
そのあたりのサイズを調整すればなんとかなるのかも。
770Socket774:2006/01/13(金) 13:50:01 ID:uhG5QY+4
>>763
webサーバーやデータベースだと
処理時間の8割がメモリの待ち時間
なんで簡単なマルチスレッティングで
スループットがかなりあがる

pentium4以外はSMTやイベントドリブン式の
マルチスレッティングでオンライントランザクションが
速くなってる
771763:2006/01/14(土) 00:44:35 ID:Qa26lV4/
>>769
さんくす!見てみます。
772Socket774:2006/01/14(土) 01:32:26 ID:jjx4cRPO
みんな何を読んだりしてそんなに詳しくなったの?
773Socket774:2006/01/14(土) 02:13:07 ID:E4dtUQXR
そういやNiagaraってVerilogの論理設計データをオープンソースで公開するって
話だったな。
774Socket774:2006/01/14(土) 15:34:46 ID:RhL4VqOx
人間ナイアガラ!
775Socket774:2006/01/14(土) 17:32:56 ID:UQBK3MQ2
>>764
Alphaだけど普及させようということでDECがSAMSUGと手を組んでたよね
Alphaが普及してたら今頃CPUでもSAMSUNGが天下を取ってたわけですよ

776Socket774:2006/01/14(土) 17:48:03 ID:0zGW2vM0
まぁクロックが予定通り伸びなかった主犯という声もある。
777Socket774:2006/01/14(土) 18:34:41 ID:tH4kE6cI
でもISA的には一番好きよ、Alpha。
IA32やx86_64はアレだし、IA64は複雑すぎだし、
Alpha以外のRISCはどれも盲腸みたいな特徴が
いくつかあるし。
778Socket774:2006/01/14(土) 18:42:48 ID:x/HUaBvF
三星さんとこは
2002年にAlphaの技術を生かしたらしい1GHzなARMを発表、
2004年には3GHzに到達とか言ってたけど
あの話はどこに行ったんだろう。
779Socket774:2006/01/14(土) 21:00:47 ID:bdHc7p7C
>>777
POWERじゃダメなん?
780Socket774:2006/01/14(土) 21:15:49 ID:tH4kE6cI
POWER は結構盲腸が…
781Socket774:2006/01/14(土) 21:53:05 ID:RhL4VqOx
>>780
条件コードがあるのが気に入らん。
782Socket774:2006/01/14(土) 22:55:11 ID:XP0Fxdej
Alphaに性能面での最大の好敵手であったPA-RISCってほんと情報少ないんだな。
RISCプロセッサトークでも比較対象として話題に出てこない。
783Socket774:2006/01/14(土) 22:57:33 ID:7FPBeT4s
だってPA-RISCは秘密なんだもん。
784Socket774:2006/01/14(土) 22:58:59 ID:tH4kE6cI
785Socket774:2006/01/14(土) 23:16:37 ID:XP0Fxdej
PA-RISCのマイクロアーキってPA-8000が96年で、
4 way oooコアで、命令ウインドウも56エントリあるし、FMACもある。
今さらだけどItaniumが高IPCなのってIntelよりもHPの性格がそのままでてるよね。
内蔵キャッシュも750k, 1.5M 〜 3M, 6M, 9M, 12Mだし繋がる。
786Socket774:2006/01/15(日) 00:21:22 ID:R4J+g/0N
確か、PA-RISC ってx86と違ってスタックが逆につまれるんだよな。
787Socket774:2006/01/15(日) 01:05:40 ID:jTQOE1Ag
>>785
FMACはPA-RISC1.1からあったよ。
IA64は大部分がHPの成果だよ。
PA-RISCこそ全身盲腸だと言えるよ。SPARCは全身癌だよ。
788Socket774:2006/01/15(日) 02:02:06 ID:Fj6OZ33I
>>785
>内蔵キャッシュも750k, 1.5M 〜 3M, 6M, 9M, 12Mだし繋がる。
これはじゃない。SRAMチップだといわれたりしたわけだが。
Itatniumはロジックもでかいけど。

>>787
レジスタウィンドウはウンコだよなぁ。
789Socket774:2006/01/15(日) 02:33:10 ID:5/ZugwXC
全身盲腸って。
なんか、自分がハンドアセンブルするときのわかりやすさ、
感覚的ななすっきり具合
で、盲腸とかいってない?
790Socket774:2006/01/15(日) 02:38:15 ID:OEF2m8C0
> レジスタウィンドウはウンコだよなぁ。

IA-64 の立場は…
791Socket774:2006/01/15(日) 03:55:44 ID:9qemvAMy
そういや、タスクスイッチするときレジスタウィンドウの内容ってどうするの?
タスクIDでもついてるのか、全部スタックに積んじゃうのか。
後者だとレジスタ多いほどタスクスイッチのコスト高そうだけど、
元々高コストな処理だから気にするほどでもないのかな?
792Socket774:2006/01/15(日) 04:12:16 ID:OEF2m8C0
> そういや、タスクスイッチするときレジスタウィンドウの
> 内容ってどうするの?

全部メモリに退避。

> レジスタ多いほどタスクスイッチのコスト高そうだけど、

これはその通り。

> 元々高コストな処理だから気にするほどでもないのかな?

トレンドとしては、コストは若干下がる傾向にあると思う。
Niagara みたいに 32スレッドも CPU 内に抱えてれば、
そもそもメモリに退避することが減るので。
793Socket774:2006/01/15(日) 06:07:35 ID:9i/UQ/HB
IA-64っていうのはPA-RISCを外販するようにしたもの、なのか。
794Socket774:2006/01/15(日) 07:58:30 ID:hJwqwGDS
IA64はIntelがHPのVLIWの技術を分けてもらって作った新アーキテクチャ。
HPが技術協力の見返りにPA-RISCとの互換性を持たせた。

突っ込みあったらplz。
795・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/15(日) 08:44:35 ID:YUiwjRkV
Intelも望んだことじゃないかな。HP-UXがそのまま動かせるからHPの顧客をそのまま引き継げる。
x86はx86デコーダ使ってネイティブで実行するよりエミュレーションしたほうが速いってのは皮肉だよなぁ。
それでも同クロックのXeon並の速度、つまりWillamette並です。Opteron対策として全然役に立ってないなぁ。
796Socket774:2006/01/15(日) 10:02:31 ID:xEb6A+xu
32ELなんて飾りです。
797Socket774:2006/01/15(日) 11:27:05 ID:6QkVT+ru
>x86エミュ
MercedでもP75並になるんだっけか。
798Socket774:2006/01/15(日) 12:12:35 ID:ErOaFScC
どこで仕入れた情報だwww
それじゃH/Wより遅い。
799797:2006/01/15(日) 12:21:00 ID:6QkVT+ru
記憶では月刊ASCIIあたりだったかと。
800Socket774:2006/01/15(日) 12:25:17 ID:ErOaFScC
その昔、Mercedのx86 coreの性能を測ったときにP 200程度だったぞ。
まぁ、ベンチの内容でも全然違うんだがP 75は下に見積もりすぎ。
801Socket774:2006/01/15(日) 12:38:48 ID:0JE7XA2U
もはやMIPSなんて、組み込み機器くらいしか使われないんだろうな。
802Socket774:2006/01/15(日) 12:53:55 ID:9i/UQ/HB
昔は、SGIのモンスター級のグラフィックスマシンのCPUだったのにねぇ、MIPSは。

>>797
HDBENCHの結果ではPentium 100MHz並みだったな。

インテルがx86バイナリでも、
同クロックのPentiumIIIと同等の速度が出る
というのは、いったい何だったのか、と。
803Socket774:2006/01/15(日) 12:57:53 ID:Nl2RyTnt
>>801
組み込み向け市場の規模からみたら、パソコン市場限定のx86なんて…
804Socket774:2006/01/15(日) 13:25:44 ID:1r+KCvDp
でもintelの売上は4兆円クラスで、ぶっちぎりトップだからな
805Socket774:2006/01/15(日) 13:46:46 ID:y90j3I6q
HDBENCHはベンチとしては、、、
806Socket774:2006/01/15(日) 16:05:58 ID:Fj6OZ33I
>>804
その売り上げって、組み込み向けのフラッシュやXscaleまで含んだ数字なんでしょ?
ちっとも「でも」になってないよーん。
807Socket774:2006/01/15(日) 17:49:20 ID:Zuw76rM2
組み込みは段違いに数量出るけど単価_| ̄|○なイメージ
市場規模(金額)どれぐらいなの?
808Socket774:2006/01/15(日) 20:19:24 ID:Nl2RyTnt
>>807
有名な話だが、AMDが米国の小売市場でシェアトップをとったんだぜ!


そんなAMDが小さく見えるくらいの規模
x86にしがみついて生きてる会社なんてそんなもんですよ
インテルはいろいろ売ってるから儲かる

簡単に想像してもらえればわかるが、身の回りにあるコンピュータと、Petnium/Athlonが載ってるパソコンの数なんて、比較にならないだろ?
携帯電話、ゲーム機、風呂わかし、レンジ、冷蔵庫、時計、テレビ、車、音楽プレイヤー、、、目に入るだけでもこんなんだ
自販機とか駅の改札とか、挙げればどうみてもパソコンの数と比較になりません
本当にありがとうございました
809Socket774:2006/01/15(日) 21:05:26 ID:galUw+Ee
売上はともかく、利益の大部分はx86からだろ
たくさんのメーカーと競争している組み込みやFROMより、
intelとAMDの二社で寡占してるx86のほうが
儲かるに決まってる
810Socket774:2006/01/15(日) 22:03:37 ID:7exXvpTs
>>725-726
セガがガンか。
811Socket774:2006/01/16(月) 00:04:47 ID:P+8ypVsv
>>802
そのSGIがMIPSを買収してからMIPSから撤退したメーカーがたくさん出たわけだが
SGIがMIPSを買収しなければx86からMIPSへの乗り換えを提唱した
Ace initiativeはある程度成功したかもしれないのに
812Socket774:2006/01/16(月) 00:14:10 ID:ySmYR7Cy
>>789
遅延分岐、レジスタペア、アドレスアップデート、単一仮想アドレス
813Socket774:2006/01/16(月) 00:14:51 ID:ySmYR7Cy
たまにはi860のことも思い出してあげてください。
814Socket774:2006/01/16(月) 00:34:51 ID:w7eXyXRf
>>805
HDBENCHのCPU部分は
ドライストンとウェットストンでしょ?
ちょっと古典的だとは思うけどさ。

>>813
i860を搭載したUNIXワークステーションが、クボタから出てたね。
815Socket774:2006/01/16(月) 01:30:14 ID:vkwIU+wj
>>811
R4x00の性能だと、intelに比べてあんまインパクト
なかったんで駄目だったと思う
816Socket774:2006/01/16(月) 01:35:53 ID:1oEWa9a0
Ace連合って久しぶりに見たな。

MIPS、ALPHAはNT4で打ち止めにならなかったら、もっと伸びてた気がする。
817Socket774:2006/01/16(月) 01:46:33 ID:vkwIU+wj
alphaは伸びてただろうね
でも最後はHPに息を止められて
今と同じになってたんだろうな
818Socket774:2006/01/16(月) 02:28:41 ID:0RYgQKmO
96, 97年頃のSPECのスコアだと大体
Alpha > PA-RISC > SPARC > MIPS > PPC, x86
くらいだった気がする。癖のある命令セットとかなんとかいってるけど、
あんまネックになってないのはネックになってないよね。
819Socket774:2006/01/16(月) 02:41:43 ID:ySmYR7Cy
>>818
96,7年くらいということは、
21264, PA-8?00, UltraSPARC, R10000, PowerPC603,4、PentiumProってとこ?

PA-RISCの盲腸は、さほどの害もないがあっても役にたたないのが多いね。かつては気の利いたトリックだったのだろうが。
UltraSPARCは強力なUPAにずいぶん助けられていたと思う。
820Socket774:2006/01/16(月) 15:19:57 ID:c/uRkW2e
>>814
呼びましたか?
中身は沖さん(OKIStation7300)でグラフィックエンジンがStardent、OSがKCIです。
821Socket774:2006/01/16(月) 16:21:05 ID:tfo/r/LH
OKIstation ですな。
DataGeneral も AViON という i860 機を出してた。
i860 は、割り込みが起きた後の処理がとんでもなく
大変で、全然性能が出なかったって話があったような。
822Socket774:2006/01/16(月) 16:30:18 ID:ySmYR7Cy
>>821
AViiONは88K
ひっくりかえすとNOVAII

29kを除く初期のRISCはたいてい割り込みハンドリングが大変だったけど、i860は別格かも。88kもひどかったけど。
823Socket774:2006/01/16(月) 17:06:48 ID:tfo/r/LH
> AViiONは88K

あああ、間違って記憶してた。どうも。

> ひっくりかえすとNOVAII

そういう意味なんかい。
824Socket774:2006/01/16(月) 19:54:11 ID:VTk9g1Od
AViiONの逆はNOIIVAでないかい。
825Socket774:2006/01/16(月) 19:59:24 ID:hY30tGdh
せっかくなのでメタルラック神の文章投下しておこう。
ttp://jun.artcompsci.org/articles/future_sc/face.html#TOC
826Socket774:2006/01/16(月) 21:52:09 ID:ox4ZoDiw
高橋メソッド版が大笑い。

ベクトルマシンの大メモリバンド幅は、コスト的にもはや割りにあわん
という主旨なんだが、tarusan はこれ読んでどう思うかのう。
827Socket774:2006/01/16(月) 22:33:03 ID:VGZoiqVu
どういう話
をするか。
-----------
ベクトルを
買ってはい
けない。
-----------
何故話をす
るか。
-----------
和田君に
命令された。


禿藁
828Socket774:2006/01/16(月) 23:41:34 ID:oz51ra31
>>792
SPARCのRegister Windowを言ってるんだと思うけど、
SPARCの場合はRegister Windowを2つまで分割して扱うこともできるから、
片方のWindow領域を例えばOSのカーネル用に使えば、全Window Registerを
メモリに退避する必要はないね。
User Process用全部という意味で全部と言っているのなら失礼。
829Socket774:2006/01/17(火) 04:43:59 ID:DoTuo/7A
>>820
実際、どんな代物だったんですか?
830Socket774:2006/01/17(火) 10:43:11 ID:ARDf21J7
>>829
薄くて小さい
831820:2006/01/17(火) 10:58:05 ID:FIK+Q6JV
>>829
OKIStationは普通に素直な作りでしたよ。Mips R3230やDEC Station2100など、
当時のデスクトップワークステーションと構成的には変わりません。
OSはSVR4/i386からi860依存部分を変更したもので、初期のBootMesssageと
CopyRightにはi386の文字がしっかり出てました。

古い書籍で持ってる人がどの位いるかわかりませんが、1989年 ASCII出版発刊の
改訂版UNIXデバイスドライバ(Writing a UNIX DEVICE DRIVER)は、著者の一人
トーマス・テキセイラ(Thomas J.Teixeira)が当時Stardent社員だった事もあり、
Titan Vistra800 をベースに書かれていますので、kernel/deviceまわりはこの
本に目を通すと大体お分かり頂けると思います。
832820:2006/01/17(火) 11:02:06 ID:FIK+Q6JV
ここからちょっと昔話。

米Ardent社ではMIPS R2000にWeitekのVectorUnitを浮動小数点演算機にし、
それを 1〜4ユニット搭載した TITANを製造・販売していました
(後にR3000+R3010にWeitekのVectorUnit搭載とグレードアップ)。
当時としては最先端を行っていたMIPSのコンパイラに自動ベクトル化/
パラレル化の機能を追加し、廉価にスパコン並みの環境を実現していました。

とは言え冷蔵庫大のサイズですから、これをデスクトップに持ってくる計画が
立ち上ります。開発コードStiletto、仮称BabyTITAN/TITAN500です。
TITANシリーズで使われていた WeitekのVectorUnitを Intel i860に置き換え、
グラフィックサブシステムを統合し IBM PC/ATサイズ(つまりフルタワー筐体)
に詰め込んだ物です。

開発は難航し製品リリース直前までこぎつけましたが、結局ポシャりました。
確か米Stellar社との合併で、開発が重なっていたTitan Vistra800に主軸が
移ったからじゃなかったかな。これがポシャったおかげで日本市場で切望
されていた小規模なTITANが白紙になり、山梨工場R&D の連中が TITANの
バックプレーンを半分にぶった切って TITAN750を作り上げたのは別の話。
833820:2006/01/17(火) 11:03:57 ID:FIK+Q6JV
で、TITAN Vistra。

OKIStation 7300をベースに Stilettoで培ったグラフィックサブシステムを搭載し、
旧Stellar社のレンダリングアルゴリズムを載せて堂々世に登場…したんだけど、
Stardent社のH/W事業撤退で日本のクボタコンピュータに開発拠点を移し開発続行。
NLXより二周り程大きい程度の筐体に、最上位機種でメインCPU i860、グラフィック
サブシステムに i860x2、合計 3つも載せてた豪勢なマシンです。OKI Station の
ままだとバスのファンアウトが足りなくて急遽バスバッファを強化したとかいう
のはヒミツ。

40MHzの i860による性能はまずまずで、Whetstone 20MFLOPS、Linpack性能で
8〜10MFlops(TITAN 1CPUシステムの半分程度)を出すことが出来ました。また、
グラフィックサブシステムに用いていた二つのi860も演算に使いまわせるように
しよう、という目論見もありましたが、これはキャンセルされました。
834820:2006/01/17(火) 11:05:39 ID:FIK+Q6JV
実はStardent社はH/W事業撤退の直前まで、i860(XR)の改良版である i860XPを
使ったマルチプロセッサのTITAN後継機種の開発をしていました。が、Intelに
よるi860XPキャンセル(?)で白紙に。モックアップだけで火が入るまでは行っ
てなかったと思う。

そうこうしてるうちにDEC から Alpha発表、OEM供給を受けてTITAN2発売。
50MFlops?は?何その鈍亀(ぷ って感じ。敵いませんな。んで、Alpha マンセー
とか言ってたら世の中ダウンサイジングでPCの台頭。2000万円でWS買って一人で
やるより10倍遅くてもPC20台で20人同時のほうが効率良いじゃんとか世の中
気がついてWSがバッタバッタと消えて行くっと。
835Socket774:2006/01/17(火) 23:38:17 ID:ARDf21J7
>>832
トンクス。中の人?

TITANってバスが弱くなかった?
836Socket774:2006/01/17(火) 23:51:56 ID:7WVJ5ga7
一気に良スレ化の予感
837Socket774:2006/01/18(水) 01:06:35 ID:Zv0oE6Ty
CPUのキャッシュについて質問したいんですがスレ違いだったら誘導していただけますか?
http://up.mugitya.com/img/Lv.1_up20314.jpg
このファイルをPDFにリネームして図1を見てください。
メモリーチェインというプログラムを用いてL1/2キャッシュアクセス時間と主記憶アクセス時間、ブロックサイズを推定するというものです。
CPUはAthlonXPのBartonコアを用いています。
配列の要素の大きさは4byteです。

一番低い線が64kBというサイズのチェインを実行したものでL1キャッシュ速度を推定できると考えました。
チェインの間隔を空けても空けなくても時間が掛からないのは一度に64kB分をL1キャッシュ上にロードしたために
どのチェインの要素をアクセスしようとしてもL1キャッシュに100%ヒットするからだと思います。

次に低い線は512kBです。
ここからL2キャッシュ速度を推定したいです。
チェインの間隔が4byte、すなわちチェインとチェインが連続になっている部分に着目するとL1キャッシュとほぼ同じ速度です。
これは一度のロードでL2キャッシュにほぼ総ての配列がロードされたからだと考えました。
それ以降、ほぼ比例的にチェイン間隔32バイトまでアクセス時間が上がっていくのは一度に512kB分をロードできないので
何度も小分けにロードするためと考えました。
4バイト間隔では1度のロード(64kB分ずつ)、8バイト間隔では2度のロード、16バイト間隔では4度のロード、32バイト間隔では8度のロード。
こう考えると64kBずつ8度のロードで512kBのL2キャッシュに総てのデータをロードすることができるのではないでしょうか。
しかしなぜ、チェイン間隔が32kBのところで32クロックという時間がかかったのかが分かりません。
間違えてキャッシュの一部を破棄してしまって再ロードしているのでしょうか。
詳しい方の解説をお聞きしたいです。
838829:2006/01/18(水) 03:47:48 ID:ai49dr9m
>>820さん
昔話ありがとうございます。
839Socket774:2006/01/18(水) 07:33:28 ID:+2o7chA2
840Socket774:2006/01/18(水) 07:58:31 ID:Zv0oE6Ty
>839
誘導ありがとうございます!
841Socket774:2006/01/18(水) 12:33:13 ID:i1nDA6nP
>>835
>トンクス。中の人?
元がつきます。

>TITANってバスが弱くなかった?
し、しししっ、しつれいなぁぁ。
Vistraはともかく、TITANの方は当時のWSとしては強力な部類だと思いますよ。
バックプレーンにはI-BusとR-Busという二つのバスがあって、どっちがどっち
だったかな…一方が通常のR/Wで、片方がReadOnlyの32bit幅、P3システムで
32MHz駆動ですから、最大転送速度で256MB/sec.です。

通常のデータ転送はR/Wのバスを用いますが、ベクタユニット使用時はI/R
両方のバスを用い、ベクタデータの二つのソースブロックを同時に読み出す
事が可能です。つまり、A[..]*B[..]のA列とB列を別々のバスで連続して
読み出しますから、レイテンシが非常に小さくなるわけです。

そしてなんと!(今では普通ですけど)CPUボード、メモリボード共にバスを
切り離す事が可能でした。つまり、CPUがリクエストしたメモリ転送要求を
メモリが受け取った後、実際にデータが現れるまで時間がかかるわけですが、
その時間を別のCPU、メモリが利用できバスの利用率が上がります。

 P2/P3システムではCPUボードを最大4つ、メモリボードを最大4つ(バック
プレーンはグラフィック用を除くと6つまでなので最大4+2か2+4)で構成でき
ますから、マルチプロセッサ構成やマルチメモリ構成の場合に理論値に近い
データ転送速度を実現していました。

大型機やスパコンで使われていた手法ですけど、パーソナルスーパー
コンピュータと銘打ってたのはこのあたりも関係してます。
842Socket774:2006/01/18(水) 12:40:18 ID:i1nDA6nP
また、Stardentのもう一つのTITAN、Steller GSシリーズのほうもユニークです。
こちらはデータパス(DataPath)と呼ぶ512bit幅の完全なクロスバースイッチを
中心に配し、メモリ、プロセッサ、グラフィック、IOを結んでいました。

バンド幅の非常に大きなメモリシステムをこのデータパスにつないでいたため、
グラフィックサブシステムは専用のメモリを持たず、今で言うUMA構成をとります。
ビデオDACも直接メモリを参照しちゃいますから、パラパラアニメの性能はダントツ
です^^;

今では、SunのUPAがこれとほぼ同様のバスアーキテクチャですよね。
843Socket774:2006/01/18(水) 17:08:33 ID:GO/WXQM7
ConroeとMeromの違いって単にキャッシュとクロックだけなんだろうか?
キャッシュが倍になって、クロックが若干上がっただけで
TDPが倍以上になるもんかな?

Meromにはノーマリーオフ機能がついてるけどConroeはどうなんだろう
FSBアーキテクチャとかも同じなのかな
844Socket774:2006/01/18(水) 20:47:09 ID:xu1pUMHp
閾値電圧やVddも違うでしょ。
845Socket774:2006/01/19(木) 03:50:08 ID:ZJRiXMvk
だな。
製造プロセスのチューニングでVth下げるだけでリーク電流は簡単に数倍は
増やせる。代わりに得られるトランジスタの高速化は20%程度で、配線や
クロックスキューは変わらないから周波数は10%しか上がらない。
Vth化Trはむしろ設計時にクリティカルパスに集中的に使用するのが効果的。
846Socket774:2006/01/19(木) 08:07:16 ID:8+vw6Nht
>>843
Yonahの通常電圧版と低電圧版を比べれば、
TDPは倍違うけどクロックは大して変わらない。
それと同じようなものじゃないかな。
847Socket774:2006/01/27(金) 22:42:04 ID:IJ4E74uH
捕手
848Socket774:2006/01/28(土) 04:26:08 ID:ahP34Hbi
スターデントの裏話をせっかく書いてくれたのにありがたすぎてレスができんですまぬ。プライムの話もあれば聞きたいでっす。

Stellarって細粒度マルチスレッドでしたっけ。Apollo DN10000とあわせて憧れのハイエンドマシンだったよ。
また88kの悪口になってしまうけど、lunaの4CPUモデルは遅かったよ(バスが)。
整数レジスタ上で浮動小数点演算を行う設計も正気の沙汰とは思えん。88110でFPレジスタついたけど。

O2もUMAでクロスバーなのかな。SGIの最後の光かも。本体は1万円くらいだけどOSが高くてなかなか手が出ないや。
849Socket774:2006/01/30(月) 15:25:44 ID:DFvIEEaF
ルネサス、600MHz駆動のSH-4A「SH7785」
http://pc.watch.impress.co.jp/docs/2006/0130/renesas.htm
850Socket774:2006/01/30(月) 16:51:30 ID:fodyh7vR
>>849
a[0]*b[0]+a[1]*b[1]+a[2]*b[2]+a[3]*b[3] がスループット1だもんな
SSEの何十倍速いんだろ
851Socket774:2006/01/30(月) 16:53:12 ID:gn8sGZqJ
>>849
なんかいろいろ周辺回路も付いてるんだね。
ワンチップマイコンもレベル上がったなぁ。
852Socket774:2006/01/30(月) 16:57:13 ID:O83Duz9o
メモリは外付けだからワンチップじゃねーべさ。
853・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/30(月) 21:41:54 ID:/uuVavPL
>>850
でもそれだけ速くても話にならないし、Pentium 4でもソフトパイプラインやれば1 DQWORDあたり数クロック程度で済む。
そのクロックで最大単精度4.2GFlopsなら確かにかなりの速度だけど、Pen4なら15GFlops逝くからね。

SHのISAはRISCの中でもコンパクトな部類だけど、即値が使えなかったりするからx86のほうが速いケースも多いよ。
854Socket774:2006/01/31(火) 00:27:07 ID:sZN15CxG
液晶ディスプレイコントローラーって……PowerVR?
855Socket774:2006/01/31(火) 00:53:03 ID:I3pxU0lW
RISCでimmediateに制限が発生するのは仕方が無い。しかもISAをコンパクトにすれば当然だ。
団子は下らん事を書いてオナニーする癖がどうにも直らんな。
856Socket774:2006/01/31(火) 01:46:09 ID:bMBerGbi
>>854
ええっ
857・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/31(火) 03:25:02 ID:n+xucbKR
今気づいた。
4.2GFlopsって4要素・4要素の積和算で7オペレーション分だから単純にクロックのちょうど7倍ってことか。
なるほど。激しくクロックがあげられない気がするのは俺だけ?

しかしSSE3の水平加算ってやたら使い勝手悪いのな。
同等の演算を、巧くソフトパイプライニングして1DQWORDあたり10クロック程度?
参考 ftp://download.intel.com/design/Pentium4/manuals/24896612.pdf

どうみても低速です。本当にありがとうございました。
858Socket774:2006/01/31(火) 04:02:09 ID:wzWAD4Ar
>>857
ベクトル化が上手く填まるようなコードでは、もはや演算速度は問題じゃないでしょ。
スループットはメモリ帯域だけで決まるといって良い。
859Socket774:2006/01/31(火) 08:57:04 ID:sZN15CxG
>>857
実はSH4はドリキャスの時代からクロックの7倍Flopsと主張してる。
クロックの向上に伴ってメモリも高速化してるので実性能が出ないことはないと思うが。
860Socket774:2006/01/31(火) 09:33:41 ID:btelz2zq
D$にのっかるデータだけをこねくり回すならそこそこ出るよ。
861Socket774:2006/01/31(火) 10:14:21 ID:kDAfJXVu
>>854
SH4はもともと128birの2Dグラフィックコア内蔵してて
ドリキャスはそれと別にPowerVR2を搭載してたんだよん。
それで128bit機を名乗っていたのはどうかと思うけどな。

STMicroとの合弁だったからそっち由来のコアかもしれんね。
862Socket774:2006/01/31(火) 11:11:56 ID:2oKUNV3o
ソフトパイプラインなんてやってられるか!
MMXや3DNow!でもできる積和をクロックアップのためだけに排除しているSSEは
イヤガラセでしかない
863Socket774:2006/01/31(火) 15:09:37 ID:BNMT4FfD
SH778xは2D/3Dアクセラレータ載ってない。
SH7770とかSH-MobileにはPowerVRが入ってる。
864Socket774:2006/01/31(火) 20:58:52 ID:dhUtvsoh
>>862
>クロックアップのためだけ
それだけで十分な理由だと思いますが何か?(漏れそれが(・∀・)イイ!!トレードオフかどうかはわからないけど)



>イヤガラセでしかない
は、もっと不条理な仕様のための言葉かと
865・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/31(火) 23:04:17 ID:QMwHmPpr
無用に演算コストの大きい命令サポートすると高クロック化が難しくなるってのはPowerPCとか見てればわかるかと。
でもMPC7450シリーズはすごくいい石だよな。バス帯域が狭いけど。
866Socket774:2006/01/31(火) 23:36:50 ID:izt18hZc
>>857
> 激しくクロックがあげられない気がするのは俺だけ?

なんで?

レイテンシが1ではないよ。
スループットが1だよ。

クロックを上げるのを阻害するのは、
1ステージの長さですよ。
867・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/01/31(火) 23:55:20 ID:QMwHmPpr
>>866
ステージ細分化(レイテンシ増大)すれば上げられるのは解ってるよ。PPC970がそうやってるし。

Dreamcastってたしか200MHzだったけど、x86ではDeschutesの450MHzや初代Xeonがハイエンドの頃だろ。
SHのクロックが3倍伸びる間にx86は5倍以上伸びてる。
熱設計の制限のきつい組み込み向けと比べるのは酷かもしれんが、
Pentium MならPentium II/IIIと消費電力そんなに変わらない(むしろ落ちてる?)のに
2.26GHzまで出てること考えれば、SHの進化って鈍いんじゃね?
868Socket774:2006/02/01(水) 00:01:04 ID:WD0IEnYA
>>867
SHの展開が遅いのは別に今に始まった事じゃないから。
まあ会社の合併やら大変なんだろうなとは思うが。
869Socket774:2006/02/01(水) 00:17:25 ID:RoiARy1r
SSE3の水平加算はK8のほうが性能いいな
Yonahで改善されたか気になるな
870・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/02/01(水) 00:32:09 ID:GJSQjT1Q
PenMはそもそもSSE3サポートしてませんから。
ところでアレ水平加算って言えるの?Intelの開発マニュアル読むにDWORD単位で転置してからaddしてるだけじゃないかと。
PenMはレイテンシの小ささがイイ感じだけど、浮動小数は実クロックが命かと。
MMX>SSE2整数がSSE2整数≧MMXくらいになってると思っている。

どっかで見つけた4要素積和算

SSE2
mulps xmm0, xmm1
movaps xmm1, xmm0
shufps xmm0, xmm1, 0xb1
addps xmm0, xmm1
movaps xmm1, xmm0
shufps xmm0, xmm0, 0x0a
addps xmm0, xmm1


SSE3
mulps xmm0, xmm1
haddps xmm0, xmm0
haddps xmm0, xmm0

普通に計算したら依存関係のチェインで33クロックかかる。並列実行でようやく元が取れる。
てかレジスタ8本しか無いのがきつい。
871・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/02/01(水) 00:34:16 ID:GJSQjT1Q
>>869
K8では下のコードで15クロックらしい。実クロックの差加味してもK8のが上だな。
872・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/02/01(水) 01:04:19 ID:GJSQjT1Q
続き。どうみても3D NOW!のが高速です。
とっさに思いついた4要素×4要素の積和算2セット同時実行。

pfmul mm0, mm4 -並列実行可能
pfmul mm1, mm5 ┘
pfmul mm2, mm6 ┘
pfmul mm3, mm7 ┘

pfadd mm0, mm1 -並列実行可能
pfadd mm2, mm3 ┘

pfacc mm0, mm2

最後にmm0の上下に2セット分のデータが入る。pfaccってすごいリッチな命令だな。

レジスタ全部使ってるけど、メモリからロードしてもレイテンシは十分隠蔽可能なので
まだまだ並列化の余地は十分ある。

※K8ではmulpsはマイクロアーキレベルでは上下に分けてpfmul×2発行してるだけの実装。
しかもデコーダの負担はxmmベース1命令=mmベース2命令
mmレジスタのほうが小回りがききやすい→MMX/3D NOW!のほうが速い
873Socket774:2006/02/01(水) 01:09:28 ID:Fs3cpYiQ
小さい計算だけで比較して命令の優劣を語るバカ
874Socket774:2006/02/01(水) 01:13:06 ID:xT+0VSPv
大きい計算やってもSSEはうんこ
875・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/02/01(水) 01:17:52 ID:GJSQjT1Q
SSEはユニットが128bit化されてから価値が出てくる。それまではMMXや3D NOW!のが速くても已む無し。
つかK8の整数/単精度浮動小数でSSE>MMX/3DNOW!になるケースってほぼ皆無じゃね?

Pentium 4はL/Sだけは128bit化されてるからロード/ストア回数が多い演算に限ってはMMXよりSSE2整数のが有利。
876・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/02/01(水) 01:48:44 ID:GJSQjT1Q
じゃあ
プレス子のSSE3で4要素×4要素の積和算4つな

mulps xmm0, xmm1
mulps xmm2, xmm3
mulps xmm4, xmm5
mulps xmm6, xmm7
haddps xmm0, xmm2
haddps xmm4, xmm6
haddps xmm0, xmm4

データシートどおりなら多分これで40clkくらい。
レジスタ無駄遣い辞めて8並列くらいやればもっとスループット上げられるかも。
877Socket774:2006/02/01(水) 08:37:23 ID:k+1F3D4W
>>867
当時は200MHzがそもそも無理したクロックなので、166MHz版と比較してやってくれ。
878Socket774:2006/02/01(水) 09:10:25 ID:wL3QqNck
>>867
消費電力やプロセス、パイプラインの段数を考えればSH4はそんなもんじゃないのかな?

組み込みだから割込応答を考えるとパイプライン段数は増やせないし、熱設計を考えれば
プロセスを細かくした分を純粋に周波数アップにも使えないだろうし。
879Socket774:2006/02/01(水) 09:21:44 ID:sQG+CjRO
SHはSH3で機能が固まっちゃって、
夢カスあたりで性能向上を諦めた感があるね。
ペルソナだってHandheldPC/Proで止めてるから
デモ機用の性能が不必要になったと言うべきか。

そりゃ、HandheldPC2000なペルソナは見たかったけど(w
880Socket774:2006/02/01(水) 09:58:17 ID:wL3QqNck
ところでここ、PC以外もあり?
881Socket774:2006/02/01(水) 09:58:57 ID:wL3QqNck
もっと有体に言えば非ノイマンOK?
882Socket774:2006/02/01(水) 20:36:03 ID:3Q1hzfSc
個人的には論理回路とかついてればビー玉だろうがOKだと思っている。
ttp://japanese.engadget.com/2006/01/25/marble-logic/
883Socket774:2006/02/01(水) 21:36:19 ID:b2s1m7tk
>>867
> 熱設計の制限のきつい組み込み向けと比べるのは酷かもしれんが、

そうなんだよなあ、、、そういえばサターンにも空冷ファンの準備工事が
してあったような気がするけど、結局ファンは実装されてなかった。

それが今は、Xbox360という、ゲームができてDVDも見ることが
できる電気温風器とか許されるもんなあ。夏が楽しみだ。
884Socket774:2006/02/01(水) 21:59:28 ID:Il5hRdt4
SH4に32ビット命令長モードを組み込む予定は無いのか
885Socket774:2006/02/01(水) 23:30:12 ID:tLRzdx9b
>>884
それがSH5な訳なんだが、いつまでたってもモノが出てこない。
だいたい、せっかくSH4があっても売れ筋はSH3っぽいし、
ARMも売れ筋はARM7系みたいだし、あんまり高性能な路線はニーズが無いっぽい。
886Socket774:2006/02/02(木) 02:05:27 ID:MbedrHls
もしかしてSH5はSH4より性能低いんじゃないか?
SH5ってクロックどのくらい?
887Socket774:2006/02/02(木) 10:59:53 ID:0bP80KA8
>>876
その計算は40clkかかるかもしれないけど、
実際は他の処理や次の積和算と並列実行できるから
実質もっと短く済むとオモ。
888Socket774:2006/02/02(木) 11:38:37 ID:RH8NbYT+
>>886
SH5は会社ごとお星さまになりますた。
合掌。
889Socket774:2006/02/02(木) 11:59:11 ID:jwjgn41y
>>887
衝突判定の場合なんかは1個ずつやるしかないわけで
素直なデータ配置のままシンプルな命令でやれる方がありがたい
エライ人にはどうでもいいことだけど

Altivecも整数でしか水平加算ができないけどa*b+cをスループット1でできるから
クロックあたりの能力はSSEの倍、、、でも使われない
890Socket774:2006/02/02(木) 12:42:15 ID:B4SZ4VgT
クロックで決めようとする>>886は中学生
891Socket774:2006/02/02(木) 13:24:59 ID:y8xQxsjx
SH5はシングルスケーラだから同じクロックだったらSH4より遅いと思う。
SH3→SH4のようにSH5→SH6でスーパースケーラになるはずだったんだけど...まぁそういうわけだ。
892886:2006/02/02(木) 16:37:27 ID:MbedrHls
>>890
いや、891のような事をふまえた上で
昔の予定では初期のSH5が700Mhzだったなぁと思いだしてSH4の方が、思った。
893Socket774:2006/02/02(木) 18:43:29 ID:y8xQxsjx
まぁ水子のクロックを語ってもむなしいだけだけどねぇ...。
894Socket774:2006/02/02(木) 20:10:23 ID:K4/NcYSY
ソフトウェアの互換性を考えれば、
新規追加された命令が128ビット幅なのに、64ビット幅の演算器を2回まわす実装
というのは正しい選択なんですよ。


新しい命令を追加しました。
この命令を使うとスピードアップしますが、
世の中で使われているPCの1%しか、この命令に対応したCPUを積んでいません。

というのでは、お話にならないが、

新しい演算器を追加しました。
このCPUを使うとスピードアップしますし、
世の中で使われているPCの80%が、すでにこの命令に対応したCPUを積んでいます。

というのはウマーでしょ。
895Socket774:2006/02/02(木) 20:52:20 ID:7DDhYBB+
いやそれ因果律遡ってる
896Socket774:2006/02/02(木) 21:00:41 ID:4S6UVOhO
ソフトウェアの互換性と演算器の実装は関係ないですよ
897Socket774:2006/02/02(木) 22:42:42 ID:jwjgn41y
ロードした後途方に暮れるようなパズルアーキテクチャだし
3割くらいしかスピードアップしないし
面倒だから今でもFPU
高クロックとメモリ帯域のギャップのおかげで単純な処理なら差なし
898・∀・)っ-○●◎- ◆Pu/ODYSSEY :2006/02/02(木) 23:19:33 ID:b5oPorJn
>>887
確かにそうだし、OoOの動きを読みまくってアンロール・スケジューリングすれば
今の演算の繰り返しだけでも更に倍近いスループットを稼げると思う。
ただし演算ユニットがいっぱいあってもポートが共有してるから実際にはそんなに性能良くないような。

>>889
VPERM系オペレーション+垂直加算でよくね?
確かにvmadd*はどう使えばいいか逆に困るよね。
899Socket774:2006/02/03(金) 05:15:00 ID:ZH/72gyY
何で富士通が作ってるSPARC64の話が出てこないの?
国産CPUの中では高性能だと思うけどな
900Socket774:2006/02/03(金) 05:28:42 ID:Z4JG6uYw
互換という現実路線で夢がないから。
独自アーキテクチャーのSH4が人気なのもこの理由。
……もちろん実生活では夢でMPUを語っちゃダメだぞ。
901Socket774:2006/02/03(金) 09:14:15 ID:bWLFHrjW
というより触れる機会があまりないからでないかな。

SPARC64積んだマシンってでかくてごついやつばっかりだもの。
中古でもあまり出てこないし。
902Socket774:2006/02/03(金) 16:42:51 ID:DATToIUk
>>895
演算器の強化と新命令の追加を一度にやるのではなく、
将来を見越して早めに新命令を追加しておくのですよ。

いますぐには64ビットは必要ないけど、
64ビット対応のCPUを売るのと同じですよ。
903Socket774:2006/02/03(金) 17:33:27 ID:bWLFHrjW
>>902
意味不明なんだが?
命令追加を隠して入れておいて、演算器を追加したときに公開するって話?
何で隠すのわざわざ?
後で公開するっていうならあらかじめバリデーションしておかないといけないよね。
当面使わない命令のバリデーションをやるのは無駄っぽいけど。

命令追加したときに公開するならやっぱり
>世の中で使われているPCの1%しか、この命令に対応したCPUを積んでいません。
と変わらないんじゃないの?
904Socket774
>>899
というかそれより上は現行国産CPUだとSX8の中のベクトルプロセッサだけのような