【骨髄反射】INTEL厨 vs AMD厨 Part21【エグゼクテブ】

このエントリーをはてなブックマークに追加
748Socket774:04/04/03 08:29 ID:QX0EpvtQ
>>746
それのどこにメモリオペランドが存在するのかと小一時間...
749Socket774:04/04/03 08:32 ID:QX0EpvtQ
あ、逃げられるのを防ぐ為に、より単純な方向に進もうとしたのか、スマソ。
750Socket774:04/04/03 08:36 ID:skQ3n0jX
x86のニモニックには疎いんだけど、それは64bit即値が示すアドレスの中身を
64bit単位でレジスタにロードするって意味?即値が単なるデータなら趣旨から
外れるし、アドレス情報なら少し馬鹿っぽいけどある程度合理的な逃げ道がある
のよね…出来れば、録音の目の届かないとこで話し合いたいな。
751Socket774:04/04/03 09:31 ID:KPRq8ILY
>744,>745

珍しくまともな書き方で話とる・・・。とうとうスクリプトが壊れたか・・・。
つーか、そんな書き方出来るなら最初からヤレ。このとんちんかん。
752T.A.:04/04/03 09:37 ID:UhLW37aU
>>741,742
相変わらず他人の考えを横取りするのだけはうまいね。
年収4500万とやらもそうやって稼いでるんだろうね。
753Socket774:04/04/03 09:48 ID:KPRq8ILY
>752

確かにコイツって他人が見解を出した後にしか出さないよなぁ・・・。
やっぱりスクリプトなので、ベースになるモノが必要なんだろうな。
754Socket774:04/04/03 09:51 ID:skQ3n0jX
>>752
前半部は、T.Aさんの示したソースを自分なりに解釈して書いたんだろうね。
後半部で、俺たちが思ってる疑問、解釈をまったく理解できていないことは明白になっているわけだが。
755Socket774:04/04/03 10:03 ID:27WX4OCF
SunとMSが和解

SunとMSは10年来の係争を和解で終結させ、技術協力協定を結んだ。
MSはSunに、アンチ・トラスト訴訟に関して$700百万、パテント訴訟に関して$900百万、
サーバ製品に関するパテント使用料の前払い金として$350百万、合計約$20億支払う。
SunとMSは、今後、相手のテクノロジーの使用料を払う。

その他、MSのJavaサポートの件や、Javaと.Netの件、SunはXeon (さらにOpteron)製品
にWindowsを搭載できるようになるらしいことも書かれています。

http://mypage.odn.ne.jp/www/k/8/k8_hammer_trans/files/Hammer-Info.html

#Intel包囲網ですな。
756Socket774:04/04/03 10:24 ID:PS2XUDeT
まあまあ、マターリとできるのならいいではないですかヽ(´▽`)ノ

>742
結局のところIA-32eを出すきっかけが欲しかったのでしょうね。
AMD64が発表された当時、パーソナルユースではIA-64よりも歓迎されておりましたし、
Itaniumの価格もなかなか落ちてくる気配が感じられなかったのでYamhillを開発したのだと思います。
今までのIntelの戦略を考えると、恐らくYamhillはAMD64以上の機能を持った命令群だったのでしょうね。
その内容には非常に興味が有るのですが・・・ もう知る由も無いんですよね。少々残念です(^^;

>744
そういう場合は下位DW,上位DWと分割してトレースキャッシュに格納しているのではないでしょうか?
757Socket774:04/04/03 10:43 ID:rI3O72Sy
>>756
RISCの命令は固定長が基本だから並べるのはナシでは。
64bit即値のロードは、デコーダで
16bitのロード命令4つとかに分割されるものかと思われ。多分。
μOPのサイズが32bit程度なら。

つかIA32eとかの64bit拡張のじゃなくて、現状の32bitデータのロードも
16bitのロード命令2つに分割されてるかと。きっと。
758Socket774:04/04/03 11:11 ID:skQ3n0jX
>>757
並べるのはナシだったらアドレッシングに厳しい制約がつかない?
759Socket774:04/04/03 11:12 ID:PS2XUDeT
>757
μOPレベルでそれをやってしまうとクロックが余計にかかってしまいますから(その例だと4クロックですかね)、恐らく違うのではないかと。
この辺りはimm32とimm64のクロック数を比較してみれば想像できるのですが、まだ公表されていないみたいですしね(^^;;

私は32bit境界から外れなければOKだと考えていたのですが・・・ 他の64bitRISCプロセッサはどのように処理しているのでしょうね?
760Socket774:04/04/03 11:17 ID:skQ3n0jX
>>759
>>380のリンクの資料のP292みて。
761Socket774:04/04/03 11:46 ID:QX0EpvtQ
>>757
μOPの幅は、32bitよりもはるかに大きいよ。
x86命令を効率的に実行する事を考えると、32bitの即値オペランドを最低でも
1つは運べないといけない。

>>760
AMD側はALUやレジスタファイル自体を64bit化してるから、プレスコの参考に
はならないんじゃ?
762Socket774:04/04/03 11:56 ID:PS2XUDeT
>760
Athlon64/Opteronはimm8〜imm64までクロック数は変わらないみたいですね。
もしPrescottも同じならば、imm64時においても一括してデータを処理できるようにならなくてはいけませんよね。
そうなるとμOPのサイズを64bit以上にするか、L2キャッシュからデータを取得するアドレッシング・モードを設けているのかもしれません。
763Socket774:04/04/03 11:58 ID:o1MOikWY
>>757
現状の32bitPen4の場合は、32bit即値は2つに分割されてトレースキャッシュに格納されます。
ただし、32bit命令が2つの16bit命令に分割される訳ではないです。
32bit即値を伴う命令は、即値データを分割して、前後の隣接する命令の空いている即値データ領域に格納します。
つまりトレースキャッシュ上のμOPは厳密な意味では固定長ではありません。
32bit即値を伴う命令が連続すると、即値データを格納する領域が不足してしまうので、
ダミーのμOPが追加されます(その分遅くなります)。

参考文献↓ ページ2-72「Assembly/Compiler Coding Rule 48.」
ttp://developer.intel.com/design/pentium4/manuals/24896610.pdf
764 ◆Rb.XJ8VXow :04/04/03 12:03 ID:j1o0NWBg
>>744
uOPに変換が基本ですぜ。
64bit即値オペランドは3つに分解すればそれでOK
765 ◆Rb.XJ8VXow :04/04/03 12:05 ID:j1o0NWBg
>>763
> その分遅くなります
騒ぐ必要は何処にも無いぜ。
766Socket774:04/04/03 12:21 ID:SuXDMaFI
>>763
日本語版の最適化マニュアル

アセンブリ/ コンパイラ・コーディング規則48 ( 影響ML、一般性M)。( 符号拡張された
16 ビット即値としてコード化できない)32 ビット即値を使用する命令同士を、近くに配
置しないようにする。32 ビット即値を使用するマイクロオペレーション(μOP) の直前ま
たは直後には、即値を持たないマイクロオペレーション(μOP) をスケジューリングする
(2-58 ページ)。
767762:04/04/03 12:22 ID:PS2XUDeT
よく考えたらμOPのサイズまで64bit幅に揃える必要は無いですね_| ̄|○
よって>762の下2行は無視してください(^^;;;;
768Socket774:04/04/03 12:28 ID:SuXDMaFI
>>764
3つに分解って・・・??????????
769Socket774:04/04/03 12:38 ID:PS2XUDeT
>768
恐らく実行OP,上位DW,下位DWに分けるという事だと思います。
でもμOPが64bitサイズのデータを一括で処理できるとしたら、64bit即値を1クロックで処理できるのですが・・・
770Socket774:04/04/03 12:39 ID:rI3O72Sy
>>763
なるほどー、カコイイ格納方法してるねぇ・・・
771Socket774:04/04/03 12:51 ID:SuXDMaFI
>>770
あの文章はコーディングの最適化について説明してるのであって
別にトレースキャッシュの構造を説明しているわけじゃありません。
772Socket774:04/04/03 13:21 ID:QX0EpvtQ
>>771
それはわかるけど、最適化が必要な理由として >>763 は説得力あると思う。
トレースキャッシュの容量をケチる手段としても、よさげだしね。
トレースキャッシュ上ではμOPペア毎に合計32bitの即値を保持できて、スケ
ジューラに渡すときに正しい即値データを持つμOPが作られる。
再構成用に余分な1bitが必要になるが16bit減らせるので、15bitの省エネ。
12KμOPSの容量が各15bit少なくなると22Kバイトも少なくてすむ。
773 ◆Rb.XJ8VXow :04/04/03 13:58 ID:j1o0NWBg
まぁ、どっちにしてもIA-32eになったからと言って容量が倍要るなんて
戯言を言い出すのはT.A君だけだろうね。

774Socket774:04/04/03 14:59 ID:o1MOikWY
私がWillametteで試した範囲では、
 add reg32,ebp
を連続配置(reg32はeax,ebx,ecx,...等、同じレジスタが連続しないようにいろいろ変える)
して実行した場合、IPC=3

 add reg32,0x00007777
を連続配置して実行した場合も、IPC=3

 add reg32,0x77777777
を連続配置して実行した場合は、IPC=1.5

 add reg32,ebp
 add reg32,0x77777777
 add reg32,ebp
 add reg32,0x77777777
  :
と交互に連続配置して実行した場合は、IPC=3

 add reg32,0x00007777
 add reg32,0x77777777
 add reg32,0x00007777
 add reg32,0x77777777
  :
と交互に連続配置して実行した場合は、IPC=2
775Socket774:04/04/03 19:02 ID:E6OeIHzG
結局今イニシチアブを持ってるのはAMDっと。
Intelはいまいち冴えがなく後手後手。
776Socket774:04/04/03 19:21 ID:6Ucrd7W6
LGA775はピン曲げでマザーを使い捨てにさせる陰謀だと予想
777Socket774:04/04/03 19:28 ID:Dy/ah+WS
コア欠けならぬピン曲げが登場するわけか・・・
778Socket774:04/04/03 19:52 ID:10rJz9nc
でも、ピン折れで死亡するCPUも無くなる訳か。
779Socket774:04/04/03 20:31 ID:Dy/ah+WS
変わりにピン曲がりするマザーの誕生
780Socket774:04/04/03 20:53 ID:alefzJzG
      ______
     /::::::::::::::::::::::::::\
     /::::::::::::::::::::::::::::::::::\
    |:::::::::::::::::|_|録音|_|
     |;;;;;;;;;;ノ   \,, ,,/ ヽ      
     |::( 6  ー─◎─◎ )          
     |ノ  (∵∴ ( o o)∴)          
   /|   <  ∵   3 ∵>  ん?uOPに変換が基本ですぜ♪
   ::::::\  ヽ        ノ\   
   :::::::::::::\_____ノ:::::::::::\
781Socket774:04/04/03 20:59 ID:KPRq8ILY
>780

先生はμopって書かないでuOPってかくんだよなぁ・・・。
バカっぽいよ。
782Socket774:04/04/03 21:02 ID:KPRq8ILY
>773
まあ、どっちにしても年収4500万なんて世迷い言言い出すのは先生だけだろうね。
783Socket774:04/04/03 21:12 ID:SoO5eOgh
>>776
クレームを避けるためと予想。
ピンはマザボ側だから、簡単に曲がってもインテルは悪くないぞと。
784Socket774:04/04/03 21:39 ID:MIrVXVtg
録音の年収
2000万→3000万→4500万
大体一月毎に1.5倍になります。
785Socket774:04/04/03 21:51 ID:1zJPPF1n
4500万 ・・で、どこの貨幣単位で?
786Socket774:04/04/03 22:01 ID:gGVrK1eu
リラ
787Socket774:04/04/03 22:16 ID:x4wUbOTc
>>781
μの読み方を知らないので変換できないのです。
788Socket774:04/04/03 22:40 ID:Oy3Li4u+
ミュ
789Socket774:04/04/03 22:51 ID:KweurONI
>>785
ウォン
冗談じゃなくウォンだとホントっぽくなるウォン計算だと年収400万円くらいになるんだよね
金持ちって自分で言ってもなかなか買い換えないとか見てるとちょーどそのくらいになるんだよねぇ
790Socket774:04/04/03 22:53 ID:EykEskuG
>>789
漏れは年収150万円の貧乏フリーターでつが何か?
791Socket774:04/04/03 22:53 ID:6Ucrd7W6
日本語も不自由だしね、彼
792T.A.:04/04/03 23:34 ID:UhLW37aU
>>773
>まぁ、どっちにしてもIA-32eになったからと言って容量が倍要るなんて
>戯言を言い出すのはT.A君だけだろうね。
まあ、戯言なのは今更言われるまでもなく自分自身よく判ってるからね。
何しろ真相はIntel(それも設計陣のトップレベルの連中)しか知らないんだから
どれほど真実味があっても、所詮、推測に過ぎないし。

ただ、夕べからのやり取りは「議論」のやり方としてはいい勉強になっただろう?

議論の結末には3種類あるんだが、

1)発散:複数の意見が単に衝突を繰り返すのみで、問題解決に至る結論が出ない状態。
 議論の結末としては最悪。更に最悪の場合は問題自体が摩り替わってしまい、本来の
 問題以外に別の問題を派生させてしまう。
2)妥協:複数の意見の利害関係の中間点を結論とすることで、取り敢えず問題解決を
 優先する。これでも充分に問題が解決する場合もあるが、多くの場合は根本的解決
 にはならず、後々に最終的な解決を必要とする。
3)昇華:複数の意見を元に短所を改め、長所をより高めた意見を作り上げる。
 議論の結末としては最も理想的。

録音先生が議論に参加した場合、必ず1)の結末に向かっているんだよねぇ・・・
(参加しなかった場合については、夕べからのμOP関連の議論を見れば判るだろうから
改めて書く必要はないよな?)


ちなみに、あくまで「議論の方法」についての話なので、出てきた「結論」について
は考えてないからね。

793録音名語録上げ:04/04/03 23:39 ID:skQ3n0jX
744 :Socket774 :04/04/03 07:42 ID:FkN9EIqi
>>741
オペランドにメモリを指定している場合はどうなるんだ?
64bitモードの場合、64bitのアドレス値が必要になるんじゃないか?

764 : ◆Rb.XJ8VXow :04/04/03 12:03 ID:j1o0NWBg
>>744
uOPに変換が基本ですぜ。
64bit即値オペランドは3つに分解すればそれでOK
794Socket774:04/04/03 23:42 ID:GVUsakLo
なんかやけにスレ進んでると思ったら…
やっぱり予想通りでしたか…
795 ◆Rb.XJ8VXow :04/04/03 23:54 ID:j1o0NWBg
>>792
非常に残念だが結論が分かりきってるものを議論する必要は無い。
単に戯言を否定するだけで良いのだよ♪
796Socket774:04/04/03 23:58 ID:uoY5eKAP
議論の結末とか、詭弁とか、そんなの気にしてるのは
録音に良い様に弄ばれてる厨だけだろ。
いい加減相手にするのは止めにしてみてはどうか。
奴を論破することによって、自らの精神の平安を得ていると言うのなら
俺が言い過ぎた、ごめんね。
月曜にでも医者に行け。
797 ◆Rb.XJ8VXow
ついでに言っとくが「真実味」はこれっぽっちも無いぞ。
ってか、「寝ぼけるなボケ!」としか言い様が無い。