Intelの次世代CPUについて語ろう 25

939 ：Socket774：2006/09/03(日) 19:46:38 ID:u8KIHILX

>>936
デコードやエフェクトをGPUに任せることはあってもGPUエンコは未来の話だ

940 ：Socket774：2006/09/04(月) 12:05:28 ID:8B76cLQg

Conroe糞過ぎてバロスｗｗｗ

941 ：926：2006/09/04(月) 19:28:37 ID:HqmWZvTb

>>939
と言うことは、
935のアドバイスはGPU(VPU)がデコードやエフェクト処理するから、
その分快適になるということなのかな？

エフェクトはあんまり使用しないけど、ハイビジョン映像だとデコードだけでも
CPUにかなり負担がかかるということなのかな？

942 ：Socket774：2006/09/04(月) 22:24:54 ID:ZfXccc3n

使い勝手は知らないが、ATIのAvivoがGPUでエンコードを高速化してたが。

ビデオカードの動画再生支援機能が無いと、ハイビジョンどころか通常の動画再生もままならない。

943 ：Socket774：2006/09/05(火) 01:07:19 ID:g9SwwKeR

>>942
ATIのアレはX1000シリーズ搭載マシンでしか使えないようにしてあるけど
今は単に手抜きCPUエンコで爆速に見せかけてるだけじゃなかったっけ？
スレ違いになりつつあるが。

944 ：孟宗：2006/09/05(火) 06:16:39 ID:pY3uQKJD

ついでに乗って
MPEG -> Windows Media Videoの変換で
約30分のソースを変換するのにかかる時間は

Turion64 MT-34(1.8GHz L2 1M) + Radeon X1300LE
で16分

Athlon64 X2 4400+ (2.2GHz L2 1Mx2) + Radeon X1600XT x2(この場合の効果は不明）
で2分

catalyst 6.8での結果。
参考までに・・・

945 ：Socket774：2006/09/05(火) 06:20:52 ID:lRkqAXKb

CPUとVGA両方変えたデータ出されてもなんの参考にもならん

946 ：孟宗：2006/09/05(火) 06:59:53 ID:7cW9NXCD

Turion64 MT-34(1.8GHz L2 1M) + Radeon X1300LE
は10分だな、16分はmp3再生しながらの結果。

仮にCPUだけで変換しているのなら
Turion MT-34とAthlon X2 4400+の違いを加味しても
約5倍もの差は出ないと思いますが。

X1600とX1300のpixel shader数は12と4で約3倍の差
GPUでも何らかの処理が行われていると読み取れるのでは？

947 ：Socket774：2006/09/05(火) 11:48:36 ID:d1Eo2aXb

　　＿＿＿__
　　|　　|　コ |
　　|　　|. .ン.|
　　|　　|. 炉 |
　　|　　|.(笑)|
　|￣|￣￣||ii~ |
　|　 |　凸（￣）凸
　　　　　　　,,, ,,,
（´・ω・）つ┃┃~~~
ｶﾜｲｿｽ

948 ：Socket774：2006/09/05(火) 16:18:43 ID:yyHdbfk2

>>946
HDDのオーバーヘッドとか？
怪しいからビデオカード変えてみてよ。

949 ：Socket774：2006/09/05(火) 16:59:05 ID:Lh1oXR7P

エンコードを手抜きする（処理を端折る）だけでそれだけ高速化するなら、
それはそれで結構なソフトウェア技術な気がする。

950 ：Socket774：2006/09/05(火) 19:59:30 ID:4rQu95zH

>>950
だが画質はかなり悪いぞ。
iPodやPSPに放り込んで見たら消す、ぐらいしか使えん気が。

951 ：Socket774：2006/09/05(火) 20:03:53 ID:Gnb8Ufgh

>>950よ、950の言う通りだぞ

952 ：孟宗：2006/09/05(火) 21:06:33 ID:7cW9NXCD

>>948
すんません。
お互い入れ替えてみましたが、時間かわらず・・・
パフォーマンス差はやはりCPUの違いによるものっぽいです。
もっと言えばネットワークカードの性能もあるかも。

953 ：孟宗：2006/09/05(火) 21:46:40 ID:7cW9NXCD

ただ、GPUが全く使われていないのか？って事はよく判らない・・・
なぜなら、Brookで書かれた姫野ベンチの結果が
X1600,X1300で、ほぼ同じで約30000MFLOPS
（厳密にはGeForce6100に挿し奴のほうが
CrossFire Xpress 3200に指した奴より若干速い。）

即ちBrookで書かれたプログラムはR5x0,RV5xx世代でいう
1スレッド分（pixel shader 4本）しか使われていないという考察になる。
（だれか、X1900で試してみてほしい・・・）

でも、AVIVOの変換はCPUだけかな・・・

954 ：Socket774：2006/09/06(水) 00:21:00 ID:RSJf8O3D

>>953
GeForce6100の内蔵グラフィックで試してみたら？

955 ：Socket774：2006/09/06(水) 00:40:51 ID:RSJf8O3D

>>953
すまん、今ではATI以外では使うのは面倒みたいだ。

ttp://www.katch.ne.jp/~kakonacl/douga/avivo/avivo.html

> GPUに対応しているのはRADEON X1000シリーズだが、GeForce 6000シリーズでも
> GPUには依存せずにCPUのみでも動作するし、しかも驚異的に早い速度でエンコード
> するとのことだ。

> 2006年04月12日にATI Avivo Video Converter v6.4となって、ATI Catalyst(x32)ドライバに
> 追加インストールして利用する仕様になったので、RADEON X1000シリーズ専用版となってしま
> った。

> しかし、ATI DirectShow関連のフィルターは以下の如くインストールされるので、GraphEditを用
> いて利用することが可能だ

956 ：Socket774：2006/09/06(水) 12:11:07 ID:WyfQo1vR

957 ：Socket774：2006/09/06(水) 12:37:31 ID:jmB1sqCi

AVIVO使ってみた
何気にこれ、AviSynth使えるんだな・・・

958 ：Socket774：2006/09/06(水) 13:11:08 ID:DqhueRsA

Celeron 2 Duo

959 ：Socket774：2006/09/06(水) 17:49:35 ID:DORareAq

今回のたるたるはまともな記事だにゃん

960 ：Socket774：2006/09/06(水) 20:42:45 ID:UY7VbAqS

でも、大原氏の雑記での全方位ベンチマークについての追加コメントは読んでないようだな
読んでたら、今回のネタは書けないはず

961 ：Socket774：2006/09/06(水) 20:55:33 ID:DORareAq

ttp://www.yusuke-ohara.com/weblog2/archive/2006/09/post_46.html#more
>という訳で、本エントリの結論として「おっしゃる通り、原因は確定できません」ということで、お返事に代えさせていただきます。

962 ：Socket774：2006/09/06(水) 21:00:33 ID:mOuSf5t8

大原がバカなところはここ
> K7/K8はIPC=6を狙えるアーキテクチャっつーことになっちまいます。
> K7/K8は一応デコード段がx86命令換算で３命令/Cycleのデコード性能なので、
> 普通に考えるとこんな形でμOpが投入される可能性は低いのですが、
> 今スケジューラに３つのLoad命令がデータ待ちしていて、そこに後から３つのALU命令(例えばNOP)がデコーダからやってきて、
> これが一斉に実行ユニットに投入されるとピーク時にはIPC=6という事になります。

3つのLoad命令がデータ待ち？
これK7/K8の欠陥部分だろう？
同時に3つのLoad命令が実行されるとでも思っているのか？、キャッシュが泣いてるぞ。
バカ正直な回路ではなく、いい加減な回路でムダで洗練されていないスケジューラと評価すべき箇所だよ。

963 ：・∀・）っ-○◎●新世紀ダンゴリオン ◆DanGorION6 ：2006/09/06(水) 23:32:00 ID:pBJiYb0t

リタイヤメントが3命令/clkだから瞬間最大なんて全然意味ない罠。
もし6μOPs分実行できてもリタイヤ待ちでストールするだけ。
整数とFP/SIMDパイプが分かれてる分潜在的には高い並列実行性能は得られるのだから
せっかく32byte/clkのフェッチ帯域にするなら、そのへんは改良の余地はあるのだけど。

964 ：Socket774：2006/09/07(木) 22:29:35 ID:NF5ifRL+

デュアルコアItanium2をハイエンドからエントリーまで投入
日本HP、デュアルコアItanium2搭載サーバー新製品7機種を発表
http://biz.ascii24.com/biz/news/article/2006/09/07/664395-000.html

965 ：Socket774：2006/09/07(木) 22:44:38 ID:DPICwzbw

FB-DIMMのほうがより高い耐障害性を付加できるんだけどね
発熱がもたらす不安要素の方が大きいという判断だろうか

966 ：Socket774：2006/09/08(金) 01:37:41 ID:IYK0ei8p

> 同時に3つのLoad命令が実行されるとでも思っているのか？、キャッシュが
> 泣いてるぞ。

キャッシュの効かないHPC系のアプリとかなら、まあ、ありうるでしょ。
アプリに依存した話。

967 ：・∀・）っ-○◎●新世紀ダンゴリオン ◆DanGorION6 ：2006/09/08(金) 01:51:46 ID:AM8zcn98

Athlon 64はL/Sユニットが２つ(Load/Store両方向×１、Load片方向×1）しかない
同時に3命令はどう考えても無理だよ。

968 ：Socket774：2006/09/09(土) 22:51:37 ID:yMM2sqO9

海洋研究開発機構が国内最大級のItanium 2システムを稼働
http://www.itmedia.co.jp/enterprise/articles/0609/05/news023.html

Itaniumイイヨイイヨー（・∀・）

969 ：Socket774：2006/09/10(日) 10:17:45 ID:2DHOa7YJ

確かにDirect PathとVecter Pathの2系統は強化して欲しいな

970 ：Socket774：2006/09/10(日) 10:40:15 ID:Yh1zTABk

>>966
AMDのは欺しなんだよ、実行ユニットがあるように見せ掛けた欺しなw
ちらっと見るとLoadが同時に3つ行えるように見えるし、それでないとおかしい回路構成になってるが、
ダンゴが言ってるように真の実行ユニットは3つ存在しない。
つまりスケジューラがヘボくていい加減な訳で、同時に実行不可能なのに同時に3命令とも実行パイプラインへ投入してしまう。
これストールの原因だし・・・

971 ：Socket774：2006/09/10(日) 17:10:42 ID:E2vUs5Xp

┌──────┬───┬──────────────┬──────────────┬──────────────┐
│　　　　　　　　 .│ Clock │　　　　　　機能限定版　　　　　　 .│　　　　　　シングルコア　　　　　　│　疑似マルチコア(ニコイチコア)　 │
├──────┼───┼──────────────┼──────────────┼──────────────┤
│Pen4　 (90nm)│↑up　 │　　　　　　　　　－　　　　　　　　　 │1コア Northwood (512KB)　　　　 .│　　　　　　　　　－　　　　　　　　　 │
├──────┼───┼──────────────┼──────────────┼──────────────┤
│Pen4/D(90nm)│↑up　.│1コア Prescott-V　　　　　　　　　 .│1コア Prescott (1MB)　　　　　　　.│2コア Smithfield (2MB)　　　　　　 │
│　　　　　　　　 .│　　　　 │　　　　　　　　　　　　　　　　　　　　.│　　　　Prescott 2M (2MB)　　　　 │　　　　　　　　　　　　　　　　　　　　 │
├──────┼───┼──────────────┼──────────────┼──────────────┤
│Pen4/D(65nm)│　－　.│1コア Cedar Mill-V　　　　　　　　　│1コア Ceder Mill (2MB)　　　　　　 │2コア Presler (4MB)　　　　　　　　 │
└──────┴───┴──────────────┴──────────────┴──────────────┘

972 ：Socket774：2006/09/10(日) 17:11:27 ID:E2vUs5Xp

┌──────┬───┬──────────────┬──────────────┬──────────────┐
│　　　　　　　　 .│ Clock │　　　　　　機能限定版　　　　　　 .│　　　　　真のマルチコア　　　　　 │　疑似マルチコア(ニコイチコア)　 │
├──────┼───┼──────────────┼──────────────┼──────────────┤
│core　 .(65nm)│　－　 │1コア Solo Yonah-SC (1MB)　　　.│2コア Duo Yonah-DC (2MB)　　　 │　　　　　　　　　－　　　　　　　　　 │
├──────┼───┼──────────────┼──────────────┼──────────────┤
│core 2 (65nm)│↓down│1コア Stealey (512KB)　　　　　　 .│2コア Duo Conroe (2MB、4MB)　 │4コア Quad Kentsfield (4MB)　　　│
│　　　　　　　　 .│　　　　 │1コア Millville (1MB FSB1066)　　 │2コア Duo Merom (4MB)　　　　　 │　　　　　　　　　　　　　　　　　　　　 │
│　　　　　　　　 .│　　　　 │2コア Allendale (2MB FSB800)　　│　　　　　　　　　　　　　　　　　　　　.│　　　　　　　　　　　　　　　　　　　　 │
├──────┼───┼──────────────┼──────────────┼──────────────┤
│core 2 (45nm)│↑up　 │1コア Perryville (2MB)　　　　　　　│2コア Duo Ridgefield (6MB)　　　　.│　　　　　　　　　　　　　　　　　　　　 │
│　　　　　　　　 .│　　　　 │2コア Wolfdale (3MB)　　　　　　　 │2コア Duo Wolffield (3MB)　　　　　│　　　　　　　　　　　　　　　　　　　　.│
│　　　　　　　　 .│　　　　 │　　　　　　　　　　　　　　　　　　　　.│2コア Duo Penryn (3MB、6MB)　 .│　　　　　　　　　　　　　　　　　　　　 │
├──────┼───┼──────────────┼──────────────┼──────────────┤

973 ：Socket774：2006/09/10(日) 17:12:05 ID:E2vUs5Xp

│core 3 (45nm)│↓down│2コア Silverthorme (4MB、8MB)　│4コア Quad Nehalem　　　　　　　　│8コア Oct Yorkfield (12MB)　　　　│
│　　　　　　　　 .│　　　　 │　　　　　　　　　　　　　　　　　　　　.│4コア Quad Bloomfield (6MB)　　 .│　　　　　　　　　　　　　　　　　　　　 │
│　　　　　　　　 .│　　　　 │　　　　　　　　　　　　　　　　　　　　.│4コア Quad Gilo　　　　　　　　　　 .│　　　　　　　　　　　　　　　　　　　　 │
├──────┼───┼──────────────┼──────────────┼──────────────┤
│core 3 (32nm)│↑up　 │　　　　　　　　　？　　　　　　　　　 .│4コア Quad Nehalem-C　　　　　　│8コア Oct 　　　　　　　　　　　　　　│
├──────┼───┼──────────────┼──────────────┼──────────────┤
│core 4 (32nm)│↓down│　　　　　　　　　？　　　　　　　　　 │8コア Oct Gesher　　　　　　　　　 .│16コア１６　　　　　　　　　　　　　　│
├──────┼───┼──────────────┼──────────────┼──────────────┤
│core 4 (22nm)│↑up　 │　　　　　　　　　？　　　　　　　　　 .│8コア Oct　　　　　　　　　　　　　　 │16コア１６　　　　　　　　　　　　　　│
├──────┼───┼──────────────┼──────────────┼──────────────┤
│core 5 (22nm)│↓down│　　　　　　　　　？　　　　　　　　　 │16コア１６　　　　　　　　　　　　　　│32コア３２　　　　　　　　　　　　　　│
├──────┼───┼──────────────┼──────────────┼──────────────┤
│core 5 (16nm)│↑up　 │　　　　　　　　　？　　　　　　　　　 .│16コア１６　　　　　　　　　　　　　　│32コア３２　　　　　　　　　　　　　　│
├──────┼───┼──────────────┼──────────────┼──────────────┤

974 ：Socket774：2006/09/11(月) 19:53:47 ID:2YDhPVhx

Intel's Core 2 Quadro Kentsfield: Four Cores on a Rampage
ttp://www.tomshardware.com/2006/09/10/four_cores_on_the_rampage/

975 ：Socket774：2006/09/11(月) 21:17:14 ID:l/Jl+5jo

もうクロックを上げないのですか？
早く3.8Ghzの壁を破って欲しいのだが。

976 ：Socket774：2006/09/11(月) 23:01:31 ID:JZkB9Nsg

そこでPentium終了記念のPentium4 4GHz Premium Edtionの登場ですよ！

977 ：Socket774：2006/09/11(月) 23:42:16 ID:zwWjjsiR

PenM～Core派だがシダミルはちょっと確保しておきたい気分

978 ：Socket774：2006/09/12(火) 20:25:28 ID:IgrI482c

早くCore 2最適化してよ
これ見てたら先走りが
ttp://jp.xlsoft.com/documents/intel/compiler/Intel_Compiler_v91_performance_indicators.PUBLIC.6-06.pdf

979 ：・∀・）っ-○◎●新世紀ダンゴリオン ◆DanGorION6 ：2006/09/14(木) 00:04:28 ID:2Et8/cQK

/QxTでSSE4使えるじゃん

980 ：Socket774：2006/09/14(木) 00:21:02 ID:GVlKEzPT

あのさぁ、Intelに関する質問スレってないの？
いきなりだけど…

981 ：Socket774：2006/09/14(木) 00:24:39 ID:StqZCPsZ

>>980
【ﾏﾀｰﾘ】Intel雑談スレ1coreめ【待ち】
http://pc7.2ch.net/test/read.cgi/jisaku/1143695185/

982 ：Socket774：2006/09/14(木) 00:31:25 ID:QjwkqJ45

>>978
Itaniumの向上率がすごすぎて思わず笑った。

gccがはき出すItaniumバイナリは出来がよくないとは聞いてたけど。

983 ：Socket774：2006/09/14(木) 00:31:37 ID:GVlKEzPT

>>981
さんくす！

984 ：Socket774：2006/09/14(木) 00:59:10 ID:StqZCPsZ

>>982
実際カーネルサービスががんがん動くサーバではLinux + Itaniumは論外だよ
今更こんな話が出るぐらいだもんWindowsのほうが何ぼかマシなんじゃないか
普通はHP-UX選ぶだろうけどね
http://www.hpcwire.com/hpc/836590.html

985 ：Socket774：2006/09/14(木) 04:26:50 ID:Gg+OMkl2

いや、普通 Woodcrest か、さもなきゃ Opteron。

価格性能比で Itanium より圧倒的に優れてるし、
gcc でもそこそこ性能が出るから Linux でも大丈夫。
もちろん icc の方が性能が出るが、NetBurst や Itanium の場合ほどの差はない。

986 ：Socket774：2006/09/14(木) 08:32:53 ID:iriuhR85

987 ：Socket774：2006/09/14(木) 17:18:10 ID:k13nYiTS

ItaniumサーバーならHP-UX(Windows?)
XeonかOpteron使え
この二つには日本海溝より深い隔たりがあると思うｗ

988 ：Socket774：2006/09/15(金) 11:17:15 ID:UO5R64eB