Xeon 2機種ベンチマーク (2005/2/15)
新製品のXeon-IrwindaleをXeon-Noconaと同じ実行環境にて比較しました。キャッシュメモリが1MBから2MBに増強された結果、全ての規模の計算において高速処理が実現しています。
比較したCPU:
- Dual Xeon(Nocona)-3.4GHz(1MBキャッシュメモリ)+4GB(DDR2-400) < Tsumuji3R1 >
- Dual Xeon(Irwindale)-3.4GHz(2MBキャッシュメモリ)+4GB(DDR2-400) < Tsumuji3R1 >
未知数2000、4000、6000、8000、10000の連立一次方程式を、Lapackをコンパイルして得られた実行コード及び高速ライブラリを用いて得られた実行コードにて計算し、計算結果をMFLOPSの単位にてまとめてあります。いずれもSMPシステムで、メモリバスの競合による性能低下の度合いを把握できる様に、1個または2個あるいは4個のジョブを実行し(即ち各CPUの上で1ジョブが実行されている)ています。
◆ メモリアクセスの多発するプログラム(Lapackを64bitコードでコンパイルして実行)
CPU | Xeon(Nocona)-3.4GHz | Xeon(Irwindale)-3.4GHz | |||
---|---|---|---|---|---|
CPU数 | 2 | 2 | |||
コンパイラ | Intel Fortran 8.1 | Intel Fortran 8.1 | |||
ジョブ数 | 1 | 2 | 1 | 2 | |
未知数 | 2000 | 1202.0 | 982.2 | 1792.3 | 1758.1 |
4000 | 814.8 | 518.5 | 1276.4 | 1079.5 | |
6000 | 762.0 | 508.9 | 1104.0 | 689.5 | |
8000 | 758.9 | 509.5 | 1040.6 | 540.3 | |
10000 | 750.8 | 506.0 | 1023.5 | 520.5 |
CPU | Xeon(Nocona)-3.4GHz | Xeon(Irwindale)-3.4GHz | |||
---|---|---|---|---|---|
CPU数 | 2 | 2 | |||
コンパイラ | g77 3.3.3-7 | g77 3.3.3-7 | |||
ジョブ数 | 1 | 2 | 1 | 2 | |
未知数 | 2000 | 671.2 | 633.7 | 685.1 | 689.1 |
4000 | 607.4 | 497.1 | 653.8 | 630.1 | |
6000 | 600.9 | 473.7 | 635.3 | 557.1 | |
8000 | 492.7 | 450.3 | 608.9 | 511.2 | |
10000 | 428.0 | 328.8 | 623.8 | 513.2 |
◆ キャッシュによくヒットしピーク性能を出すプログラム(MKLを用いて実行)
CPU | Xeon(Nocona)-3.4GHz | Xeon(Irwindale)-3.4GHz | |||
---|---|---|---|---|---|
CPU数 | 2 | 2 | |||
ライブラリ | MKL 7.2 | MKL 7.2 | |||
ジョブ数 | 1 | 2 | 1 | 2 | |
未知数 | 2000 | 4836.4 | 4618.8 | 5158.8 | 4966.8 |
4000 | 5492.9 | 5264.6 | 5637.2 | 5512.7 | |
6000 | 5690.5 | 5389.8 | 5803.9 | 5678.8 | |
8000 | 5809.0 | 5529.8 | 5919.0 | 5824.4 | |
10000 | 5830.7 | 5588.0 | 5953.4 | 5840.4 |
(単位:MFLOPS)