パフォーマンスレポート primergy bx620 s6...ホワイトペーパー...
TRANSCRIPT
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6
© Fujitsu Technology Solutions 2010-2011 1/34 ページ
ホワイトペーパー
FUJITSU PRIMERGY サーバ
パフォーマンスレポート PRIMERGY BX620 S6
本書では、PRIMERGY BX620 S6 で実行したベンチマークの概要について説明します。
PRIMERGY BX620 S6 のパフォーマンスデータを、他の PRIMERGY モデルと比較して
説明しています。ベンチマーク結果に加え、ベンチマークごとの説明およびベンチマーク
環境の説明も掲載しています。
バージョン
2.0a
2011-12-21
目次
ドキュメントの履歴 ............................... 2
製品データ.............................................. 3
SPECcpu2006 ........................................ 4
SPECjbb2005 ....................................... 13
OLTP-2 ................................................. 16
vServCon .............................................. 23
STREAM ............................................... 31
関連資料 ............................................... 33
お問い合わせ先 .................................... 34
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
2/34 ページ © Fujitsu Technology Solutions 2010-2011
ドキュメントの履歴
バージョン 1.0a
以下のベンチマークを含むレポートの初版
SPECcpu2006
Xeon E5503、E5506、E5507、L5609、L5630、E5620、E5630、E5640、X5667、L5640、X5650、
X5660、X5670 で測定
SPECjbb2005
Xeon X5670 で測定
vServCon
Xeon E5507、L5609、L5630、E5620、E5630、E5640、X5667、L5640、X5650、X5660、X5670
で測定
バージョン 1.1
以下のベンチマークを追加
OLTP-2
Xeon E5503、E5506、E5507、E5620、E5630、E5640、L5609、L5630、L5640、X5650、X5660、
X5667、X5670 で測定
バージョン 2.0
以下のベンチマークを追加
STREAM
Xeon E5603、E5606、E5607、E5645、E5649、X5672、X5675 で測定
以下のベンチマークを更新
SPECcpu2006
Xeon E5603、E5606、E5607、E5645、E5649、X5672、X5675 で測定
(インテル C++/Fortran コンパイラー 12.0)
SPECjbb2005
Xeon X5675 で測定
OLTP-2
Xeon 55xx および 56xx プロセッサシリーズで測定
vServCon
Xeon 55xx および 56xx プロセッサシリーズで測定
バージョン 2.0a
軽微な訂正
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
© Fujitsu Technology Solutions 2010-2011 3/34 ページ
製品データ
PRIMERGY BX600 S3 ブレードサーバは、スケーラビリティの高い 19 インチラックシステム(7 U)で、
最大 10 枚のコンパクトデュアルサーバブレードを搭載できます。そのため、企業のデータセンター、イン
ターネットサービスプロバイダーやアプリケーションサービスプロバイダーの要件を十分に満たすことがで
きます。
PRIMERGY BX600 S3 では、ホットプラグ対応のサーバブレードに加えて、冗長構成の 2 台のファンユ
ニット(それぞれ 2 台のファンを搭載)、冗長構成の最大 4 台の電源供給モジュール(それぞれ 3 台の追
加のファンを搭載)、1 つの KVM スイッチ、冗長構成の 2 枚のマネジメントブレードを搭載できます。さ
らに、オプションで、Gbit イーサネットパススルーブレード、Gbit イーサネットスイッチブレード、また
は Gbit イーサネットインテリジェントブレードを最大 4 枚搭載できます。また、最大 2 台のファイバー
チャネルパススルーブレード、ファイバーチャネルスイッチブレード、またはファイバーチャネルアクセス
ゲートウェイも搭載できます。
PRIMERGY BX620 S6 デュアルサーバブレードには、Intel 5500 チップセットが装備されており、Intel
Xeon 5500 または 5600 シリーズのプロセッサ( 2 コア、4 コア、6 コア)を最大 2 基搭載できます。また、
最大 192 GB の DDR3-SDRAM が搭載可能な 12 本の DIMM スロット、2 チャネル 1 Gbit イーサネットコン
トローラー 3 基、内蔵ハードディスク用プラグインストレージモジュール、2.5 インチの SSD、SATA、ま
たは SAS ハードディスク用のモジュール 2 台、PCI-Express x8 スロットが 1 本装備されています。
詳細な製品データについては、PRIMERGY BX600 S3 データシートおよび PRIMERGY BX620 S6 データ
シートを参照してください。
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
4/34 ページ © Fujitsu Technology Solutions 2010-2011
SPECcpu2006
ベンチマークの説明
SPECcpu2006 は、整数演算および浮動小数点演算でシステム性能を測定するベンチマークです。このベン
チマークは、12 本のアプリケーションから成る整数演算テストセット(SPECint2006)、および 17 本のア
プリケーションから成る浮動小数点演算テストセット(SPECfp2006)で構成されています。これらのアプ
リケーションは大量の演算を実行し、CPU およびメモリを集中的に使用します。他のコンポーネント
(ディスク I/O、ネットワークなど)は、このベンチマークでは測定しません。
SPECcpu2006 は、特定のオペレーティングシステムに依存しません。このベンチマークは、ソースコード
として利用可能で、実際に測定する前にコンパイルする必要があります。したがって、使用するコンパイ
ラーのバージョンやその最適化設定が、測定結果に影響を与えます。
SPECcpu2006 には、2 つのパフォーマンス測定方法が含まれています。1 つ目の方法(SPECint2006 およ
び SPECfp2006)では、1 つのタスクの処理に必要な時間を測定します。2 つ目の方法(SPECint_rate2006
および SPECfp_rate2006)では、スループット(並列処理できるタスク数)を測定します。いずれの方法
も、さらに 2 つの測定の種類、「ベース」と「ピーク」に分かれています。これらは、コンパイラー最適化
を使用するかどうかという点で異なります。「ベース」値は常に公開されていますが、「ピーク」値はオプ
ションです。
ベンチマーク 演算 タイプ コンパイラー最適化 測定結果 アプリケーション
SPECint2006 整数 ピーク アグレッシブ 速度 単体実行
SPECint_base2006 整数 ベース 標準
SPECint_rate2006 整数 ピーク アグレッシブ スループット 多重実行
SPECint_rate_base2006 整数 ベース 標準
SPECfp2006 浮動小数点 ピーク アグレッシブ 速度 単体実行
SPECfp_base2006 浮動小数点 ベース 標準
SPECfp_rate2006 浮動小数点 ピーク アグレッシブ スループット 多重実行
SPECfp_rate_base2006 浮動小数点 ベース 標準
測定結果は、個々のベンチマークで得られた正規化比の幾何平均です。算術平均と比較して、幾何平均の方
が、ひとつの飛び抜けて高い値に左右されない平均値です。「正規化」とは、テストシステムがリファレン
スシステムと比較してどの程度高速であるかを測定することです。例えば、リファレンスシステムの
SPECint_base2006、SPECint_rate_base2006、SPECfp_base2006、および SPECfp_rate_base2006 の結
果が、値「1」と判定されたとします。このとき、SPECint_base2006 の値が「2」の場合は、測定システム
がこのベンチマークをリファレンスシステムの 2 倍の速さで実行したことを意味します。
SPECfp_rate_base2006 の値が「4」の場合は、測定対象システムがリファレンスシステムの約 4/[ベー
スコピー数]倍の速さでこのベンチマークを実行したことを意味します。「ベースコピー数」とは、実行さ
れたベンチマークの並行インスタンスの数です。
弊社では、SPEC の公開用に、SPECcpu2006 のすべての測定値を提出しているわけではありません。その
ため、SPEC の Web サイトに公開されていない結果が一部あります。弊社では、すべての測定のログファ
イルをアーカイブしているので、測定の内容に関していつでも証明できます。
ベンチマーク結果
測定 1
2010 年 4 月から 9 月にかけて、Xeon 5500 および 5600 シリーズのプロセッサを使用して、PRIMERGY
BX620 S6 を測定しました。結果は次の 4 つの表に示すとおりです。ベンチマークプログラムは、インテル
C++/Fortran コンパイラー 11.1 でコンパイルし、SUSE Linux Enterprise Server 11(64 ビット)で実行し
ました。すべての結果は、http://www.spec.org で公開されています。
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
© Fujitsu Technology Solutions 2010-2011 5/34 ページ
プロセッサ コア GHz L3 キャッ
シュ
QPI
スピード TDP
SPECint_base2006
2 チップ
SPECint2006
2 チップ
Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 20.4 22.1
Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 21.9 23.8
Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 22.9 24.3
Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 21.4 22.7
Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 26.2 28.1
Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 29.6 31.9
Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 26.2 28.1
Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 32.0 34.5
Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 37.9 40.9
Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 30.5 33.2
Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 34.3 36.9
Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 35.4 38.3
Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 36.6 39.5
プロセッサ コア GHz L3 キャッ
シュ
QPI
スピード TDP
SPECint_rate_base2006 SPECint_rate2006
1 チップ 2 チップ 1 チップ 2 チップ
Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 36.9 72.8 40.0 78.9
Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 70.07 138 75.8 148
Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 73.7 144 78.8 153
Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 69.9 136 75.7 147
Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 94.4 181 101 193
Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 107 210 114 223
Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 111 218 118 232
Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 115 225 122 239
Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 137 269 145 285
Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 141 270 151 290
Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 165 321 175 344
Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 170 329 181 354
Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 173 337 185 361
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
6/34 ページ © Fujitsu Technology Solutions 2010-2011
プロセッサ コア GHz L3 キャッ
シュ
QPI
スピード TDP
SPECfp_base2006
2 チップ
SPECfp2006
2 チップ
Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 23.9 25.6
Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 26.2 28.2
Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 27.2 29.0
Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 25.8 27.4
Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 30.8 33.1
Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 34.4 36.9
Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 35.6 38.2
Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 36.7 39.4
Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 43.4 46.6
Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 36.1 39.2
Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 40.1 43.0
Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 40.9 43.8
Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 42.3 45.4
プロセッサ コア GHz L3 キャッ
シュ
QPI
スピード TDP
SPECfp_rate_base2006 SPECfp_rate2006
1 チップ 2 チップ 1 チップ 2 チップ
Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 37.3 72.3 38.6 74.9
Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 60.3 116 62.1 120
Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 62.0 119 63.9 123
Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 63.0 116 65.2 120
Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 74.5 136 77.6 141
Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 84.7 164 87.7 170
Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 86.8 168 90.0 174
Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 88.7 172 92.1 178
Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 106 205 110 213
Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 104 193 108 201
Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 119 232 123 240
Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 121 236 125 244
Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 123 239 127 248
測定 2
2010 年 12 月から 2011 年 3 月にかけて、Xeon 5600 シリーズのプロセッサを使用して、PRIMERGY
BX620 S6 を測定しました。結果は次の 4 つの表に示すとおりです。ベンチマークプログラムは、インテル
C++/Fortran コンパイラー 12.0 でコンパイルし、SUSE Linux Enterprise Server 11 SP1(64 ビット)で実
行しました。次の表の太字の値は、http://www.spec.org で公開されています。「予測」という印付きの値は、
予測値です。
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
© Fujitsu Technology Solutions 2010-2011 7/34 ページ
プロセッサ コア GHz L3
キャッシュ
QPI
スピード TDP
SPECint_base2006
2 チップ
SPECint2006
2 チップ
Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 22.3(予測) 23.4(予測)
Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 19.1 20.0
Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 23.9(予測) 25.2(予測)
Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 25.0(予測) 25.7(予測)
Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 25.6 26.8
Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 27.0 28.2
Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 23.3(予測) 24.0(予測)
Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 28.7(予測) 30.1(予測)
Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 32.4(予測) 34.2(予測)
Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 28.7(予測) 30.1(予測)
Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 35.0(予測) 37.0(予測)
Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 41.6(予測) 43.9(予測)
Xeon X5672 4 3.20 12 MB 6.40 GT/s 95 W 42.5 44.9
Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 33.4(予測) 35.6(予測)
Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 32.9 35.7
Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 35.1 37.2
Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 37.5(予測) 39.6(予測)
Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 38.7(予測) 41.1(予測)
Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 40.0(予測) 42.4(予測)
Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 41.6 43.9
プロセッサ コア GHz L3
キャッシュ
QPI
スピード TDP
SPECint_rate_base2006 SPECint_rate2006
1 チップ 2 チップ 1 チップ 2 チップ
Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 39.0(予測) 76.5(予測) 41.7(予測) 82.6(予測)
Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 60.9 118 64.8 126
Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 74.1(予測) 145(予測) 79.1(予測) 155(予測)
Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 78.0(予測) 151(予測) 82.2(予測) 160(予測)
Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 79.6 154 84.4 163
Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 83.5 161 88.4 171
Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 73.9(予測) 143(予測) 79.0(予測) 154(予測)
Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 100(予測) 192(予測) 106(予測) 203(予測)
Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 114(予測) 223(予測) 120(予測) 234(予測)
Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 118(予測) 232(予測) 124(予測) 244(予測)
Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 122(予測) 239(予測) 128(予測) 251(予測)
Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 147(予測) 290(予測) 155(予測) 306(予測)
Xeon X5672 4 3.20 12 MB 6.40 GT/s 95 W 148 291 156 306
Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 150(予測) 287(予測) 158(予測) 305(予測)
Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 153 293 163 314
Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 158 303 169 324
Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 177(予測) 346(予測) 187(予測) 369(予測)
Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 183(予測) 354(予測) 194(予測) 380(予測)
Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 186(予測) 363(予測) 198(予測) 387(予測)
Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 191 371 204 396
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
8/34 ページ © Fujitsu Technology Solutions 2010-2011
プロセッサ コア GHz L3
キャッシュ
QPI
スピード TDP
SPECfp_base2006
2 チップ
SPECfp2006
2 チップ
Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 32.4(予測) 33.7(予測)
Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 29.3 31.3
Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 35.6(予測) 37.1(予測)
Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 36.9(予測) 38.1(予測)
Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 36.5 39.0
Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 38.0 40.7
Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 35.0(予測) 36.0(予測)
Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 41.0(予測) 43.5(予測)
Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 45.7(予測) 48.5(予測)
Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 47.3(予測) 50.2(予測)
Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 48.8(予測) 51.8(予測)
Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 58.6(予測) 62.4(予測)
Xeon X5672 4 3.20 12 MB 6.40 GT/s 95 W 58.6 63.0
Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 48.0(予測) 51.5(予測)
Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 48.1 51.6
Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 49.4 52.4
Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 54.2(予測) 57.6(予測)
Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 55.2(予測) 58.6(予測)
Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 57.1(予測) 60.8(予測)
Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 58.1 61.2
プロセッサ コア GHz L3
キャッシュ
QPI
スピード TDP
SPECfp_rate_base2006 SPECfp_rate2006
1 チップ 2 チップ 1 チップ 2 チップ
Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 39.9(予測) 75.4(予測) 41.3(予測) 79.9(予測)
Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 58.6 107 60.5 113
Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 64.5(予測) 121(予測) 66.5(予測) 128(予測)
Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 66.3(予測) 124(予測) 68.4(予測) 131(予測)
Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 70.7 128 73.3 134
Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 72.9 131 75.5 138
Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 67.4(予測) 121(予測) 69.8(予測) 128(予測)
Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 80.0(予測) 146(予測) 82.5(予測) 151(予測)
Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 90.9(予測) 177(予測) 93.2(予測) 182(予測)
Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 93.2(予測) 181(予測) 95.7(予測) 186(予測)
Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 95.2(予測) 185(予測) 97.9(予測) 190(予測)
Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 113(予測) 215(予測) 116(予測) 223(予測)
Xeon X5672 4 3.20 12 MB 6.40 GT/s 95 W 115 222 118 228
Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 112(予測) 208(予測) 115(予測) 215(予測)
Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 113 211 117 216
Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 116 215 120 220
Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 127(予測) 244(予測) 130(予測) 252(予測)
Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 129(予測) 248(予測) 132(予測) 256(予測)
Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 131(予測) 251(予測) 134(予測) 260(予測)
Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 134 258 137 265
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
© Fujitsu Technology Solutions 2010-2011 9/34 ページ
整数演算テストセットおよび浮動小数点演算テストセットの両方で、2 プロセッサのスループットは 1 プロ
セッサの約 2 倍です。
SPECint_rate_base2006
SPECint_rate2006
0
50
100
150
200
250
300
350
400
1 x Xeon X5675 2 x Xeon X5675
191
371
204
396
SPECfp_rate_base2006
SPECfp_rate2006
0
50
100
150
200
250
300
1 x Xeon X5675 2 x Xeon X5675
134
258
137
265
SPECcpu2006:整数演算性能
PRIMERGY BX620 S6(2 ソケットと 1 ソケットの比較)
SPECcpu2006:浮動小数点演算性能
PRIMERGY BX620 S6(2 ソケットと 1 ソケットの比較)
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
10/34 ページ © Fujitsu Technology Solutions 2010-2011
次の 4 つのグラフは、PRIMERGY BX620 S6 とその旧モデルである PRIMERGY BX620 S5 のスループット
を比較したものです。それぞれ最大のパフォーマンス構成になっています。
SPECint_base2006
SPECint2006
0
5
10
15
20
25
30
35
40
45
PRIMERGY BX620 S52 x Xeon X5570
PRIMERGY BX620 S62 x Xeon X5672
31.6
42.5
35.7
44.9
SPECint_rate_base2006
SPECint_rate2006
0
50
100
150
200
250
300
350
400
PRIMERGY BX620 S52x Xeon X5570
PRIMERGY BX620 S62 x Xeon X5675
232
371249
396
SPECcpu2006:整数演算性能
PRIMERGY BX620 S6 と 旧モデルとの比較
SPECcpu2006:整数演算性能
PRIMERGY BX620 S6 と 旧モデルとの比較
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
© Fujitsu Technology Solutions 2010-2011 11/34 ページ
SPECfp_base2006
SPECfp2006
0
10
20
30
40
50
60
70
PRIMERGY BX620 S52 x Xeon X5570
PRIMERGY BX620 S62 x Xeon X5672
37.7
58.640.3
63.0
SPECfp_rate_base2006
SPECfp_rate2006
0
50
100
150
200
250
300
PRIMERGY BX620 S52 x Xeon X5570
PRIMERGY BX620 S62 x Xeon X5672
186
258194
265
SPECcpu2006:浮動小数点演算性能
PRIMERGY BX620 S6 と 旧モデルとの比較
SPECcpu2006:浮動小数点演算性能
PRIMERGY BX620 S6 と 旧モデルとの比較
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
12/34 ページ © Fujitsu Technology Solutions 2010-2011
ベンチマーク環境
測定 1
SPECcpu2006 の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY BX620 S6 で行いまし
た。
ハードウェア
モデル PRIMERGY BX620 S6
CPU Xeon E5503、E5506、E5507、L5609、L5630、E5620、E5630、E5640、X5667、
L5640、X5650、X5660、X5670
CPU 数
1 チップ
Xeon E5503: 2 コア
Xeon E5506、E5507、L5609、L5630、E5620、E5630、E5640、X5667: 4 コア
その他すべて: 6 コア
2 チップ
Xeon E5503: 4 コア
Xeon E5506、E5507、L5609、L5630、E5620、E5630、E5640、X5667: 8 コア
その他すべて: 12 コア
1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり)
2 次キャッシュ 256 KB オンチップ(コアあたり)
その他のキャッシュ Xeon E5503、E5506、E5507: 4 MB(命令 + データ)オンチップ(チップあたり)
その他すべて: 12 MB(命令 + データ)オンチップ(チップあたり)
ソフトウェア
オペレーティングシステム SUSE Linux Enterprise Server 11(64 ビット)
コンパイラー インテル C++/Fortran コンパイラー 11.1
測定 2
SPECcpu2006 の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY BX620 S6 で行いまし
た。
ハードウェア
モデル PRIMERGY BX620 S6
CPU Xeon E5603、E5606、E5607、E5645、E5649、X5672、X5675
CPU 数
1 チップ
Xeon E5603、E5606、E5607、X5672: 4 コア
Xeon E5645、E5649、X5675: 6 コア
2 チップ
Xeon E5603、E5606、E5607、X5672: 8 コア
Xeon E5645、E5649、X5675: 12 コア
1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり)
2 次キャッシュ 256 KB オンチップ(コアあたり)
その他のキャッシュ Xeon E5603、E5606、E5607: 8 MB(命令 + データ)オンチップ(チップあたり)
Xeon E5645、E5649、X5672、X5675:12 MB(命令 + データ)オンチップ(チップあたり)
ソフトウェア
オペレーティングシステム SUSE Linux Enterprise Server 11 SP1(64 ビット)
コンパイラー インテル C++/Fortran コンパイラー 12.0
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
© Fujitsu Technology Solutions 2010-2011 13/34 ページ
SPECjbb2005
ベンチマークの説明
SPECjbb2005 は、Java サーバプラットフォームのパフォーマンスを評価する Java ビジネスベンチマーク
です。これは、本質的には SPECjbb2000 をアップデートしたものです。主な違いは次のとおりです。
トランザクションは、多様な機能範囲に対応するために、より複雑になっています。
ベンチマークのワーキングセットは、システムの負荷の増大に対応するために、拡大されています。
SPECjbb2000 では、アクティブな Java 仮想マシンインスタンスは 1 つのみ許可されていましたが、
SPECjbb2005 では複数のインスタンスが許可され、特に大規模なシステムで実環境との高い近似性
を得ることができます。
SPECjbb2005 は、ソフトウェアについては主にジャストインタイムコンパイラーで使用される JVM と、ス
レッドおよびガーベージコレクションの実装のパフォーマンスを測定します。使用されるオペレーティング
システムの機能も評価します。ハードウェアについては、CPU およびキャッシュの効率、メモリサブシス
テム、共有メモリシステム(SMP)のスケーラビリティを評価します。ディスクおよびネットワーク I/O は
無関係です。
SPECjbb2005 は、最近の代表的なビジネスプロセスアプリケーションである 3 階層クライアント/サーバ
システムをエミュレートしたもので、中間層システムに重点を置いています。
クライアントは、TPC-C ベンチマークを基にしたドライバスレッドを負荷として生成し、データ
ベースへの OLTP アクセスを思考時間ゼロで行います。
中間層システムは、ビジネスプロセスおよびデータベースの更新を実装します。
データベースはデータ管理を行い、メモリ内の Java オブジェクトによりエミュレートされます。
トランザクションのログ記録は XML ベースで実装されます。
このベンチマークの主な利点は、シングルホスト上で 3 つの層すべてを実行できることです。中間層のパ
フォーマンスが測定されます。このため、大規模なハードウェアの設置は不要となり、異なるシステムの
SPECjbb2005 の結果を直接比較できます。クライアントとデータベースのエミュレーションも Java で記
述されています。
SPECjbb2005 には、オペレーティングシステムと J2SE 5.0 機能に対応した Java 仮想マシンのみが必要で
す。
スケーリングの単位は、約 25 MB の Java オブジェクトから成るウェアハウスです。1 つのウェアハウスに
つき、1 つの Java スレッドがオペレーションを実行します。これらのビジネスオペレーションは TPC-C で
次の項目を前提としています。
新規オーダーエントリー
支払
オーダーステータスの照会
納入
在庫レベル監視
顧客レポート
ただし、これらは SPECjbb2005 と TPC-C が共通して持っている機能にすぎません。2 つのベンチマーク
の結果は比較できません。
SPECjbb2005 には、次の 2 つの性能指標があります。
bops(1 秒あたりのビジネスオペレーション)は、1 秒あたりのすべてのビジネスオペレーション
の処理レートです。
bops/JVM は、上記の性能指標(bops)とアクティブな JVM インスタンス数の比率です。
SPECjbb2005 のさまざまな結果の比較では、両方の性能指標を考慮する必要があります。
これらの性能指標の測定は、次のようなベンチマークのルールに準拠しています。
ベンチマーク測定は、ウェアハウス数(スレッド数)が増加する一連の測定ポイントで構成され、それぞれ
においてウェアハウス数は 1 つずつ増加します。測定は 1 ウェアハウスで開始され、2*MaxWh(少なくと
も 8 ウェアハウス)まで実行されます。MaxWh は、ベンチマークで予想される秒あたりの処理レートが最
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
14/34 ページ © Fujitsu Technology Solutions 2010-2011
高になるウェアハウス数です。デフォルトでは、MaxWh はオペレーティングシステムで認識される CPU
の数と同じ値が設定されます。
性能指標の bops は、MaxWh ウェアハウスと 2*MaxWh ウェアハウス間のすべての測定ポイントのオペ
レーション速度の算術平均です。
ベンチマーク結果
測定 1:
2010 年 8 月、2 基の Xeon X5670 プロセッサおよび 96 GB の PC3L-10600R DDR3-SDRAM メモリの構成
で PRIMERGY BX620 S6 を測定しました。測定には、Windows Server 2008 R2 Enterprise を使用しました。
IBM から提供されている J9 VM の 6 つのインスタンスを使用しました。
測定結果は次のとおりです。
SPECjbb2005 bops = 886753
SPECjbb2005 bops/JVM = 147792
測定 2:
2011 年 1 月、2 基の Xeon X5675 プロセッサおよび 96 GB の PC3-10600R DDR3-SDRAM メモリの構成で
PRIMERGY BX620 S6 を測定しました。その他の構成は、2010 年 8 月の測定と同じです。
測定結果は次のとおりです。
SPECjbb2005 bops = 907449
SPECjbb2005 bops/JVM = 151242
次のグラフは、PRIMERGY BX620 S6 とその旧モデルである PRIMERGY BX620 S5 のスループットを比較
したものです。
554740
886753 907449
0
200000
400000
600000
800000
1000000
PRIMERGY BX620 S52 x Xeon X5570
PRIMERGY BX620 S62 x Xeon X5670
PRIMERGY BX620 S62 x Xeon X5675
0
200000
400000
600000
800000
1000000
1 2 3 4 5 6 7 8warehouses
PRIMERGY BX620 S62 x Xeon X5675PRIMERGY BX620 S62 x Xeon X5670PRIMERGY BX620 S52 x Xeon X5570
SPECjbb2005 bops:
PRIMERGY BX620 S6 と旧モデルとの比較
SPECjbb2005 bops:
PRIMERGY BX620 S6 と旧モデルとの比較
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
© Fujitsu Technology Solutions 2010-2011 15/34 ページ
ベンチマーク環境
SPECjbb2005 の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY BX620 S6 で行いまし
た。
ハードウェア
モデル PRIMERGY BX620 S6
CPU Xeon X5670, Xeon X5675
CPU 数 2 チップ、12 コア(チップあたり 6 コア)
1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり)
2 次キャッシュ 256 KB(命令 + データ)オンチップ(コアあたり)
その他のキャッシュ 12 MB(命令 + データ)オンチップ(チップあたり)
メモリ 8 GB PC3(L)-10600R DDR3-SDRAM × 12 枚
ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Enterprise
JVM バージョン IBM J9 VM (build 2.4, JRE 1.6.0 IBM J9 2.4 Windows Server 2008 amd64-64 jvmwa6460sr6-20090923_42924 (JIT enabled, AOT enabled)
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
16/34 ページ © Fujitsu Technology Solutions 2010-2011
OLTP-2
ベンチマークの説明
OLTP とは、Online Transaction Processing(オンライントランザクション処理)の略です。OLTP-2 ベン
チマークは、データベースソリューションの標準的なアプリケーションシナリオを基にしています。OLTP-
2 では、データベースアクセスがシミュレートされ、1 秒あたりに実行されるトランザクションの数(tps)
が測定されます。
独立した機関によって標準化され、その規則を順守して測定しているかを監視される SPECint や TPC-E の
ようなベンチマークとは異なり、OLTP-2 は、富士通が開発した固有のベンチマークです。OLTP-2 は、
データベースのベンチマークとしてよく知られている TPC-E を基に開発されました。そして、CPU やメモ
リの構成に応じてシステムがスケーラブルな性能を示すことを実証するために、さまざまな構成で測定でき
るように設計されています。
OLTP-2 と TPC-E の 2 つのベンチマークが同じ負荷プロファイルを使用して同様のアプリケーションのシ
ナリオをシミュレートしても、この 2 つのベンチマークは異なる方法でユーザーの負荷をシミュレートする
ため、結果を比較したり同等のものとして扱うことはできません。通常、OLTP-2 の値は、TPC-E に近い値
となります。しかし、価格性能比が算出されないため、直接比較できないだけでなく、OLTP-2 の結果を
TPC-E として利用することも許可されません。
詳細情報は、『ベンチマークの概要 OLTP-2』を参照してください。
ベンチマーク結果
PRIMERGY RX300 S6 の OLTP-2 の値は、Xeon 55xx および 56xx プロセッサシリーズを使用して、48 GB、
72 GB、96 GB、144 GB、および 192 GB のメモリ構成で測定しました。
次の表は、測定対象のプロセッサの仕様を示しています。
プロセッサ コア数/
チップ L3 キャッシュ
プロセッサ
周波数
QPI
スピード HT TM TDP
55
00
E5503 2 4 MB 2.00 GHz 4.8 GT/s - - 80 W
E5506 4 4 MB 2.13 GHz 4.8 GT/s - - 80 W
E5507 4 4 MB 2.27 GHz 4.8 GT/s - - 80 W
56
00
シリ
ーズ
4 コ
ア E5603 4 4 MB 1.60 GHz 4.8 GT/s - - 80 W
E5606 4 8 MB 2.13 GHz 4.8 GT/s - - 80 W
E5607 4 8 MB 2.27 GHz 4.8 GT/s - - 80 W
L5609 4 12 MB 1.87 GHz 4.8 GT/s - - 40 W
4 コ
ア、
HT、
TM
L5630 4 12 MB 2.13 GHz 5.86 GT/s 40 W
E5620 4 12 MB 2.40 GHz 5.86 GT/s 80 W
E5630 4 12 MB 2.53 GHz 5.86 GT/s 80 W
E5640 4 12 MB 2.67 GHz 5.86 GT/s 80 W
X5647 4 12 MB 2.93 GHz 5.86 GT/s 130 W
X5667 4 12 MB 3.07 GHz 6.4 GT/s 95 W
X5672 4 12 MB 3.20 GHz 6.4 GT/s 95 W
X5677 4 12 MB 3.46 GHz 6.4 GT/s 130 W
X5687 4 12 MB 3.60 GHz 6.4 GT/s 130 W
6 コ
ア、
HT、
TM
L5640 6 12 MB 2.27 GHz 5.86 GT/s 60 W
E5645 6 12 MB 2.40 GHz 5.86 GT/s 80 W
E5649 6 12 MB 2.53 GHz 5.86 GT/s 80 W
X5650 6 12 MB 2.67 GHz 6.4 GT/s 95 W
X5660 6 12 MB 2.80 GHz 6.4 GT/s 95 W
X5670 6 12 MB 2.93 GHz 6.4 GT/s 95 W
X5675 6 12 MB 3.06 GHz 6.4 GT/s 95 W
X5680 6 12 MB 3.33 GHz 6.4 GT/s 130 W
X5690 6 12 MB 3.46 GHz 6.4 GT/s 130 W
QPI=Quick Path インターコネクト、GT=ギガトランスファー、HT=ハイパースレッディング、TM=ターボモード、TDP=熱設計電力
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
© Fujitsu Technology Solutions 2010-2011 17/34 ページ
データベースのパフォーマンスは、CPU やメモリの構成と、データベースで使用するディスクサブシステ
ムの接続性によって、大きく異なります。Xeon 55xx および 56xx プロセッサシリーズは、次のようなさま
ざまなシステム構成に対応しています。
プロセッサ TX200 S6 TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2
55
00
E5503
E5506
E5507
56
00
シリ
ーズ
4 コ
ア E5603
E5606
E5607
L5609
4 コ
ア、
HT、
TM
L5630
E5620
E5630
E5640
X5647
X5667
X5672
X5677
X5687
6 コ
ア、
HT、
TM
L5640
E5645
E5649
X5650
X5660
X5670
X5675
X5680
X5690
最大 メモリ TX200 S6 TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2
CPU × 1 48 GB 96 GB 96 GB 96 GB 96 GB 96 GB 96 GB 96 GB 144 GB
*)
CPU × 2 96 GB 192 GB 192 GB 192 GB 192 GB 144 GB 192 GB 192 GB 288 GB
*)
*) 16 GB デュアルランクメモリモジュールの特別リリース
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
18/34 ページ © Fujitsu Technology Solutions 2010-2011
次に示す CPU およびメモリの性能評価では、ディスクサブシステムは適切であり、ボトルネックにならな
いものとします。
PRIMERGY RX300 S6 の OLTP-2 の値は、オペレーティングシステム Microsoft Windows Server 2008 R2
Enterprise とデータベース SQL Server 2008 R2 Enterprise x64 Edition で測定したものです。システム構成
の詳細については、「ベンチマーク環境」を参照してください。
データベース環境でメインメモリを選択するときのガイドラインとして、メモリアクセス速度よりも、メモ
リ容量が十分にあることが重要です。そのため、16 GB モジュールの最大構成、8 GB モジュールの最大構
成、および 8 GB モジュールの別構成で測定しました。周波数は、プロセッサと、メモリモジュールの種類
および数によって変わります。メモリパフォーマンスの詳細については、ホワイトペーパー『Xeon 5600
(Westmere-EP)搭載システムのメモリパフォーマンス』を参照してください。
次のグラフは、Intel Xeon 5600 および 5500 シリーズのプロセッサ(1 基または 2 基)と、さまざまなメモ
リ構成で測定した OLTP-2 トランザクションレートを示しています。
多種類のプロセッサにより、広範にわたるレベルのパフォーマンスが実現されていることがわかります。同
じ最大メモリ構成で比較すると、パフォーマンスが最も低いプロセッサ(Xeon E5503)を使用した場合に
比べ、パフォーマンスが最も高いプロセッサ(Xeon X5690)を使用した場合は、OLTP-2 値は 5.4 倍に
なっています。
測定結果が示す性能に基づき、プロセッサをいくつかのグループに分類できます。
最もパフォーマンスが低いのは、わずか 2 コアのプロセッサである Xeon E5503 です。
その次のグループのプロセッサは、OLTP-2 でほぼ 2 倍のパフォーマンスを達成しています。ハイパース
レッディングをサポートしていない 4 コアプロセッサ(Xeon E5506、Xeon E5507、Xeon E5603、Xeon
E5606、Xeon E5607 および Xeon L5609)が、このグループです。OLTP-2 の測定では、コア数を 2 倍に
すると、パフォーマンスもほぼ 2 倍になります。
ハイパースレッディングとターボモードの両方をサポートする 4 コアプロセッサでは、さらに高いパフォー
マンスが得られます。Xeon L5630、Xeon E5620、Xeon E5630、Xeon E5640 および Xeon X5647 がこの
グループです。このグループでは、ハイパースレッディングによって論理的なプロセッサコア数が 2 倍にな
るため、OLTP-2 の測定では特に優れた結果が得られます。Xeon X5667、Xeon X5672、Xeon X5677、
Xeon X5687 は、同じくハイパースレッディングとターボモードをサポートする 4 コアプロセッサですが、
高レベルのターボモードを利用可能で、QPI スピードも 5.86 GT/s よりさらに高速の 6.4 GT/s です。これ
により、このグループの 4 コアプロセッサは、下位の 6 コアプロセッサであるクロック周波数、ターボ
モードレベル、QPI スピードが低いモデル(Xeon E5645、および Xeon E5649)に近いスループットを達
成できます。
最高のパフォーマンスを発揮するのは、QPI スピード 6.4 GT/s を実現する 6 コアプロセッサ Xeon X5650、
Xeon X5660、Xeon X5670、Xeon X5675、Xeon X5680 および Xeon X5690 のグループです。このグルー
プでは、2 基の CPU を使用した OLTP-2 の測定のほとんどで、96 GB(8 GB DIMM × 12)で周波数
1333 MHz のメモリ構成の方が、144 GB(8 GB DIMM × 18)で周波数 800 MHz のメモリ構成より優れた
結果が得られました。
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
© Fujitsu Technology Solutions 2010-2011 19/34 ページ
0 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300
E5503-2Core
E5506-4Core
E5507-4Core
E5603-4Core
E5606-4Core
E5607-4Core
L5609-4Core
L5630-4Core
E5620-4Core
E5630-4Core
E5640-4Core
X5647-4Core
X5667-4Core
X5672-4Core
X5677-4Core
X5687-4Core
L5640-6Core
E5645-6Core
E5649-6Core
X5650-6Core
X5660-6Core
X5670-6Core
X5675-6Core
X5680-6Core
X5690-6Core
OLTP-2 tps2CPUs-192GB 2CPUs-144GB 2CPUs-96GB 1CPU-96GB 1CPU-72GB 1CPU-48GB
tps
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
20/34 ページ © Fujitsu Technology Solutions 2010-2011
PRIMERGY 現行モデルでの OLTP-2 の最高値は、旧モデルの最高値と比較して約 50 %向上しています。
0
100
200
300
400
500
600
700
800
900
1000
1100
1200
1300
1400
+ ~ 50%
tps
現行モデル TX200 S6 TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2
旧モデル TX200 S5 TX300 S5 RX200 S5 RX300 S5 BX620 S5 BX920 S1 - -
2 × X5570
96 GB RAM
2 × W5590
96 GB RAM
2 × X5670
96 GB RAM
2 × X5690
96 GB RAM
現行モデル 旧モデル
OLTP-2 tps の最高値
システム世代間の比較
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
© Fujitsu Technology Solutions 2010-2011 21/34 ページ
ベンチマーク環境
一般的な測定環境を以下に示します。
Intel Xeon 55xx および 56xx プロセッサシリーズの OLTP-2 のすべての値は、PRIMERGY RX300 S6 を使
用して測定しました。
データベースサーバ(B 層)
ハードウェア
システム PRIMERGY RX300 S6
プロセッサ Xeon E5503(2 コア、2.00 GHz)× 2 基
Xeon E5506(4 コア、2.13 GHz)× 2 基
Xeon E5507(4 コア、2.27 GHz)× 2 基
Xeon E5603(4 コア、1.60 GHz)× 2 基
Xeon E5606(4 コア、2.13 GHz)× 2 基
Xeon E5607(4 コア、2.27 GHz)× 2 基
Xeon L5609(4 コア、1.87 GHz)× 2 基
Xeon L5630(4 コア、2.13 GHz)× 2 基
Xeon E5620(4 コア、2.40 GHz)× 2 基
Xeon E5630(4 コア、2.53 GHz)× 2 基
Xeon E5640(4 コア、2.67 GHz)× 2 基
Xeon X5647(4 コア、2.93 GHz)× 2 基
Xeon X5667(4 コア、3.07 GHz)× 2 基
Xeon X5672(4 コア、3.20 GHz)× 2 基
Xeon X5677(4 コア、3.46 GHz)× 2 基
Xeon X5687(4 コア、3.60 GHz)× 2 基
Xeon L5640(6 コア、2.27 GHz)× 2 基
Xeon E5645(6 コア、2.40 GHz)× 2 基
Xeon E5649(6 コア、2.53 GHz)× 2 基
Xeon X5650(6 コア、2.67 GHz)× 2 基
Xeon X5660(6 コア、2.80 GHz)× 2 基
Xeon X5670(6 コア、2.93 GHz)× 2 基
Xeon X5675(6 コア、3.06 GHz)× 2 基
Xeon X5680(6 コア、3.33 GHz)× 2 基
Xeon X5690(6 コア、3.46 GHz)× 2 基
メモリ 48 GB~192 GB、 1333 MHz Registered ECC DDR3(8 GB DIMM)、または
1066 MHz Registered ECC DDR3(16 GB DIMM)
設定(デフォルト) ターボモード有効、NUMA サポート有効、ハイパースレッディング有効
ネットワーク
インターフェース
オンボード LAN 1 Gbps × 2 基
ディスクサブシステム RX300 S6: オンボード RAID コントローラー SAS 6G 5/6 512 MB
73 GB 15k rpm SAS ドライブ × 2 台、RAID1(OS)、
147 GB 15k rpm SAS ドライ ブ × 6 台、RAID10(ログ)
LSI MegaRAID SAS 9280-8e × 5 基
JX40 × 5 台:各 64 GB SSD ドライブ × 24 台、RAID5(データ)
ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Enterprise
データベース SQL Server 2008 R2 Enterprise x64
アプリケーション
サーバ
A 層
B 層
ネットワーク
ネットワーク
クライアント
データベースサーバ
ストレージサブシステム
SUT(System Under Test:テスト対象システム)
ドライバ
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
22/34 ページ © Fujitsu Technology Solutions 2010-2011
アプリケーションサーバ(A 層)
ハードウェア
システム PRIMERGY RX200 S6
プロセッサ Xeon E5640 (6 コア、2.66 GHz)× 1 基
メモリ 12 GB、1333 MHz Registered ECC DDR3
ネットワーク
インターフェース
オンボード LAN 1 Gbps × 2 基、デュアルポート LAN 1 Gbps × 2 基
ディスクサブシステム 73 GB 15k rpm SAS ドライブ × 1 台
ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Standard
クライアント
ハードウェア
システム PRIMERGY RX200 S5
プロセッサ Xeon X5570(4 コア、2.93 GHz)× 2 基
メモリ 24 GB、1333 MHz Registered ECC DDR3
ネットワーク
インターフェース
オンボード LAN 1 Gbps × 2 基
ディスクサブシステム 73 GB 15k rpm SAS ドライブ × 1 台
ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Standard
OLTP-2 ソフトウェア EGen バージョン 1.12.0
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
© Fujitsu Technology Solutions 2010-2011 23/34 ページ
vServCon
ベンチマークの説明
vServCon は、富士通テクノロジー・ソリューションズが、ハイパーバイザーを使用するサーバ構成につい
て、サーバ統合の適合性の比較に使用するベンチマークです。これにより、システム、プロセッサ、および
I/O テクノロジーの比較に加え、ハイパーバイザー、仮想化形式、および仮想マシン用の追加ドライバの比
較も可能になります。
vServCon は、厳密に言えば新しいベンチマークではありません。これは、言うなればフレームワークであ
り、すでに確立されたベンチマークをワークロードとして集約し、統合され仮想化されたサーバ環境の負荷
を再現します。データベース、アプリケーションサーバ、Web サーバというアプリケーションシナリオを
対象とする 3 つの実証済みのベンチマークが使用されます。
3 つのアプリケーションシナリオのそれぞれが、1 つの専用の仮想マシン(VM)に割り当てられます。これ
らに加えてアイドル VM という 4 番目の仮想マシンが追加されます。これら 4 つの VM が 1 つの「タイル」
を構成します。最大の性能値を引き出すためには、測定対象となるサーバの処理能力に応じて、いくつかの
タイルを並行して開始しなければならない場合もあります。
3 つの vServCon アプリケーションシナリオのそれぞれが、各 VM のアプリケーション固有のトランザク
ションレートという形でベンチマーク結果を提供します。スコアを正規化するために、1 つのタイルのそれ
ぞれのベンチマーク結果とリファレンスシステムの結果との比を求めます。その相対性能値に適切な重み付
けを行い、すべての VM とすべてのタイルについて加算します。最終的な計算結果が、このタイル数に対す
るスコアになります。
原則として、1 つのタイルから始めて、vServCon スコアの大幅な増加が見られなくなるまで、タイル数を
増やしながらこの手順が実行されます。最終的な vServCon スコアは、すべてのタイル数から得られた
vServCon スコアの最大値です。したがって、このスコアは、CPU リソースを最大限まで使用する構成で達
成される最大スループットを反映しています。このため、vServCon の測定環境は、CPU のみが制限要因と
なるように設計されており、他のリソースによる制限は発生しないように設計されています。
タイル数の増加に対する vServCon スコアの伸びは、テスト対象システムのスケーリング特性を知るための
有益な情報となります。
さらに、vServCon では、ホストの合計 CPU 負荷(VM および他のすべての CPU 処理)を記録し、可能な
場合は消費電力も記録します。
vServCon の詳細については、『ベンチマークの概要 vServCon』を参照してください。
アプリケーションシナリオ ベンチマーク 論理 CPU コアの数 メモリ
データベース Sysbench(補正済み) 2 1.5 GB
Java アプリケーションサーバ SPECjbb(補正済み、50~60 %の負荷) 2 2 GB
Web サーバ WebBench 1 1.5 GB
テスト対象システム
… …
タイル n
タイル 3
タイル 2
タイル 1
データベース
VM Web VM
アイドル
VM Java VM
データベース
VM Web VM
アイドル
VM Java VM
データベース
VM Web VM
アイドル
VM Java VM
データベース
VM Web VM
アイドル
VM Java VM
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
24/34 ページ © Fujitsu Technology Solutions 2010-2011
ベンチマーク結果
PRIMERGY の 2 ソケットモデル現行世代は、Intel Xeon シリーズ 5600(または 5500)プロセッサをベー
スにしています。
次のようなさまざまなシステム構成に対応しています。
プロセッサ TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2
5500 E5507
56
00
シリ
ーズ
4 コ
ア
E5607
L5609
4 コ
ア、
HT、
TM
L5630
E5620
E5630
E5640
X5647
X5667
X5672
X5677
X5687
6 コ
ア、
HT、
TM
L5640
E5645
E5649
X5650
X5660
X5670
X5675
X5680
X5690
HT = ハイパースレッディング、TM = ターボモード
PRIMERGY の 2 ソケットモデル現行世代は、プロセッサテクノロジーの進歩により、アプリケーションの
仮想化に最適なシステムとなっています。6 コアプロセッサにも対応しているため、前世代のプロセッサを
ベースとするシステムと比較して、仮想化性能が約 50 %向上しています(vServCon スコアで測定)。6 コ
アプロセッサを 2 基搭載したシステムで、前述の vServCon プロファイルを基にして 27 のアプリケーショ
ン VM(9 つのタイルに相当)を使用した場合、CPU リソースの最大活用をほぼ実現できます。
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
© Fujitsu Technology Solutions 2010-2011 25/34 ページ
次のグラフは、各プロセッサで達成可能な仮想化性能値を比較したものです。発売済みの 4 コアまたは 6
コアのプロセッサを対象に幅広く測定しました。
このグラフに示されているプロセッサ間の大きな性能差は、その機能が影響していると考えられます。グラ
フの左側のグループのプロセッサは、エントリーモデルです。グラフ中央のグループのプロセッサは、ハイ
パースレッディングとターボモードに対応しているため、パフォーマンスが大幅に向上していることがわか
ります。
グラフの中央と右側のグループのプロセッサでは、それぞれのプロセッサのメモリクロック周波数が徐々に
上がっています。このとき、パフォーマンスは、プロセッサのメモリクロック周波数とプロセッサ間のデー
タ転送速度(「QPI スピード」)の組み合わせで決まります。
グラフの右側のグループは、6 コアプロセッサで構成されています。6 コアプロセッサの場合、同機能の 4
コアプロセッサと比較すると、期待どおりにパフォーマンスが約 50 %向上しています。グラフの右側のグ
ループでは、E5649 から X5650 への大幅な向上が特に目立っています。X5650 以降は、最高の QPI スピー
ドと強力なターボモードを備えたアドバンストプロセッサというカテゴリであるためです。
メモリパフォーマンスと QPI アーキテクチャーの詳細については、ホワイトペーパー『Xeon 5600
(Westmere-EP)搭載システムのメモリパフォーマンス』を参照してください。
仮想化環境のメインメモリを選択するときのガイドラインとして、メモリアクセス速度よりも、メモリ容量
が十分にあることが重要です。
各プロセッサの製品データについて再度簡潔にまとめ、次の表に示します。
E5507
L5609
E5607
L5630
E5620
E5630
E5640
X5647
X5667
X5672
X5677
X5687
L5640
E5645
E5649
X5650
X5660
X5670
X5675
X5680
X5690
4 4 4 6 6 6 6 6 7 7 7 7 9 9 9 9 9 9 9 9 9
0
1
2
3
4
5
6
7
8
9
10
Fin
al v
Serv
Co
n S
co
re
#Tiles
4 Cores / 4 Threads 6 Cores / 12 Threads4 Cores / 8 Threads
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
26/34 ページ © Fujitsu Technology Solutions 2010-2011
プロセッサ コア数/
チップ
L3 キャッ
シュ
プロセッサ
周波数
QPI
スピード HT TM TDP タイル数 スコア
5500 E5507 4 4 MB 2.27 GHz 4.8 GT/s - - 80 W 4 3.02
56
00
シリ
ーズ
4 コ
ア
E5607 4 8 MB 2.27 GHz 4.8 GT/s - - 80 W 4 3.39
L5609 4 12 MB 1.87 GHz 4.8 GT/s - - 40 W 4 3.06
4 コ
ア、
HT、
TM
L5630 4 12 MB 2.13 GHz 5.86 GT/s 40 W 6 4.61
E5620 4 12 MB 2.40 GHz 5.86 GT/s 80 W 6 5.40
E5630 4 12 MB 2.53 GHz 5.86 GT/s 80 W 6 5.56
E5640 4 12 MB 2.67 GHz 5.86 GT/s 80 W 6 5.79
X5647 4 12 MB 2.93 GHz 5.86 GT/s 130 W 6 6.23
X5667 4 12 MB 3.07 GHz 6.4 GT/s 95 W 7 6.93
X5672 4 12 MB 3.20 GHz 6.4 GT/s 95 W 7 7.20
X5677 4 12 MB 3.46 GHz 6.4 GT/s 130 W 7 7.24
X5687 4 12 MB 3.60 GHz 6.4 GT/s 130 W 7 7.57
6 コ
ア、
HT、
TM
L5640 6 12 MB 2.27 GHz 5.86 GT/s 60 W 9 7.36
E5645 6 12 MB 2.40 GHz 5.86 GT/s 80 W 9 7.40
E5649 6 12 MB 2.53 GHz 5.86 GT/s 80 W 9 7.60
X5650 6 12 MB 2.67 GHz 6.4 GT/s 95 W 9 8.63
X5660 6 12 MB 2.80 GHz 6.4 GT/s 95 W 9 8.87
X5670 6 12 MB 2.93 GHz 6.4 GT/s 95 W 9 9.02
X5675 6 12 MB 3.06 GHz 6.4 GT/s 95 W 9 9.29
X5680 6 12 MB 3.33 GHz 6.4 GT/s 130 W 9 9.41
X5690 6 12 MB 3.46 GHz 6.4 GT/s 130 W 9 9.61
QPI = QuickPath インターコネクト、GT = ギガトランスファー、HT = ハイパースレッディング、
TM = ターボモード、TDP = 熱設計電力
次のグラフは、Xeon E5620(4 コア)プロセッサおよび E5649(6 コア)プロセッサを搭載した時の、VM
数の増加に対する仮想化性能を示しています。ホストのそれぞれの CPU 負荷も示されています。CPU 負荷
が 90 %のときが最適なタイル数で
す。90 %を超えると過負荷となり、
仮想化のパフォーマンスは停滞また
は低下します。
物理コア数の増加に加えて、ハイ
パースレッディング機能によって、
多数の VM の稼動が可能になります。
ハイパースレッディング機能では、
1 つの物理プロセッサコアが結果的
に 2 つの論理コアに分割されるた
め、ハイパーバイザーが利用できる
コア数は 2 倍になります。そのた
め、ハイパースレッディング機能は、
一般的にシステムの仮想化性能を向
上させます。
ハイパースレッディング機能を使用するシステムでは、前のグラフに示されているタイル数のスケーリング
曲線が明確に見られます。Xeon E5649 プロセッサには、12 個の物理コア、すなわち 24 個の論理コアがあ
り、1 つのタイルにつき 4 個程度の論理コアが使用されます(『ベンチマークの説明』を参照)。つまり、
ほぼ 3 タイルまでは、複数の VM が同じ物理コアを並行して使用することを回避できます。そのため、この
範囲ではほぼ理想的にパフォーマンスが上昇します。その後、CPU 使用率が限界に達するまでのパフォー
マンス曲線は、傾きが緩やかになっていきます。
2.1
8
3.8
4
4.4
7
5.0
1
5.3
0
5.4
0
2.1
2
4.2
3
5.6
9
6.3
7
7.0
8
7.3
4
7.4
5
7.5
5
7.6
0
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
E5620 E5649
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 1 2 3 4 5 6 7 8 9
CP
U u
tilizati
on
vS
erv
Co
n S
co
re
# Tiles
vServCon Score (left axis) CPU utilization of host (right axis)
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
© Fujitsu Technology Solutions 2010-2011 27/34 ページ
これまでは、システムの仮想化性能を全体的に分析してきました。ここからは、仮想化環境での個別アプリ
ケーション VM の観点でパフォーマンスについて説明します。ここでは例として、Xeon E5649 プロセッサ
のシステムを取り上げています。
システム総体としてのパフォーマンスを重視してアプリケーション VM の数を全体最適化(例として 6 タイ
ル)すると、部分最適化(例として 1 タイル)して負荷が少ない状況に比べ、個別の VM のパフォーマンス
はかなり低くなります。次のグラフ(VM の数が増加したときの 3 種類の各アプリケーション VM のリファ
レンスシステムに対する相対的なパフォーマンス)により、この点を明らかにしています。各アプリケー
ション(Java、Web、DB)のグラフの最初の列には、1 つのタイルを構成する合計 3 つの VM がアプリ
ケーション別に 1 つずつ表示されています。2 番目の列には 2 つのタイルを構成する合計 6 つの VM がア
プリケーション別に 2 つずつ表示され、以降も同様に、タイルを構成する VM がアプリケーション別に表示
されています。各グラフから、個々のアプリケーション VM の値、およびアプリケーション種別ごとの合計
値が読み取れます。
仮想ホスト上の VM の数に関して、全体的なパフォーマンスよりも個別のアプリケーションのパフォーマン
ス要件を重視すべき場合もあります。
はじめに、完全に構成されたシステムの仮想化性能について見てきました。一方で、プロセッサを 1 基から
2 基に増やしたときに、どの程度パフォーマンスが向上するかという疑問もあります。パフォーマンスの向
上度が増せば、サーバ内のリソース共有によるオー
バーヘッドは減少します。プロセッサ追加時の性能
向上度を示すスケーリング係数は、サーバの用途に
よって異なります。サーバ統合用の仮想化プラット
フォームとしてサーバを使用する場合、プロセッサ
の追加で性能は 1.95 倍になります。つまり、Xeon
E5649 のグラフに示したように、2 基のプロセッサ
を使用すると、1 基のプロセッサを使用した場合に比
べて、仮想化性能が約 2 倍になります。
0
1
2
3
4
5
6
7
8
9
10
1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9
Re
lative
pe
rfo
rma
nce
co
mp
are
d w
ith
Re
fSys
Relative performance of single VM for increasing tile count
9th VM 8th VM 7th VM 6th VM 5th VM 4th VM 3rd VM 2nd VM 1st VM
Web DBJava
#Tiles
0
1
2
3
4
5
6
7
8
9
1 × E5649 2 × E5649
× 1.95
vS
erv
Co
n S
co
re
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
28/34 ページ © Fujitsu Technology Solutions 2010-2011
2008 年以降のプロセッサテクノロジーにおける仮想化関連の進歩は、一方では個別の VM に影響し、他方
では CPU をフル活用したときの使用可能な最大 VM 数に影響しています。次のグラフでは、この 2 つの側
面における向上の度合いを比較しています。ここでは、2008 年の Xeon E5420 × 2 基のシステム、2009 年
の Xeon X5540 × 2 基のシステム、そして Xeon E5649 × 2 基の現行システムといった、ほぼ同じプロセッ
サ周波数を持つ 3 つのシステムを比較しています。
2011 TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2
2009 TX300 S5 RX200 S5 RX300 S5 BX620 S5 BX920 S1 - -
2008 TX300 S4 RX200 S4 RX300 S4 BX620 S4 - - -
パフォーマンスの向上は、Xeon 5500 プロセッサ世代が登場した 2008 年から 2009 年にかけて最も顕著で
す(「拡張ページテーブル」(EPT)機能の実装などによる1)。VM の数が少ないケース(1 タイル)では、
vServCon スコアが 1.30 倍に増加しています。
全体最適化した CPU フル稼動時のケースでは、vServCon スコアは、2.02 倍に増加しています。その理由
の 1 つは、個々の VM で実現できるパフォーマンスの向上です(グラフ左側の Few VMs のスコアを参照)。
もう 1 つの理由は、全体最適化された状態で実行可能な VM の数の向上です(ハイパースレッディング機能
の使用および物理コア数の増加による)。ただし、VM の数を増やすことで個々の VM のパフォーマンスは
低下しているため、全体としての性能向上は、VM の数が 3 倍になったことによってもたらされたものと言
えます。
2009 年から 2011 年にかけて、テクノロジーは、厳密にはどの点で進歩を遂げたのでしょうか。ここでは、
クロック周波数が同じで、キャッシュのサイズとメモリアクセス速度が異なるプロセッサを比較しています
が、低負荷状態における個々の VM のパフォーマンスについては、プロセッサによる違いはほとんどありま
せん。決定的に進歩を遂げた点は、物理コア数の増加と、それに関連した仮想化性能値の向上(グラフでは
1.47 倍)、および CPU 最大使用時における電力あたりの性能効率の向上です。ここで比較している 2009
年のプロセッサと 2011 年のプロセッサは、TDP(Thermal Design Power:熱設計電力)が 80 W で等しい
ため、CPU 最大使用時の消費電力はほぼ同じです。したがって、電力あたりの性能も約 1.47 倍に向上して
います。
仮想化パフォーマンスの増加は、個別の VM の性能向上によるものがすべてではありません。個別の VM の
性能向上だけでは、Xeon 5400 世代(2008 年)の同一クロックのプロセッサと比較して、30 %~50 %を
超えるスループットの増加は不可能です。2009 年以降の仮想化環境におけるパフォーマンス向上の大部分
は、利用可能な論理コアまたは物理コアが増加した結果として、実行できる VM 数が増大したことによって
達成されたものです。
1 EPT は、ホストとゲストのメモリアドレスのマッピングをハードウェアでサポートすることで、メモリの仮想化を高
速化します。
0
1
2
3
4
5
6
7
8
9
2008E5420
2.5 GHz4C
2009E5540
2.53 GHz4C
2011E5649
2.53 GHz6C
2008E5420
2.5 GHz4C
2009E5540
2.53 GHz4C
2011E5649
2.53 GHz6C
Overall OptimumFew VMs
×1.30
×2.02
vS
erv
Co
n S
co
re
×1.47
YearCPU
Frequency#Cores
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
© Fujitsu Technology Solutions 2010-2011 29/34 ページ
ベンチマーク環境
測定は次のような環境で行いました。
Intel Xeon 55xx と 56xx プロセッサシリーズのすべての vServCon スコアは、PRIMERGY TX300 S6 を使用
して測定しました。
SUT ハードウェア
モデル PRIMERGY TX300 S6
プロセッサ 1 チップ: Xeon E5649(6 コア、2.53 GHz)
2 チップ: Xeon E5507(4 コア、2.27 GHz)
Xeon L5609(4 コア、1.87 GHz)
Xeon E5607(4 コア、2.27 GHz)
Xeon L5630(4 コア、2.13 GHz)
Xeon E5620(4 コア、2.40 GHz)
Xeon E5630(4 コア、2.53 GHz)
Xeon E5640(4 コア、2.67 GHz)
Xeon X5647(4 コア、2.93 GHz)
Xeon X5667(4 コア、3.07 GHz)
Xeon X5672(4 コア、3.20 GHz)
2 チップ: Xeon X5677(4 コア、3.47 GHz)
Xeon X5687(4 コア、3.60 GHz)
Xeon L5640(6 コア、2.27 GHz)
Xeon E5645(6 コア、2.40 GHz)
Xeon E5649(6 コア、2.53 GHz)
Xeon X5650(6 コア、2.67 GHz)
Xeon X5660(6 コア、2.80 GHz)
Xeon X5670(6 コア、2.93 GHz)
Xeon X5675(6 コア、3.07 GHz)
Xeon X5680(6 コア、3.33 GHz)
Xeon X5690(6 コア、3.46 GHz)
メモリ 96 GB(それぞれ PC3-10600R、8 GB、DIMM-1A~DIMM-1F および DIMM-2A~DIMM-2F に
搭載)
ネットワーク
インターフェース
1 Gbit LAN × 2 基:負荷用(2 基の LAN アダプター経由)× 1 基、制御用 × 1 基
ディスク
サブシステム
内蔵ハードディスクは使用せず、ストレージシステム FibreCAT CX500 のみを使用
VM の仮想ディスクファイル用のタイルあたり 1 つの 50 GB LUN
各 LUN は、5 つの Seagate ST373454 ディスク(15 krpm)で構成された RAID 0 アレイ
ストレージの接続 FC コントローラー Qlogic QLE 2462 を使用
SUT ソフトウェア
オペレーティング
システム
ハイパーバイザー VMware ESX Server
リリース バージョン 4.0 U1 ビルド 236512
BIOS バージョン 6.00 R1.08..2619.N1
隣接キャッシュラインプリフェッチ:無効、ハードウェアプリフェッチ:無効
DCU ストリーマープリフェッチ:無効、データ再利用の最適化:無効
複数の
1 Gb または 10 Gb
ネットワーク
負荷ジェネレーター
サーバ ストレージシステム
SUT(System Under Test:テスト対象システム)
フレームワーク
コントローラー
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
30/34 ページ © Fujitsu Technology Solutions 2010-2011
SUT:仮想化に関する詳細
ESX 設定 デフォルト
一般的な詳細 『ベンチマークの概要 vServCon』を参照
負荷ジェネレーターのハードウェア
モデル PRIMERGY BX920 S1 サーバブレード(PRIMERGY BX900 シャーシ)× 17 台
プロセッサ それぞれ Xeon X5570(2.93 GHz)× 2 基
メモリ 12 GB
ネットワーク
インターフェース
それぞれ 1 Gbit LAN × 3 基
オペレーティング
システム
Windows Server 2008 R2 Enterprise with Hyper-V
負荷ジェネレーター VM(タイルあたり 3 つの負荷ジェネレーターを複数のサーバブレードで動作)
プロセッサ 論理 CPU × 1 基
メモリ 512 MB
ネットワーク
インターフェース
それぞれ 1 Gbit LAN × 2 基
オペレーティング
システム
Windows Server 2003 Enterprise
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
© Fujitsu Technology Solutions 2010-2011 31/34 ページ
STREAM
ベンチマークの説明
STREAM は、メモリのスループットを測定するために長年使用されてきた総合的なベンチマークで、John
McCalpin 氏がデラウェア大学に教授として在職中に、氏によって開発されました。現在はバージニア大学
でサポートされており、ソースコードを Fortran または C のいずれでもダウンロードできます。STREAM
は、特に HPC(ハイパフォーマンスコンピューティング)分野で、重要な役割を担っています。例えば、
STREAM は、HPC Challenge ベンチマークスイートの一部として使用されています。
このベンチマークは、PC とサーバシステムの両方で使用できるように設計されています。測定単位は、
[GB/s] であり、1 秒あたりにリード/ライト可能なギガバイト数です。
STREAM では、シーケンシャルアクセスでのメモリスループットを測定します。メモリ上のシーケンシャ
ルアクセスは、CPU キャッシュが使用されるため、一般にランダムアクセスより高速です。
ベンチマーク実行前に、測定環境に合わせて、STREAM のソースコードを調整します。また、CPU キャッ
シュによる測定結果への影響ができるだけ少なくなるよう、データ領域のサイズは、全 CPU キャッシュの
総容量の 4 倍以上にする必要があります。ベンチマーク中にプログラムの一部を並列実行するために、
OpenMP プログラムライブラリを使用します。これにより、利用可能なプロセッサコアに対して最適な負
荷分散が行われます。
STREAM ベンチマークでは、8 バイトの要素で構成されるデータ領域が、4 つの演算タイプに連続的にコ
ピーされます。COPY 以外の演算タイプでは、算術演算も行われます。
演算タイプ 演算 ステップあたりのバイト数 ステップあたりの浮動小数点演算
COPY a(i) = b(i) 16 0
SCALE a(i) = q × b(i) 16 1
SUM a(i) = b(i) + c(i) 24 1
TRIAD a(i) = b(i) + q × c(i) 24 2
スループットは、演算タイプ別に GB/s で表されます。しかし最近のシステムでは、通常、演算タイプによ
る値の差はほんのわずかです。そのため、一般的に、性能比較には TRIAD の測定値だけが使用されます。
測定結果は、主にメモリモジュールのクロック周波数によって変わります。また、算術演算は、CPU に
よって影響を受けます。結果の精度は約 5 %です。
本章では、スループットを 10 のべき乗で表しています。(1 GB/s = 109 Byte/s)
ベンチマーク結果
PRIMERGY BX620 S6 の STREAM の値は、Xeon 5600 シリーズのプロセッサを使用して測定しました。
ベンチマークプログラムは、インテル C コンパイラー 12.0 でコンパイルし、SUSE Linux Enterprise
Server 11 SP1(64 ビット)で実行しました。
データ領域は 4,000 万個の要素で構成されます。これは約 305 MB に相当します。
プロセッサ コア GHz L3 キャッシュ メモリ周波数 TDP TRIAD [GB/s]
Xeon E5603 4 1.60 4 MB 1067 MHz 80 W 27.2
Xeon E5606 4 2.13 8 MB 1067 MHz 80 W 27.8
Xeon E5607 4 2.27 8 MB 1067 MHz 80 W 27.7
Xeon E5645 6 2.40 12 MB 1333 MHz 80 W 36.4
Xeon E5649 6 2.53 12 MB 1333 MHz 80 W 36.8
Xeon X5675 6 3.07 12 MB 1333 MHz 95 W 39.8
Xeon X5672 4 3.20 12 MB 1333 MHz 95 W 40.9
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
32/34 ページ © Fujitsu Technology Solutions 2010-2011
測定結果から、最大メモリ周波数が 1067 MHz のプロセッサと 1333 MHz のプロセッサの違いがはっきり
とわかります。6 コアのプロセッサでも、4 コアのプロセッサと同程度のスループットになっています。こ
れは、CPU あたり 4 スレッドで、メモリコントローラーの容量の上限に達しているためです。
次のグラフは、PRIMERGY BX620 S6 とその旧モデルである PRIMERGY BX620 S5 のスループットを、最
大パフォーマンス構成で比較したものです。
ベンチマーク環境
STREAM の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY BX620 S6 で行いました。
ハードウェア
モデル PRIMERGY BX620 S6
CPU Xeon E5603、E5606、E5607、E5645、E5649、X5672、X5675
コア数
2 チップ
Xeon E5603、E5606、E5607、X5672: 8 コア
その他すべて: 12 コア
1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり)
2 次キャッシュ 256 KB オンチップ(コアあたり)
その他のキャッシュ
Xeon E5603: 4 MB(命令 + データ)オンチップ(チップあたり)
Xeon E5606、E5607: 8 MB(命令 + データ)オンチップ(チップあたり)
その他すべて: 12 MB(命令 + データ)オンチップ(チップあたり)
メモリ 8 GB PC3-10600R DDR3-SDRAM × 6 枚
ソフトウェア
オペレーティング
システム SUSE Linux Enterprise Server 11 SP1(64 ビット)
コンパイラー インテル C コンパイラー 12.0
ベンチマーク Stream.c バージョン 5.9
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
STREAM TRIAD
0
5
10
15
20
25
30
35
40
45
PRIMERGY BX620 S52 × Xeon X5550
PRIMERGY BX620 S62 × Xeon X5672
35.5
40.9
GB/s
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
© Fujitsu Technology Solutions 2010-2011 33/34 ページ
関連資料
PRIMERGY システム
http://ts.fujitsu.com/primergy
PRIMERGY BX600 S3
データシート(英語)
http://docs.ts.fujitsu.com/dl.aspx?id=2d4e799b-8317-4d00-b58a-08ba1b4af170
PRIMERGY BX620 S6
データシート(英語)
http://docs.ts.fujitsu.com/dl.aspx?id=04a297dc-739d-40b9-9c71-f747b150e980
Xeon 5600(Westmere-EP)搭載システムのメモリパフォーマンス
http://docs.ts.fujitsu.com/dl.aspx?id=e88beb76-a61b-4fad-8081-9f941d12476b
RAID コントローラーのパフォーマンス
http://docs.ts.fujitsu.com/dl.aspx?id=38e25913-195d-4f59-9efa-adaa2478ad6b
単一ディスクのパフォーマンス
http://docs.ts.fujitsu.com/dl.aspx?id=de940140-2f25-4207-8862-563c4d91f30c
PRIMERGY のパフォーマンス
http://ts.fujitsu.com/products/standard_servers/primergy_bov.html
OLTP-2
ベンチマークの概要 OLTP-2
http://docs.ts.fujitsu.com/dl.aspx?id=9775e8b9-d222-49db-98b1-4796fbcd6d7a
SPECcpu2006
http://www.spec.org/osg/cpu2006
ベンチマークの概要 SPECcpu2006
http://docs.ts.fujitsu.com/dl.aspx?id=00b0bf10-8f75-435f-bb9b-3eceb5ce0157
SPECjbb2005
http://www.spec.org/jbb2005
ベンチマークの概要 SPECjbb2005
http://docs.ts.fujitsu.com/dl.aspx?id=18c15041-a25f-4d23-b0a5-5742dd5715ba
STREAM
http://www.cs.virginia.edu/stream/
vServCon
ベンチマークの概要 vServCon
http://docs.ts.fujitsu.com/dl.aspx?id=c3d5ce5d-5610-43c6-86b4-051549940a71
PC サーバ PRIMERGY(プライマジー)
http://jp.fujitsu.com/platform/server/primergy/
ホワイトペーパー パフォーマンスレポート PRIMERGY BX620 S6 バージョン: 2.0A 2011-12-21
34/34 ページ © Fujitsu Technology Solutions 2010-2011
お問い合わせ先
富士通テクノロジー・ソリューションズ
Web サイト:http://ts.fujitsu.com
PRIMERGY のパフォーマンスとベンチマーク
mailto:[email protected]
知的所有権を含むすべての権利は弊社に帰属します。製品データは変更される場合があります。納品までの時間は在庫状況によって異なります。データ
および図の完全性、事実性、または正確性について、弊社は一切の責任を負いません。本書に記載されているハードウェアおよびソフトウェアの名称
は、それぞれのメーカーの商標等である場合があります。第三者が各自の目的でこれらを使用した場合、当該所有者の権利を侵害することがあります。
詳細については、http://ts.fujitsu.com/terms_of_use.html を参照してください。
2011-12-21 WW JA Copyright © Fujitsu Technology Solutions GmbH 2010-2011