AWSとスパコンを比較する方法-スパコン用ベンチマークソフトを動かしてみる


前に、お手元のマシンとスパコンを比較する方法と言うなんともアホっぽい記事を書いた。更に思った。Amazon EC2の最もCPUが高いマシンと、比べてみたらどうだろうか?
実際のスパコンは、メモリーやストレージ性能も段違いなので、あまり真に受けないように。

AWS c4.8xlarge でLINPACK ベンチマークを動かす。

という訳で、AWSで最もCPUが早そうなマシンを使って、スパコンと性能の比較をしてみる。

今回使用したマシンはこちら

c4.8xlarge

モデル vCPU メモリ
c4.8xlarge 36core 60GB

ベンチマークソフトの入手は、前回の実験を参考。

LINPACKベンチ実行

$ ./runme_xeon64

と実行すれば、ベンチマークが走る

実行結果


ubuntu@ip-*-*-*-*:~/l_mklb_p_11.3.1.002/benchmarks_11.3.1/linux/mkl/benchmarks/linpack$ ./runme_xeon64
This is a SAMPLE run script for SMP LINPACK. Change it to reflect
the correct number of CPUs/threads, problem input files, etc..
./runme_xeon64: 37: [: -gt: unexpected operator
Fri Nov 13 11:26:24 UTC 2015
Intel(R) Optimized LINPACK Benchmark data

Current date/time: Fri Nov 13 11:26:24 2015

CPU frequency:    3.126 GHz
Number of CPUs: 2
Number of cores: 18
Number of threads: 36

Parameters are set to:

Number of tests: 15

中略

Performance Summary (GFlops)

Size   LDA    Align.  Average  Maximal
1000   1000   4       111.9889 130.8526
2000   2000   4       238.4829 241.5401
5000   5008   4       339.5006 343.8180
10000  10000  4       504.4043 507.6466
15000  15000  4       561.8308 568.8488
18000  18008  4       605.1949 607.6225
20000  20016  4       612.9355 612.9947
22000  22008  4       616.1507 618.2845
25000  25000  4       625.9232 626.5519
26000  26000  4       629.0290 629.1309
27000  27000  4       629.0215 629.0215
30000  30000  1       630.3005 630.3005
35000  35000  1       631.0244 631.0244
40000  40000  1       642.6358 642.6358
45000  45000  1       634.4839 634.4839

Residual checks PASSED

End of tests

Done: Fri Nov 13 11:38:43 UTC 2015

長いので省略した。全部の結果はこちらのgistにある .

結果を見ると、630GFlops位になりそうだ。

ちなみに、その時にCPUの使用率はこんなもん。

効率的に各CPUを使えているみたいだ。

スパコンと比べると

先の記事を参考にすると、京コンピュータの実効性能は、10510TFlopsだそうだ。

10,510TFlopsは10,510,000GFlopsなので、10,510,000/630より約16682倍になり、約16000倍くらいの性能のようだ。

こちらによると、1996年の11月のTOP1よりは性能が良いようだ。Rmaxを見れば良いらしい。

システム名 rMax(GFlops)
Center for Computational Sciences, University of Tsukuba Japan 368.2
aws c4.8xlarge 630

次のランキングでは、Sandia National Laboratories United Statesが突如、1,068.0GFlopsを叩きだした。

ちなみに、先の程の記事で、MacBookPro(core-i5-2.5GB)の性能を計測しており、その性能は37GFlops位なので、630/37は17倍位になり、aws c4.8xlargeは17倍くらい高性能だと考えられ、まあそんなもんかなと言う気がする(小数演算の性能しか比べていないので本当の性能比較はもっと複雑です・・)。