3世代のサーバの能力を検証してみた

ベンチマークソフトを使ってもいいけど、実際に仕事に使うスクリプトを処理するのにかかる時間を計測したほうが意味があるだろう。
ということで、試しにBAMファイルをcufflinksにかけて遺伝子発現量を算出させてみた。
処理してみたBAMファイルは
1, 4.4GBリード数74139744
2, 416KBリード数8653
3, 11KBリード数116
の3ファイル
サーバのスペックは
A, Intel(R) Xeon(R) CPU E3-1230 v6 @ 3.50GHz 4core 8thread mem:64GB
B, Intel(R) Xeon(R) CPU E5-2620 0 @ 2.00GHz 6core 12thread x 2 mem:16GB
C, Intel(R) Xeon(R) CPU E5630 @ 2.53GHz 4core 8thread x 2 mem:26GB

さて、

$ cat arrayjob180901.sh.o379-15 
18/09/01 21:58:26
[21:58:27] Loading reference annotation.
[21:58:29] Inspecting reads and determining fragment length distribution.
Processed 31122 loci.                       
> Map Properties:
>	Normalized Map Mass: 29205450.00
>	Raw Map Mass: 29205450.00
>	Fragment Length Distribution: Truncated Gaussian (default)
>	              Default Mean: 200
>	           Default Std Dev: 80
[22:00:12] Estimating transcript abundances.
Processed 31122 loci.                       
finish cufflinks
 
[22:02:38] Loading reference annotation.
[22:02:39] Inspecting reads and determining fragment length distribution.
Processed 31122 loci.                       
> Map Properties:
>	Normalized Map Mass: 8924.00
>	Raw Map Mass: 8924.00
>	Fragment Length Distribution: Truncated Gaussian (default)
>	              Default Mean: 200
>	           Default Std Dev: 80
[22:02:44] Estimating transcript abundances.
Processed 31122 loci.                       
finish cufflinks2

[22:03:03] Loading reference annotation.
[22:03:05] Inspecting reads and determining fragment length distribution.
Processed 31122 loci.                       
> Map Properties:
>	Normalized Map Mass: 2074.00
>	Raw Map Mass: 2074.00
>	Fragment Length Distribution: Truncated Gaussian (default)
>	              Default Mean: 200
>	           Default Std Dev: 80
[22:03:08] Estimating transcript abundances.
Processed 31122 loci.                       
finish cufflinks3
18/09/01 22:03:27
finish
18/09/01 22:03:27

こんな感じに処理は行われた。
A,
1, 4min11sec
2, 25sec
3, 24sec
total 5min1sec

B,
1, 5min59sec
2, 36sec
3, 33sec
total 8min10sec

C,
1, 6min41sec
2, 45sec
3, 42sec
total 8min10sec

データを書き込む処理などで実際に計算にかかった時間より余分がついてはいるがざっとこんな感じかな。
Bの24スレッドがあんまり伸びないのはメモリがボトルネックになっているのかもしれない。クロックも控えめだしな。
なんだかんだいって最新CPUが一番速いという当たり前のような結果となった。
まあそうじゃなかったら新しい機種がどんどん開発されている意味がないわな。

kuroの覚え書き

96の個人的覚え書き

3世代のサーバの能力を検証してみた