AlmaLinux
サブシステムをクラスタ化しようとしてちょっとハマった。 メインシステムはほぼ同じスペックで各ノード256GBメモリを積んでおり、特に問題なくSlurmがインストールできて NODELIST NODES PARTITION STATE CPUS S:C:T MEMORY TMP_DISK WEIGHT AVAIL_FE REASO…
サーバとして売られているPCにはたいていネットワークコネクタ(NIC)が2つ以上ついている。 場合によっては2つのNICを使ってネットワークをブリッジさせる目的に使われるが、多くは冗長化によるネットワークの安定を図る目的で使われていると思う。 チーミ…
Slurmを運用していて、原因不明で計算ノードが動かなくなった。 sinfoで確認すると # sinfo PARTITION AVAIL TIMELIMIT NODES STATE NODELIST work* up infinite 1 idle kk3 work* up infinite 2 down kk4,kk5みたいな感じ。 それぞれのノードでslurmdのステ…
あんまりRは得意ではないんですが、入れてくれという希望があったためAlmaLinuxに入れてみる。CentOS8にインストールした事例をいくつかみてみたところ $ sudo dnf install epel-release $ sudo dnf config-manager --set-enabled PowerToolsとしろ、と書か…
理研の玉田さんのSiGN-BNによるベイジアンネットワーク解析を利用させてもらっている。データサンプルとしてRNA-seqデータを投入しているのだが、久々にやり直してみようと思ったらうまく動かない。 実行履歴をもとに同じコマンドを投げても動かないのだ。ど…
私の用途としては大量のデータの処理、という方がメインなのでクラスタと言ってもノードをまたぐ並列処理よりもバッチシステムのほうがよく使う。しかしノードをまたぐような大規模解析も時々行うことがあって、これまではスパコンを使ってやっていた。せっ…
さて、サーバ間でユーザとディレクトリを共有できるようになったので、次にジョブスケジューラを導入してサーバクラスタとしたい。 これまでCentOS7ではTORQUEを使ってきたのだが、どうも8系以降ではインストールができないらしい。有料のSGEという選択肢…
新しいサーバマシンが導入されたため、環境をセットアップする。 これまでサーバはCentOS7を並列クラスタ、データベース用に使用し、AlphaFold2用GPUサーバに限ってUbuntu20.04をインストールしていた。 CentOS7のサポート期限が来年ということで、5年はあま…