クラスタを使用してpythonコードを実行

782 ワード

クラスタには4台のホストがあり、master(GPUなし)、node 01、node 02、node 03(GPUホスト)、python main.pyプログラムを直接実行してCPUで実行します.
プログラムを実行するには、次の手順に従います.
ファイルディレクトリの下にlsf.shファイルを新規作成し、本文を書き込みます.

#!/bin/sh                   

#BSUB -q normal       

#BSUB -o %J.out

#BSUB -e %J.err

#BSUB -n 1 

#BSUB -J JOBNAME

#BSUB  -R span[ptile=1]   

#BSUB -m "node03"         

#BSUB  -gpu  num=1         


python main.py 

python main.pyはプログラムを実行するコマンドです.source activate conda
環境を開くbsub
プログラムを実行することができます.端末はあなたにタスク番号をあげます.出力ファイルは .out .errです.
**その他のコマンド:**bjobs -Wタスクの実行状況を確認しますbhosts -gpuクラスタGPUの使用状況を表示します.