文書の過去の版を表示しています。
サーバの設定
- 多くのサイトでは、ファイルを書き換えて行う方法を紹介しているが、その場合、torque-server (pbs_server) を再起動する必要がある。
- ここでは qmgr によって設定 (動的に変更) する方法を紹介する
手順
- 新たにサーバプロファイルを作成 (このコマンドを実行すると torque_server が起動する)
$ sudo pbs_server -t create
- ノードの設定
- 4スレッドを持つ hoge というノードを追加する場合
$ sudo qmgr > create node hoge > set node hoge np=4 > set node hoge properties="cpu"
- CPU 2スレッド、GPU 1 ノードのノード fuga を追加する場合 (Torque 2.5.6, 3.0.2 移行のバージョンで指定可能)
$ sudo qmgr > create node fuga > set node fuga np=2 > set node fuga gpus=1 > set node fuga properties="gpu"
np
: CPU 数gpus
: GPU のノード数properties
:resources_default.neednodes
で指定する際に指定する任意の名前 (他のノードとひとまとめに指定できる)- 上記コマンドをノードの数だけ設定していく
- 設定は /var/spool/torque/server_priv/nodes に保存されていく (他のサイトで編集しているファイルと同じ)
- サーバやキューの設定
# # Create queues and set their attributes. # # # Create and define queue F # create queue F set queue F queue_type = Execution set queue F resources_default.ncpus = 1 set queue F resources_default.nodes = 1 set queue F enabled = True set queue F started = True # # Create and define queue Q2 # create queue Q2 set queue Q2 queue_type = Execution set queue Q2 max_running = 1 set queue Q2 resources_max.ncpus = 4 set queue Q2 resources_max.nodes = 1 set queue Q2 resources_default.ncpus = 1 set queue Q2 resources_default.nodes = 1 set queue Q2 resources_available.ncpus = 4 set queue Q2 resources_available.nodes = 1 set queue Q2 enabled = True set queue Q2 started = True # # Create and define queue Q4 # create queue Q4 set queue Q4 queue_type = Execution set queue Q4 max_running = 1 set queue Q4 resources_max.ncpus = 4 set queue Q4 resources_max.nodes = 1 set queue Q4 resources_default.ncpus = 1 set queue Q4 resources_default.nodes = 1 set queue Q4 resources_available.ncpus = 4 set queue Q4 resources_available.nodes = 1 set queue Q4 enabled = True set queue Q4 started = True # # Create and define queue Q1 # create queue Q1 set queue Q1 queue_type = Execution set queue Q1 max_running = 1 set queue Q1 resources_max.ncpus = 4 set queue Q1 resources_max.nodes = 1 set queue Q1 resources_default.ncpus = 1 set queue Q1 resources_default.nodes = 1 set queue Q1 resources_available.ncpus = 4 set queue Q1 resources_available.nodes = 1 set queue Q1 enabled = True set queue Q1 started = True # # Create and define queue Q3 # create queue Q3 set queue Q3 queue_type = Execution set queue Q3 max_running = 1 set queue Q3 resources_max.ncpus = 4 set queue Q3 resources_max.nodes = 1 set queue Q3 resources_default.ncpus = 1 set queue Q3 resources_default.nodes = 1 set queue Q3 resources_available.ncpus = 4 set queue Q3 resources_available.nodes = 1 set queue Q3 enabled = True set queue Q3 started = True # # Set server attributes. # set server scheduling = True set server default_queue = F set server log_events = 511 set server query_other_jobs = True set server scheduler_iteration = 600 set server node_check_rate = 150 set server tcp_timeout = 6 set server node_pack = False set server allow_node_submit = True
- F: 制限がないキュー
- Q1〜Q4: 1 ジョブしか流せないキュー
- キューファイルの例:
$ sudo service torque-server start $ sudo qmgr < queue.conf</code>