文書の過去の版を表示しています。
apt-getによる導入
サーバ側(サーバでもジョブを処理させる場合)
- インストール
- サーバでもジョブを処理させる場合
$ sudo apt-get install torque-server torque-mom torque-client torque-scheduler
- 起動中の torque を終了させる
- 起動中の torque を確認
$ ps -e | grep pbs
- root 権限で終了させる (service コマンドの stop や kill) する
$ sudo service torque-mom stop $ sudo service torque-scheduler stop $ sudo service torque-server stop
※service コマンドで torque-server が終了しない場合
$ sudo kill 24277
24277 は、pbs_server の PID で
ps -e | grep pbs
で確認する
- 設定ディレクトリの設定
$ sudo mkdir /var/spool/torque/server_priv $ sudo chmod 777 /var/spool/torque/spool /var/spool/torque/undelivered $ sudo chmod o+t /var/spool/torque/spool /var/spool/torque/undelivered
- サーバ名の設定
$ sudoedit /etc/torque/server_name
ホスト名を入れる
- 新たにサーバプロファイルを作成 (このコマンドを実行すると torque_server が起動する)
$ sudo pbs_server -t create
- ノードの設定
$ ps -e | grep pbs $ sudo kill xxxxx $ sudoedit /var/spool/torque/server_priv/nodes
- 中には
ノード名 np=CPU数
、さらに必要であれば名前
を列挙していく (名前はresources_default.neednodes
で指定する際に便利) - 例:
server np=8 node1 np=4 fast node2 np=4 fast node3 np=2 slow
- ホスト名の設定
$ sudoedit /etc/hosts
- 127.0.0.1 は localhost からホスト名に変更
- 127.0.1.1 はコメントアウト
- ノードのホスト名も入れていく
- サーバやキューの設定 (設定ファイルを読み込ませる)
$ sudo service torque-server start $ sudo qmgr < queue.conf
- 設定ファイル (queue.conf) は以下の通り
- queue.conf
# # Create queues and set their attributes. # # # Create and define queue F # create queue F set queue F queue_type = Execution set queue F resources_default.ncpus = 1 set queue F resources_default.nodes = 1 set queue F enabled = True set queue F started = True # # Create and define queue Q2 # create queue Q2 set queue Q2 queue_type = Execution set queue Q2 max_running = 1 set queue Q2 resources_max.ncpus = 4 set queue Q2 resources_max.nodes = 1 set queue Q2 resources_default.ncpus = 1 set queue Q2 resources_default.nodes = 1 set queue Q2 resources_available.ncpus = 4 set queue Q2 resources_available.nodes = 1 set queue Q2 enabled = True set queue Q2 started = True # # Create and define queue Q4 # create queue Q4 set queue Q4 queue_type = Execution set queue Q4 max_running = 1 set queue Q4 resources_max.ncpus = 4 set queue Q4 resources_max.nodes = 1 set queue Q4 resources_default.ncpus = 1 set queue Q4 resources_default.nodes = 1 set queue Q4 resources_available.ncpus = 4 set queue Q4 resources_available.nodes = 1 set queue Q4 enabled = True set queue Q4 started = True # # Create and define queue Q1 # create queue Q1 set queue Q1 queue_type = Execution set queue Q1 max_running = 1 set queue Q1 resources_max.ncpus = 4 set queue Q1 resources_max.nodes = 1 set queue Q1 resources_default.ncpus = 1 set queue Q1 resources_default.nodes = 1 set queue Q1 resources_available.ncpus = 4 set queue Q1 resources_available.nodes = 1 set queue Q1 enabled = True set queue Q1 started = True # # Create and define queue Q3 # create queue Q3 set queue Q3 queue_type = Execution set queue Q3 max_running = 1 set queue Q3 resources_max.ncpus = 4 set queue Q3 resources_max.nodes = 1 set queue Q3 resources_default.ncpus = 1 set queue Q3 resources_default.nodes = 1 set queue Q3 resources_available.ncpus = 4 set queue Q3 resources_available.nodes = 1 set queue Q3 enabled = True set queue Q3 started = True # # Set server attributes. # set server scheduling = True set server default_queue = F set server log_events = 511 set server query_other_jobs = True set server scheduler_iteration = 600 set server node_check_rate = 150 set server tcp_timeout = 6 set server node_pack = False set server allow_node_submit = True
- F: 制限がないキュー
- Q1〜Q4: 1 ジョブしか流せないキュー
- 起動
$ sudo service torque-scheduler start $ sudo service torque-mom start
- サーバ名の確認
$ qstat -q
- サーバの設定状況の確認
$ pbsnodes -a
- テスト
$ echo "sleep 30" | qsub $ qstat
サーバ側 (サーバでジョブを処理させない場合)
- インストール
$ sudo apt-get install torque-server torque-scheduler
- 起動中の torque を終了させる
- 起動中の torque を確認
$ ps -e | grep pbs
- root 権限で終了させる (service コマンドの stop や kill) する
$ sudo service torque-scheduler stop $ sudo service torque-server stop
※service コマンドで torque-server が終了しない場合
$ sudo kill 24277
24277 は、pbs_server の PID で
ps -e | grep pbs
で確認する
- 設定ディレクトリの設定
$ sudo mkdir /var/spool/torque/server_priv $ sudo chmod 777 /var/spool/torque/spool /var/spool/torque/undelivered $ sudo chmod o+t /var/spool/torque/spool /var/spool/torque/undelivered
- サーバ名の設定
$ sudoedit /etc/torque/server_name
ホスト名を入れる
- 新たにサーバプロファイルを作成 (このコマンドを実行すると torque_server が起動する)
$ sudo pbs_server -t create
- ノードの設定
$ ps -e | grep pbs $ sudo kill xxxxx $ sudoedit /var/spool/torque/server_priv/nodes
- 中には
ノード名 np=CPU数
、さらに必要であれば名前
を列挙していく (名前はresources_default.neednodes
で指定する際に便利) - 例:
server np=8 node1 np=4 fast node2 np=4 fast node3 np=2 slow
- ホスト名の設定
$ sudoedit /etc/hosts
- 127.0.0.1 は localhost からホスト名に変更
- 127.0.1.1 はコメントアウト
- ノードのホスト名も入れていく
- サーバやキューの設定 (設定ファイルを読み込ませる)
$ sudo service torque-server start $ sudo qmgr < queue.conf
queue.conf は「サーバ側(サーバでもジョブを処理させる場合」セクションの queue.conf を参照
- 起動
$ sudo service torque-scheduler start $ sudo service torque-mom start
- サーバ名の確認
$ qstat -q
- サーバの設定状況の確認
$ pbsnodes -a
- テスト
$ echo "sleep 30" | qsub $ qstat
ノード側
- インストール
$ sudo apt-get install torque-mom torque-client
- サーバ名の変更
$ sudoedit /var/spool/torque/server_name
サーバ名を記入
- ホスト名の設定
$ sudoedit /etc/hosts
- 127.0.0.1 は localhost からホスト名に変更
- 127.0.1.1 はコメントアウト
- ノードのホスト名も入れていく
- 再起動
$ sudo service torque-mom restart
- サーバ名の確認
$ qstat -q
- サーバの設定状況の確認
$ pbsnodes -a