分子シミュレーション関連:環境構築:torque_旧pbs

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン 前のリビジョン
次のリビジョン
前のリビジョン
分子シミュレーション関連:環境構築:torque_旧pbs [2016/07/19 12:17] mumeiyamibito分子シミュレーション関連:環境構築:torque_旧pbs [2016/11/25 12:17] (現在) – 以前のリビジョンを復元 (2016/10/12 17:14) mumeiyamibito
行 41: 行 41:
   * ジョブの保留解除\\ <code bash>$ qrls ジョブID1 ジョブID2 ...</code>   * ジョブの保留解除\\ <code bash>$ qrls ジョブID1 ジョブID2 ...</code>
   * ジョブの実行\\ <code bash>$ qrun ジョブID1 ジョブID2 ...</code>   * ジョブの実行\\ <code bash>$ qrun ジョブID1 ジョブID2 ...</code>
-  * キューの変更\\ <code bash>$ qmove 変更後のキュー名 ジョブID</code>+  * キューの変更\\ <code bash>$ qmove 変更後のキュー名 ジョブID1 ジョブID2 ...</code> 
 +  * ジョブの属性変更\\ <code bash>$ qalter [投入時の属性オプション] ジョブID1 ジョブID2 ...</code> 
 +    * ''投入時の属性オプション'' とは、qsub に与えた ''-l'' や ''-j''、''-m''、''-N'' などのノードやジョブタイトルなどの属性 (詳しくは、[[#ジョブファイル | ジョブオプション]] を参照) 
 +    * qhold してから qalter、qrls して使うと良い 
 +    * ただし、ジョブ内容は変更できない (例えば、特定のノードでのみ有効なジョブコマンドを属性変更したノード先では使えないし、ジョブが ''mpirun -n 16'' で 16 CPU 使うのに対し、''ppn=4'' で 4 CPU に変更したりするとエラーで落ちるので注意)
   * ジョブにシグナルを送信\\ <code bash>$ qsig -s シグナル ジョブID</code>   * ジョブにシグナルを送信\\ <code bash>$ qsig -s シグナル ジョブID</code>
     * STOP: ジョブのサスペンド(ジョブを終了することなく、CPU を空ける; ただし、torque としては CPU が空くわけではないので、次のジョブは実行されない)     * STOP: ジョブのサスペンド(ジョブを終了することなく、CPU を空ける; ただし、torque としては CPU が空くわけではないので、次のジョブは実行されない)
行 90: 行 94:
     * 特定のバージョンしか扱えない (Ubuntu 14.04 で 2.4.16)     * 特定のバージョンしか扱えない (Ubuntu 14.04 で 2.4.16)
       * 2016/07/19 現在、最新版は 6.0.1 であるため、相当古い。       * 2016/07/19 現在、最新版は 6.0.1 であるため、相当古い。
-      * GPU に対応しているのは、2.5.6, 3.0.2 移行のバージョンであるため、リポジトリにあるものでは GPU マシンへジョブを投入できない。 +      * GPU に対応しているのは、2.5.6, 3.0.2 移行のバージョンであるため、リポジトリにあるものでは GPU マシンへジョブを投入できない。(ノードリストに gpus が入っていると segfault する) 
-  [[分子シミュレーション関連/環境構築/Torque (旧PBS)/apt-getによる導入|導入手順]]+  [[分子シミュレーション関連/環境構築/Torque (旧PBS)/apt-getによる導入|導入手順]] 
 +  - [[分子シミュレーション関連/環境構築/Torque (旧PBS)/サーバの設定|サーバの設定]] 
 ==== コンパイルによる導入 ==== ==== コンパイルによる導入 ====
 +  * ソースからコンパイル、インストールする方法
   * 長所   * 長所
     * 最新版や特定のバージョンが使える     * 最新版や特定のバージョンが使える
行 100: 行 107:
       * 依存関係などを調べる必要がある       * 依存関係などを調べる必要がある
     * 設定項目が環境に依存する     * 設定項目が環境に依存する
-  [[分子シミュレーション関連/環境構築/Torque (旧PBS)/コンパイルによる導入|導入手順]] +  [[分子シミュレーション関連/環境構築/Torque (旧PBS)/コンパイルによる導入|導入手順]] 
 +  - [[分子シミュレーション関連/環境構築/Torque (旧PBS)/サーバの設定|サーバの設定]]
  
 ===== キューの設定項目 ===== ===== キューの設定項目 =====
-==== サーバ設定 ==== 
-''set server ...'' で始まる項目 
- 
-^  項目  ^  意味  ^  値 (太字がデフォルト)  ^ 
-|scheduling|スケジューリングの有効化|true or false| 
-|default_queue|デフォルトのキューを設定| | 
-|log_events|ログの出力内容| | 
-|query_other_jobs|root以外のユーザが他人のジョブを閲覧する許可|true or **false**| 
-|scheduler_iteration|?| | 
-|node_check_rate|ノードが死亡していると判断するまでの時間(秒)|整数値 (**600**)| 
-|tcp_timeout|pbs_serverとpbs_mon間のTCPソケットのタイムアウト時間(秒)|整数値 (**8**)| 
-|node_pack|1つのノードを埋めてから次のノードを利用するか|true or false| 
-|allow_node_submit|ノードからのジョブ投入の許可|true or **false**| 
-|keep_completed|完了後キューの中に留めておく時間(秒)|整数値 (**0**)| 
- 
-=== キュー設定 === 
-''set queue キュー名 ...'' で始まる項目 
- 
-^  項目  ^  意味  ^  値 (太字がデフォルト)  ^ 
-|queue_type|キュータイプ| execution(e) or route(r)| 
-|resources_default.ncpus|デフォルトで指定されるCPU数| | 
-|resources_default.nodes|デフォルトで指定されるノード数| | 
-|resources_default.neednodes|使用するノードを指定 (nodes ファイルで指定した名前)| | 
-|enabled|ジョブの受け入れ(このキューでのジョブ投入を許可するか)|true or **false**| 
-|started|ジョブを実行するか(falseならhold状態で投入される)|true or **false**| 
- 
-  * 参考サイト: 特定のノードの指定 [[http://hydro.iis.u-tokyo.ac.jp/~kei/?plugin=attach&refer=IT%20memo%2Flinuxmemo4&openfile=103-Torque%E5%8F%96%E6%89%B1%E8%AA%AC%E6%98%8E.pdf | untitled - http://hydro.iis.u-tokyo.ac.jp/~kei/?plugin=attach&refer=IT%20memo%2Flinuxmemo4&openfile=103-Torque%E5%8F%96%E6%89%B1%E8%AA%AC%E6%98%8E.pdf]] 
-  * 参考サイト: 特定のノードの指定 [[http://docs.adaptivecomputing.com/torque/archive/3-0-2/4.1queueconfig.php | neednodes]] 
  
 ===== ノードの追加 ===== ===== ノードの追加 =====
行 141: 行 120:
 > set node ノード名 properties = 名前 > set node ノード名 properties = 名前
 > quit</code> > quit</code>
-この後に、''qnodes -a'' を実行すると、ノードが追加されたことが分かる他、/var/spool/torque/server_priv/nodes を見ると、追記されている。+  * GPU マシンの場合、さらに ''set node ノード名 gpus = GPU数'' を実行すると GPU の設定ができる (ただし、Torque 2.5.6, 3.0.2 以降に限る) 
 +  * この後に、''qnodes -a'' を実行すると、ノードが追加されたことが分かる他、/var/spool/torque/server_priv/nodes を見ると、追記されている。
   * これを応用すると、実行中のキュー以外のキューをサーバプログラムを止めることなく、変更することができる。   * これを応用すると、実行中のキュー以外のキューをサーバプログラムを止めることなく、変更することができる。
  
行 147: 行 127:
  
 ===== その他 ===== ===== その他 =====
-  * qmgr の設定を表示\\ <code bash>$ echo 'p s' | sudo qmgr</code> 
-    * '''p s''' は '''print server''' でも可 
   * 長時間ジョブを別々のキューで走らせた時に後方にある一方のキューが動かない   * 長時間ジョブを別々のキューで走らせた時に後方にある一方のキューが動かない
     * 例:     * 例:
行 174: 行 152:
  
 ===== 参考サイト ===== ===== 参考サイト =====
-  * [[http://tech.ckme.co.jp/torque.shtml | TORQUEの導入・設定:tech.ckme.co.jp]] インストールなど 
-  * [[http://docs.adaptivecomputing.com/torque/4-0-2/Content/topics/4-serverPolicies/queueAttributes.htm | Queue attributes]] qmgr キューの設定 
-  * [[http://docs.adaptivecomputing.com/torque/3-0-5/a.bserverparameters.php | ]] qmgr サーバ設定 
-  * [[http://wiki.epii.jp/%E3%82%BD%E3%83%95%E3%83%88%E3%82%A6%E3%82%A7%E3%82%A2/TORQUE | ソフトウェア/TORQUE - epii's Wiki]] qmgr サーバ設定 
   * [[http://www.nas.nasa.gov/hecc/support/kb/commonly-used-qsub-options-in-pbs-scripts-or-in-the-qsub-command-line_175.html | Commonly Used QSUB Options in PBS Scripts or in the QSUB Command Line - HECC Knowledge Base]] ジョブファイルオプション   * [[http://www.nas.nasa.gov/hecc/support/kb/commonly-used-qsub-options-in-pbs-scripts-or-in-the-qsub-command-line_175.html | Commonly Used QSUB Options in PBS Scripts or in the QSUB Command Line - HECC Knowledge Base]] ジョブファイルオプション
 +  * 特定のノードにのみジョブを流す [[http://docs.adaptivecomputing.com/torque/4-1-3/Content/topics/3-nodes/nodeProperties.htm | Node properties]]
 +
 +{{tag>Linux サーバ 分子シミュレーション}}
  • 分子シミュレーション関連/環境構築/torque_旧pbs.1468898258.txt.gz
  • 最終更新: 2016/07/19 12:17
  • (外部編集)