====== PDB ファイル ====== ===== 概要 ===== * Protein Data Bank で提供されている生体分子の 3 次元構造データのフォーマット。 ===== フォーマット ===== * 公式: * [[https://www.wwpdb.org/documentation/file-format-content/format33/v3.3.html | Atomic Coordinate Entry Format Version 3.3]] * 参考: * [[https://www.cgl.ucsf.edu/chimera/docs/UsersGuide/tutorials/pdbintro.html | Introduction to Protein Data Bank Format]] * 各行の先頭 6 文字は、その行で記述されている内容の種類を示している。 * ''ATOM'': 構造を構成する原子情報が記述された行 * ''HETATM'': 一般的な生体分子 (タンパク質や核酸) ではない、低分子などの原子情報が記述された行 * ''TER'': chain (一連のアミノ酸残基やヌクレオチド) の区切りを示す行 * ''END'': .pdb ファイルの終了を示す行 * ''MODEL'': 複数の配座が登録されている際の配座の開始を示す行 * ''ENDMDL'': 複数の配座が登録されている際の配座の終了を示す行 * ''ATOM'' 行や ''HETATM'' 行は、文字数 (x 文字目〜y 文字目) にそれぞれの情報が記述されている。下記表記で、1-6 とある場合、1 文字目から 6 文字目を意味する。 * 1-6: ''ATOM'' や ''HETATM'' などの行の種類 (左寄せ) * 7-11: 原子インデックス (各原子に付けられた通し番号; 右寄せ) * 13-16: 原子名 (元素名ではない; 各残基・各ヌクレオチド内の原子に付けられた固有名; 右寄せ) * 18-20: 残基・ヌクレオチド名 * 22: chain ID (一連の残基・ヌクレオチドに付けられた ID) * 23-26: 残基・ヌクレオチドインデックス (各残基・各ヌクレオチドに付けられた通し番号) * 31-38: 原子の座標 x (小数点以下 3 桁; 右寄せ) * 39-46: 原子の座標 y (小数点以下 3 桁; 右寄せ) * 47-54: 原子の座標 z (小数点以下 3 桁; 右寄せ) * 55-60: 占有率 occupancy (残基内で複数の配座の可能性がある場合の存在確率; 小数点以下 2 桁) * 61-66: tempFactor (結晶内での動きの大きさ; 小数点以下 2 桁; 右寄せ) * 77-78: 元素名 (右寄せ) * 79-80: 電荷 * 残基名・ヌクレオチド名 * アミノ酸残基: * アミノ酸の 3 文字表記の大文字で示される。 * 特殊なアミノ酸残基: * ASH: 中性電荷 ASP * CYX: S-S 結合している CYS * SYM: 負電荷 CYS * GLH: 中性電荷 GLU * HIP: 正電荷 HIS * HID: 中性電荷で、HD1 水素が付加されている HIS * HIE: 中性電荷で、HE2 水素が付加されている HIS * LYN: 中性電荷 LYS * TYM: 負電荷 TYR * DNA ヌクレオチド: * 塩基の 1 文字表記の前に D が付く。例: DA (アデニン塩基のヌクレオチド) * 5'-末端は末尾に 5 が付く。例: DA5 (5'-末端のアデニン塩基のヌクレオチド) * 3'-末端は末尾に 3 が付く。例: DA3 (3'-末端のアデニン塩基のヌクレオチド) * RNA リボヌクレオチド: * 塩基の 1 文字表記のみの場合と、塩基表記の前に R が付く場合がある。例: アデニン塩基のヌクレオチドの場合は A あるいは RA * 5'-末端は末尾に 5 が付く。例: A5 あるいは RA5 (5'-末端のアデニン塩基のヌクレオチド) * 3'-末端は末尾に 3 が付く。例: A3 あるいは RA3 (3'-末端のアデニン塩基のヌクレオチド) ===== 見出し ===== ===== 参考サイト ===== * 特殊残基: [[https://ics.uci.edu/~dock/pdb2pqr/programmerguide.html | PDB2PQR Programmer Guide]] {{tag>Linux サーバ 分子シミュレーション}}