PDB ファイル
概要
- Protein Data Bank で提供されている生体分子の 3 次元構造データのフォーマット。
フォーマット
- 公式:
- 参考:
- 各行の先頭 6 文字は、その行で記述されている内容の種類を示している。
ATOM
: 構造を構成する原子情報が記述された行HETATM
: 一般的な生体分子 (タンパク質や核酸) ではない、低分子などの原子情報が記述された行TER
: chain (一連のアミノ酸残基やヌクレオチド) の区切りを示す行END
: .pdb ファイルの終了を示す行MODEL
: 複数の配座が登録されている際の配座の開始を示す行ENDMDL
: 複数の配座が登録されている際の配座の終了を示す行
ATOM
行やHETATM
行は、文字数 (x 文字目〜y 文字目) にそれぞれの情報が記述されている。下記表記で、1-6 とある場合、1 文字目から 6 文字目を意味する。- 1-6:
ATOM
やHETATM
などの行の種類 (左寄せ) - 7-11: 原子インデックス (各原子に付けられた通し番号; 右寄せ)
- 13-16: 原子名 (元素名ではない; 各残基・各ヌクレオチド内の原子に付けられた固有名; 右寄せ)
- 18-20: 残基・ヌクレオチド名
- 22: chain ID (一連の残基・ヌクレオチドに付けられた ID)
- 23-26: 残基・ヌクレオチドインデックス (各残基・各ヌクレオチドに付けられた通し番号)
- 31-38: 原子の座標 x (小数点以下 3 桁; 右寄せ)
- 39-46: 原子の座標 y (小数点以下 3 桁; 右寄せ)
- 47-54: 原子の座標 z (小数点以下 3 桁; 右寄せ)
- 55-60: 占有率 occupancy (残基内で複数の配座の可能性がある場合の存在確率; 小数点以下 2 桁)
- 61-66: tempFactor (結晶内での動きの大きさ; 小数点以下 2 桁; 右寄せ)
- 77-78: 元素名 (右寄せ)
- 79-80: 電荷
- 残基名・ヌクレオチド名
- アミノ酸残基:
- アミノ酸の 3 文字表記の大文字で示される。
- 特殊なアミノ酸残基:
- ASH: 中性電荷 ASP
- CYX: S-S 結合している CYS
- SYM: 負電荷 CYS
- GLH: 中性電荷 GLU
- HIP: 正電荷 HIS
- HID: 中性電荷で、HD1 水素が付加されている HIS
- HIE: 中性電荷で、HE2 水素が付加されている HIS
- LYN: 中性電荷 LYS
- TYM: 負電荷 TYR
- DNA ヌクレオチド:
- 塩基の 1 文字表記の前に D が付く。例: DA (アデニン塩基のヌクレオチド)
- 5'-末端は末尾に 5 が付く。例: DA5 (5'-末端のアデニン塩基のヌクレオチド)
- 3'-末端は末尾に 3 が付く。例: DA3 (3'-末端のアデニン塩基のヌクレオチド)
- RNA リボヌクレオチド:
- 塩基の 1 文字表記のみの場合と、塩基表記の前に R が付く場合がある。例: アデニン塩基のヌクレオチドの場合は A あるいは RA
- 5'-末端は末尾に 5 が付く。例: A5 あるいは RA5 (5'-末端のアデニン塩基のヌクレオチド)
- 3'-末端は末尾に 3 が付く。例: A3 あるいは RA3 (3'-末端のアデニン塩基のヌクレオチド)
見出し
参考サイト
- 特殊残基: PDB2PQR Programmer Guide