100 likes | 549 Views
CATH の分類について. 2003/11/18 稲田 稔. CATH. PDB のデータのうち , 以下に該当するものを除いたデータを分類の対象とする タンパク質でないもの α 炭素だけのモデル構造 構造解析の解像度が 3.0Å よりも悪いもの 上記のように選ばれたデータを , 次のような 4 つのグループに分類する Class(C) Architecture(A) Topology(T) Homologous Superfamily(H) これらの分類は C,A,T,H の順で階層的である. Class(C).
E N D
CATHの分類について 2003/11/18 稲田 稔
CATH • PDBのデータのうち, 以下に該当するものを除いたデータを分類の対象とする • タンパク質でないもの • α炭素だけのモデル構造 • 構造解析の解像度が3.0Åよりも悪いもの • 上記のように選ばれたデータを, 次のような4つのグループに分類する • Class(C) • Architecture(A) • Topology(T) • Homologous Superfamily(H) • これらの分類はC,A,T,Hの順で階層的である
Class(C) • タンパク質構造中の二次構造の構成による分類 • 既知構造の90%を分類することができ, 次のような3つのクラスがある • α主クラス(mainly-alpha) • β主クラス(mainly-beta) • αβクラス(mixed alpha-beta) • αへリックスとβストランドを交互にもつα/β構造と,αヘリックスで充填されているドメイン中に小さいβシートを持つα+βの構造の両方を含む • 先の3つのほかに, Few-Secondary Structureという分類もある • 二次構造が少ないものが分類されている
Architecture(A) • タンパク質のドメイン全体の形状を二次構造の適応度によって分類する • 二次構造間の結合は無視される • 二次構造の配置による分類
Topology(T) • 全体的な形状と二次構造の結合性の両方を考慮した分類 • 構造の類似性比較にはSSAPと呼ばれるアルゴリズムを用いる • SSAPのスコアが70以上, かつ2つのタンパク質の大きさを比べたとき, 小さなほうが大きなほうの大きさの少なくとも60%以上のとき, この2つのタンパク質は同じTの分類に入る
Homologous Superfamily(H) • 配列の相同性と構造の類似性の両方を考慮し, 共通の祖先を有すると考えられるものの分類 • 構造の類似性比較にはTopologyと同じくSSAPを用いる • 以下の3つの基準のうち, どれかひとつでも満たせば, それらのタンパク質は同じグループに分類される • 配列の相同性が35%以上, かつ小さいほうの大きさが大きいほうの60%以上 • SSAPのスコアが80.0以上,配列の相同性が20%以上,かつ小さいほうの大きさが大きいほうの60%以上 • SSAPのスコアが80.0以上, 小さいほうの大きさが大きいほうの60%以上, かつ似通った機能を持つ
CATHの分類 • CATH Code • c.a.t.hの順で数字を並べる • 例: DNA helicase RuvA subunit, C-terminal domainの場合 1.10.8.10 C A T H Helicase, Ruva Protein, domain 3 Orthogonal Bundle mainly-aipha DNA helicase RuvA subunit, C-terminal domain Up-down Bundle mainly-beta ・ ・ ・ ・ ・ ・ alpha-beta ・ ・ ・
そのほかの分類データベース • SCOP • PDBのデータをまず以下の7つのクラスに分類し, その後各クラス内でさらにfold, superfamily, familyに分類する • All alpha proteins • All beta proteins • Alpha and beta proteins (a/b) • Alpha and beta proteins (a+b) • Multi-domain proteins • Membrane and cell surface proteins • Small proteins • Enzyme • (酵素の)機能による分類
参考URL • CATH Protein Structure Classification Database • http://www.biochem.ucl.ac.uk/bsm/cath_new/index.html • General information on CATH • http://www.biochem.ucl.ac.uk/bsm/cath_new/cath_info.html • SCOP: Structural Classification of Proteins • http://scop.mrc-lmb.cam.ac.uk/scop/ • ExPASy - ENZYME • http://us.expasy.org/enzyme/