77
日本蛋白質構造データバンク: PDBj の紹介とHPの使い方 中村春木 大阪大学蛋白質研究所 附属プロテオミクス総合研究センター 蛋白質情報科学研究室 http://www.pdbj.org/ DDBJing and PDBjing, 200532

DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

日本蛋白質構造データバンク: PDBjの紹介とHPの使い方

中村春木

大阪大学蛋白質研究所

附属プロテオミクス総合研究センター

蛋白質情報科学研究室

http://www.pdbj.org/

DDBJing and PDBjing, 2005年3月2日

Page 2: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

PDBjProtein Data Bank

Japanhttp://www.pdbj.org/

大阪大学蛋白質研究所 にて実施。

(独立法人)科学技術振興機構バイオインフォマティクス推進センター(http://www-bird.jst.go.jp/)がスポンサー

Page 3: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

PDB (Protein Data Bank): 蛋白質の立体(3次元)構造情報

原子種とその座標、アミノ酸残基、実験手法、実験時の情報、実験観測データ(構造因子)を整理して登録する。

X線結晶解析、核磁気共鳴法(NMR)、電子顕微鏡観測

蛋白質立体構造

Page 4: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

PDB (Protein Data Bank): 蛋白質の立体(3次元)構造情報

原子種とその座標、アミノ酸残基、実験手法、実験時の情報、実験観測データ(構造因子)を整理して登録する。

X線結晶解析、核磁気共鳴法(NMR)、電子顕微鏡観測

蛋白質立体構造(Rice dwarf Virus composed of 3,500,000 atoms (1UF2: By Nakagawa et al., 2003))

Page 5: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

日本蛋白質構造データバンク:PDBj1.国際蛋白質構造データバンク(wwPDB)の創設

と協力

2.蛋白質立体構造データベース登録作業

3.蛋白質構造情報の標準XML記述(PDBML)の開発とその応用

4.蛋白質構造解析実験および蛋白質機能に関する文献情報の付加

5.蛋白質立体構造に関する新規二次データベースの構築と解析ツールの開発

6.教育用蛋白質構造データベース(eProtS)の開発

Page 6: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

日本蛋白質構造データバンク(PDBj)の実施体制

代表研究者

研究チーム事務員

早大サブグループProMode

早稲田大学社会科学部

阪大情報科学サブグループPRT

阪大情報科学研究科

阪大・蛋白研サブグループeF-site, jV, MrPDB

阪大蛋白研

京大サブグループASH

京都大学化学研究所

阪大蛋白研附属プロテオミクス総合研究センター運営委員会・蛋白質立体構造データベース専門部会

月原冨武,長谷俊二,中村春木(阪大蛋白研)郷 信広(原研計算科学技術推進センター)甲斐 泰(阪大理学研究科)西村善文(横浜市大総合理学研究科)若槻壮市(高エ研構物質構造科学研究所)飯塚哲太郎(理研播磨研究所)

(以上H16-17年度)

wwPDB

新規蛋白質立体構造データベース(PDBML)構築

グループ

阪大蛋白研

解析システム開発と二次データベース構築グループ

PDBデータベース管理運営グループ

阪大蛋白研

BMRBデータベース管理運営グループ

阪大蛋白研

教育用蛋白質データベース作成公開グループ

阪大蛋白研

Page 7: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

日本蛋白質構造データバンク:PDBj1.国際蛋白質構造データバンク(wwPDB)の創設

と協力

2.蛋白質立体構造データベース登録作業

3.蛋白質構造情報の標準XML記述(PDBML)の開発とその応用

4.蛋白質構造解析実験および蛋白質機能に関する文献情報の付加

5.蛋白質立体構造に関する新規二次データベースの構築と解析ツールの開発

6.教育用蛋白質構造データベース(eProtS)の開発

Page 8: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 9: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

www.wwpdb.org

Page 10: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

Rutgers Univ.

UCSD NIST

大阪大学蛋白質研究所

PDBj

Research Collaboratory for Structural Bioinformatics

グラント支援

NSF

Dept. of Energy

NIH

国際蛋白質構造データバンク: wwPDB(world wideProtein Data Bank) 3万件の構造データ

European Bioinformatics

Institute (MSD-EBI)

JST-BIRD

グラント支援

構造ゲノムプロジェクト

新たな国際組織 wwPDB が2003年に創設。(Berman, Henrick & Nakamura (2003) Nat. Struct. Biol. 10, 980)

Page 11: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

Agreement signature

Nature Structure Biology (2003) Vol. 10, No.12

Page 12: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

RCSB-PDB Team

RCSB PDB Team: Ken Addess, Helen M. Berman, Wolfgang F. Bluhm, Phil Bourne, Kyle Burkhardt, Li Chen, Sharon Cousin, Jim Croker, Nita Deshpande, Shuchismita Dutta, Zukang Feng, Lew-Christiane Fernandez, Judith L. Flippen-Anderson, Gary Gilliland, Rachel Kramer Green, Vladimir Guranovic, Shri Jain, Ann Kagehiro, Charlie Knezevich, Andrei Kouranov, Kevin Lwinmoe, Jeff Merino-Ott, Irina Persikova, Suzanne Richman, Melcoir Rosas, Kathryn Rosecrans, BohdanSchneider, Wayne Townsend-Merino, Susan Van Arnum, Elizabeth Walker, John Westbrook, Alice Xenachis, Huanwang Yang, Jasmin Yang, Christine Zardecki, Cindy Zhang

www.pdb.org • [email protected]

Page 13: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

The MSD group at EBI

Harry Boutselakis search databaseDimitris Dimitropoulos MSDChem

Joel Fillon eHTPXAdel Golovin active site

Kim Henrick group leaderAyzaz Hussain PDB depositionsJohn Ionides NMR / data model

Melford John DBAPeter Keller deposition database

leaderEugene Krissinel MSDfold

Phil McNeil database developmentAvi Naim EM validation

Richard Newman EM / PDB depositions

Tom Oldfield search system leader

Anne Pajon NMR / data modelJorge Pineda database developmentAbdel-Krim Rachedi visualizationJanet Roser-Copeland outreachAndre Sitnov deposition system

Siamak Sobhany APIAntonio Suarez-Uruena mapping

Jawahar Swaminathan PDB depositions

Mohammed Tagari EM / deposition system

John Tate search systemSwen Tromm validation

Sameer Velankar search systemWim Vranken NMR

Page 14: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

S. Saeki, A. Takahashi, Y. Shimizu, K. KobayashiY. Ikegawa, R. Igawashi, Y. Kengaku, M. Kusunoki

H. Nakamura, C. Kamada, H. Sakamoto, D. Standley, T. Kosada, E. Nakatani

PDBj Team at Osaka

Page 15: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

S. Saeki, A. Takahashi, Y. Shimizu, K. KobayashiY. Ikegawa, R. Igawashi, Y. Kengaku, M. Kusunoki

H. Nakamura, C. Kamada, H. Sakamoto, D. Standley, T. Kosada, E. Nakatani

PDBj Team at Osaka

A. Paehler, R. Yamashita, A. Yoshihara, Y. Matsuki (BIRD-JST)

H. Akutsu (Institute for Protein Research, Osaka Univ.)

N. Ito (School of Biomedical Science, Tokyo Medical & Dental Univ.)

K. Kinoshita (Institute of Medical Science, Univ. Tokyo)

H. Wako (Waseda Univ.), S. Endo (Kitasato Univ.)

H. Toh (Institute for Chem. Research, Kyoto Univ.)

T. Okawa (Graduate School of Informatics Science, Osaka Univ.)

Page 16: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

wwPDBにおける国際協力

(Berman, Henrick & Nakamura (2003) Nat. Struct. Biol. 10, 980)

RutgersUniv.

UCSD

NIST

PDBjEBI

RCSB

1) 1ヶ所の “アーカイブ・キーパー(RCSB)”が管理を行う唯一のデータ・アーカイブ。

2) wwPDBメンバー内で、データフォーマットや記述法を

討議する。

3) データ編纂・編集・登録作業を全てのメンバーが行う。

4) 各メンバーはそれぞれ独自のビューアやAPI、サービス

の開発が望まれている。

Page 17: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

日本蛋白質構造データバンク:PDBj1.国際蛋白質構造データバンク(wwPDB)の創設

と協力

2.蛋白質立体構造データベース登録作業

3.蛋白質構造情報の標準XML記述(PDBML)の開発とその応用

4.蛋白質構造解析実験および蛋白質機能に関する文献情報の付加

5.蛋白質立体構造に関する新規二次データベースの構築と解析ツールの開発

6.教育用蛋白質構造データベース(eProtS)の開発

Page 18: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 19: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 20: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

PDBデータ登録作業の流れ

ADITによる登録手順

CoordinatesStr. Factors

Precheck

Validationcheck

TitleRelease date

Contact authorExp. Condition

etc

Deposit section

End of ADIT inputDisplay PDB id and

RCSB id

Revised PDB fileand Validation letter by an editor

Agree or not withthe revision

Reply agreement or not within 3 days

RegistrationCompleted

e-mail

YesNo

登録者 PDB編集者

ADITAuto Deposition

Input Tool

登録者の指定した公開時期

PDB検索サーバー

登録者の指定できる公開時期

・すぐ公開する。

・登録から半年後か1年後

・雑誌が出版された後

Page 21: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

PDBjにおけるデータ登録の変遷

アジア・オセアニア地域からのデータを中心に、世界全体の20% ~30%のデータの

登録が行われている。

year

Yearly wwPDB registration numberYearly PDBj registration number

Yea

rly

regi

stra

tion

num

ber

1972 75 80 85 90 95 00 2004

Monthly processed data in 2004

Month

Page 22: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

アジア・オセアニア地区Japan: 700Korea 47Singapore 9China: 75Hong Kong 6Taiwan 49India 62Australia 54New Zealand 17アジア・オセアニア地区のサブ・トータル: 1019

北米および南米地区USA 97Canada 30Brazil 5 Mexico 1北米および南米地区のサブ・トータル: 133

ヨーロッパAustria 7Belgium 8Sweden 20United Kingdom 45France 68Germany 128Denmark 18Italy 33Netherlands 7Israel 13Greece 8Spain 5Switzerland 43Finland 17Czech Republic 1Hungary 3Poland 3Portugal 1Slovenia 6

ヨーロッパからのサブ・トータル: 434

2004-01-01 ~ 2004-12-31における国別登録量の統計日本蛋白質構造データバンク(PDBj)での全登録数: 1586(世界全体での全登録数: 5501)

Page 23: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

日本蛋白質構造データバンク:PDBj1.国際蛋白質構造データバンク(wwPDB)の創設

と協力

2.蛋白質立体構造データベース登録作業

3.蛋白質構造情報の標準XML記述(PDBML)の開発とその応用

4.蛋白質構造解析実験および蛋白質機能に関する文献情報の付加

5.蛋白質立体構造に関する新規二次データベースの構築と解析ツールの開発

6.教育用蛋白質構造データベース(eProtS)の開発

Page 24: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 25: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 26: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.)

Page 27: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

PDB フォーマットファイルの例 (1)HEADER HYDROLASE 21-AUG-00 1FN8 TITLE FUSARIUM OXYSPORUM TRYPSIN AT ATOMIC RESOLUTION COMPND MOL_ID: 1; COMPND 2 MOLECULE: TRYPSIN; COMPND 3 CHAIN: A; COMPND 4 EC: 3.4.21.4; COMPND 5 MOL_ID: 2; COMPND 6 MOLECULE: GLY-ALA-ARG; COMPND 7 CHAIN: B; COMPND 8 ENGINEERED: YES SOURCE MOL_ID: 1; SOURCE 2 ORGANISM_SCIENTIFIC: FUSARIUM OXYSPORUM; SOURCE 3 ORGANISM_COMMON: FUNGUS; SOURCE 4 MOL_ID: 2; SOURCE 5 SYNTHETIC: YES KEYWDS BETA BARREL EXPDTA X-RAY DIFFRACTION AUTHOR W.R.RYPNIEWSKI,P.OESTERGAARD,M.NOERREGAARD-MADSEN,M.DAUTER, AUTHOR 2 K.S.WILSON REVDAT 1 07-FEB-01 1FN8 0 JRNL AUTH W.R.RYPNIEWSKI,P.OESTERGAARD,M.NOERREGAARD-MADSEN, JRNL AUTH 2 M.DAUTER,K.S.WILSON JRNL TITL FUSARIUM OXYSPORUM TRYPSIN AT ATOMIC RESOLUTION AT JRNL TITL 2 100 AND 283 K: A STUDY OF LIGAND BINDING JRNL REF ACTA CRYSTALLOGR., SECT.D V. 57 8 2001 JRNL REFN ASTM ABCRE6 DK ISSN 0907-4449

Page 28: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

CRYST1 58.390 86.700 46.270 90.00 90.00 90.00 P 21 21 2 4 ORIGX1 0.017126 0.000000 0.000000 0.00000ORIGX2 0.000000 0.011534 0.000000 0.00000 ORIGX3 0.000000 0.000000 0.021612 0.00000 SCALE1 0.017126 0.000000 0.000000 0.00000 SCALE2 0.000000 0.011534 0.000000 0.00000 SCALE3 0.000000 0.000000 0.021612 0.00000 ATOM 1 N PRO A 1 29.061 39.981 4.981 1.00 28.69 ATOM 2 CA PRO A 1 29.970 38.922 4.561 1.00 29.08 ATOM 3 C PRO A 1 29.325 38.106 3.429 1.00 29.19 ATOM 4 O PRO A 1 28.097 38.168 3.298 1.00 29.87 ATOM 5 CB PRO A 1 30.106 38.013 5.789 1.00 29.07 ATOM 6 CG PRO A 1 28.749 38.112 6.413 1.00 28.59 ATOM 7 CD PRO A 1 28.387 39.600 6.246 1.00 29.21 ATOM 8 N GLN A 2 30.153 37.412 2.681 1.00 28.13 ATOM 9 CA GLN A 2 29.636 36.572 1.593 1.00 27.95 ATOM 10 C GLN A 2 29.861 35.139 2.082 1.00 27.28 ATOM 11 O GLN A 2 31.038 34.773 2.266 1.00 27.61 ATOM 12 CB GLN A 2 30.373 36.787 0.305 1.00 28.43 ATOM 13 CG GLN A 2 30.346 35.501 -0.539 1.00 29.40 ATOM 14 CD GLN A 2 30.921 35.844 -1.899 1.00 29.51 ATOM 15 OE1 GLN A 2 31.894 35.283 -2.340 1.00 30.56 ATOM 16 NE2 GLN A 2 30.288 36.839 -2.518 1.00 30.01

PDB フォーマットファイルの例 (2)

Page 29: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

PDBフォーマットにおける問題

1. “固定フォーマット”の限界

2. “異なるフォーマットの混在”による混乱

3. 著者定義における不統一性

アミノ酸残基番号における例

-90-91-91A-91B-92-93- (挿入)-90-91-92-96-97-98- (削除)-90-91-92·····96-97-98- (flexible部分で観測されない)

データ検証が困難 データ品質管理上の問題が残る。

Page 30: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

PDBML: PDBデータ記述のカノニカル XML

PDBML設計のための留意点:• “Macromolecular Crystallographic Information

Format (mmCIF)” をテンプレートとして利用する。

• mmCIFの包括的な辞書における名前と構造をできるだけ用いる。

• DTDではなく、さらにいろいろな記述が可能な XML Schema を採用する。

(Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics,in press)

Page 31: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

テンプレートとしてのmmCIF(macromolecular Crystallographic Information Format)

mmCIF は、 name とvalueからなるデータ項目からできており、XMLにおけるelements (tag とcontent) との対応性がよいため、PDBフォーマットから XMLのテンプレートとするのではなく、mmCIFをXMLのテンプレートとする。

_name value↓

<tag> content </tag>

Page 32: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

_entry.id 1GOF_cell.length_a 98.000_cell.length_b 89.400_cell.length_c 86.700_cell.angle_alpha 90.00_cell.angle_beta 117.80_cell.angle_gamma 90.00_symmetry.space_group_name_H-M 'C 2 '

loop__atom_site.label_seq_id_atom_site.group_PDB_atom_site.type_symbol _atom_site.label_atom_id _atom_site.label_comp_id _atom_site.auth_seq_id _atom_site.label_asym_id _atom_site.Cartn_x _atom_site.Cartn_y _atom_site.Cartn_z _atom_site.occupancy_atom_site.B_iso_or_equiv_atom_site.id1 ATOM N N ALA 1 A 38.840 0.236 1.012 1.00 34.65 11 ATOM C CA ALA 1 A 38.356 -0.999 0.357 1.00 42.26 21 ATOM C C ALA 1 A 37.098 -1.547 1.056 1.00 41.25 31 ATOM O O ALA 1 A 36.619 -0.946 2.028 1.00 29.44 41 ATOM C CB ALA 1 A 39.398 -2.114 0.379 1.00 40.70 52 ATOM N N SER 2 A 36.610 -2.666 0.495 1.00 32.67 62 ATOM C CA SER 2 A 35.411 -3.244 1.202 1.00 34.90 72 ATOM C C SER 2 A 35.683 -4.740 1.081 1.00 38.30 82 ATOM O O SER 2 A 36.827 -5.147 0.747 1.00 28.59 92 ATOM C CB SER 2 A 34.063 -2.660 0.823 1.00 24.49 102 ATOM O OG SER 2 A 33.031 -3.308 1.686 1.00 20.37 11

mmCIF の記述例

Page 33: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

PDBML の記述例(1)HELIX 1 1 ILE A 7 PRO A 19 1 6

<PDBx:struct_confCategory><PDBx:struct_conf id="HELX_P1">

<PDBx:conf_type_id>HELX_P</PDBx:conf_type_id><PDBx:pdbx_PDB_helix_id>H1</PDBx:pdbx_PDB_helix_id><PDBx:beg_label_comp_id>ILE</PDBx:beg_label_comp_id><PDBx:beg_label_asym_id>A</PDBx:beg_label_asym_id><PDBx:beg_label_seq_id>7</PDBx:beg_label_seq_id><PDBx:end_label_comp_id>PRO</PDBx:end_label_comp_id><PDBx:end_label_asym_id>A</PDBx:end_label_asym_id><PDBx:end_label_seq_id>19</PDBx:end_label_seq_id><PDBx:beg_auth_comp_id>ILE</PDBx:beg_auth_comp_id><PDBx:beg_auth_asym_id>A</PDBx:beg_auth_asym_id><PDBx:beg_auth_seq_id>7</PDBx:beg_auth_seq_id><PDBx:end_auth_comp_id>PRO</PDBx:end_auth_comp_id><PDBx:end_auth_asym_id>A</PDBx:end_auth_asym_id><PDBx:end_auth_seq_id>19</PDBx:end_auth_seq_id><PDBx:pdbx_PDB_helix_class>1</PDBx:pdbx_PDB_helix_class><PDBx:details>3/10 CONFORMATION RES 17,19</PDBx:details><PDBx:pdbx_PDB_helix_length>13</PDBx:pdbx_PDB_helix_length>

</PDBx:struct_conf>

Page 34: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

<PDBx:atom_siteCategory><PDBx:atom_site id="1">

<PDBx:group_PDB>ATOM</PDBx:group_PDB><PDBx:type_symbol>N</PDBx:type_symbol><PDBx:label_atom_id>N</PDBx:label_atom_id><PDBx:label_comp_id>THR</PDBx:label_comp_id><PDBx:label_asym_id>A</PDBx:label_asym_id><PDBx:label_entity_id>1</PDBx:label_entity_id><PDBx:label_seq_id>1</PDBx:label_seq_id><PDBx:Cartn_x>17.047</PDBx:Cartn_x><PDBx:Cartn_y>14.099</PDBx:Cartn_y><PDBx:Cartn_z>3.625</PDBx:Cartn_z><PDBx:occupancy>1.00</PDBx:occupancy><PDBx:B_iso_or_equiv>13.79</PDBx:B_iso_or_equiv><PDBx:auth_seq_id>1</PDBx:auth_seq_id><PDBx:auth_comp_id>THR</PDBx:auth_comp_id><PDBx:auth_asym_id>A</PDBx:auth_asym_id><PDBx:auth_atom_id>N</PDBx:auth_atom_id><PDBx:pdbx_PDB_model_num>1</PDBx:pdbx_PDB_model_num>

</PDBx:atom_site>

<atom_record id="1">ATOM 1 A A 1 1 ? . THR THR N N N 17.047 14.099 3.625 1.00 13.79</atom_record>

Full-tag記述 (all)

原子座標のみ別ファイル(no-atom & ext-atom)

PDBMLの記述例(2)

Page 35: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 36: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 37: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 38: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 39: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 40: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 41: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 42: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 43: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 44: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

インタラクティブな分子グラフィック表示を RasMol タイプのコマンドで実行(ソースコード公開).

スタンドアローンとしても、JAVAに

よりアプレットとしても利用できる。

XMLで定義されるポリゴンが

表示され操作される。

PDBML ファイル(all & ext-atom)

をパースできる。

http://www.pdbj.org/PDBjViewer/

PDBjViewer or jV

Page 45: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 46: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 47: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 48: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

PDBMLplus データベースシステム

PDBML(noatom)

PDBMLplus

Web server

XSLT processor

downloader

Loader

RCSB

XML-DB

PDBMLplus

PDBMLplusF

download(FTP)

FTP server

Internet

GNETSwisprot

PIRGenBank

EBICATRES

Function/Source

Information

Get/Input Tools

CATRESData

AnnotationData

AddInformation

Filtering(error cut etc…)

PDBMLplus

PDBMLplusF

xPSSS

Page 49: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

日本蛋白質構造データバンク:PDBj1.国際蛋白質構造データバンク(wwPDB)の創設

と協力

2.蛋白質立体構造データベース登録作業

3.蛋白質構造情報の標準XML記述(PDBML)の開発とその応用

4.蛋白質構造解析実験および蛋白質機能に関する文献情報の付加

5.蛋白質立体構造に関する新規二次データベースの構築と解析ツールの開発

6.教育用蛋白質構造データベース(eProtS)の開発

Page 50: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

オリジナルのPDBデータに対する

追加情報の付加。

現状のPDBファイルには、実験条件や実験

手法等、多くの情報が欠落している。また、

アミノ酸残基および原子レベルでの機能情報

が記述されているのはまれである。

そこで、拡張が容易であるXML記述の特性

を生かして、 文献や他のデータベースからそ

れらの情報を、アノテータが追加している。

Page 51: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

欠落している実験データの付加

<exptl><method>SYNCHROTRON RADIATION</method><crystal id="1"><grow auth_validate="N" update_id="6"><method auth_validate="N" update_id="6">Microdialysis</method><temp auth_validate="N" unit="&amp;#x2103;" update_id="6">4</temp><pH auth_validate="N" update_id="6">4</pH>

</grow><grow_comp id="1" auth_validate="N" update_id="6"><sol_id auth_validate="N" update_id="6">1</sol_id><name auth_validate="N" type="common name" update_id="6">protein</name><conc auth_validate="N" unit="mg/ml" update_id="6">13</conc>

</grow_comp><grow_comp id="2" auth_validate="N" update_id="6"><sol_id auth_validate="N" update_id="6">2</sol_id><name auth_validate="N" type="common name" update_id="6">ammonium sulphate</name><conc auth_validate="N" unit="%sat" update_id="6">70</conc>

</grow_comp>::</crystal>

</exptl>

Page 52: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 53: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

機能データの追加

<struct><site id="CATRES1" auth_validate="N" info_subtype="catalytic"

info_type="CATRES" update_id="2"><num_residues>3</num_residues><details>a catalytic site defined by CATRESS, Medline 98100076</details><site_gen nid="1"><label_comp_id>ARG</label_comp_id><label_asym_id>1</label_asym_id><label_seq_id>100</label_seq_id><details>transition-state stabilisation. stabilise negatively charged tetrahedral intermediate</details>

</site_gen><site_gen nid="2"><label_comp_id>ASP</label_comp_id><label_asym_id>1</label_asym_id><label_seq_id>46</label_seq_id><details>acid/base, transition-state stabilisation. stabilisespositively charged NH3+ part of intermediate, then as a base removes proton from this, leading to collapse and formation of asn</details>

</site_gen><site_gen nid="3"><label_comp_id>GLN</label_comp_id> <label_asym_id>1</label_asym_id><label_seq_id>116</label_seq_id><details>transition-state stabilisation. stabilise negatively charged tetrahedral intermediate</details>

</site_gen></site>

</struct>

Page 54: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 55: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 56: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

PDBの全登録数 29,101GO (Genome Ontology) 情報(Biological Process, Molecular Function, Cellular Component)

20,066

文献情報からの抽出情報 11,066eF-siteからの機能情報 10,033Swiss-Protからの機能情報(ACT_SITE, BINDING, DNA_BIND, NP_BIND, ZN_FING, TRANSMEM)

14,417

CATRES –EBI-からの機能情報

extCATERS (ホモロジー解析による追加)

1712,433

Medline 文献情報 25,335

xPSSSにおいて追加された情報

(January 2005)

Page 57: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

12AS(Asn Synthetase)の機能情報検索を行うXPath サーチ

Page 58: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

SOAP (Simple Object Access Protocol) の利用例% ./sample1.pl "/datablock[@datablockName='12AS-noatom']/struct_site_genCategory/ struct_site_gen[@info_subtype='catalytic']" 50<struct_site_gen auth_validate="N" info_subtype="catalytic" info_type="CATRES" ino:id="71" nid="1" site_id="CATRES1" update_id="1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">

<label_comp_id>ARG</label_comp_id><label_asym_id>A<label_asym_id></label_asym_id><label_seq_id>100<label_seq_id></label_seq_id><details>transition-state stabilisation. stabilise negatively charged

tetrahedral intermediate</details></struct_site_gen><struct_site_gen auth_validate="N" info_subtype="catalytic" info_type="CATRES" ino:id="71" nid="2" site_id="CATRES1" update_id="1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">

<label_comp_id>ASP</label_comp_id><label_asym_id>A<label_asym_id></label_asym_id><label_seq_id>46<label_seq_id></label_seq_id><details>acid/base, transition-state stabilisation. stabilises positively

charged NH3+ part of intermediate, then as a base removes proton from this, leading to collapse and formation of asn</details></struct_site_gen><struct_site_gen auth_validate="N" info_subtype="catalytic" info_type="CATRES" ino:id="71" nid="3" site_id="CATRES1" update_id="1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">

<label_comp_id>GLN</label_comp_id><label_asym_id>A<label_asym_id></label_asym_id><label_seq_id>116<label_seq_id></label_seq_id><details>transition-state stabilisation. stabilise negatively charged

tetrahedral intermediate</details></struct_site_gen>

Page 59: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

日本蛋白質構造データバンク:PDBj1.国際蛋白質構造データバンク(wwPDB)の創設

と協力

2.蛋白質立体構造データベース登録作業

3.蛋白質構造情報の標準XML記述(PDBML)の開発とその応用

4.蛋白質構造解析実験および蛋白質機能に関する文献情報の付加

5.蛋白質立体構造に関する新規二次データベースの構築と解析ツールの開発

6.教育用蛋白質構造データベース(eProtS)の開発

Page 60: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

Protein Molecular Surface Database,eF-site (Kinoshita & Nakamura)

Protein Dynamics Database, ProMode(Wako & Endo)

Alignment of Structural Homologues, ASH(Standley & Toh)

Encyclopedia of Protein Structures, eProtS(Ito & Nakamura)

Sequence Navigator & Structure Navigator (Standley)

Development of Secondary Databases

Page 61: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 62: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

eF-site database http://www.pdbj.org/eF-site

eF-siteelectrostatic-surface of

Functional siteantibody (103)prosite (5399)ActiveSite (5042)Membrane (51)Binding site (15,480)

as a total: 19,121 entries without redundancy

Kinoshita et al., J. Struct. Funct. Genomics 2, 9-22 (2002)Kinoshita & Nakamura, Bioinformatics (2004) in press.

Page 63: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 64: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 65: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 66: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 67: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 68: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 69: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

ASHアラインメント結果の表示例配列・構造統合アラインメントの設定画面

ASH: Alignment of Structural Homologues

Page 70: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 71: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 72: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 73: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

NER: Number of Equivalent ResiduesStandley, Toh, Nakamura (2004) PROTEINS 57, 381-391

Page 74: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 75: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例

日本蛋白質構造データバンク:PDBj1.国際蛋白質構造データバンク(wwPDB)の創設

と協力

2.蛋白質立体構造データベース登録作業

3.蛋白質構造情報の標準XML記述(PDBML)の開発とその応用

4.蛋白質構造解析実験および蛋白質機能に関する文献情報の付加

5.蛋白質立体構造に関する新規二次データベースの構築と解析ツールの開発

6.教育用蛋白質構造データベース(eProtS)の開発

Page 76: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例
Page 77: DDBJing and PDBjing, 2005年3月2日 - PDB Japan - …2005/03/02  · PDBML (Westbrook, Ito, Nakamura, Henrick, Berman (2004) Bioinformatics, in press.) PDB フォーマットファイルの例