94
生物代謝物データベースKNApSAcK Family DB:多目的利用に向けて 金谷重彦平井晶 高橋弘喜 中村由紀子 Md.Altaf-Ul-Amin 中村建介 奈良先端科学技術大学院大学・情報科学研究科 計算システムズ生物学研究室 630-0101 生駒市高山町8916-5 講演で出てきた主要なURLは以下です KNApSAcK Family: Integrated Metabolite.Plant Species Databases for Multifaceted Plant Research http://kanaya.naist.jp/KNApSAcK_Family/ KNApSAcK: A Comprehensive Species-Metabolite Relationship Database http://kanaya.naist.jp/KNApSAcK/ 詳細情報は Afendi, F.M. et al.,Plant Cell Physiol. 53:e1(1-12),2012を参照ください。

Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

生物代謝物データベースKNApSAcK Family DB:多目的利用に向けて 金谷重彦† 平井晶 高橋弘喜 中村由紀子 Md.Altaf-Ul-Amin 中村建介 奈良先端科学技術大学院大学・情報科学研究科 計算システムズ生物学研究室 〒630-0101 生駒市高山町8916-5 講演で出てきた主要なURLは以下です KNApSAcK Family: Integrated Metabolite.Plant Species Databases for Multifaceted Plant Research http://kanaya.naist.jp/KNApSAcK_Family/ KNApSAcK: A Comprehensive Species-Metabolite Relationship Database http://kanaya.naist.jp/KNApSAcK/ 詳細情報は Afendi, F.M. et al.,Plant Cell Physiol. 53:e1(1-12),2012を参照ください。

Page 2: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

1

メタボロミクス統合データベースの活用法

奈良先端科学技術大学院大学・情報科学研究科

計算システムズ生物学研究室 金谷重彦

[0]ゲノム科学とその応用

[1]KNApSAcK DBの現状

[2]食履歴/漢方データベース

[3]世界の薬用植物

[4]DB複雑系

shibata
テキストボックス
生物代謝物データベースKNApSAcK Family DB:多目的利用に向けて 金谷重彦† 平井晶 高橋弘喜 中村由紀子 Md.Altaf-Ul-Amin 中村建介 奈良先端科学技術大学院大学・情報科学研究科 計算システムズ生物学研究室 〒630-0101 生駒市高山町8916-5 講演で出てきた主要なURLは以下です KNApSAcK Family: Integrated Metabolite.Plant Species Databases for Multifaceted Plant Research http://kanaya.naist.jp/KNApSAcK_Family/ KNApSAcK: A Comprehensive Species-Metabolite Relationship Database http://kanaya.naist.jp/KNApSAcK/ 詳細情報は Afendi, F.M. et al.,Plant Cell Physiol. 53:e1(1-12),2012を参照ください。
Page 3: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

2

(嫌気性)

古細菌

(好気性)

真正細菌

Nature Cell Biol., 3,210-214 (2001)

酵母

Page 4: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

細胞の働きと遺伝子の関係を研究してノーベル賞を受けたシドニー・ブレンナー氏は、来日した時こんな冗談を言った。 「DNAは何の訳だと思う?」 本村 有紀子著 「理系思考 分からないから面白い」 毎日新聞社(2007)

Page 5: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

細胞の働きと遺伝子の関係を研究してノーベル賞を受けたシドニー・ブレンナー氏は、来日した時こんな冗談を言った。 「DNAは何の訳だと思う?」 Don’t (K)Now Anything. 何もわかならいってこと」。DNAだけですべて説明できるほど、人間は単純じゃない。だからおもしろい。」 本村 有紀子著 「理系思考 分からないから面白い」 毎日新聞社(2007)

Page 6: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

5

[0]バイオインフォマティクス

a

b c

d e f g

h i k m

j l

5’

5’ 3’

3’

A B C D E F G H I J K L M Protein

A B C D E F

G H I J K L M Function

Unit

代謝物 1 代謝物2 代謝物3

代謝物4

Metabolite 5

Metabolite 6

B C

D E F

I L

H K Metabolic Pathway

G

Activation (+) A

G Repression (-)

a b c

d e f g h i k m

j l 5’

5’ 3’ 3’

ゲノム:

トランスクリプトーム:

プロテオーム

メタボローム

FT-MS

生体要素

(ゲノム, mRNAs,

たんぱく質, 代謝物)

生命をシステムとして理解

(Systems Biology)

生物間の関係

(Survival Strategy)

Page 7: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

6

配合 メタボロミクス 生物 生理活性 機能性 プロテオミクス

トランスクリプトミクス

有用生物 ヒト

・・・

・・・

・・・

・・・

・・・

・・・

・・・

・・・

薬用・食用

知識ベース

メタボロミクス プロテオミクス

トランスクリプトミクス

ヒト-生物関係システムズバイオロジー

生物システムズバイオロジー ヒトシステムバイオロジー

オミックス研究をヒト-生物の関係に拡張すると…

Okada, T., Afendi, FM., Amin, M., Takahashi, H., Nakamura, K., Kanaya, S.,

Current Computer Aided Drug Design, 179-196, 10, (2010)

Page 8: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

7

有用生物 ヒト

・・・

・・・

・・・

・・・

・・・

・・・

・・・

・・・

薬用・食用

知識ベース

NMNN

M

M

xxx

xxx

xxx

...

............

...

...

21

22221

12111

X

各階層の要素間の関係

主成分分析法

自己組織化マッピング

DPClus

Intra-omcis analysis

配合 メタボロミクス 生物 生理活性 機能性 プロテオミクス

トランスクリプトミクス メタボロミクス プロテオミクス

トランスクリプトミクス

Page 9: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

8

BL-SOM

(Batch-learning Self-organizing Mapping)

一括学習型 自己組織化地図

Page 10: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

9

時系列データ

0.01

0.1

1

10

1 2

T j

Time

Growth curve

DTDjDD

iTijii

Tj

Tj

xxxx

xxxx

xxxx

xxxx

......

..................

......

..................

......

......

21

21

222221

111211

D

i

Gene

Gene

Gene

Gene

...

...

2

1

Expression profiles

When we measure time-series microarray, gene expression profile is represented by a matrix

SOM makes it possible to examine gene similarity and stage similarity simultaneously.

実験 1 2 …. j … T

実験 1 2 …. j … T

Gene1

Gene2

Genei

GeneD

Page 11: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

10

時系列データ

0.01

0.1

1

10

1 2

T j

Time

Growth curve

DTDjDD

iTijii

Tj

Tj

xxxx

xxxx

xxxx

xxxx

......

..................

......

..................

......

......

21

21

222221

111211

D

i

Gene

Gene

Gene

Gene

...

...

2

1

Expression profiles

When we measure time-series microarray, gene expression profile is represented by a matrix

SOM makes it possible to examine gene similarity and stage similarity simultaneously.

実験 1 2 …. j … T

… …

実験間比較

STATES

State-Transition

実験 1 2 …. j … T

Gene1

Gene2

Genei

GeneD

Page 12: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

11

時系列データ

0.01

0.1

1

10

1 2

T j

Time

Growth curve

DTDjDD

iTijii

Tj

Tj

xxxx

xxxx

xxxx

xxxx

......

..................

......

..................

......

......

21

21

222221

111211

D

i

Gene

Gene

Gene

Gene

...

...

2

1

Expression profiles

When we measure time-series microarray, gene expression profile is represented by a matrix

SOM makes it possible to examine gene similarity and stage similarity simultaneously.

実験 1 2 …. j … T

遺伝子間比較

STATES

State-Transition

実験 1 2 …. j … T

Gene1

Gene2

Genei

GeneD

Page 13: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

12

時系列データ

0.01

0.1

1

10

1 2

T j

Time

Growth curve

DTDjDD

iTijii

Tj

Tj

xxxx

xxxx

xxxx

xxxx

......

..................

......

..................

......

......

21

21

222221

111211

D

i

Gene

Gene

Gene

Gene

...

...

2

1

Expression profiles

実験 1 2 …. j … T

… …

多変量解析

自己組織化法(BL-SOM).

http://kanaya.aist-nara.ac.jp/SOM/

実験 1 2 …. j … T

Gene1

Gene2

Genei

GeneD

実験間比較

遺伝子間比較

Page 14: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

13

X2

X1

XT

自己組織化法(BL-SOM)

Gene i (xi1,xi2,..,xiT)

DTDjDD

iTijii

Tj

Tj

xxxx

xxxx

xxxx

xxxx

......

..................

......

..................

......

......

21

21

222221

111211

D

i

Gene

Gene

Gene

Gene

...

...

2

1

D

i

x

x

x

x

...

...

2

1

T, different time-series microarray experiments

Page 15: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

14

X2

X1

XT

自己組織化法(BL-SOM) 1.格子点ベクトルの構築

Page 16: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

15

X2

X1

XT

自己組織化法(BL-SOM) 1.格子点ベクトルの構築

2.遺伝子の格子点への分類

Gene i (xi1,xi2,..,xiT)

Page 17: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

16

X2

X1

XT

自己組織化法(BL-SOM)

Xk> Th.(k)

Xk< -Th.(k)

X1 (Time 1)

X2 (Time 2)

X3 (Time 3)

XT (Time T)

(ex.)

…..

…..

…..

k=1,2,…,T

1.格子点ベクトルの構築

2.遺伝子の格子点への分類

3.実験ごとの発現プロファ

イルの視覚化(特徴マップの作成)

Page 18: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

17

Feature Maps from time 1 to T

自己組織化法(BL-SOM)

特徴地図の比較

X1 (Time 1)

X2 (Time 2)

X3 (Time 3)

XT (Time T)

…..

…..

…..

State

Transition

…..

…..

1.格子点ベクトルの構築

2.遺伝子の格子点への分類

3.実験ごとの発現プロファ

イルの視覚化(特徴マップの作成)

4.遷移点の検出

Page 19: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

18

解析例1

(トランスクリプトーム・メタボローム解析を中心に)

Bacillus subtilis (LB medium) における発現プロファイル解析

Stage 1 2 3 4 5 6 7 8

(min)

Cell Density

(OD600 )

0.001

0.01

0.1

1

10

-1000

0

-2000

1

2

3 4

8 7 6 5

LB

P-value estimated by Bayesian statistics

0 200 400 600 800 1000

Low prob.

High prob.

(Morioka, R.et al., BMC. Bioinformatics (2007) )

トランスクリプトームでは、生育曲線における対数増殖期後期はすでに定常期に入っている。

Page 20: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

19

解析例2

Page 21: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

20

解析例3

PCA

BL-SOM

Page 22: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

21

Inter-omics analysis

NMNN

M

M

xxx

xxx

xxx

...

............

...

...

21

22221

12111

X

各層間の関係

Partial Least Square

多変量回帰分析

判別分析

Ny

y

y

...

2

1

y

Xfy

機能性,生理活性. 薬用植物の組み合せ、植物成分

有用生物 ヒト

・・・

・・・

・・・

・・・

・・・

・・・

・・・

・・・

薬用・食用

知識ベース

配合 メタボロミクス 生物 生理活性 機能性 プロテオミクス

トランスクリプトミクス メタボロミクス プロテオミクス

トランスクリプトミクス

Page 23: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

22

Prescription

Proteome

Interactome

Transcriptome Metabolomics Medicinal Herb.

・・・

Physiological

Activity

・・・

Therapeutic

Usage ・・・

・・・

Metabolomics

・・・

・・・

・・・

Proteome

Interactome

Transcriptome

・・・

Plant Omics Human Omics

Co

nn

ect

wit

h T

her

ap

euti

c U

sag

e

Co

nn

ect

wit

h P

hy

sio

log

ica

l A

ctiv

ity

Plant-Human interaction

Traditional & Modern

Knowledge of Medicinal

Plants

Mixed herbs.

FARRIT (Indonesia)

Consistency Examination of plant to efficacy assignment using Bootstrap

Page 24: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

Modeling Ingredient of Jamu to Predict Its

Efficacy

Y(efficacy)= a1 X1 +…+ aj Xj +….+ aM XM

1. Urinary related problems

2. Disorders of appetite

3. Disorders of mood and behavior

4. Gastrointestinal disorders

5. Female reproductive organ problems

6. Musculoskeletal and connective tissue disorders

7. Respiratory disease

8. Pain/inflammation Respiratory disease

9. Wounds and skin infection

xij = 1 if jth medicinal plant is used in ith jamu.

xij = 0 no use

yj = 1 if ith jamu has a targeted efficacy.

yi = 0

Page 25: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

Modeling Ingredient of Jamu to Predict Its

Efficacy

• PLS model yields 71.6% of total correct classification.

Systematical understand of herbal usage of Jamu

Selection of Main Herbs: 95%

reconstruction of herbal usage

Page 26: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

25

配合 メタボロミクス 生物 生理活性 機能性 プロテオミクス

トランスクリプトミクス

有用生物 ヒト

・・・

・・・

・・・

・・・

・・・

・・・

・・・

・・・

薬用・食用

知識ベース

メタボロミクス プロテオミクス

トランスクリプトミクス

1.データ前処理技術

DrDMASS, TREBAX

2.要素技術

DPClus (Network clustering)

BL-SOM,

PCA,

PLS,

….

http://kanaya.naist.jp/Web/JTop.html

Page 27: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

26

・・・

・・・

・・・

・・・

・・・

・・・

・・・

・・・

Co

nn

ect

wit

h T

her

ap

euti

c U

sag

e

Co

nn

ect

wit

h P

hy

sio

log

ica

l A

ctiv

ity

伝統知識と現代的知識の融合: KNApSAcK Family データベースをつくろう!

222ヵ国:

50,000対の薬用植物と使用国の関係

709種の食用生物

336種の漢方処方

278種生薬

5310の配合処方

1133種生薬

50048種の代謝物

101500対の生物種-代謝物の関係

配合 メタボロミクス 薬用植物 生理活性 治療法 プロテオミクス

トランスクリプトミクス

植物/微生物Omicis ヒトOmics 薬用・食用

知識ベース

メタボロミクス プロテオミクス

トランスクリプトミクス

5034対の代謝物-生物活性の関係

Page 28: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

配合 メタボロミクス 薬用植物 生理活性 機能性 プロテオミクス

トランスクリプトミクス

植物 ヒト

・・・

・・・

・・・

・・・

・・・

・・・

・・・

・・・

薬用・食用

知識ベース

メタボロミクス プロテオミクス

トランスクリプトミクス

生物種・代謝物DB

[1]KNApSAcK: 生物種-代謝物関係データベース

Page 29: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

28

課題

[0]ゲノム科学とその応用

[1]KNApSAcK DBの現状

[2]食履歴/漢方データベース

[3]世界の薬用植物

[4]DB複雑系

Page 30: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

29

0

600

±1 ±0.1 ±0.01 ±0.001

候補分子式の数

精密分子量: 226.0477

251

32 1

Chorismic acid Isochorismic acid

597

FT-MS 分子の精密分子量を測定できる (ppm)]

KNApSAcK: 生物種-代謝物関係データベース

±1 ±0.1 ±0.01 ±0.001

分子式 候補代謝物

Since 2004

(Mw margin )

C10H10O6

LTQ-Orbitrap MS

high accurate MW for

metabolites <5ppm

resolution: 30,000

(FWHM @ m/z 400)

HCD Collision Cell )

Page 31: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

30

[1] Metabolomics

代謝物 1 代謝物 2 代謝物 3

代謝物 4

代謝物 5

代謝物 6

B C

D E F

I L

H K

Interpretation of Metabolome

生物種

分子量と分子式

フラグメンテーションパターン

代謝物情報

生物種 代謝物

生物サンプル

Experimental Information

MS

代謝経路推定

生物種-代謝物DB

Page 32: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

31

[1] Metabolomics

代謝物 1 代謝物 2 代謝物 3

代謝物 4

代謝物 5

代謝物 6

B C

D E F

I L

H K

Interpretation of Metabolome

生物種

分子量と分子式

フラグメンテーションパターン

代謝物情報

生物種 代謝物

生物サンプル

生物種-代謝物DB

Experimental Information

MS

代謝経路推定

PNAS, 101, 10205-10210,(2004)

1年/ 2 研究者 (Bottleneck)

MS 3日

Page 33: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

32

KNApSAcK: Species-Metabolite Relation DBの構築

Since 2004

生物種 代謝物

Page 34: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

33

データ入力履歴

0

5,000

10,000

15,000

20,000

25,000

30,000

35,000

40,000

45,000

50,000

2004 2005 2006 2007 2008 2009 2010

4月 ?月

代謝物数

逐次入力システム

Page 35: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

34

データ入力履歴

0

5,000

10,000

15,000

20,000

25,000

30,000

35,000

40,000

45,000

50,000

2004 2005 2006 2007 2008 2009 2010

4月 ?月

代謝物数

逐次入力システム

Page 36: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

35

データ入力履歴

0

5,000

10,000

15,000

20,000

25,000

30,000

35,000

40,000

45,000

50,000

2004 2005 2006 2007 2008 2009 2010

4月 ?月

代謝物数

逐次入力システム

Page 37: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

36

データ入力履歴

0

5,000

10,000

15,000

20,000

25,000

30,000

35,000

40,000

45,000

50,000

2004 2005 2006 2007 2008 2009 2010

4月 ?月

代謝物数

逐次入力システム

Page 38: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

37

データ入力履歴

0

5,000

10,000

15,000

20,000

25,000

30,000

35,000

40,000

45,000

50,000

2004 2005 2006 2007 2008 2009 2010

4月 ?月

代謝物数

逐次入力システム 一括入力システム

Page 39: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

38

データ入力履歴

0

5,000

10,000

15,000

20,000

25,000

30,000

35,000

40,000

45,000

50,000

2004 2005 2006 2007 2008 2009 2010

一括入力システム

重複チェックシステム

4月 ?月

代謝物数

Page 40: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

39

データ入力履歴

0

5,000

10,000

15,000

20,000

25,000

30,000

35,000

40,000

45,000

50,000

2004 2005 2006 2007 2008 2009 2010

一括入力システム

重複チェックシステム

4月 ?月

代謝物数

Page 41: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

40

データ入力履歴

0

5,000

10,000

15,000

20,000

25,000

30,000

35,000

40,000

45,000

50,000

2004 2005 2006 2007 2008 2009 2010

一括入力システム

重複チェックシステム

4月 ?月

代謝物数 49,553/2010.3年

Page 42: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

41

データ入力履歴

0

5,000

10,000

15,000

20,000

25,000

30,000

35,000

40,000

45,000

50,000

2004 2005 2006 2007 2008 2009 2010

一括入力システム

重複チェックシステム

4月 ?月

代謝物数

50,054代謝物

102,009 生物種-代謝物関係

/2010.3年

ノウハウの蓄積

Page 43: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

42

データ入力履歴

0

5,000

10,000

15,000

20,000

25,000

30,000

35,000

40,000

45,000

50,000

2004 2005 2006 2007 2008 2009 2010

一括入力システム

重複チェックシステム

4月 ?月

代謝物数

50,054代謝物

102,009 生物種-代謝物関係

/2010.3年

ノウハウの蓄積

データベースを維持すると

男の修行がよくわかる。

「苦

しいこともあるだろう

云いたいこともあるだろう

不満なこともあるだろう

腹の立つこともあるだろう

泣きたいこともあるだろう

これらをじっと

こらえてゆくのが

男の修行である

山本五十六」

Page 44: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

43

How many metabolites in organisms? 植物 (Predicted)

-- 200,000 種の代謝物がある。

D. Strack and R. Dixon (2003)

既知天然物

-- 50,000 /植物, Luca and Pierre, (2000)

-- 43,000 entries Chapman & Hall

KNApSAcK(last updata 2009/10/5)

-- 50,054 代謝物

102,009 生物種-代謝物の関係

モデル生物

Arabidopsis thaliana

-- 5,000 ca. 1/3 of 1200 protein types

Human

-- 2,500 Ryals (2004)

Bacteria (E. coli, B. subtilis)

-- 800 – 1700

Chemotaxonomy

生物-代謝物の関係の体系化

--天然物における生物進化

--遺伝子-代謝物関連解析

--メタボロミクス解析

長寿、持続、安全社会

-- 食品化学

日本は食材の宝庫

-- 医薬学

健康維持

(新規ドラッグの探索)

Page 45: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

地球の代謝物数

scale free scale free (partial)

log [代謝物数] = 2.155 log 報告されている生物数]+4.813

r = 0.973

total: 98,800 metabolites

植物flowering plants: 223,000 種 (Scotland and Wortley, 2003) / DB: 20,741 種

1060,000 代謝物 Afendi et al Plant Cell Physiol.(2012)

Page 46: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

45

生物活性のある代謝物数の予測

0

1000

2000

3000

4000

5000

6000

7000

0 10,000 20,000 30,000 40,000

Asia

Others

China

Indonesia

India

Malaysia

the US

Thailand Vietnam

Hungary

Jordan Sri Lanka Bulgaria

Philippines Nepal France

Korea

Pakistan

Japan

(Schippmann et al.,(2006)を改変して作成

薬用

植物

の報

告数

自生植物数

136,436 代謝物数

367,328 代謝物数

Afendi et al Plant Cell Physiol.(2012)

Page 47: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

46

Web sites having links with KNApSAcK DB

Web sites

市民にも活用できるデータベース

Page 48: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

47

Page 49: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

48

Google

Page 50: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

49

Davey, M.P., et al., Metabolomics, (2009) 18 papers-2009 (Red, Foreign country)

Hounsome, N. et al., Postharvest Biol. Technol., (2009)

Xie,Z., et al., J.Exp.Botany,60, 87-97, (2009)

Giavalisco, Anal.Chem.(2009)

Draper et al., BMC Bioinformatics, (2009)

Shroff et al., PNAS (2009)

Yonekura-Sakakibara and Saito, Nat. Prod. Rep., 26, 1466-1487 (2009)

Oish et al., Plant Biotechnol.,26,167-174 (2009)

Kai et al., Plant Biotechnol, 26, 175-182(2009)

Matsuda et al., ProS One, 4, e7490.1-10(2009)

Malitsky, S.,., et al., Plant Physiol., (2008) 17 papers-2008

Warner, E., et al., J.Chromatography B,(2008)

Fait, A., et al., Plant Physiol., 148, 730-750 (2008)

Mintz-Oron, S., et al., Plant Physiol., 147, 823-851, (2008)

Hanhineva, K., et al., Phytochemistry, 69, 2463-2481 (2008)

Bottcher,C., et al., Plant Physiol.,147,2107-2120, (2008)

Farder, A. et al., J. Nutrition, 138, 1282-1287, (2008)

Mintz-Oron, S., et al., Plant Physiol.,147,823-825, (2008)

Overy, D.P., et al., Nature Protocols, 3, 471-485, (2008)

Dunn, W.B., Physical Biol.,5, 1-24, (2008)

Akiyama, K., In Silico Biol., 8, 27, (2008)

Sawada, Plant Cell Physiol., (2008)

Arita,M. and Suwa, K., BioData Mining, 1,7.1-8 (2008)

Saito, K. et al., Trends in Plant Sci.,13, 36-43, (2008)

Akiyama, K., et al., In Silico Biol., 8, 339-345, (2008)

Takahashi, H., Anal. Bioanal Chem. (in press) (2008)

Iijima, Y., et al., Plant J., 54, 949-962, (2008)

Want, E.J. et al., J. Proteome Res., 6, 459-468, (2007) 10 papers-2007

Sofia, M., et al., Trends in Anal. Chem., 26, 855-866, (2007)

Hummel, J., et al., Topics in Curr. Genet., 18, 75-95, (2007)

Gaida, A., and Neumann, S., J. Int. Bioinf., (2007)

Griffiths,W.J.,Metabolomics,Metabolonomics and Metabolite Profiling,(Royal Soc.Chem.),2007

Ohta, D., et al., Anal.Biol. Chem.(2007)

Nakamura, Y., et al., Planta, (2007)

Suzuki, H., et al., Phytochemistry, (2007)

Sakakibara, K., et al., , J .Biol. Chem.,282, 14932-14941, (2007)

Saito, K. et al., Trends in Plant Sci., 13, 36-42, (2007)

Kikuchi, K and Kakeya, H., Nature Chem. Biol., 2, 392-394, (2006) 4 papers-2006

Oikawa, A.,et al., Plant Physiol., 142, 398-413, (2006)

Shinbo, Y., et al., Biotchnol. Agric. Forestry, 57, 166-181, (2006)

Shinbo, Y., et al., J. Comput. Aided Chem., 7, 94-101, (2006)

since 2004

Web-sites linked to KNApSAcK

(WikiBook) http://en.wikibooks.org/wiki/Metabolomics/Databases

(UC Davis) http://fiehnlab.ucdavis.edu/staff/kind/Metabolomics/Structure_Elucidation/

KNApSAcKによるMetabolomics 研究

0 5 10 15 20

Bioinformatics Methodology

Development

Review Article

Metabolomics

Non-targeted Analysis

Target of Research

0 5 10

Rattus norvegicus

Curcuma longa

E. coli

Salanum lycopersicum

Fragaria x ananassa

Arabidopsis thaliana

Brassica oleracea

~100

Page 51: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

KNApSAcK FamilyKNApSAcK Core System

マニュアル

Page 52: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

KNApSAcK Keyword Search Web Versionの画面

1.Metabolite(代謝物)を選択する。

2.「 Gibberelin A4 」と入力する。

3.Listボタンをクリックする。

Gibberelin A4

Page 53: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

Fungi

Bacteria

Plantae

Gibberelin A4

Page 54: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

辛い植物を検索しよう!

「夫婦喧嘩のあとの大根おろしは辛い」

気のたっているおかみさんがごしごしと手荒に、力を入れて大根をおろすから、ダイコンの組織がみんな壊れて、シニグリン(sinigrin)がミロシナーゼの作用で加水分解されて、辛いアリルイソチオシアネート(allylisothiocyanate; isothiocyanate)がたくさん遊離するということによります。

sinigrin + H2O glucose + isothiocyanate

深海浩著

化学生態学外論:生物たちの不思議な物語 化学同人(1992)

Page 55: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

KNApSAcK Keyword Search Web Versionの画面

1.Metabolite(代謝物)を選択する。

2.「sinigrin」と入力する。

3.Listボタンをクリックする。

Page 56: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

4.C00001488をクリックする。

75種の植物

sinigrinが含まれている植物:

多分辛い!

Page 57: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

表1 sinigrinを含む植物

___________________________________________________________________________________________________

ID 生物名(学名) 科 概説

___________________________________________________________________________________________________

1 Alliaria petiolata アブラナ科 ガーリック・マスタード:全草にニンニクに似た匂いがある。

2 Arabidopsis thaliana アブラナ科 シロイヌナズナ:モデル植物でゲノム配列が決定された。

3 Arabis kennedyae アブラナ科 ワサビダイコン: ホースラディッシュ,セイヨウワサビ,オ

カワサビ: ローストビーフや魚介類のホースラディッシュソ

ースに使われる。

6 Armoracia lapathifolia アブラナ科 (ワサビダイコン)

9 Brassica hirta アブラナ科 マスタード ホワイト:種子はすりつぶしマスタード ソース

10 Brassica juncea アブラナ科 カラシナ: 野菜(からし菜)として栽培され、葉茎は油炒め

やおひたし、漬物などに利用される。

11 Brassica nigra アブラナ科 種子をマスタードの原料とするほか、野菜またはハーブとし

ても利用される。

12 Brassica oleracea アブラナ科 薬用植物(フィンランド、レバノン、エジプト、インドネシア、

日本)

22 Capparis ovata フウチョウソウ科

23 Capparis spinosa フウチョウソウ科 つぼみを酢漬けにし、肉や魚料理、パスタ、サラダのトッピ

ングなどに用います。

24 Capsella bursa-pastoris アブラナ科 ペンペングサ、春の七草

25 Chorispora tenella アブラナ科 ツノミナズナ

28 Crambe maritima アブラナ科 シーケイル, サラダ

33 Descurainia sophia アブラナ科 薬用植物(中国)

34 Diplotaxis erucoides アブラナ科 薬用植物(中近東)

73 Thlaspi arvense アブラナ科 薬用植物(インド、ハンガリー)

74 Turritis glabra アブラナ科

75 Wasabi japonica アブラナ科 ワサビ、日本料理に使用される。

Page 58: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

57

メタボロミクス解析プラットフォーム Data Processing from FT-MS data acquisition of a time series experiment

to assessment of cellular conditions

0.1

1

10

0 200 400 600 800

Time (min)

OD

600

T1

T2

T3

T4

T5 T6 T7 T8 (a) 時系列データ測定

Metabolites

M M+1

M/2 (e) 細胞コンディションの査定

sM

Mk

Mk

ss

j

j

x

xx

xx

xx

xx

xxx

.............

..................

........

..........

..........

....................

..........

.....

22

11

21

221

11211

m/z

Tim

e p

oin

t

(b) データ行列の構築

(d) 代謝物の同定

(c) イオン種の代謝物への対応付け

Detected

m/z

Theoretical

m/z

Molecular

formula Exact mass Error Candidate Species

72.9878 73.9951 C2H2O3 74.0004 0.0053 Glyoxylic acid Escherichia coli

143.1080 144.1153 C8H16O2 144.1150 0.0003 Octanoic acid Escherichia coli

662.1037 663.1109 C21H27N7O14P2 663.1091 0.0018 NAD Escherichia coli

664.1095 665.1168 C21H29N7O14P2 665.1248 0.0080 NADH Escherichia coli

.....

..........

..........

.....

..... ..........

.......... .....

.....

.....

.....

.....

..........

.....

.....

.....

DrDMASS

DPClus

KNApSAcK DB

E. coli

Page 59: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

58

719.4869

722.505

747.5112

NMNk

tMtjtt

sM

Mk

Mk

ss

j

j

xx

x

xxx

xxx

x

xx

xx

xx

xx

xxx

NjNN........

..................

.............

..................

.....

....................

.....

....................

.............

..................

........

..........

..........

....................

..........

.....

21

21

22

11

21

221

11211time 1

time 8

time 2

metab.1 metab.200

(b) Data matrix

Software are provided by T. Nishioka (Kyoto Univ./Keio Univ.)

Page 60: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

59

1-1

1-2

1-3

1-4,5

1-6

2-1

2-2

2-3

3

4 5

6

7 8

9

10

11

PG5

PG7

PG9 PG3

PG1

PG6

PG2

PG4

PG10

PG8

M-1

M-2 M-3

M-4

M-5

M-6

M-7

M-8

M-9

M-10

M-11

M-12

M-13

M-14

M-15

M-16

M-17

(c) イオン種の代謝物への対応付け(DPClus)

同位体イオンの分類. 代謝物の炭素数の推定:

Page 61: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

60

A

B

D

E

L

F

H

G

K

J

I

H

G

C

F

A

B

D

E

L

C L

A

B

D

E

L

F

H

G

K

J

I

H

G

C

F

A

B

D

E

L

C L

1. Density

2. Periphery

Define core units

How do we extract core sets from PPI?

Page 62: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

61

1-1

1-2

1-3

1-4,5

1-6

2-1

2-2

2-3

3

4 5

6

7 8

9

10

11

PG5

PG7

PG9 PG3

PG1

PG6

PG2

PG4

PG10

PG8

M-1

M-2 M-3

M-4

M-5

M-6

M-7

M-8

M-9

M-10

M-11

M-12

M-13

M-14

M-15

M-16

M-17

(c) イオン種の代謝物への対応付け(DPClus)

同位体イオンの分類. 代謝物の炭素数の推定:

Page 63: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

62

(d) KNApSAcK DBによる代謝物のアノーテション Detected

m/za

Theoretical

m/z

Molecular

formula Exact mass Error Candidate Species

72.9878 73.9951 C2H2O3 74.0004 0.0053 Glyoxylic acid Escherichia coli

143.1080 144.1153 C8H16O2 144.1150 0.0003 Octanoic acid Escherichia coli

253.2137 254.2210 C16H30O2 254.2246 0.0036 omega-Cycloheptanenonanoic acid Alicyclobacillus acidocaldarius

253.2185 254.2258 C16H30O2 254.2246 0.0012 omega-Cycloheptanenonanoic acid Alicyclobacillus acidocaldarius

281.2444 282.2516 C18H34O2 282.2559 0.0042 Oleic acid Escherichia coli

C18H34O2 282.2559 0.0042 cis-11-Octadecanoic acid Lactobacillus plantarum

C18H34O2 282.2559 0.0042 omega-Cycloheptylundecanoic acid Alicyclobacillus acidocaldarius

297.2410 298.2482 C18H34O3 298.2508 0.0026 alpha-Cycloheptaneundecanoic acid Alicyclobacillus acidocaldarius

297.2467 298.2540 C18H34O3 298.2508 0.0032 alpha-Cycloheptaneundecanoic acid Alicyclobacillus acidocaldarius

297.2516 298.2589 C18H34O3 298.2508 0.0081 alpha-Cycloheptaneundecanoic acid Alicyclobacillus acidocaldarius

321.0506 322.0579 C10H15N2O8P 322.0566 0.0013 dTMP Escherichia coli K12

346.0570 347.0643 C10H14N5O7P 347.0631 0.0012 AMP Escherichia coli

C10H14N5O7P 347.0631 0.0012 3'-AMP Escherichia coli

C10H14N5O7P 347.0631 0.0012 dGMP Escherichia coli

401.0168 402.0241 C10H16N2O11P2 402.0229 0.0012 dTDP Escherichia coli

402.9962 404.0035 C9H14N2O12P2 404.0022 0.0013 UDP Escherichia coli

426.0237 427.0310 C10H15N5O10P2 427.0294 0.0016 Adenosine 3',5'-bisphosphate Escherichia coli

C10H15N5O10P2 427.0294 0.0016 ADP Escherichia coli

C10H15N5O10P2 427.0294 0.0016 dGDP Escherichia coli

454.0391 455.0464 C20H19Cl2NO7 455.0539 0.0075 Antibiotic MI 178-34F18A2 Actinomadura spiralis MI178-34F18

C20H19Cl2NO7 455.0539 0.0075 Antibiotic MI 178-34F18C2 Actinomadura spiralis MI178-34F18

458.1112 459.1185 C15H22N7O8P 459.1267 0.0083 Phosmidosine B Streptomyces sp. strain RK-16

495.1039 496.1112 C24H20N2O10 496.1118 0.0006 Kinamycin A Streptomyces murayamaensis sp. nov.

C24H20N2O10 496.1118 0.0006 Kinamycin C Streptomyces murayamaensis sp. nov.

505.9908 506.9981 C10H16N5O13P3 506.9957 0.0023 ATP,dGTP Escherichia coli

547.0756 548.0829 C16H26N2O15P2 548.0808 0.0020 dTDP-L-rhamnose Escherichia coli

565.0503 566.0576 C15H24N2O17P2 566.0550 0.0025 UDP-D-glucose Escherichia coli

C15H24N2O17P2 566.0550 0.0025 UDP-D-galactose Escherichia coli

606.0775 607.0848 C17H27N3O17P2 607.0816 0.0032 UDP-N-acetyl-D-mannosamine Escherichia coli

C17H27N3O17P2 607.0816 0.0032 UDP-N-acetyl-D-glucosamine Escherichia coli

618.0897 619.0970 C17H27N5O16P2 619.0928 0.0042 ADP-L-glycero-beta-D-manno-

heptopyranose Escherichia coli

662.1037 663.1109 C21H27N7O14P2 663.1091 0.0018 NAD Escherichia coli

664.1095 665.1168 C21H29N7O14P2 665.1248 0.0080 NADH Escherichia coli

Page 64: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

63

PLS y

細胞状態

X

N=8

M=220 K=1

N=8

PLS (Partial Least Square regression model) .

N (測定数) << M (代謝物数)

(e) 代謝物組成による細胞状態の推定.

Y(Cell density)= a1 x1 +…+ aj xj +…. + aM xM

xj, j 番目の代謝物量

cell condition cell condition

mea

sure

men

t p

oin

ts 代謝物数

0.1

1

10

0 200 400 600 800

Time (min)

OD

600

T1 T2 T3

T4 T5

T6 T7 T8

Page 65: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

64

0.1

0.0

aj UDP-glucose, UDP-galactose

NAD

Parasperone A

UDP-N-acetyl-D-glucosamine

UDP-N-acetyl-D-mannosamine

ADP, Adenosine 3',5'-bisphosphate, dGDP

UDP

omega-Cycloheptyl-alpha-hydroxyundecanoate

Octanoic acid

dTMP, dGMP, 3'-AMP

NADH

Argyrin G

dTDP

ATP, dGTP

Lenthionine

omega-Cycloheptylnonanoate dTDP-6-deoxy-L-mannose

omega-Cycloheptylundecanoate, cis-11-Octadecanoic acid

ADP-(D,L)-glycero-D-manno-heptose

Glyoxylate

omega-Cycloheptyl-alpha-hydroxyundecanoate

-0.15

定常状態優勢 対数増殖期優勢

y(OD600 Cell Density)= a1 x1 +…+ aj xj +….+ aM xM

aj > 0, 定常状態に優勢の代謝物

xj , the quantity for jth

aj < 0, 対数増殖期に優勢の代謝物

(e) 代謝物組成による細胞状態の推定

(PLS model of OD600 to metabolite intensities)

Red: E.coli metabolites;Black: Other bacterial metabolites

PG1,3,5,7,9

MS/MS analyses

120 metabolites

80 metabolites

MS/MS analyses PG2,4,6,8,10

Page 66: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

65

10 Phosphatidylglycerols detected by MS/MS spectra

(b) Relation of mass differences among PG1 to 10

marker molecules

PG5

30:1(14:0,16:1)

PG1

32:1(16:0,16:1)

PG3

34:1(16:0,18:1)

PG6

31:0(14:0,c17:0)

PG2

33:0(16:0,c17:0)

PG4

34:5(16:0,c19:0)

PG7

34:2(16:1,18:1)

PG9

36:2(18:1,18:1)

PG8

35:1(16:1,c19:1)

PG10

37:1(18:1,c19:0)

(Cluster 1)

28.0281

14.0170

(Cluster 2)

14.0187 14.0110

14.0181

28.0315

28.0298 28.0237

2.0138

2.0051

28.0330

28.0314

14.0197

CFA CFA CFA

CFA CFA ∆(CH2)2

US

US

∆(CH2)2

∆(CH2)2

∆(CH2)2

∆(CH2)2

∆(CH2)2

O

O C15H31

O

O

OX3

O

O C15H31

O

O

OX3

プロパン環化マーカー代謝物質

対数増殖期

定常期

Cyclopropane

Formaiton of PGs

unsaturated PGs

cyclopropanated PGs

Page 67: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

66

課題

[0]ゲノム科学とその応用

[1]KNApSAcK DBの現状

[2]食履歴データベース

[3]世界の薬用植物

[4]DB複雑系解析

Page 68: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

食履歴データベース

植物の食・薬用利用

Page 69: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

68

配合 メタボロミクス 生物 生理活性 機能性 プロテオミクス

トランスクリプトミクス

有用生物 ヒト

・・・

・・・

・・・

・・・

・・・

・・・

・・・

・・・

薬用・食用

知識ベース

メタボロミクス プロテオミクス

トランスクリプトミクス

食用植物

Page 70: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

1a.種名から検索

1b.科名から検索

1c.あいまいに検索

1d.全件を表示して検索

1a-c.の後、Searchボタンをクリック!

Page 71: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

「ネギ」と入力して、Searchボタンをクリックする。

詳細を見たいとき、moreをクリックする!

タマネギの詳細をみてみよう!

Page 72: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

日本伝来

原産

健康促進

Page 73: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

文献

写真

成分表

Page 74: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

カレーライス:混ぜる科学

[1]クラーク博士起源説:札幌農学校(現北海道大学)に赴任したのが明

治9年で、そのとき、寮に住む学生の栄養状態がよくないので、米食ばかりにたよるバランスの悪い和食が原因だとしてそれをあらためさせようとました。そこで「生徒は米飯を食すべからず。ただし、らいすかれいはこのかぎりにあらず」という規則を作ったと言う記録があります。

[2]パリ万国博への使節団説(明治5年)。岩倉具視、大久保利通、伊藤博文らが、万国博をはじめヨーロッパ各国を2年間視察してまわりました。

その帰路、スエズ運河を超えセイロン島に立ち寄ったところでの記録に登場しています。

「地に稲をうゆれば常に熟す、その米を土缶にて炊き、しょう汁をそそき、手にてまぜてくう、西洋「らいすかれい」の因てはじまる所なり」

(森枝卓士著 カレーライスと日本人 講談社現代新書937;久米邦武編「米欧回覧実記」岩波文庫)

カレーの効能?

Page 75: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

カレーライスはどこからきたか?

KNApSAcK Lunch Box DBで調べてみると…

Page 76: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

カレーライスはどこからきたか?

地中海沿岸

クミン

コリアンダー

サフラン

フェンネル

フェヌグリーク

ペルー

唐辛子

パプリカ

ジャガイモ

インド

胡椒

ショウガ

カルダモン

中央アジア

ニンニク

熱帯アジア

ウコン

クローブ

ナツメグ

中国南部、ベトナム

シナモン

ジャマイカ・メキシコ

オールスパイス

ヨーロッパ東部

キャラウェイ

イラン北部

タマネギ アフがニスタン

ニンジン 中国、インド、インドネシア

世界の植物の混合体:グローバル・フード!

Page 77: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

KNApSAcK FamilyKNApSAcK from around the world

世界の薬用植物データベース

Page 78: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

77

KNApSAcK from around the world:グローバル化に向けて

48,256 medicinal or edible plant vs. country relations 217 GZs

Page 79: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)
Page 80: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

79

配合 メタボロミクス 薬用植物 生理活性 機能性 プロテオミクス

トランスクリプトミクス

植物 ヒト

・・・

・・・

・・・

・・・

・・・

・・・

・・・

・・・

薬用・食用

知識ベース

メタボロミクス プロテオミクス

トランスクリプトミクス

Page 81: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

80

KNApSAcK FamilyKAMPO

漢方データベース

Page 82: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

81

「葛根」にチェックを入れる OKボタンをクリック。

Page 83: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

82

KNApSAcK FamilyJamu

Jamuデータベース

Page 84: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

Pre

scri

pti

on

Pro

teo

me

Inte

ract

om

e

Tra

nsc

rip

tom

e

Met

ab

olo

mic

s

Med

icin

al H

erb

.

Ph

ysi

olo

gic

al

Act

ivit

y

Th

era

peu

tic

Usa

ge

Met

ab

olo

mic

s

Pro

teo

me

Inte

ract

om

e

Tra

nsc

rip

tom

e

Plant Omics Human Omics

Knowledge of

Medicinal Plants

・・・

・・・

・・・

・・・

・・・

・・・

・・・

・・・

(c) WorldMap DB

(a) KAMPO DB

Database

(b) JAMU DB

(d) KNApSAcK Core

(e) Motorcycle DB

(f) Biological Activity

(g) Compound Activity

現状:

Page 85: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

84

課題

[0]ゲノム科学とその応用

[1]KNApSAcK DBの現状

[2]食履歴データベース

[3]世界の薬用植物

[4]DB複雑系解析

Page 86: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

KNApSAcK WORLD

KAMPO DB

JAMU DB

Nation Med. Plant

Formula Med. Plant Group

Formula Med. Plant

KNApSAcK Core DB

Species Metabolite

Biological Activity DB

Species Biol. Activity

222 GZs 15,240 species

41,548 GZ-species relations

1,581 fomulas 278 species

5,310 fomulas 550 species

3,363 formula-species relations

25,436 formula-species relations

20,741 specie 50,048 metabolites

1,399 species 2,418 biol. activities

33,703 species-biol.activity relations

101,500 species-metabolite relations

複雑系解析 KNApSAcK DB

Page 87: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

1

2

3

4

5

6

7

1

2

3

4

5

6

7

8

9

10

11

1 1 2

2

2

3

4

4 4 5 5

6 6

7

7

8

9

10

11

1

2

log (# of metabolites)

species

log(C

ou

nt

of

spec

ies)

1

3 1

1

2 2

2 3

2

3

4

4

5 5 6 6 6 7

7 8 7 9 7 10

7 11

metabolites

# of

metabolites

count of

species

2

3

3 1

4 1

Count of species for # of reported metabolites

# of

species

count of

metabolites

Count of metabolites for # of reported species

1

2

3

8

2

1

0.0 1.0 0.0

1.0

log (# of species)

log(C

ou

nt

of

met

ab

oli

tes)

0.0

1.0

0.0 1.0

3 1

4

Page 88: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

KNApSAcK WORLD

KNApSAcK WORLD

Nation Med. Plant

222 GZs 15,240 sp.

41,548 GZ-sp.

General

usage

Specific

usage

Carica papaya (69)

Rsidium guajava (68)

Zingiber officinale (65)

Ricinus communis (65)

Jatropha curcas (64)

Page 89: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

漢方処方 & インドネシア配合生薬JAMU DB

KAMPO DB

JAMU DB

Formula Med. Plant Group

Formula Med. Plant

1,581 fomulas 278 sp.

5,310 fomulas 5,310 sp.

3,363 fm-sp.

25,436 fm-sp.

scale free

non-scale free

non-scale free

8 species

5 species

5

sp. formula

Page 90: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

Bioactivity DB

Biological Activity DB

Species Biol. Activity

1,399 sp 2,418 sp.

33,703 sp-met..

scale free

10

sp. formula

non-scale free

10 species

Page 91: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

KNApSAcK Core

KNApSAcK Core DB

Species Metabolite

20,741 sp 50,048 met

101,500 sp-met..

scale free scale free (partial)

log [Count of metabolites] = 2.155 log [# of species]+4.813

r = 0.973

total: 98,800 metabolites

flowering plants: 223,300 species/ DB: 20,741 species

地球上の二次代謝物数:1060,000 代謝物

Page 92: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

91

混ぜる科学:Hasse Diagram:配合生薬の体系化

配合生薬A= {a, b, c}

配合生薬B= {a, c}

配合生薬C= {b, c}

配合生薬D= {c}

A

B C

D

この線は

書かない!

Page 93: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

92

漢方処方

インドネシア配合生薬(Jamu)

Page 94: Md.Altaf-Ul-Amin 630-0101 8916-5 URL KNApSAcK …bioinf.mind.meiji.ac.jp › rish2012 › pdf › naist_kanaya.pdfLow prob. High prob. (Morioka, R.et al., BMC. Bioinformatics (2007)

93

・・・

・・・

・・・

・・・

・・・

・・・

・・・

・・・

Co

nn

ect

wit

h T

her

ap

euti

c U

sag

e

Co

nn

ect

wit

h P

hy

sio

log

ica

l A

ctiv

ity

伝統知識と現代的知識の融合: KNApSAcK Family データベースをつくろう!

222ヵ国:

50,000対の薬用植物と使用国の関係

709種の食用生物

336種の漢方処方

278種生薬

5310の配合処方

1133種生薬

50048種の代謝物

101500対の生物種-代謝物の関係

配合 メタボロミクス 薬用植物 生理活性 治療法 プロテオミクス

トランスクリプトミクス

植物/微生物Omicis ヒトOmics 薬用・食用

知識ベース

メタボロミクス プロテオミクス

トランスクリプトミクス

5034対の代謝物-生物活性の関係

金谷 [email protected] までご連絡ください。