25
Genetische Anfälligkeit für Krebs Ei A l H lb d - Eine Analyse von Halb- und Vollgeschwisterdaten Vollgeschwisterdaten Melanie Bevier , Marianne Weires, Jan Sundquist, Kari Hemminki Deutsches Krebsforschungszentrum (DKFZ) Heidelberg

Genetische Anfälligkeit für Krebs - Ei A l H lbEine ... · Genetische Anfälligkeit für Krebs - Ei A l H lbEine Analyse von Halb-und Vollgeschwisterdaten Melanie Bevier, Marianne

Embed Size (px)

Citation preview

Genetische Anfälligkeit für Krebs Ei A l H lb d- Eine Analyse von Halb- und

VollgeschwisterdatenVollgeschwisterdaten

Melanie Bevier, Marianne Weires, Jan Sundquist, Kari Hemminki

Deutsches Krebsforschungszentrum (DKFZ) Heidelberg

Übersicht

• Genetische Modelle (Zwillingsstudien)

• Analysis of Twin Data Using SAS y g(Rui Feng et al., Biometrics, June 2009)

• Anwendung des ACE-Modells auf Halb- und Vollgeschwisterdateng

Page 23/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

Vererbbarkeit

• ZwillingsstudienZwillingsstudien

• werden angewandt, um die Vererbbarkeit eines Merkmals, aufgegliedert nach genetischen und umweltbedingten Einflüssen, zu analysiereng g , y

• Monozygote Zwillinge: teilen 100% der Gene

• Dizygote Zwillinge: teilen ca. 50% der Gene

• Vererbbare Merkmale: höhere Korrelation in monozygoten als in dizygoten Zwillingen wird erwartet

=> diese höhere Übereinstimmung bei monozygoten Zwillingen wird zur Bestimmung des genetischen Einflusses verwendet

Page 33/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

Vererbbarkeit

• Varianzkomponenten Modelle werden zur Analyse• Varianzkomponenten-Modelle werden zur Analyse genutzt

=> sichtbare phänotypische Varianz wird aufgeteilt in additiv-genetische (A), dominant-genetische (D), geteilte Umwelteinflüsse (C) und zufällige Umwelteinflüsse (E)Umwelteinflüsse (E)

• Vererbbarkeit (Heritabilität):( )

)()()()()()(²

EVarCVarDVarAVarDVarAVarh

++++

=)()()()( EVarCVarDVarAVar +++

Page 43/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

Vererbbarkeit

Software zur Analyse für Zwillingsdaten:• Software zur Analyse für Zwillingsdaten:

• zum Beispiel LISREL Mx Mplus• zum Beispiel LISREL, Mx, Mplus

Page 53/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

Genetische Modelle• Genetisches Modell:

Kovariable dominant-genetische Effekte

yij = Xijβ + aij + dij + ci + εij,verbleibende Effekte

additiv-genetische Effekte

geteilte Umwelteinflüsse

=> ADE- oder ACE-Modelle

Page 63/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

Genetische Modelle für binäre Merkmale• Annahme: Y ist binär (z.B.: Analyse von Krebs: erkrankt oder

gesund)g )

• Probit-Modell zur Anpassung der Daten:

• probit(Pr(yij=1)) = Xijβ + aij + dij + ci ,

probit( ) Inverse der kumulierten Standardnormalverteilung• probit(.)= Inverse der kumulierten Standardnormalverteilung

Page 73/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

Anwendungsbeispiel: Zwillingsdateng p g

⎟⎟⎞

⎜⎜⎛ 11

proc iml;covA1=sqrsym({1,1,1});gA1=t(root(covA1));covA2=sqrsym({1,0.5,1});gA2=t(root(covA2));

⎟⎟⎠

⎜⎜⎝ 11

⎟⎟⎠

⎞⎜⎜⎝

⎛0101

gA2=t(root(covA2));covD1=sqrsym({1,1,1});gD1=t(root(covD1));covD2=sqrsym({1,0.25,1});gD2=t(root(covD2));

⎠⎝ 01

/* for additive genetic effect, the G design matrix determines the model throughthe model covariance structure: VAR[A]=GZG`. The mixed model is then representedas: logit(p{y=1}) = mu + ZG + e */

g1=INSERT(gA1,gD1,0,3); /*combine matrix for MZ twin*/g2=INSERT(gA2,gD2,0,3); /*combine matrix for DZ twin*/

⎟⎞

⎜⎛ 0101

⎟⎟⎠

⎞⎜⎜⎝

⎛0101

Page 83/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

Anwendungsbeispiel: Zwillingsdateng p g

use one1;read all var {FAMID zygo} into vzygo;

close one1;nsub=nrow(vzygo);

⎟⎟⎞

⎜⎜⎛ 0101

g=j(nsub,4,.);do i=1 to nsub;

ind=2-mod(i,2);if(vzygo[i,2]=1) then g[i,]=g1[ind,]; /* MZ twin*/if(vzygo[i,2]=0) then g[i,]=g2[ind,]; /* DZ twin*/

⎟⎟⎠

⎜⎜⎝ 0101

( yg [ , ] ) g[ ,] g [ ,];end;cname={"aone" "atwo" "done" "dtwo"};create rmatrix1 from g[colname=cname];append from g;close rmatrix1; ⎟⎟

⎞⎜⎜⎝

⎛970250870500101

close rmatrix1;quit;

⎟⎠

⎜⎝ 97.025.087.05.0

Page 93/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

Anwendungsbeispiel: Zwillingsdaten

title1 'ADE model';

g p g

Startwerte mit Hilfe von proctitle1 ADE model ;

proc nlmixed data=two2 ;*you need to choose your own initial values;*it may be useful to run a simple model such as PROC LOGISTIC;*usually you may need to try-and-err;

b t 1 0 192 b t 2 0 088 b t 3 0 0011 b t 4 0 889 b t 5 0 230 b t 6 1 092 1 4

Hilfe von proc logistic schätzen

parms beta1=-0.192 beta2=0.088 beta3=0.0011 beta4=0.889 beta5=0.230 beta6=-1.092 s1=4s2=0.01;*include the fixed covariates in the next statement;fixed1 = beta0+beta1*SEX+beta2*GA+beta3*BW+beta4*inst2+beta5*inst3+beta6*RDS;*the following statement specifies additive (a1 and a2) and;*dominant (d1 and d2) random effects;random1 = a1*aone + a2*atwo + d1*done + d2*dtwo;eta = fixed1 + random1;*specifies a probit model;p = 1 - probnorm(eta);

Probit model mit zufälligen Effekten spezifizieren

p 1 probnorm(eta);model BPD ~ binary(p);random a1 a2 d1 d2 ~ normal([0,0,0,0],[s1,0,s1,0,0,s2,0,0,0,s2]) subject=FAMID;estimate 'icc' (s1+s2)/(1+s1+s2);run;

Heritabilität

Page 103/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

Anwendungsbeispiel: Zwillingsdateng p g

title2 'ACE model';proc nlmixed data=two2;parms beta0=2.793 beta1=0.133 beta2=-0.095 beta3=-0.0011 beta4=-0.929 beta5=-0.283b t 6 1 112 1 3 2 1beta6=1.112 s1=3 s2=1;fixed1 = beta0+beta1*SEX+beta2*GA+beta3*BW+beta4*inst2+beta5*inst3+beta6*RDS;*the following statement specifies additive (a1 and a2) and;*common environment (c) random effects;random1 = a1*aone+a2*atwo+c;

G t ilt U lt i flü i deta = fixed1 + random1;p = 1 - probnorm(eta);model BPD ~ binary(p);random a1 a2 c ~ normal([0,0,0],[s1,0,s1,0,0,s2]) subject=FAMID;estimate 'icc' s1/(1+s1+s2);

Geteilte Umwelteinflüsse sind gleich für Zwillingspaare

estimate icc s1/(1 s1 s2);run;

Heritabilität

Page 113/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

Ziel der Analysey

• Genetische Modelle (ADE- oder ACE-Modell) zur Bestimmung genetischer Vererbbarkeit von Krankheiten bisher meist anhand von Zwillingsdaten analysiert

• Zwillingsdaten sehr selten und ergeben kleine Datensätze

• Ziel: Geschwister und Halbgeschwister zu analysieren um mit i öß D t V bb k it K b häteiner größeren Datenmenge Vererbbarkeit von Krebs schätzen

zu können

Page 123/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

Daten

• Schwedische Familien Krebsregister Datenbank• Schwedische Familien-Krebsregister-Datenbank

• Analyse aller Frauen die• Analyse aller Frauen, die• eine Schwester und keine Halbgeschwister haben• eine Halbschwester mütterlicherseits und keine Geschwister

haben

A l fü B tk b dj ti t h Alt d• Analyse für Brustkrebs adjustiert nach Alter und sozioökonomischem Status

Page 133/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

Übersicht der Daten

full siblings (n = 588,568) half siblings (n = 54,262) p * Signifikanterage, n (%) <.00010 ‐ 4 52251 (8.88) 3875 (7.33)5 ‐ 9 51547 (8.76) 4297 (7.92)10‐14 49840 (8.47) 5315 (9.80)

Signifikanter Unterschied in Altersstruktur der beiden Gruppen15‐19 44695 (7.59) 5662 (10.43)

20‐24 37828 (6.43) 5136 (9.47)25‐29 40629 (6.90) 5198 (9.58)30‐34 45610 (7.75) 5403 (9.96)

beiden Gruppen => Gruppen werden nach Alter

li h30 34 45610 (7.75) 5403 (9.96)35‐39 46166 (7.84) 4792 (8.83)40‐44 42105 (7.15) 4422 (8.15)45‐49 35057 (5.96) 3107 (5.73)50 54 34643 (5 89) 2598 (4 79)

angeglichen

50‐54 34643 (5.89) 2598 (4.79)55‐59 37001 (6.29) 2049 (3.78)60‐64 35911 (6.10) 1266 (2.33)65‐69 22029 (3.74) 668 (1.23)70+ 13257 (2.25) 374 (0.69)

* Wilcoxon rank sum test

Page 143/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

Übersicht der Daten

full siblings (n = 52,476) half siblings (n = 52,476) p*period n (%) < 0001period, n (%) <.0001< 1986 2218 (4.23) 853 (1.63)1986‐1990 1181 (2.25) 379 (0.72)1991‐1995 1798 (3.43) 620 (1.18)1996 2000 1975 (3 76) 991 (1 89)1996‐2000 1975 (3.76) 991 (1.89)> 2001 45301 (86.33) 49630 (94.58)region, n (%) 0.51Big cities 13368 (25.48) 13603 (25.92)Southern region 13436 (25.61) 13176 (25.11)Northern region 7439 (14.18) 8352 (15.92)Other 18230 (34.74) 17342 (33.05)sei, n (%) 0.003se , (%) 0 003Agricul 80 (0.15) 52 (0.10)Worker 7342 (13.99) 9177 (17.49)BlueCol 7890 (15.04) 5976 (11.39)Profess 1488 (2 84) 779 (1 48)Profess 1488 (2.84) 779 (1.48)Private 380 (0.72) 351 (0.67)Other 35293 (67.26) 36138 (68.87)

* l k

Page 153/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

* Wilcoxon rank sum test

Beispiel: Datensatz zu Brustkrebsp

data breast2;set breast;id=_n_;run;

Page 163/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

Logistische Regressiong g

bl l f bTable: Logistic regression analysis for breast cancer.

Estimate Standard error 95% CI p‐value

Age ‐0.0360 0.00295 ‐0.03895 to ‐0.03305 <.0001

Worker reference

BlueCol ‐0.4501 0.0792 ‐0.5293 to ‐0.3702 <.0001

Profess ‐0.4601 0.1345 ‐0.5946 to ‐0.3256 0.0006

Private ‐0.7199 0.1924 ‐0.9123 to ‐0.5275 0.0002

Other 1.3575 0.1202 1.2373 to 1.4777 <.0001

Page 173/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

Kovarianz-Strukturen• Kovarianz zwischen Schwestern:

• cov(ai1,ai2) = ½ σa²

• Kovarianz zwischen Halbschwestern:

• cov(ai1,ai2) = ¼ σa²

Page 183/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

ACE-Modell (SAS-code)( )

proc iml;covA1 sqrsym({1 0 5 1});covA1=sqrsym({1,0.5,1}); gA1=t(root(covA1)); /* Schwestern */covA2=sqrsym({1,0.25,1});gA2=t(root(covA2)); /* Halbschwestern*/use breast2;

read all var {fam hsm} into fam4;close breast2;nsub=nrow(fam4);g=j(nsub,2,.);do i=1 to nsub;

⎟⎟⎠

⎞⎜⎜⎝

⎛87.05.001

;ind=2-mod(i,2);if(fam4[i,2]=1) then g[i,]=gA1[ind,]; /* Schwestern */if(fam4[i,2]=0) then g[i,]=gA2[ind,]; /* Halbschwestern*/

end;cname={"aone" "atwo" }; ⎞⎛ 01cname={ aone atwo };create rmatrix from g[colname=cname];append from g;close rmatrix;quit;

⎟⎟⎠

⎞⎜⎜⎝

⎛97.025.001

Page 193/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

ACE-Modell (SAS-code)

d i

( )

data rmatrix;set rmatrix;id=_n_;run;data two;merge breast2 rmatrix;by id;run;

Page 203/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

ACE-Modell (SAS-code)( )Startwerte mit proc logistic

title 'ACE model';proc nlmixed data=two tech=congra;parms beta1=-0.0360 beta2=-0.4501 beta3=-0.4601 beta4=-0.7199 beta5=1.3575;fixed1 = beta0+beta1*age+beta2*sei3+beta3*sei4+beta4*sei5+beta5*sei6;

ggeschätzt

fixed1 beta0 beta1 age beta2 sei3 beta3 sei4 beta4 sei5 beta5 sei6;random1 = a1*aone+a2*atwo+c;eta = fixed1 + random1;p = 1 - probnorm(eta);model code ~ binary(p);random a1 a2 c normal([0 0 0] [s1 0 s1 0 0 s2]) subject fam;random a1 a2 c ~ normal([0,0,0],[s1,0,s1,0,0,s2]) subject=fam;estimate 'icc' s1/(1+s1+s2);run;

Heritabilität

Page 213/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

ACE-Modell (SAS-Output)( p )The NLMIXED Procedure

SpecificationsData Set DATA.TWODependent Variable cancerDependent Variable cancer Distribution for Dependent Variable Binary Random Effects a1 a2 c Distribution for Random Effects Normal Subject Variable famOptimization Technique Conjugate-GradientOptimization Technique Conjugate Gradient Integration Method Adaptive Gaussian Quadrature

DimensionsObservations Used 104052Observations Not Used 0Total Observations 104052Subjects 52026Max Obs Per Subject 2Parameters 8Quadrature Points 7

Parameters beta5 beta7 beta8 beta9 beta10 beta0 s1 s2 NegLogLike

-0.036 -0.4501 -0.4601 -0.7199 1.3575 1 1 1 45864.9111

Iteration HistoryNOTE GCONV it i ti fi d

Page 223/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

NOTE: GCONV convergence criterion satisfied. NOTE: GCONV convergence criterion satisfied.NOTE: At least one element of the (projected) gradient is greater than 1e-3.

ACE-Modell (SAS-Output)

Fit Statistics

( p )

-2 Log Likelihood 9194.6AIC (smaller is better) 9210.6AICC (smaller is better) 9210.6BIC (smaller is better) 9281.5

Parameter Estimates

StandardParameter Estimate Error DF t Value Pr > |t| Alpha Lower Upper Gradient

beta5 -0.01969 0.002813 52E3 -7.00 <.0001 0.05 -0.02520 -0.01417 4.918816beta7 -0.2315 0.05020 52E3 -4.61 <.0001 0.05 -0.3298 -0.1331 2.543996beta8 -0.2310 0.07760 52E3 -2.98 0.0029 0.05 -0.3831 -0.07892 1.825858beta9 -0.3989 0.1196 52E3 -3.34 0.0008 0.05 -0.6333 -0.1646 -0.74822beta10 0.5586 0.08849 52E3 6.31 <.0001 0.05 0.3852 0.7321 -2.78602beta0 3.5842 0.4538 52E3 7.90 <.0001 0.05 2.6947 4.4737 -1.37133s1 0.5071 0.5655 52E3 0.90 0.3699 0.05 -0.6014 1.6155 0.13806s2 0.08351 0.1866 52E3 0.45 0.6546 0.05 -0.2823 0.4493 1.156674

Additional EstimatesAdditional Estimates

StandardLabel Estimate Error DF t Value Pr > |t| Alpha Lower Upper

icc 0.3188 0.2771 52E3 1.15 0.2500 0.05 -0.2244 0.8620

Page 233/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

Schlussfolgerungg g

Mit Hilfe eines ACE Modells konnte die genetische• Mit Hilfe eines ACE-Modells konnte die genetische Vererbbarkeit von Brustkrebs geschätzt werden

• 31,88% der Varianz der Anfälligkeit für Brustkrebs ist allein genetischen Faktoren zuzuschreibengenetischen Faktoren zuzuschreiben

Page 243/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

Referenzen• Rui Feng, Gongfu Zhou, Meizhuo Zhang, and Heping Zhang.

Analysis of twin data using SAS. Biometrics, 65(2):584–589, y g , ( ) ,Jun 2009.

• Orly Levit, Yuan Jiang, Matthew J Bizzarro, Naveed Hussain, Catalin S Buhimschi, Jeffrey R Gruen, Heping Zhang, and Vineet Bhandari. The genetic susceptibility to respiratory distress syndrome. Pediatr Res, 66(6):693–697, Dec 2009.

• Isabella Locatelli, Paul Lichtenstein, and Anatoli I Yashin. The heritability of breast cancer: a Bayesian correlated frailty modelheritability of breast cancer: a Bayesian correlated frailty model applied to Swedish twins data. Twin Res, 7(2):182–191, Apr 2004.

Page 253/25/2011 | Melanie Bevier Molecular and Genetic Epidemiology (C050)

2004.