16
Originalarbeit Interrater-Reliabilität des Diagnostischen Interviews bei psychischen Störungen im Kindes- und Jugendalter (Kinder-DIPS) Murielle Neuschwander 1 , Tina In-Albon 2 , Carmen Adornetto 3 , Binia Roth 4 und Silvia Schneider 1 1 Klinische Kinder- und Jugendpsychologie, Ruhr-Universität Bochum, 2 Klinische Psychologie und Psychotherapie des Kindes- und Jugendalters, Universität Koblenz-Landau, 3 Kinder- und Jugendpsychiatrische Klinik der UPK Basel, 4 Kinder- und Jugendpsychiatrie, Baselland Zeitschrift für Kinder- und Jugendpsychiatrie und Psychotherapie, 41 (5), 2013, 319–334 DOI 10.1024/1422-4917/a000247 Zusammenfassung. Fragestellung: Ziel der vorliegenden Studie ist, die Interrater-Reliabilität des Diagnostischen Interviews bei psy- chischen Störungen im Kindes- und Jugendalter (Kinder-DIPS; Schneider, Unnewehr & Margraf, 2009) anhand von Eltern- und Kinder- interviews für verschiedene Störungsklassen zu ermitteln. Zusätzlich wird geprüft, ob sich in Abhängigkeit des Alters oder des Geschlech- tes des Kindes, Unterschiede hinsichtlich der Interrater-Reliabilität ergeben. Methodik: 264 Eltern- und 213 Kinderinterviews wurden von 48 geschulten Interviewern in kinder- und jugendpsychiatrischen und schulpsychologischen Einrichtungen sowie im Rahmen eines Forschungsprojektes durchgeführt. Ergebnisse: Die Übereinstimmungsmaße der Eltern- und Kinderinterviews zeigen eine gute bis sehr gute Interrater-Reliabilität der Oberklassen Expansive Störungen, Ticstörungen, Ausscheidungsstörungen, Affektive Störungen, Essstö- rungen, Schlafstörungen sowie einem Großteil der spezifischen Diagnosen und für den Ausschluss psychischer Störungen. Das Geschlecht und das Alter der interviewten Kinder hatten keinen Einfluss auf die Reliabilitätswerte. Schlussfolgerung: Die Ergebnisse zeigen, dass es sich beim Kinder-DIPS mit trainierten Interviewern für die Oberklassen psychischer Störungen um ein reliables Eltern- und Kinder- interview zur Diagnostik psychischer Störungen handelt. Schlüsselwörter: Psychische Störungen, Kinder-DIPS, strukturiertes Interview im Kindes- und Jugendalter, Reliabilität Abstract. Interrater reliability of the «Diagnostisches Interview bei psychischen Störungen im Kindes- und Jugendalter» (Kinder-DIPS) Objective: This study investigates the interrater reliability of the «Diagnostisches Interview bei psychischen Störungen im Kindes- und Jugendalter» (Kinder-DIPS; Schneider, Unnewehr & Margraf, 2009) based on child and parent interviews. It further investigates differ- ences in the interrater reliability depending on age or sex of the children. Method: 48 certified interviewers conducted 264 parent and 213 child interviews in various inpatient, outpatient, and research settings. Results: There is a good interrater reliability for the parent and child interviews for the major diagnostic categories of conduct disorders, tic disorders, elimination disorders, mood disorders, eating disorders, sleeping disorders, the majority of the specific psychiatric disorders, and the exclusion of psychiatric disorders. Neither the sex nor the age of the children influenced interrater reliability. Conclusions: The second and expanded Kinder-DIPS proves to be a reliable parent and child interview for the assessment of mental disorders in both outpatient and inpatient settings. Keywords: mental disorders, Kinder-DIPS, structured interview for children and adolescents, reliability Einleitung Psychische Störungen im Kindes- und Jugendalter weisen eine mittlere Periodenprävalenz (1–12 Monate) von 22 % auf (Eschmann, Weber Häner & Steinhausen, 2007). Die häufigsten psychischen Störungen im Kindes- und Jugend- alter stellen Angststörungen, hyperkinetische und dissozia- le Störungen dar. Im Jugendalter treten zudem vermehrt affektive Störungen, Substanzmissbrauch und Essstörun- gen auf (Essau, Karpinski, Petermann & Conradt, 1998; Ihle & Esser, 2002; Merikangas et al., 2010). Bei etwa 40 % der Kinder und Jugendlichen liegen eine oder mehrere ko- Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern

Interrater-Reliabilität des Diagnostischen Interviews bei ... · tern. Edelbrock, Costello, Dulcan, Kalas und Conover (1985) konnten zeigen, dass diagnostische Interviews mit Kindern

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Interrater-Reliabilität des Diagnostischen Interviews bei ... · tern. Edelbrock, Costello, Dulcan, Kalas und Conover (1985) konnten zeigen, dass diagnostische Interviews mit Kindern

M. Neuschw ander et al.: Interrater-Reliabilität des Kinder-DIPSZ. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern

Originalarbeit

Interrater-Reliabilität desDiagnostischen Interviews bei

psychischen Störungen im Kindes-und Jugendalter (Kinder-DIPS)

Murielle Neuschwander1, Tina In-Albon2, Carmen Adornetto3,Binia Roth4 und Silvia Schneider1

1Klinische Kinder- und Jugendpsychologie, Ruhr-Universität Bochum, 2Klinische Psychologie undPsychotherapie des Kindes- und Jugendalters, Universität Koblenz-Landau, 3Kinder- und

Jugendpsychiatrische Klinik der UPK Basel, 4Kinder- und Jugendpsychiatrie, Baselland

Zeitschrift für Kinder- und Jugendpsychiatrie und Psychotherapie, 41 (5), 2013, 319–334

DOI 10.1024/1422-4917/a000247

Zusammenfassung. Fragestellung: Ziel der vorliegenden Studie ist, die Interrater-Reliabilität des Diagnostischen Interviews bei psy-chischen Störungen im Kindes- und Jugendalter (Kinder-DIPS; Schneider, Unnewehr & Margraf, 2009) anhand von Eltern- und Kinder-interviews für verschiedene Störungsklassen zu ermitteln. Zusätzlich wird geprüft, ob sich in Abhängigkeit des Alters oder des Geschlech-tes des Kindes, Unterschiede hinsichtlich der Interrater-Reliabilität ergeben. Methodik: 264 Eltern- und 213 Kinderinterviews wurdenvon 48 geschulten Interviewern in kinder- und jugendpsychiatrischen und schulpsychologischen Einrichtungen sowie im Rahmen einesForschungsprojektes durchgeführt. Ergebnisse: Die Übereinstimmungsmaße der Eltern- und Kinderinterviews zeigen eine gute bis sehrgute Interrater-Reliabilität der Oberklassen Expansive Störungen, Ticstörungen, Ausscheidungsstörungen, Affektive Störungen, Essstö-rungen, Schlafstörungen sowie einem Großteil der spezifischen Diagnosen und für den Ausschluss psychischer Störungen. Das Geschlechtund das Alter der interviewten Kinder hatten keinen Einfluss auf die Reliabilitätswerte. Schlussfolgerung: Die Ergebnisse zeigen, dasses sich beim Kinder-DIPS mit trainierten Interviewern für die Oberklassen psychischer Störungen um ein reliables Eltern- und Kinder-interview zur Diagnostik psychischer Störungen handelt.

Schlüsselwörter: Psychische Störungen, Kinder-DIPS, strukturiertes Interview im Kindes- und Jugendalter, Reliabilität

Abstract. Interrater reliability of the «Diagnostisches Interview bei psychischen Störungen im Kindes- und Jugendalter» (Kinder-DIPS)

Objective: This study investigates the interrater reliability of the «Diagnostisches Interview bei psychischen Störungen im Kindes- undJugendalter» (Kinder-DIPS; Schneider, Unnewehr & Margraf, 2009) based on child and parent interviews. It further investigates differ-ences in the interrater reliability depending on age or sex of the children. Method: 48 certified interviewers conducted 264 parent and213 child interviews in various inpatient, outpatient, and research settings. Results: There is a good interrater reliability for the parentand child interviews for the major diagnostic categories of conduct disorders, tic disorders, elimination disorders, mood disorders, eatingdisorders, sleeping disorders, the majority of the specific psychiatric disorders, and the exclusion of psychiatric disorders. Neither thesex nor the age of the children influenced interrater reliability. Conclusions: The second and expanded Kinder-DIPS proves to be a reliableparent and child interview for the assessment of mental disorders in both outpatient and inpatient settings.

Keywords: mental disorders, Kinder-DIPS, structured interview for children and adolescents, reliability

EinleitungPsychische Störungen im Kindes- und Jugendalter weiseneine mittlere Periodenprävalenz (1–12 Monate) von 22 %auf (Eschmann, Weber Häner & Steinhausen, 2007). Diehäufigsten psychischen Störungen im Kindes- und Jugend-

alter stellen Angststörungen, hyperkinetische und dissozia-le Störungen dar. Im Jugendalter treten zudem vermehrtaffektive Störungen, Substanzmissbrauch und Essstörun-gen auf (Essau, Karpinski, Petermann & Conradt, 1998;Ihle & Esser, 2002; Merikangas et al., 2010). Bei etwa 40 %der Kinder und Jugendlichen liegen eine oder mehrere ko-

Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern

Page 2: Interrater-Reliabilität des Diagnostischen Interviews bei ... · tern. Edelbrock, Costello, Dulcan, Kalas und Conover (1985) konnten zeigen, dass diagnostische Interviews mit Kindern

morbide psychische Störungen vor (Essau et al., 1998;Merikangas et al., 2010).

Um eine solide Indikationsstellung und somit eine adä-quate Behandlung zu ermöglichen, ist eine zuverlässigeund valide Differentialdiagnostik unbedingt erforderlich(Silverman & Ollendick, 2005). Zur Feststellung von Stö-rungen mit Krankheitswert ist eine kategoriale und eine di-mensionale Diagnostik sinnvoll (Heubrock & Petermann,2005). Im Rahmen der kategorialen Diagnostik stellenstrukturierte und standardisierte Interviews zur Diagnose-stellung nach den Kriterien von ICD-10 oder DSM-IV-TRden Gold-Standard für eine zuverlässige Diagnosestellungpsychischer Störungen bei Kindern und Jugendlichen dar(Costello, Egger & Angold, 2005; In-Albon, Dubi, Ador-netto, Blatter-Meunier & Schneider, 2011). Für den engli-schen Sprachraum existieren verschiedene standardisierteund strukturierte Interviews zur Diagnostik psychischerStörungen im Kindes- und Jugendalter (vgl. Schneider &Adornetto, 2006). Im deutschen Sprachraum sind dreistrukturierte Interviews, das Mannheimer Elterninterview(MEI; Esser, Blanz, Geisel & Laucht, 1989), das Diagnos-tische Interview bei psychischen Störungen im Kindes- undJugendalter (Kinder-DIPS; Schneider, Unnewehr & Mar-graf, 2009) und das Kiddie-SADS-Present and Lifetime(K-SADS-PL; Delmo, Weiffenbach, Gabriel, Stadler &Poustka, 2001) aktuell verfügbar. Zudem sind das halb-strukturierte Interview CASCAP-D (PsychopathologischesBefund-System für Kinder und Jugendliche; Döpfner, Ber-ner, Flechtner, Lehmkuhl & Steinhausen, 1999) und dasDISYPS-II (Diagnostik-System für psychische Störungennach ICD-10 und DSM-IV für Kinder und Jugendliche –II; Diagnose-Checkliste; Döpfner, Görtz-Dorten & Lehm-kuhl, 2008) erhältlich. Tabelle 1 beschreibt deutschsprachi-ge Verfahren, deren Altersbereich, Klassifikationssystemder Diagnosestellung und Gütekriterien. Neben den stö-rungsübergreifenden klinischen Interviews existieren wei-tere störungsspezifische Interviews für den Kinder- und Ju-gendbereich wie bspw. die Interviews zur Posttraumati-schen Belastungsstörung bei Kindern und Jugendlichen(IBS-KJ; Steil & Füchsel, 2006), die deutsche Version desChild Eating Disorder Examination (ChEDE; Hilbert, imDruck), die deutsche Version der Children’s DepressionRating Scale – Revised (CDRS-R; Keller, Grieb, Kölch &Spröber, 2012) oder das Diagnostische Interview für Au-tismus – Revidiert (ADI-R; Bölte, Rühl, Schmötzer &Poustka, 2005).

Lapouse und Monk (1959, 1964) sowie Rutter undGraham (1968) verwendeten erstmals für die Diagnostikpsychischer Störungen im Kindes- und Jugendalter Paral-lelversionen strukturierter Interviews für Eltern und Kin-der. Verhaltensweisen, Gefühle und Fähigkeiten der Kin-der wurden direkt erfragt. Der Wortlaut der Fragen, dieAntwortkategorien und die Reihenfolge der Fragen wur-den dem Interviewer genau vorgegeben. Gezeigt werdenkonnte, dass Kinder ihre Beschwerden reliabel schildernkönnen (Angold, 2002; Rutter & Graham, 1968). Hin-sichtlich des Geschlechts und Alters der Kinder bestehen

unterschiedliche Befunde in Bezug auf reliable und vali-de Angaben. Nach Herjanic, Herjanic, Brown undWheatt (1975) können Mädchen reliablere Angaben ma-chen als Jungen. Unter Experten besteht keine Einigkeit,ab welchem Alter Kinder im Rahmen von diagnostischenInterviews ausreichend detaillierte und genaue Angabenzur Diagnosestellung geben können, was sicherlich auchmit einer bislang spärlichen Datenlage zusammenhängt.Angold, Erkanli, Costello und Rutter (1996) zeigten auf-grund ihrer Datenanalyse, dass Kinder ab dem Alter von9 Jahren ebenso genaue Angaben zu Beginn, Dauer undZusammentreffen von Symptomen machen, wie ihre El-tern. Edelbrock, Costello, Dulcan, Kalas und Conover(1985) konnten zeigen, dass diagnostische Interviews mitKindern ab dem Alter von 10 Jahren sinnvoll durchge-führt werden können. Herjanic et al. (1975) teilten auf-bauend auf Entwicklungsstufen ihre Stichprobe in die Al-terskategorien 6–8, 9–13 und 14–16 Jahre ein, wobei dieErgebnisse keine signifikanten Unterschiede zwischenden Altersgruppen zeigten. Nach Poustka (1988) solltendiagnostische Interviews bei Kindern erst ab dem Altervon 12 Jahren durchgeführt werden, wobei es sich hierbeinicht um eine empirisch fundierte Aussage handelt. Ins-gesamt kann festgehalten werden, dass der Einfluss desAlters auf die Reliabilität und Validität von strukturiertenInterviews nicht abschließend eingeordnet werden kannund empirische Studien notwendig sind, um diese wich-tige Frage zu klären. Generell kann davon ausgegangenwerden, dass die altersgerechte Formulierung der Fragenin strukturierten Interviews einen erheblichen Einflussauf Reliabilität und Validität der Antworten haben dürfte(Breton et al., 1995).

Für die Diagnostik psychischer Störungen im Kindes-und Jugendalter gilt, dass verschiedene Informanten(Kind, Eltern, andere Bezugspersonen) in den diagnosti-schen Prozess eingebunden werden müssen, um einevollständige Erfassung der Symptomatologie des Kindesund somit eine valide Diagnosestellung zu ermöglichen(Kraemer et al., 2003; Silverman & Ollendick, 2005).Strukturierte klinische Interviews sind hinsichtlich ihrerGütekriterien abhängig von der Güte der ihnen zugrun-deliegenden Klassifikationssysteme (siehe Mohr &Schneider, 2013). Für deutschsprachige Interviews undandere Verfahren, die für die Diagnostik im Kindes- undJugendalter existieren, kann festgehalten werden, dassdiese hinsichtlich ihrer psychometrischen Gültigkeit we-nig überprüft sind. Aufgrund einer Überarbeitung derErstauflage des Kinder-DIPS (Unnewehr, Schneider &Margraf, 1995), wurde eine Überprüfung der Gütekrite-rien für die Zweitauflage des Kinder-DIPS (Schneider,Unnewehr et al., 2009) notwendig. Ziel der vorliegendenStudie ist es, die Interrater-Reliabilität des Kinder-DIPSanhand von Kinder- und Elterninterviews für verschiede-ne Störungsklassen zu ermitteln. Zusätzlich soll über-prüft werden, ob sich in Abhängigkeit des Alters oder desGeschlechtes des Kindes Unterschiede hinsichtlich derInterrater-Reliabilität ergeben.

320 M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS

Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern

Page 3: Interrater-Reliabilität des Diagnostischen Interviews bei ... · tern. Edelbrock, Costello, Dulcan, Kalas und Conover (1985) konnten zeigen, dass diagnostische Interviews mit Kindern

M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS 321

Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern

Page 4: Interrater-Reliabilität des Diagnostischen Interviews bei ... · tern. Edelbrock, Costello, Dulcan, Kalas und Conover (1985) konnten zeigen, dass diagnostische Interviews mit Kindern

Methodik

Kinder-DIPS für DSM-IV-TR

Das Kinder-DIPS (Schneider, Unnewehr et al., 2009) ist einstrukturiertes Interview zur Erfassung psychischer Störungenim Kindes- und Jugendalter, welches erlaubt die Fragen andas Alter der Kinder anzupassen. Das Kinder-DIPS umfassteine Kinderversion zur direkten Befragung des Kindes bzw.Jugendlichen sowie eine parallele Elternversion ab frühes-tens 6 Jahren (Empfehlung für die Kinderversion: ab frühes-tens 8 Jahren). Die Abfolge der Interviewfragen ist syndrom-orientiert und zur Vermeidung unnötiger Fragen enthält dasInterview an entsprechenden Stellen Sprungregeln, welchedas Überspringen einzelner Abschnitte erlauben. Es könnenderzeitige und Lebenszeitdiagnosen nach DSM-IV-TR(APA, 2000) und ICD-10-Diagnosen (WHO, 2000) erhobenwerden und die Überführung der Diagnosestellung vom ei-nen zum anderen Klassifikationssystem ist anhand einer Ta-belle möglich. In der 2. Auflage wurden neue, für den psy-chotherapeutischen Bereich wichtige psychische Störungenaufgenommen, z. B. Ticstörungen, Schlafstörungen, Prü-fungsangst, Selektiver Mutismus, Pica und Binge-Eating-Störung und formale Änderungen vorgenommen. Zudemwurde ein Screening zu Nikotin-, Alkohol- und Drogenmiss-brauch integriert (für eine Übersicht siehe Handbuch des Kin-der-DIPS für DSM-IV-TR; Schneider, Suppiger, Adornetto,Unnewehr & Margraf, 2009). Das Kinder-DIPS für DSM-IV-TR und ICD-10 erfasst die folgenden Störungskatego-rien: Störungen der Aufmerksamkeit, der Aktivität und desSozialverhaltens, Ticstörungen, Angststörungen, Störungender Ausscheidung, Schlafstörungen, Affektive Störungenund Essstörungen. Neben dem Teil zur Erfassung spezifi-scher psychischer Störungen enthält das Kinder-DIPS einenallgemeinen klinisch-demographischen Teil und Screening-fragen zu körperlichen Krankheiten, entwicklungsbezogenenKoordinationsstörungen, Kommunikationsstörungen, Schul-und Teilleistungsstörungen, Substanzmissbrauch, nicht-or-ganische Psychosen sowie zu Medikamentengebrauch. Zu-dem werden eine psychiatrische Anamnese, eine Familien-anamnese psychischer Störungen sowie die Achsen IV (psy-chosoziale und umgebungsbedingte Probleme) und V(globale Erfassung des Funktionsniveaus) des DSM-IV-TRerhoben. Das Kinder-DIPS enthält therapierelevante Fragenzu auslösenden und modulierenden Faktoren, um das Inter-view insbesondere für den psychotherapeutischen Gebrauchnutzbar zu machen.

Ablauf der Untersuchung

Zur Überprüfung der Interrater-Reliabilität wurden 264 El-tern- und 213 Kinderinterviews, welche in kinder- und ju-gendpsychiatrischen und psychologischen Einrichtungen ge-führt wurden, auf Tonband aufgenommen und von einemzweiten unabhängigen Diagnostiker gegenkodiert. Der unab-

hängige Diagnostiker nahm anhand der Tonbandaufnahmeeine eigenständige klinische Einschätzung vor. Die Diagno-sestellungen wurden in Fallkonferenzen besprochen und beiabweichenden Diagnosen wurden Konsensdiagnosen gebil-det. Die ermittelten Symptome wurden von den Interviewernbeschrieben, es wurden Einschätzungen anhand DSM-IV-TR-Diagnosen vorgenommen und anhand einer Checklistefür jede Störungskategorie Gründe für mangelnde Überein-stimmung zwischen zwei Diagnostikern erhoben. Die Kinderund deren Eltern wurden nach derzeitigen sowie früherenpsychischen Problemen der Kinder befragt, somit konntenneben aktuellen auch Lebenszeitdiagnosen der Kinder erho-ben werden. Die Eltern und die Kinder wurden über die Un-tersuchung informiert und gaben ihr schriftliches Einver-ständnis zur Teilnahme am diagnostischen Interview.

Interviewer und Schulung

Alle Interviewer absolvierten ein standardisiertes Trainingin der Durchführung und Auswertung des Kinder-DIPS(siehe Handbuch des Kinder-DIPS für DSM-IV-TR;Schneider, Suppiger et al., 2009) und mussten eine Zertifi-zierungsprüfung mit einem reliablen Interviewer bestehen.Erst nach Abschluss einer erfolgreichen Zertifizierungwurden die Interviewer in die Studie für die Durchführungvon Interviews bzw. Gegenkodierungen aufgenommen.

Die Eltern- und Kinderinterviews sowie die Gegenko-dierungen wurden von 48 Interviewern (39 Psychologenmit Bachelorabschluss: 35 Frauen, Alter: 21.18–42.15 Jah-re; MW = 25.86; SD = 3.81 und 4 Männer, Alter:24.37–26.83 Jahre; MW = 25.78; SD = 1.59 und 9 diplo-mierte Psychologinnen: 9 Frauen, Alter: 27.78–45.72 Jah-re; MW = 31.63, SD = 5.54) durchgeführt. Der Range fürdie Anzahl geführter Kinderinterviews pro Interviewer lagzwischen 1 und 17 und für die Anzahl geführter Elternin-terviews zwischen 1 und 36. Die neun diplomierten Psy-chologinnen führten die Interviews im Rahmen einer The-rapiestudie durch und die Interviews in der Kinder- undJugendpsychiatrie Baselland (Kinder: n = 76; Eltern: n =65) und dem Schulpsychologischer Dienst Basel-Stadt(Kinder: n = 10; Eltern: n = 13) (siehe Rekrutierung) sowiealle Gegenkodierungen (Kinder: n = 213; Eltern: n = 264)wurden von den 39 Psychologen mit Bachelorabschlussdurchgeführt.

Stichprobe

Rekrutierung

Im Zeitraum von Februar 2004 bis Dezember 2008 wurdenin der Kinder- und Jugendpsychiatrie Baselland (KJP), imSchulpsychologischen Dienst Basel-Stadt (SPD) sowie imRahmen einer Therapiestudie an der Universität Basel, ins-gesamt 272 Kinder (KJP: n = 114, 41.91 %; SPD: n = 16,5.88 %; Forschung: n = 142, 52.21 %) und 346 Eltern (KJP:

322 M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS

Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern

Page 5: Interrater-Reliabilität des Diagnostischen Interviews bei ... · tern. Edelbrock, Costello, Dulcan, Kalas und Conover (1985) konnten zeigen, dass diagnostische Interviews mit Kindern

n = 114, 32.95 %; SPD: n = 16, 4.62 %; Forschung: n =216, 62.43 %) über die Reliabilitätsstudie informiert undfür eine Studienteilnahme angefragt. Die teilnehmendenInstitutionen organisierten die Rekrutierung der Studien-teilnehmenden in ihrer Patientenpopulation. Der Verlaufder Datenerhebung ist in Abbildung 1 dargestellt.

Kinder

Der Mädchenanteil bei den Kinderinterviews betrug50.2 % (n = 107) und das durchschnittliche Alter der Kin-der war 11.31 Jahre (SD = 2.70; Min. = 6.02, Max. = 18.44).Die folgenden Schultypen waren vertreten: 2.3 % besuch-ten den Kindergarten, 53.1 % die Grundschule, 14.1 % dieMittelstufe, 11.3 % die Oberstufe (Real-/Sekundarschule),8.9 % die Oberstufe (Gymnasium), 1.4 % hatten die Schuleabgebrochen und 9 % fielen unter «andere Schule» (z. B.Sonderschule, Berufsausbildung).

Eltern

Bei den Elterninterviews betrug der Mädchenanteil 51.9 %(n = 137) und das Durchschnittsalter der Kinder lag bei10.04 Jahre (SD = 2.88, Min. = 4.82, Max. = 17.89).

138 (52.3 %) der Interviews fanden mit den Müttern, 13(4.9 %) mit den Vätern und 113 (42.8 %) mit beiden Eltern-teilen statt. Die interviewten Eltern waren durchschnittlich

41.50 Jahre (SD = 5.41, Min. = 27.74, Max. 60.96) alt.64.5 % der Mütter waren berufstätig (Angestellte: 53.1 %,n = 140, Beamte: 3.4 %, n = 9, Selbstständig Erwerbende:8.0 %, n = 21), 31.4 % waren Hausfrauen, 0.4 % arbeitslosund von 3.8 % fehlt die Angabe zur Berufstätigkeit. 86.7 %der Väter waren berufstätig (Angestellte: 66.2 %, n = 175,Beamte: 7.2 %, n = 19, Selbstständig Erwerbende: 12.1 %,n = 32), 1.1 % Hausmänner, 1.5 % arbeitslos und von10.6 % fehlt diese Angabe. 74.6 % der Eltern waren ver-heiratet, 18.2 % getrenntlebend oder geschieden, 0.4 %verwitwet, 4.2 % ledig und von 2.7 % fehlt die Angabe.

Maße zur Reliabilitätsbestimmung

Zur Bestimmung der Reliabilität werden auf der Ebene vonOberklassen psychischer Störungen (z. B. Angststörungen,Schlafstörungen) und auf der Ebene der einzelnen Diagnose-kategorien (z. B. Soziale Phobie, Spezifische Phobie) dieprozentuale Übereinstimmung, der Kappa-Koeffizient (Co-hen, 1960) und der Y-Koeffizient (Yule, 1912) angegeben.Anhand der drei Übereinstimmungsmaße sind Aussagenüber die Reliabilität einzelner Diagnosekategorien und Stö-rungsklassen möglich. Die prozentuale Übereinstimmungberücksichtigt das Ausmaß der zufällig zu erwartenden Über-einstimmung nicht, was zu einer Überschätzung der Überein-stimmung führt (Asendorpf & Wallbott, 1979). Der Y-Koef-fizient (Yule, 1912) ist dem Kappa-Koeffizienten (Cohen,1960) ähnlich, ist jedoch unabhängig von der Basisrate (Auf-

Abbildung 1. Verlauf der Datenerhebung.

M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS 323

Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern

Page 6: Interrater-Reliabilität des Diagnostischen Interviews bei ... · tern. Edelbrock, Costello, Dulcan, Kalas und Conover (1985) konnten zeigen, dass diagnostische Interviews mit Kindern

tretenshäufigkeit bestimmter Störungsbilder) und bleibt imBereich einer beobachteten Basisrate von 1–50 % stabil(Spitznagel & Helzer, 1985). Kappa-Koeffizienten mit einerBasisrate < 10 % stellen eine Unterschätzung der Überein-stimmung dar. Kappa- und Y-Werte > .40 werden als akzep-table und Werte > .70 als sehr gute Übereinstimmung inter-pretiert (Burke, 1986). Wenn eine Zelle der Häufigkeitstabel-le Null ist, kann der Y-Koeffizient nicht interpretiert werden,da er den Endpunkt eines Wertebereiches erreicht (–1 oder+1). Dies gilt auch für die Berechnung des Kappa, wenn dieZellen der Diagonale beide den Wert Null enthalten. Dieswurde anhand der Pseudo-Bayes Schätzung (Bishop, Fien-berg & Holland, 2007; Formeln 12.7–19 und 12.7–20) aus-geglichen und es wurden jeweils die absoluten sowie die ge-schätzten Koeffizienten berechnet. Für die Interpretation derÜbereinstimmung werden die geschätzten Koeffizienten be-rücksichtigt. Die Übereinstimmungsmaße sollten in Relationzueinander interpretiert und nicht als absolute Werte verstan-den werden. Die globale prozentuale Übereinstimmung zwi-schen zwei Interviewern gibt an, inwiefern mehrere Diagno-sen gleichzeitig übereinstimmend gestellt werden können.Hierbei lag eine Übereinstimmung nur dann vor, wenn beideInterviewer in allen aktuellen und früheren Diagnosen über-einstimmten. Zwischen Haupt- und Zusatzdiagnose wurdenicht unterschieden. Die Übereinstimmungskoeffizientenwurden für die gesamte und für die klinische Stichprobe be-rechnet. Der Vorteil der Berechnungen für die Gesamtstich-probe besteht darin, dass auch die Reliabilität bzgl. des Aus-schlusses psychischer Störungen ermittelt werden kann.Nachteilig ist zu erwähnen, dass sich durch dieses Vorgehendie Basisraten der zu überprüfenden Diagnoseklassen redu-zieren. Um diesem Nachteil entgegen zu wirken, wurden dieÜbereinstimmungsmaße zusätzlich für die klinische Stich-probe berechnet, um mehr Diagnoseklassen interpretierbarzu machen.

Fehleranalyse bei Nichtübereinstimmung

Die Gründe für eine nichtübereinstimmende Diagnose zwi-schen Interviewern und Gegenkodierern wurden im Rah-men von Fallkonferenzen festgehalten. Anhand einerCheckliste zur Fehleranalyse konnte für jede Störungska-tegorie der Grund für die mangelnde Übereinstimmungfestgehalten werden. Folgende Kategorien wurden unter-schieden:1. Interviewfehler: Sprungregel falsch angewendet; starke

Abweichung von standardisierten Fragen; ungenügendeFolgefragen zu Diagnoseklärung; unvollständige Befra-gung; Protokollierungsfehler.

2. Auswertungsfehler: DSM-Kriterien falsch angewendet;Differentialdiagnostische Aspekte falsch beachtet.

3. Unterschiedliche Symptomgewichtung: bezüglich Symp-tomen, Leiden/Beeinträchtigung.

4. Qualität der Tonaufnahme: die Antwort wurde nicht ver-standen; ein Teil der Aufnahme fehlt.

5. Unterschiedliche differentialdiagnostische Bewertung.

6. DSM-IV-TR oder Kinder-DIPS unpräzise/unklar: bei-spielsweise zu allgemein formulierte Diagnosekriterien;spezifische Störungen, welche nicht anhand des Kinder-DIPS erfasst werden.

Einfluss des Geschlechts und des Alters der Kinderauf die Reliabilität

Um zu prüfen, ob sich in Abhängigkeit des Alters der KinderUnterschiedeinderInterrater-Reliabilitätergeben,wurdenAl-terskategorien in Anlehnung an die Befunde zu Altersunter-schieden hinsichtlich der Reliabilität von Interviews mit Kin-derngebildet (Angoldetal.,1996;Edelbrocketal.,1985;Her-janicetal.,1975;Poustka,1988).EswurdenfürdievorliegendeUntersuchungdieAlterskategorien6.0–9.99Jahre,10.0–11.99Jahre und älter als 12 Jahre gewählt. Die Alterskategorie derjüngsten Kinder wurde weiter in die Kategorien von 6.0–7.99und 8.0–9.99 Jahre bzw. von 6.0–8.99 und 9.0–9.99Jahre ein-geteilt. Um den Einfluss des Alters und des Geschlechts derinterviewten Kinder auf die Wahrscheinlichkeit, dass zwei In-terviewer hinsichtlich der Diagnosestellung übereinstimmen,kontinuierlichzutesten,wurdeeinebinärelogistischeRegres-sionsanalyse mit denPrädiktorenAlterundGeschlechtder in-terviewten Kinder berechnet. Die binäre logistische Regres-sionsanalysewurdefürdieGesamtstichprobederKinderinter-views(N=213)undfürdieTeilstichprobederKinderinterviewsnach Ausschluss der gesunden Kinder (N = 106), d. h. ohneDiagnoseneinerpsychischenStörung,berechnet.

Ergebnisse

Es wurden insgesamt 213 Kinder- sowie insgesamt 264 El-terninterviews durchgeführt und gegenkodiert. Durchschnitt-lich wurden 0.84 Lebenszeitdiagnosen (SD = 1.09, Range0–7) anhand der Kinderinterviews sowie 1.33 Lebenszeitdi-agnosen (SD = 1.13, Range 0–6) anhand der Elterninterviewsvergeben. Die Kinderinterviews (n = 175) dauerten durch-schnittlich 76.63 Minuten (SD = 34.83, Range 10–180 Minu-ten) und die Elterninterviews (n = 223) durchschnittlich98.75 Minuten (SD = 40.06, Range 24–328 Minuten).

Interrater-Reliabilität Eltern(Lebenszeitdiagnosen)

Die Ergebnisse zur Interrater-Reliabilität für die Lebenszeit-diagnosen auf der Ebene von Oberklassen psychischer Stö-rungen sowie auf der Ebene von spezifischen Diagnosen sindin den Tabellen 2 und 3 dargestellt. Die prozentuale Überein-stimmung der Oberklassen beträgt mindestens 96.21 %. Ins-gesamt ist die Interrater-Reliabilität der Oberklassen gut bissehr gut. Die Kappa-Werte liegen zwischen 0.94 und 0.97und die Y-Werte zwischen 0.85 und 0.97.

324 M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS

Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern

Page 7: Interrater-Reliabilität des Diagnostischen Interviews bei ... · tern. Edelbrock, Costello, Dulcan, Kalas und Conover (1985) konnten zeigen, dass diagnostische Interviews mit Kindern

Tabelle 2Interrater-Reliabilität des Kinder-DIPS Elternversion (Oberklasse, Lebenszeitdiagnosen) für die gesamte Stichprobe(N = 264)

DSM-IV-TR Oberklassen Häufigkeiten % Kappa [95 % KI] Yule’s Y

–/– –/+

+/– +/+

Expansive Störungen 220 2 98.49 (.94 [.89, .99c] .96

2 40

Ticstörungen 246 2 98.49 (.87) [.74, .99c] .93

2 14

Ausscheidungsstörungen 238 3 98.11 (.88) [.78, .98] .93

2 21

Affektive Störungen 233 1 98.86 (.94 [.88, 1.00] .97

2 28

Angststörungen 104 2 96.97 (.94 [.90, .98] .95

6 152

Essstörungen 258 3 98.86 (.66) [.29, 1.00] 1.00/.87a

0 3

Schlafstörungen 240 7 96.21 (.72) [.55, .89] .85

3 14

Keine Diagnosen 202 1 98.86 (.97 [.93, 1.00] .97

2 59

Anmerkungen. Kappa-Koeffizienten, die aufgrund einer Basisrate der jeweiligen Oberklasse von < 10 % (n = 26.4 (Formel: (+/+) + ((+/–) +(–/+)/2)) eine Unterschätzung darstellen, sind in Klammer aufgeführt. aPseudo-Bayes Schätzung von Kappa bzw. Y. – nicht berechenbar. KI =Konfidenzintervalle. cObergrenze des KI wurde abgerundet, 1.00 wurde nicht erreicht.

Tabelle 3Interrater-Reliabilität des Kinder-DIPS Elternversion (Störungsebene, Lebenszeitdiagnosen) für die gesamte Stichprobe(N = 264)

DSM-IV-TR Spezifische Diagnosen Häufigkeiten % Kappa [95 % KI] Yule’s Y

–/– –/+

+/– +/+

Aufmerksamkeitsdefizit-/Hyperaktivitätsstörung 242 0 98.86 (.92) [.83, 1.00] 1.00/.96a

3 19

Störung mit oppositionellem Trotzverhalten 238 1 99.24 (.96) [.90, 1.00] .97

1 24

Störung des Sozialverhaltens 260 1 99.62 (.86) [.57, 1.00] 1.00/0.93a

0 3

Tourette-Störung 262 0 100.00 (1.00)/(.80a) [.36, 1.00]b 1.00/.96a

0 2

Chronische motorische oder vokale Ticstörung 257 1 99.24 (.83) [.59, 1.00] .95

1 5

Vorübergehende motorische oder vokale Ticstörung 254 1 99.24 (.89) [.73, 1.00] .96

1 8

Enuresis 239 3 98.11 (.88) [.77, .98] .93

2 20

Enkopresis 261 0 100.00 (1.00)/(.86a) [.55, 1.00]b 1.00/.97a

0 3

M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS 325

Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern

Page 8: Interrater-Reliabilität des Diagnostischen Interviews bei ... · tern. Edelbrock, Costello, Dulcan, Kalas und Conover (1985) konnten zeigen, dass diagnostische Interviews mit Kindern

DSM-IV-TR Spezifische Diagnosen Häufigkeiten % Kappa [95 % KI] Yule’s Y

–/– –/+

+/– +/+

Major Depression 242 2 98.49 (.89) [.79, .99c] .94

2 18

Dysthyme Störung 252 1 98.86 (.85) [.68, 1.00] .94

2 9

Störung mit Trennungsangst 160 2 98.11 (.95 [.93, .99c] .96

3 99

Panikstörung ohne Agoraphobie 263 1 99.62 – –

0 0

Panikstörung mit Agoraphobie 264 0 100.00 – –

0 0

Agoraphobie ohne Panikstörung 262 0 100.00 (1.00)/(.80a) [.36, 1.00]b 1.00/.96a

0 2

Spezifische Phobie 222 1 96.97 (.88 [.79, .96] .94

7 34

Sozialphobie 215 1 98.49 (.95 [.90, .99c] .97

3 45

Selektiver Mutismus 264 0 100.00 – –

0 0

Zwangsstörung 260 1 99.62 (.86) [.57, 1.00] 1.00/.93a

0 3

Generalisierte Angststörung 253 1 98.11 (.70) [.43, .96] .90

4 6

Posttraumatische Belastungsstörung 263 0 100.00 (1.00)/(.67a) [.00, 1.00]b 1.00/.95a

0 1

Pica 261 3 98.86 – –

0 0

Anorexia Nervosa 262 0 100.00 (1.00)/(.80a) [.36, 1.00]b 1.00/.96a

0 2

Bulimia Nervosa 263 0 100.00 (1.00)/(.67a) [.00, 1.00]b 1.00/.95a

0 1

Binge Eating Disorder 264 0 100.00 – –

0 0

Primäre Insomnie 245 5 96.97 (.72) [.52, .91] .86

3 11

Primäre Hypersomnie 263 1 99.62 – –

0 0

Schlafstörung mit Alpträumen 261 0 100.00 (1.00)/(.86a) [.55, 1.00]b 1.00/.97a

0 3

Pavor Nocturnus 264 0 100.00 – –

0 0

Schlafstörung mit Schlafwandeln 263 1 99.62 – –

0 0

Anmerkungen. Kappa-Koeffizienten, die aufgrund einer Basisrate der jeweiligen Oberklasse von < 10 % (n = 26.4 (Formel: (+/+) + ((+/–) +(–/+)/2)) eine Unterschätzung darstellen, sind in Klammer aufgeführt. a Pseudo-Bayes Schätzung von Kappa bzw. Y. – nicht berechenbar. KI =Konfidenzintervalle. b Konfidenzintervall basierend auf Pseudo-Bayes Schätzung von Kappa. c Obergrenze des KI wurde abgerundet, 1.00 wurdenicht erreicht.

326 M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS

Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern

Page 9: Interrater-Reliabilität des Diagnostischen Interviews bei ... · tern. Edelbrock, Costello, Dulcan, Kalas und Conover (1985) konnten zeigen, dass diagnostische Interviews mit Kindern

Auf der Ebene der spezifischen Diagnosen lagen alleprozentualen Übereinstimmungen über 96.97 %. Für dieInterrater-Reliabilität der spezifischen Diagnosen über dieLebenszeit ergaben sich gute bis sehr gute Werte. Die Kap-pa-Werte lagen zwischen 0.88 und 0.95 und die Y-Wertezwischen 0.86 und 0.97.

Die globale prozentuale Übereinstimmung zeigte, dassin 83.3 % (n = 220) der Interviews zwei Interviewer in allenLebenszeitdiagnosen (aktuelle und frühere Diagnosen)übereinstimmten. Die maximale Anzahl komorbider Diag-nosen betrug hierbei sieben. Bei Betrachtung der aktuellenDiagnosen stimmten in 87.9 % (n = 232) der Interviewsbeide Interviewer hinsichtlich aller Diagnosen überein. Bei86.7 % (n = 229) dieser Fälle wurde Übereinstimmung hin-sichtlich primärer und zusätzlicher Diagnose erzielt. Diemaximale Anzahl aktueller Diagnosen betrug sechs.

Interrater-Reliabilität (Eltern) beiausschließlicher Betrachtung der KlinischenStichprobe

Nach Ausschluss der Kinder ohne Diagnosen psychischerStörungen, kann der Kappa-Koeffizient für die spezifischenDiagnosen ADHS (Kappa = 0.92), Störung mit oppositionel-lem Trotzverhalten (Kappa = 0.95) und Enuresis (Kappa =0.90) interpretiert und als sehr gut eingeschätzt werden.

Interrater-Reliabilität Kinder(Lebenszeitdiagnosen)

Die Ergebnisse zur Interrater-Reliabilität für die Lebenszeit-diagnosen auf der Ebene von Oberklassen psychischer Stö-rungen sowie auf der Ebene von spezifischen Diagnosen sindin den Tabellen 4 und 5 dargestellt. Die prozentuale Überein-stimmung der Oberklassen beträgt mindestens 95.31 %. DieInterrater-Reliabilität der Oberklassen ist insgesamt gut bissehr gut. Die Kappa-Werte liegen zwischen 0.90 und 0.92und die Y-Werte liegen zwischen 0.94 und 0.97.

Auf der Ebene der spezifischen Lebenszeitdiagnosen la-gen alle prozentualen Übereinstimmungen über 97.65 %.Für die Interrater-Reliabilität der spezifischen Diagnosenüber die Lebenszeit ergaben sich gute bis sehr gute Werte.Die Kappa-Werte lagen zwischen 0.92 und 0.98 und dieY-Werte zwischen 0.84 und 0.97.

Die globale prozentuale Übereinstimmung zeigte, dass in90.6 % (n = 193) der Interviews zwei Interviewer in allenLebenszeitdiagnosen (aktuelle und frühere Diagnosen) über-einstimmten, wobei die maximale Anzahl komorbider Diag-nosen sieben betrug. In 92.0 % (n = 196) der Interviewsstimmten zwei Interviewer hinsichtlich der aktuell bestehen-den Diagnosen überein, davon stimmten in 92.0 % (n = 196)der Fälle die beiden Interviewer auch hinsichtlich der Zuord-nung der Diagnosen als primär bzw. zusätzlich überein. Diemaximale Anzahl aktueller Diagnosen betrug fünf.

Interrater-Reliabilität (Kinder) beiausschließlicher Betrachtung der KlinischenStichprobe

Nach Ausschluss der Kinder ohne Diagnosen psychischerStörungen, kann der Kappa-Koeffizient für die spezifi-schen Diagnosen Major Depression (Kappa = 0.96), Sozia-le Phobie (Kappa = 0.96) und Primäre Insomnie (Kappa =0.95) interpretiert und als sehr gut eingeschätzt werden.

Fehleranalyse Eltern und Kinder

Die häufigsten Fehlerquellen bei nichtübereinstimmendenDiagnosestellungen können für die Eltern- und Kinderin-terviews der Tabelle 6 entnommen werden.

Interrater-Reliabilität aktuelle und primäreDiagnosen

Das zeitliche Auftreten von Diagnosen (aktuell bzw. frü-her) wird durch die Analysen anhand von Lebenszeitdiag-nosen nicht berücksichtigt. Aus diesem Grund wurden dieReliabilitätsberechnungen ebenfalls für die Übereinstim-mung aller aktuell bestehenden Diagnosen zum Zeitpunktdes Interviews sowie für die Primärdiagnose, welche aktu-ell vergeben wurde, durchgeführt. Übereinstimmend mitden Ergebnissen zu den Lebenszeitdiagnosen wurde für al-le aktuellen Diagnosen auf der Basis der Oberklassen fürdie Elterninterviews die Expansiven Störungen, Ticstörun-gen, Angststörungen, Schlafstörungen sowie der Aus-schluss von psychischen Störungen (keine Diagnosen) undauf der Basis spezifischer Störungsbereiche (Störung mitoppositionellem Trotzverhalten, Chronische motorischeoder vokale Ticstörung, Major Depression, Dysthyme Stö-rung, Störung mit Trennungsangst, Spezifische Phobie, So-ziale Phobie, Generalisierte Angststörung und Primäre In-somnie) sehr gute Reliabilitätswerte ermittelt. Alle prozen-tualen Übereinstimmungen lagen über 96.21 %. DieKappa-Werte lagen zwischen 0.87 und 0.98 und die Yule’sY-Werte zwischen 0.88 und 0.98. Die Übereinstimmungder aktuellen Diagnosen anhand der Kinderinterviews wei-sen für die Oberklassen (Ticstörungen, Angststörungen,Schlafstörungen und keine Diagnosen) sowie die Störungs-ebene (Störung mit Trennungsangst und Spezifische Pho-bie) ebenfalls sehr gute Reliabilitätswerte auf. Alle prozen-tualen Übereinstimmungen lagen über 94.37 %. Die Kap-pa-Werte lagen zwischen 0.89 und 0.98 und die Yule’sY-Werte zwischen 0.87 und 0.97. Ausführliche Tabellen zuden Reliabilitätsmaßen der aktuell bestehenden und derPrimärdiagnosen können bei den Autoren angefordert wer-den.

M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS 327

Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern

Page 10: Interrater-Reliabilität des Diagnostischen Interviews bei ... · tern. Edelbrock, Costello, Dulcan, Kalas und Conover (1985) konnten zeigen, dass diagnostische Interviews mit Kindern

Tabelle 4Interrater-Reliabilität des Kinder-DIPS Kinderversion (Oberklasse, Lebenszeitdiagnosen) für die gesamte Stichprobe(N = 213)

DSM-IV-TR Oberklassen Häufigkeiten % Kappa [95 % KI] Yule’s Y

–/– –/+

+/– +/+

Expansive Störungen 201 0 99.53 (.95) [.86, 1.00] 1.00/.96a

1 11

Ticstörungen 202 6 96.71 (.52) [.17, .87] .94

1 4

Ausscheidungsstörungen 203 0 99.53 (.95) [.84, 1.00] 1.00/.96a

1 9

Affektive Störungen 191 0 99.06 (.95) [.87, 1.00] 1.00/.96a

2 20

Angststörungen 132 1 95.31 .90 [.84, .96] .94

9 71

Essstörungen 208 0 100.00 (1.00)/(.91a) [.72, 1.00]b 1.00/.97a

0 5

Schlafstörungen 195 1 98.59 (.90) [.79, 1.00] .95

2 15

Keine Diagnosen 97 8 95.78 .92 [.86, .97] .95

1 107

Anmerkungen. Kappa-Koeffizienten, die aufgrund einer Basisrate der jeweiligen Oberklasse von < 10 % (n = 21.3 (Formel: (+/+) + ((+/–) +(–/+)/2)) eine Unterschätzung darstellen, sind in Klammer aufgeführt. a Pseudo-Bayes Schätzung von Kappa bzw. Y. – nicht berechenbar. KI =Konfidenzintervalle. b Konfidenzintervall basierend auf Pseudo-Bayes Schätzung von Kappa.

Tabelle 5Interrater-Reliabilität des Kinder-DIPS Kinderversion (Störungsebene, Lebenszeitdiagnosen) für die gesamte Stichprobe(N = 213)

DSM-IV-TR Spezifische Diagnosen Häufigkeiten % Kappa [95 % KI] Yule’s Y

–/– –/+

+/– +/+

Aufmerksamkeitsdefizit-/Hyperaktivitätsstörung 210 0 99.53 (.80) [.40, 1.00] 1.00/.90a

1 2

Störung mit oppositionellem Trotzverhalten 207 0 100.00 (1.00)/(.92a) [.76, 1.00]b 1.00/.97a

0 6

Störung des Sozialverhaltens 208 1 99.53 (.89) [.66, 1.00] .93a

0 4

Tourette-Störung 212 0 100.00 (1.00)/(.67a) [.00, 1.00]b 1.00/.95a

0 1

Chronische motorische oder vokale Ticstörung 208 0 99.53 (.89) [.66, 1.00] 1.00/.93a

1 4

Vorübergehende motorische oder vokale Ticstörung 206 1 99.06 (.83) [.60, 1.00] .94

1 5

Enuresis 204 0 99.53 (.94) [.82, 1.00] 1.00/.96a

1 8

Enkopresis 211 0 100.00 (1.00)/(.80a) [.36, 1.00]b 1.00/.96a

0 2

328 M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS

Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern

Page 11: Interrater-Reliabilität des Diagnostischen Interviews bei ... · tern. Edelbrock, Costello, Dulcan, Kalas und Conover (1985) konnten zeigen, dass diagnostische Interviews mit Kindern

DSM-IV-TR Spezifische Diagnosen Häufigkeiten % Kappa [95 % KI] Yule’s Y

–/– –/+

+/– +/+

Major Depression 195 0 99.06 (.94) [.85, 1.00] 1.00/.96a

2 16

Dysthyme Störung 206 0 99.53 (.92) [.77, 1.00] 1.00/.95a

1 6

Störung mit Trennungsangst 173 2 97.65 (.92 [.85, .99] .94

3 35

Panikstörung ohne Agoraphobie 213 0 100.00 – –

0 0

Panikstörung mit Agoraphobie 212 0 100.00 – –

1 0

Agoraphobie ohne Panikstörung 210 1 99.06 (.50) [.00, 1.00] .87

1 1

Spezifische Phobie 187 0 99.53 (.98 [.93, 1.00] 1.00/.97a

1 25

Sozialphobie 198 1 99.06 (.92) [.82, 1.00] .96

1 13

Selektiver Mutismus 212 0 99.53 – –

1 0

Zwangsstörung 209 0 99.53 (.86) [.57, 1.00] 1.00/0.92a

1 3

Generalisierte Angststörung 205 0 98.59 (.76) [.50, 1.00] 1.00/.92a

3 5

Posttraumatische Belastungsstörung 212 0 100.00 (1.00)/(.67a) [.00, 1.00]b 1.00/.95a

0 1

Pica 213 0 100.00 – –

0 0

Anorexia Nervosa 210 0 100.00 (1.00)/(.86a) [.55, 1.00]b 1.00/.96a

0 3

Bulimia Nervosa 212 0 100.00 (1.00)/(.67a) [.00, 1.00]b 1.00/.95a

0 1

Binge Eating Disorder 212 0 100.00 (1.00)/(.67a) [.00, 1.00]b 1.00/.95a

0 1

Primäre Insomnie 202 0 99.53 (.95) [.85, 1.00] 1.00/.96a

1 10

Primäre Hypersomnie 211 1 99.53 (.67) [.01, 1.00] 1.00/.84a

0 1

Schlafstörung mit Alpträumen 208 0 99.53 (.89) [.67, 1.00] 1.00/.93a

1 4

Anmerkungen. Kappa-Koeffizienten, die aufgrund einer Basisrate der jeweiligen Oberklasse von < 10 % (n = 21.3 (Formel: (+/+) + ((+/–) +(–/+)/2)) eine Unterschätzung darstellen, sind in Klammer aufgeführt. aPseudo-Bayes Schätzung von Kappa bzw. Y. – nicht berechenbar. KI =Konfidenzintervalle. bKonfidenzintervall basierend auf Pseudo-Bayes Schätzung von Kappa.

M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS 329

Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern

Page 12: Interrater-Reliabilität des Diagnostischen Interviews bei ... · tern. Edelbrock, Costello, Dulcan, Kalas und Conover (1985) konnten zeigen, dass diagnostische Interviews mit Kindern

Tabelle 6Fehleranalyse des Kinder-DIPS Eltern- und Kinderversion (Störungsebene, Lebenszeitdiagnosen) für die gesamte Stich-probe

Elternversion Kinderversion

Oberklassen (n) Oberklassen (%) Oberklassen (n) Oberklassen (%)

Interviewfehler 11 19.64 4 14.29

Sprungregel falsch angewendet 0 .00 0 .00

Starke Abweichung von standardisierten Fragen 1 1.79 2 7.14

Ungenügende Folgefragen zur Diagnosestellung 9 16.07 1 3.56

Protokollierungsfehler 1 1.79 0 .00

Unvollständigkeit der Befragung 0 .00 0 .00

Andere Gründe 0 .00 1 3.57

Auswertungsfehler 23 41.07 12 42.86

DSM-Kriterien falsch angewendet 18 32.14 10 35.72

Differentialdiagnostische Aspekte falsch beachtet 5 8.93 2 7.14

Unterschiedliche Symptomgewichtung 15 26.79 11 39.28

bezüglich Symptomen 9 16.07 7 25.00

bezüglich Leiden/Beeinträchtigung 6 10.71 4 14.28

Qualität der Tonaufnahme 0 .00 0 .00

Antwort wurde nicht verstanden 0 .00 0 .00

Ein Teil der Aufnahme fehlt (Qualität der Aufnahme) 0 .00 0 .00

Unterschiedliche differentialdiagnostische Bewertung 4 7.14 1 3.57

DSM-IV-TR oder Kinder-DIPS unpräzise/unklar 3 5.36 0 .00

Total 56 100.00 18 100.00

Tabelle 7Binäre logistische Regression der vorhersagenden Wahrscheinlichkeit für übereinstimmende Diagnosestellung zwischenzwei Interviewern in Abhängigkeit des Alters und Geschlechts des interviewten Kindes (gesamte Stichprobe, N = 213)

Prädiktor B SD Odds Ratio (= eB) 95 % KI des Odds Ratio p Wald’s χ2

Untere Grenze Obere Grenze

Konstante 1.69 1.64 5.43 .30 1.07

Alter .08 .15 1.08 .81 1.44 .61 .26

Geschlecht (männlich = 1, weiblich = 2) 2.04 2.09 7.69 .13 461.18 .33 .95

Alter × Geschlecht –.22 .18 .80 .56 1.14 .21 1.56

Anmerkungen. SD = Standardfehler; KI = Konfidenzintervall. R2 = 11.75 (Hosmer & Lemeshow), .02 (Cox & Snell), .04 (Nagelkerke). Modellχ2(3) = 3.72, p = .29.

Tabelle 8Binäre logistische Regression der vorhersagenden Wahrscheinlichkeit für übereinstimmende Diagnosestellung zwischenzwei Interviewern in Abhängigkeit des Alters und Geschlechts des interviewten Kindes (nach Ausschluss der Kinder ohneDiagnose, n = 106)

Prädiktor B SD Odds Ratio (= eB) 95 % KI des Odds Ratio p Wald’s χ2

Untere Grenze Obere Grenze

Konstante .51 1.73 1.67 .77 .09

Alter .12 .16 1.13 .83 1.52 .45 .58

Geschlecht (männlich = 1, weiblich = 2) .88 2.29 2.40 .03 212.88 .70 .15

Alter × Geschlecht –.15 .20 .86 .59 1.26 .44 .60

Anmerkungen. SD = Standardfehler; KI = Konfidenzintervall. R2 = 7.85 (Hosmer & Lemeshow), .03 (Cox & Snell), .05 (Nagelkerke). Modellχ2(3) = 3.61, p = .31.

330 M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS

Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern

Page 13: Interrater-Reliabilität des Diagnostischen Interviews bei ... · tern. Edelbrock, Costello, Dulcan, Kalas und Conover (1985) konnten zeigen, dass diagnostische Interviews mit Kindern

Einfluss des Alters und des Geschlechts derinterviewten Kinder

Zusätzlich wurde untersucht, ob das Geschlecht und das Altereinen Einfluss auf die Reliabilitätswerte der Kinderinter-views haben. Die deskriptiven Vergleiche ergaben, dass dasGeschlecht keinen Einfluss auf die Reliabilitätswerte der Le-benszeitdiagnosen auf der Ebene von Oberklassen hat (aus-führliche Tabellen können bei den Autoren angefordert wer-den). Der Vergleich der Alterskategorien (6.0–9.99 Jahre,10.0–11.99 Jahre, älter als 12 Jahre) der Kinderinterviewsergab für die Lebenszeitdiagnosen auf der Ebene der Ober-klassen keine nennenswerten Unterschiede hinsichtlich derReliabilitätswerte. Die geringste prozentuale Übereinstim-mung betrug über die drei Kategorien 92.86 % (Ticstörun-gen), der niedrigste Kappa-Wert betrug 0.86 (Schlafstörun-gen) und der niedrigste Yule’s Y-Wert betrug 0.75 (ExpansiveStörungen). Nach Burke (1986) können diese Werte als sehrgute Übereinstimmungen interpretiert werden. Für die spezi-fischen Lebenszeitdiagnosen Störung mit Trennungsangst,Spezifische Phobie und Soziale Phobie zeigte sich deskriptiv,dass auch hier keine Altersunterschiede in Bezug auf die Re-liabilitätswerte bestehen. Die Alterskategorie der jüngstenKinder wurde nochmals in zwei Gruppen eingeteilt, um denEinfluss des Alters zu untersuchen. Die Gruppe der 6.00 bis7.99-Jährigen unterschied sich nicht nennenswert von derGruppe der 8.00 bis 9.99-Jährigen und die Gruppe der 6.0 bis8.99-Jährigen unterschied sich nicht von der Gruppe der 9.0bis 9.99-Jährigen hinsichtlich der Reliabilitätswerte. Die In-terrater-Reliabilität für die Lebenszeitdiagnosen auf der Ebe-ne der Oberklassen sowie die überprüften spezifischen Le-benszeitdiagnosen ergab gute bis sehr gute Werte (ausführli-che Tabellen können bei den Autoren angefordert werden).

Die kontinuierliche Testung des möglichen Einflussesdes Alters und Geschlechts der interviewten Kinder auf dieÜbereinstimmung zwischen zwei Interviewern hinsichtlichder Diagnosestellung, wurde mittels einer binären logisti-schen Regressionsanalyse überprüft. Tabelle 7 können dieErgebnisse für die Gesamtstichprobe der Kinderinterviews(N = 213) und Tabelle 8 können die Ergebnisse der Teil-stichprobe der Kinderinterviews nach Ausschluss der ge-sunden Kinder (N = 106), d. h. ohne Diagnosen einer psy-chischen Störung, entnommen werden. Die Ergebnisse ver-weisen darauf, dass die Wahrscheinlichkeit für eineDiagnose-Übereinstimmung zweier Interviewer wederdurch das Alter noch durch das Geschlecht des interview-ten Kindes signifikant beeinflusst wird.

Diskussion

Die Ergebnisse der vorliegenden Studie zur Interrater-Re-liabilität zeigen, dass die 2. Auflage des Kinder-DIPS gutebis sehr gute Interrater-Reliabilitäten aufweist, welche ver-gleichbar mit jenen der 1. Auflage des Kinder-DIPS (Un-

newehr et al., 1995) sind. Aufgrund der umfangreicherenStichprobengröße sowie der höheren Auftretenshäufigkeitspezifischer Störungsbereiche, konnten für die vorliegendeUntersuchung im Vergleich zur Überprüfung der 1. Aufla-ge für weitere Störungsbilder Reliabilitätsmaße berechnetund interpretiert werden. Gute bis sehr gute Interrater-Re-liabilitäten ergaben sich für die Eltern- und Kinderversionder Kinder-DIPS-Oberklassen Expansive Störungen, Tic-störungen, Ausscheidungsstörungen, Affektive Störungen,Angststörungen, Essstörungen und Schlafstörungen. An-hand der Kinderinterviews konnten neben der prozentualenÜbereinstimmung, welche mindestens bei 97.65 % lag, für23 der 27 spezifischen Kinder-DIPS-Diagnosen, weitereÜbereinstimmungsmaße berechnet werden (Ausnahme:Panikstörung ohne/mit Agoraphobie, Selektiver Mutismusund Pica). Alle Kappa- und Y-Koeffizienten sind als gutbis sehr gut zu interpretieren (Ausnahme: Agoraphobieohne Panikstörung, Kappa = 0.50). Für 21 der 29 spezifi-schen Diagnosen der Elterninterviews konnten neben derprozentualen Übereinstimmung, welche mindestens bei96.07 % lag, weitere Übereinstimmungsmaße berechnetwerden (Ausnahmen: Panikstörung ohne/mit Agoraphobie,Selektiver Mutismus, Pica, BED, Primäre Hypersomnie,Pavor Nocturnus und Schlafstörung mit Schlafwandeln).Alle Kappa- und Y-Koeffizienten können als gut bis sehrgut interpretiert werden. Der Ausschluss von psychischenStörungen erwies sich für die Eltern- (98.86 %) und dieKinderversion (95.78 %) ebenfalls als sehr reliabel.

Mittels der Methode der Pseudo-Bayes Schätzung (Bi-shop et al., 2007) konnten Kappa- und Y-Koeffizienten fürStörungsbilder mit einer zu geringen Basisrate (< 10 %)berechnet und interpretiert werden. Nach Ausschluss derKinder ohne psychische Störungen konnten weitere Kap-pa-Koeffizienten auf der Basis von Lebenszeitdiagnosenfür spezifische Diagnosen der Eltern- und Kinderinter-views interpretiert und als sehr gut eingeschätzt werden.

Ergebnisse im Vergleich zu weiterendeutschsprachigen klinischen Interviews

Die Interrater-Reliabilität des Kinder-DIPS kann nur be-dingt mit den Gütekriterien anderer deutschsprachiger In-terviews verglichen werden. Mit einem Kappa von 0.71und einer prozentualen Übereinstimmung von 79 % liegenebenfalls gute Interrater-Reliabilitätsmaße der Diagnose-stellung anhand des MEI (Esser et al., 1989) vor. Diesewurden jedoch anhand von nur 34 Interviews erhoben undbedürfen daher einer Replikation an einer größeren Stich-probe, die es auch erlaubt, für spezifische StörungsbilderGütekriterien zu bestimmen. Die Befunde zur Prüfung ei-niger Symptomskalen des CASCAP-D lassen keinen Ver-gleich mit der Interrater-Reliabilität des Kinder-DIPS zu,da anhand des CASCAP-D keine Diagnosestellung erfolgt(Döpfner, Berner, Schwitzgebel & Lehmkuhl, 1994). AusMangel an publizierten Befunden zur Reliabilität der

M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS 331

Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern

Page 14: Interrater-Reliabilität des Diagnostischen Interviews bei ... · tern. Edelbrock, Costello, Dulcan, Kalas und Conover (1985) konnten zeigen, dass diagnostische Interviews mit Kindern

Checklisten des DISYPS-II (Döpfner et al., 2008) und desK-SADS (Delmo et al., 2001), können ebenfalls keine wei-tergehenden Vergleiche mit Reliabilitätsbefunden deutsch-sprachiger diagnostischer Verfahren berichtet werden.

Fehlerquellen

In 44 der 264 Eltern- sowie 20 der 213 Kinderinterview lagkeine Übereinstimmung zwischen zwei Interviewern in al-len Lebenszeitdiagnosen vor. Als häufigste Fehlerquellewurde die fehlerhafte Anwendung der DSM-IV-TR-Krite-rien (Auswertungsfehler) ermittelt. Über alle Interviewsbetrachtet, ist die Fehlerquote jedoch relativ gering.

Da das Kinder-DIPS auf dem DSM aufbaut, kann die Re-liabilitätsprüfung des Kinder-DIPS auch als Überprüfung derReliabilität der Diagnosekriterien des DSM-IV-TR betrach-tet werden. Diese enge Verknüpfung mit dem DSM-IV-TRmachte das Kinder-DIPS abhängig von der Gültigkeit undVeränderungen des Klassifikationssystems. Somit könnenstrukturierte und standardisierte Interviews lediglich so relia-bel sein, wie das Klassifikationssystem auf dem sie beruhen.

Einfluss des Geschlechts und des Alters derKinder auf die Reliabilität

In der vorliegenden Untersuchung wurden einerseits dieReliabilitätsmaße getrennt nach Geschlecht sowie Alters-kategorien der Kinderinterviews berechnet und deskriptivverglichen und andererseits wurde eine binäre logistischeRegressionsanalyse mit den Kovariablen Alter und Ge-schlecht der interviewten Kinder berechnet. Es zeigte sich,dass das Geschlecht des Kindes keinen Einfluss auf die In-terrater-Reliabilität hat. Dieses Ergebnis steht im Gegen-satz zu den Befunden von Herjanic et al. (1975), dass Mäd-chen reliablere Informanten sind als Jungen und bestätigtdie Ergebnisse von Edelbrock et al. (1985) und Angold etal. (1996), wonach kein Geschlechtsunterschied für Relia-bilitätswerte bzw. präzise Antworten im Rahmen diagnos-tischer Interviews vorhanden waren. Somit kann angenom-men werden, dass die Reliabilität des Kinder-DIPS nichtmit dem Geschlecht des Kindes in Zusammenhang steht.Zur Anwendung von diagnostischen Interviews in Abhän-gigkeit vom Alter des Kindes liegen, wie oben berichtet,unterschiedliche Befunde vor (Angold et al., 1996; Edel-brock et al., 1985; Herjanic et al., 1975; Poustka, 1988).Dem Alter der Kinder konnte in der vorliegenden Untersu-chung keine entscheidende Rolle hinsichtlich der Interra-ter-Reliabilitätsmaße beigemessen werden. Die prozentua-len Übereinstimmungen, die Kappa- und die Y-Werte sindfür die überprüften Alterskategorien deskriptiv vergleich-bar und das Alter hat keinen signifikanten Einfluss auf dieÜbereinstimmung zwischen zwei Interviewern. Somitkann das Kinder-DIPS bereits mit Kindern im Grundschul-alter durchgeführt werden. Die Ergebnisse der vorliegen-

den Untersuchung stehen in Einklang mit denjenigen vonHerjanic et al. (1975), unterscheiden sich jedoch von jenenvon Angold et al. (1996), Edelbrock et al. (1985) und derLehrmeinung von Poustka (1988).

Bei der Rekrutierung wurde speziell darauf geachtet,dass neben den Interviews im Rahmen des Forschungspro-jekts, Kinder und Eltern aus klinisch-psychiatrischen undschulpsychologischen Institutionen rekrutiert wurden. Derhäufige Einwand, dass strukturierte Interviews primär imForschungskontext reliabel durchführbar sind, kann durchdie Ergebnisse der vorliegen Studie nicht bestätigt werden.Es zeigte sich, dass unabhängig vom Rekrutierungsort unddem Alter der Kinder reliable Interviewergebnisse erzieltwerden konnten.

Einschränkungen

Einschränkend muss erwähnt werden, dass aufgrund klei-ner Stichprobengrößen, auch nach Ausschluss von Kindernohne psychische Störungen, für spezifische Störungsberei-che (Elterninterviews: Tic-, Ess- und Schlafstörungen; Kin-derinterviews: Tic-, Ausscheidungs- und Schlafstörungen)eine abschließende Interpretation und Beurteilung der In-terrater-Reliabilität nicht möglich ist und die Befunde alsvorläufig betrachtet werden müssen. Des Weiteren warendie Studienbedingungen für die Teilnehmenden der dreiTeilstichproben nicht exakt identisch. Für das Forschungs-projekt wurden spezifische Alterskategorien (6- bis 12-Jäh-rige) rekrutiert und es bestand eine Zeitvorgabe bzgl. derDurchführung des Interviews. Diese gezielte Rekrutierungeiner bestimmten Alterskategorie sowie der Zeitdruck zurDurchführung des Interviews bestanden in der Praxis nicht.Weiterhin wurden alle Interviews und Gegenkodierungender Interviews in den beiden Praxisinstitutionen von Psy-chologen mit Bachelorabschluss durchgeführt. Die neundiplomierten Psychologinnen haben lediglich im For-schungskontext Interviews geführt. Aus diesem Grundkonnte der Ausbildungsgrad bzw. die klinische Erfahrungder Interviewer, nicht berücksichtigt und nicht analysiertwerden, ob der Ausbildungsstand mit der Interviewdaueroder höheren Reliabilitätswerten einhergeht. Aufgrund desstandardisierten Trainings zur Durchführung des Kinder-DIPS, kann jedoch davon ausgegangen werden, dass alleInterviewer einen Mindeststandard an klinischer Erfahrungmit strukturierten Interviews aufwiesen. Weiter kann dasFehlen von näheren Angaben zum Bildungsstand der El-tern bemängelt werden. Der Einfluss von Schul- und Be-rufsbildung der Eltern hinsichtlich der Reliabilität der In-terviewdaten konnte daher nicht untersucht werden.

Schlussfolgerungen und Ausblick

Basierend auf den Ergebnissen kann gezeigt werden, dass dasKinder-DIPS ein reliables Erhebungsinstrument für die Di-

332 M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS

Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern

Page 15: Interrater-Reliabilität des Diagnostischen Interviews bei ... · tern. Edelbrock, Costello, Dulcan, Kalas und Conover (1985) konnten zeigen, dass diagnostische Interviews mit Kindern

agnostik psychischer Störungen sowie für den Ausschlusspsychischer Störungen im Kindes- und Jugendalter anhandvon Eltern- und Kindinformationen ist. Zudem ist die unter-suchte Stichprobe der Eltern (N = 264) und Kinder (N = 213)auch im internationalen Kontext als groß zu betrachten, dieGeschlechterverteilung der Kinder ist ausgeglichen, es wur-den Interviews im Forschungskontext sowie in der Praxisdurchgeführt, ein breites Spektrum hinsichtlich des Alters derKinder konnte berücksichtigt werden und neben genügendDeutschkenntnissen wurde auf weitere Ausschlusskriterienverzichtet. Es zeigten sich gute bis sehr gute Reliabilitätsma-ße, unabhängig vom Alter und Geschlecht der Kinder. Dievorliegenden Ergebnisse und Hinweise, dass auch klinischeBeurteiler vom Einsatz strukturierter Interviews profitierenkönnen (Dolle, Schulte-Körne, von Hofacker, Izat & All-gaier, 2012), machen das Kinder-DIPS für die Praxis undForschung einsetzbar. In Anbetracht dieser Gegebenheitenkönnen die Ergebnisse der psychometrischen Überprüfungdes Kinder-DIPS als sehr gut beurteilt werden. Die vorliegen-den Ergebnisse zur Interrater-Reliabilität sollen durch Unter-suchungen zur Akzeptanz, Test-Retest-Reliabilität und zurValiditätsprüfung (in Vorbereitung) des Kinder-DIPS ergänztwerden. Ergebnisse zur Akzeptanz des Kinder-DIPS zeigen,dass Kinder und ihre Eltern am Interview wieder teilnehmenwürden und sie sich durch die strukturierte Diagnostik gutverstanden fühlen (in Vorbereitung). Ein breiter Einsatzstrukturierter Interviews erscheint daher wünschenswert undmachbar (Seehagen, Pflug & Schneider, 2012).

Abschließend soll darauf hingewiesen werden, dassstrukturierte Interviews, wie das Kinder-DIPS, eines strin-genten Trainings in Durchführung und Auswertung bedür-fen. Nur so kann die reliable und valide Anwendung sicher-gestellt werden.

Danksagung

Die Autoren danken allen Kindern und Eltern für die Teil-nahme an der Studie, allen Interviewern für die Durchfüh-rung und Auswertung der Interviews sowie der Kinder- undJugendpsychiatrie Baselland und dem Schulpsychologi-schen Dienst Basel-Stadt für die Unterstützung des For-schungsprojektes.

Literatur

Ambrosini, P. (2000). Historical development and present statusof the Schedule for Affective Disorders and Schizophrenia forSchool-Age Children (K-SADS). Journal of the AmericanAcademy of Child and Adolescent Psychiatry, 39, 49–58.

American Psychiatric Association. (Eds.). (2000). Diagnostic andStatistical Manual of Mental Disorders – Text Revision (DSM-IV-TR). Washington, DC: Autor.

Angold, A. (2002). Diagnostic interviews with parents and child-ren. In M. Rutter & E. Taylor (Hrsg.), Child and adolescentpsychiatry (4th ed., pp. 32–51). Oxford: Blackwell Science.

Angold, A., Erkanli, A., Costello, E. J. & Rutter, M. (1996). Pre-cision, reliability and accuracy in the dating of symptom onsetsin child and adolescent psychopathology. Journal of ChildPsychology and Psychiatry, 37, 657–664.

Asendorpf, J. & Wallbott, H. G. (1979). Maße der Beobachtungs-übereinstimmung: Ein systematischer Vergleich. Zeitschrift fürSozialpsychologie, 10, 243–252.

Bishop, Y. M. M., Fienberg, S. E. & Holland, P. W. (2007). Dis-crete multivariate analysis: Theory and applications. NewYork: Springer.

Bölte, S., Rühl, D., Schmötzer, G. & Poustka, F. (2005). Diagnos-tisches Interview für Autismus – Revidiert (ADI-R). Bern: Hu-ber.

Breton, J.-J., Bergeron, L., Valla, J.-P., Lapine, S., Houde, L. &Gaudet, N. (1995). Do children aged 9–11 years unterstand theDISC version 2.25 questions? Journal of the American Acad-emy of Child and Adolescent Psychiatry, 34, 946–956.

Burke, J. D. (1986). Diagnostic categorization by the DiagnosticInterview Schedule (DIS): A comparison with other methodsof assessment. In J. Barrett & R. M. Rose (Eds.), Mental dis-orders in the community (pp. 255–285). New York: Guilford.

Cohen, J. (1960). A coefficient of agreement for nominal scales.Educational and Psychological Measurement, 20, 37–46.

Costello, E. J., Egger, H. & Angold, A. (2005). 10-year researchupdate review: The epidemiology of child and adolescent psy-chiatry disorders: I. methods and public health burden. Journalof the American Academy Child and Adolescent Psychiatry,44, 972–986.

Delmo, C., Weiffenbach, O., Gabriel, M., Stadler, C. & Poustka,F. (2001). Diagnostisches Interview. Kiddie-Sads-Present andLifetime Version (K-SADS-PL). Frankfurt am Main: Klinik fürPsychiatrie und Psychotherapie des Kindes- und Jugendalters.

Dolle, K., Schulte-Körne, G., von Hofacker, N., Izat, Y. & AllgaierA.-K. (2012). Übereinstimmung von klinischer Diagnose, struk-turierten Interviews und Selbstbeurteilungsfragebögen bei De-pression im Kindes- und Jugendalter. Zeitschrift für Kinder- undJugendpsychiatrie und Psychotherapie, 40, 405–414.

Döpfner, M., Berner, W., Flechtner, H., Lehmkuhl, G. & Steinhau-sen, H.-C. (1999). Psychopathologisches Befund-System für Kin-der und Jugendliche (CASCAP-D). Göttingen: Hogrefe.

Döpfner, M., Berner, W., Schwitzgebel, P. & Lehmkuhl, G.(1994). Dimensionen psychischer Störungen bei Kindern undJugendlichen auf der Basis klinischer Beurteilungen. Zeit-schrift für Kinder- und Jugendpsychiatrie, 22, 299–317.

Döpfner, M., Görtz-Dorten, A. & Lehmkuhl, G. (2008). DISYPS-II. Diagnostik-System für Psychische Störungen nach ICD-10und DSM-IV für Kinder und Jugendliche – II. Bern: Huber.

Edelbrock, C., Costello, A. J., Dulcan, M. K., Kalas, R. & Conover,N. C. (1985). Age differences in the reliability of the psychiatricinterview of the child. Child Development, 56, 265–275.

Eschmann, S., Weber Häner, Y. & Steinhausen, H.-C. (2007). DiePrävalenz psychischer Störungen bei Kindern und Jugendli-chen unter Berücksichtigung soziodemografischer Merkmale.Zeitschrift für Klinische Psychologie und Psychotherapie, 36,270–279.

Essau, C., Karpinski, N. A., Petermann, F. & Conradt, J. (1998).Häufigkeit und Komorbidität psychischer Störungen bei Ju-gendlichen: Ergebnisse der Bremer Jugendstudie. Zeitschriftfür Klinische Psychologie, Psychiatrie und Psychotherapie,46, 105–124.

M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS 333

Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern

Page 16: Interrater-Reliabilität des Diagnostischen Interviews bei ... · tern. Edelbrock, Costello, Dulcan, Kalas und Conover (1985) konnten zeigen, dass diagnostische Interviews mit Kindern

Esser, G., Blanz, B., Geisel, B. & Laucht, M. (1989). MannheimerElterninterview (MEI). Weinheim: Beltz.

Herjanic, B., Herjanic, M., Brown, F. & Wheatt, T. (1975). Arechildren reliable reporters? Journal of Abnormal Child Psy-chology, 3, 41–48.

Heubrock, D. & Petermann, F. (2005). Diagnostik in der klini-schen Kinderpsychologie. In F. Petermann & H. Reinecker(Hrsg.), Handbuch der Klinischen Psychologie und Psycho-therapie (S. 178–190). Göttingen: Hogrefe.

Hilbert, A. (in press). Eating Disorder Examination für Kinder:deutschsprachige Übersetzung. Münster: Verlag für Psycho-therapie.

Ihle, W. & Esser, G. (2002). Epidemiologie psychischer Störun-gen im Kindes- und Jugendalter: Prävalenz, Verlauf, Komor-bidität und Geschlechtsunterschiede. Psychologische Rund-schau, 53, 159–169.

In-Albon, T., Dubi, K., Adornetto, C., Blatter-Meunier, J. &Schneider, S. (2011). Neue Ansätze in der Diagnostik vonAngststörungen im Kindes- und Jugendalter und deren Güte-kriterien. Klinische Diagnostik und Evaluation, 4, 133–147.

Keller, F., Grieb, J., Kölch, M. & Spröber, N. (2012). Children’sDepression Rating Scale – Revised by E. O. Poznanski andH. B. Mokros: Deutsche Version (CDRS-R). Göttingen: Hogre-fe.

Kraemer, H. C., Measelle, J. R., Ablow, J. C., Essex, M. J., Boyce,W. T. & Kupfer, D. J. (2003). A new approach to integratingdata from multiple informants in psychiatric assessment andresearch: Mixing and matching contexts and perspectives.American Journal of Psychiatry, 160, 1566–1577.

Lapouse, R. & Monk, M. (1959). Fears and worries in a represen-tative sample of children. American Journal of Orthopsychia-try, 29, 803–818.

Lapouse, R. & Monk, M. (1964). Behavior deviations in a repre-sentative sample of children: Variation by sex, age, race, socialclass, and family size. American Journal of Orthopsychiatry,34, 436–446.

Merikangas, K. R., He, J., Burstein, M., Swanson, S. A., Avene-voli, S., Cui, L., . . . Swendsen, J. (2010). Lifetime prevalenceof mental disorders in U. S. adolescents: Results from the Na-tional Comorbidity Survey replication – Adolescent supple-ment (NCS-A). Journal of American Academy of Child andAdolescent Psychiatry, 49, 980–989.

Mohr, C. & Schneider S. (2013). Anxiety disorders. EuropeanChild Adolescent Psychiatry, 22(Suppl. 1), 17–22.

Poustka, F. (1988). Kinderpsychiatrische Untersuchungen. In H.Remschmidt & M. H. Schmidt (Hrsg.), Kinder- und Jugend-psychiatrie in Klinik und Praxis (Bd. I, S. 478–511). Stuttgart:Thieme.

Rutter, M. & Graham, P. (1968). The reliability and validity ofthe psychiatric assessment of the child: I. Interview with thechild. British Journal of Psychiatry, 114, 563–579.

Schneider, S. & Adornetto, C. (2006). Standardisierte Diagnostikmit Interviews. In F. Mattejat (Hrsg.), Lehrbuch der Psycho-therapie, 4 Verhaltenstherapie mit Kindern, Jugendlichen undderen Familien (S. 159–169). München: CIP-Medien.

Schneider, S., Suppiger, A., Adornetto, C., Unnewehr, S. & Mar-graf, J. (2009). Handbuch zum Kinder-DIPS. In S. Schneider,S. Unnewehr & J. Margraf (Hrsg.), Diagnostisches Interviewbei psychischen Störungen im Kindes- und Jugendalter (Kin-der- DIPS) (S. 1–62). Heidelberg: Springer.

Schneider, S., Unnewehr, S. & Margraf, J. (Hrsg.). (2009). Diag-nostisches Interview bei psychischen Störungen im Kindes-und Jugendalter (Kinder-DIPS) (2. aktualisierte und erweiterteAufl.). Heidelberg: Springer.

Schwab-Stone, M., Fallon, T., Briggs, M. & Crowther, B. (1994).Reliability of diagnostic reporting for children aged 6–11years: A test-retest study of the Diagnostic Interview Schedulefor Children – Revised. American Journal of Psychiatry, 151,1048–1054.

Seehagen, S., Pflug, V. & Schneider, S. (2012). Psychotherapieund Wissenschaft. Harmonie oder Dissonanz? Zeitschrift fürKinder- und Jugendpsychiatrie und Psychotherapie, 40,301–306.

Silverman, K. W. & Ollendick, T. H. (2005). Evidence-based as-sessment of anxiety and its disorders in children and adoles-cents. Journal of Clinical Child and Adolescent Psychology,34, 380–411.

Spitznagel, E. L. & Helzer, J. E. (1985). A proposed solution tothe base rate problem in the kappa statistic. Archives of Gene-ral Psychiatry, 42, 725–728.

Steil, R. & Füchsel, G. (2006). Interviews zur PosttraumatischenBelastungsstörung bei Kindern und Jugendlichen (IBS-KJ).Göttingen: Hogrefe.

Unnewehr, S., Schneider, S. & Margraf, J. (1995). DiagnostischesInterview bei psychischen Störungen im Kindes- und Jugend-alter (Kinder-DIPS). Berlin: Springer.

World Health Organisation (WHO). (2000). The ICD-10, classi-fication of mental and behavioural disorders: Diagnostic cri-teria for research. Geneva: Autor.

Yule, G. U. (1912). On the methods of measuring association be-tween two attributes. Journal of the Royal Statistical Society,75, 579–642.

Manuskripteingang 13. Dezember 2012Nach Revision angenommen 30. April 2013

Mögliche InteressenskonflikteDie Letztautorin, Prof. Dr. Silvia Schneider, ist Mitheraus-geberin des Kinder-DIPS und erhält anteilig ein Autoren-honorar vom Verlag.

Prof. Dr. Silvia Schneider

Klinische Kinder- und JugendpsychologieRuhr-Universität BochumUniversitätsstraße 15044780 [email protected]

334 M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS

Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern