105
Ein Standardprozess für den Datenjournalismus? Journalistische Arbeitsweisen und Data-Mining-Standardprozess im Vergleich Bachelorarbeit im Fach Wissenschaftsjournalismus vorgelegt beim Prüfungsausschuss des Instituts für Journalistik Fakultät Kulturwissenschaften, Technische Universität Dortmund Erstgutachter: Prof. Holger Wormer Zweitgutachter: Prof. Dr. Claus Weihs Eingereicht von Anna Behrend Matrikelnummer: 117385 Studiengang: Wissenschaftsjournalismus Nebenfach: Physik am 23.08.2013

Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

Ein Standardprozess für den Datenjournalismus?

Journalistische Arbeitsweisen und

Data-Mining-Standardprozess im Vergleich

Bachelorarbeit im Fach Wissenschaftsjournalismus

vorgelegt beim Prüfungsausschuss des Instituts für Journalistik

Fakultät Kulturwissenschaften, Technische Universität Dortmund

Erstgutachter: Prof. Holger Wormer Zweitgutachter: Prof. Dr. Claus Weihs

Eingereicht von Anna Behrend

Matrikelnummer: 117385 Studiengang: Wissenschaftsjournalismus

Nebenfach: Physik

am 23.08.2013

Page 2: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

2

Inhaltsverzeichnis

1   Einleitung ............................................................................................................... 5  

1.1   Motivation ............................................................................................................. 5  

1.2   Ziel dieser Arbeit .................................................................................................. 6  

1.3   Forschungsstandrekonstruktion ........................................................................... 7  

2   Theoretische Erschließung des Forschungsfeldes .......................................... 8  

2.1   Begriffsdefinitionen .............................................................................................. 8  2.1.1   Arbeitsprozess, Arbeitsschritt und Handlung ................................................ 8  2.1.2   Daten ............................................................................................................. 9  2.1.3   Journalismus ............................................................................................... 10  2.1.4   Journalistische Recherche .......................................................................... 11  2.1.5   Wissenschaft ............................................................................................... 12  2.1.6   Statistik ........................................................................................................ 13  2.1.7   Data-Mining und Wissensentdeckung in Datenbanken ............................... 14  2.1.8   Datenjournalismus ...................................................................................... 16  

2.2   Qualitätskriterien ................................................................................................ 23  2.2.1   Journalismus ............................................................................................... 23  2.2.2   Wissenschaft ............................................................................................... 25  2.2.3   Vergleich der Qualitätskriterien ................................................................... 27  2.2.4   Datenjournalismus ...................................................................................... 28  

2.3   Arbeitsprozesse ................................................................................................. 31  2.3.1   Journalistischer Rechercheprozess ............................................................ 31  2.3.2   CRISP-DM: Ein Standardprozess für Data-Mining ...................................... 35  2.3.3   Datenjournalistischer Arbeitsprozess .......................................................... 41  

2.4   Arbeitsweisen im Vergleich ................................................................................ 45  2.4.1   Datenjournalismus und herkömmliche journalistische Recherche .............. 45  2.4.2   Datenjournalistischer Arbeitsprozess und CRISP-DM ................................ 47  

3   Forschungsfragen .............................................................................................. 49  

4   Entwicklung der empirischen Methode ............................................................ 51  

4.1   Das teilstandardisierte Experteninterview .......................................................... 51  

4.2   Leitfragen und Operationalisierung .................................................................... 52  

4.3   Entwicklung des Interviewleitfadens .................................................................. 54  

4.4   Die Stichprobe .................................................................................................... 55  4.4.1   Wer ist ein Experte? .................................................................................... 55  4.4.2   Auswahl der Experten ................................................................................. 56  

Page 3: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

3

5   Durchführung der empirischen Erhebung ....................................................... 57  

5.1   Regeln bei der Durchführung von teilstandardisierten Experteninterviews ........ 57  

5.2   Ablauf der Befragungen ..................................................................................... 57  

5.3   Vorgehensweise bei der Auswertung ................................................................ 58  5.3.1   Transkription ............................................................................................... 58  5.3.2   Extraktion .................................................................................................... 59  

6   Ergebnisse der empirischen Erhebung ........................................................... 60  

6.1   Der datenjournalistische Arbeitsprozess ............................................................ 60  

6.2   Verhältnis von datenjournalistischer und herkömmlicher Recherche ................ 62  

6.3   CRISP-DM und der datenjournalistische Arbeitsprozess ................................... 63  

6.4   Fazit zu CRISP-DM-Vergleich und Einschätzung der Experten ........................ 67  

7   Diskussion der Gesamtergebnisse und Ausblick ........................................... 68  

7.1   Arbeitsweisen zwischen herkömmlicher Recherche und CRISP-DM ................ 68  

7.2   Ansprüche an datenjournalistische Arbeitsweisen ............................................. 70  

7.3   CRISP-DM als Leitlinien-Vorlage ....................................................................... 71  

7.4   Reflexion des Forschungsprozesses ................................................................. 73  

7.5   Fazit ................................................................................................................... 75  

7.6   Ausblick und Forschungsdesiderate .................................................................. 76  

8   Bibliographie ....................................................................................................... 77  

Anhang I.   Tabelle der Definitionskriterien ................................................................... i  

Anhang II.   Skizzen: Datenjournalistischer Arbeitsprozess und CRISP-DM ............... ii  

Anhang III.   Interviewleitfaden ..................................................................................... v  

Anhang IV.   Erläuterungen zu den Interviewfragen ................................................. viii  

Anhang V.   Fragebogen zu beruflichen Angaben ...................................................... xi  

Anhang VI.   CRISP-DM-Übersicht ............................................................................ xii  

Anhang VII.   Potentielle Interviewpartner ................................................................. xiii  

Anhang IX.   Regeln der Interviewführung nach Gläser und Laudel ......................... xiv  

Page 4: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

4

Anhang X.   Häufige Fehler im Umgang mit Daten .................................................... xv  

Anhang XI.   Qualitätskriterien der amtlichen Statistik ............................................. xviii  

Anhang XII.   Hilfreiche Quellen für die Erstellung einer Leitlinie ............................... xx  

Page 5: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

5

1 Einleitung

„Data journalist. Computer-assisted reporter. Newsroom developer. Journo-geek. If those of

us who work in the field aren’t quite sure what to call ourselves, it’s little wonder that

sometimes even the people who work beside us are puzzled by what we do.“ 1  Troy Thibodeaux

1.1 Motivation

Seit einigen Jahren geistert das Schlagwort „Datenjournalismus“ durch die deutsche

Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele

Definitionsversuche drehen sich um den Kernaspekt „Geschichten in Daten finden und diese

erzählen“. Seine Verfechter sind der Ansicht, dass Datenjournalismus die angemessene

Reaktion auf die ständig wachsende Datenflut in unserer Gesellschaft darstellt. Nur durch die

eigene Analyse von Daten sei es Journalisten auch in Zukunft möglich, Sachverhalte kritisch

zu hinterfragen, statt Vorgesetztem hinterherzuhecheln. Andere sehen in ihm nur eine Nische

für programmier-affine Journalisten-Nerds oder bestreiten, dass es sich überhaupt um ein

neues Phänomen handelt. Wie auch immer Datenjournalismus zu definieren und einzuordnen

ist: In deutschen Redaktionen gibt es eine Community von Journalisten, die auf diesem Gebiet

tagtäglich arbeitet. Es handelt sich also um ein real existierendes Phänomen, das jedoch bisher

weitestgehend unerforscht ist.

Dementsprechend gibt es eine Vielzahl bisher unbeantworteter Fragen: Sind Datenjournalisten,

da sie eigene Ergebnisse aus Daten extrahieren, eigentlich noch Journalisten oder eher kleine

„Feuerwehrforscher“ 2 ? Und wenn sie Forscher sind, müssten sie dann nicht auch

wissenschaftlichen Qualitätskriterien genügen? Könnten sie das überhaupt in Anbetracht der

stark unterschiedlichen Arbeitsbedingungen in Journalismus und Wissenschaft?

1 THIBODEAUX, Troy: 5 tips for getting started in data journalism. (06.10.2011) http://www.poynter.org/how-tos/digital-strategies/147734/5-tips-for-getting-started-in-data-journalism/ [abgerufen am 22.04.2013]. 2 ZEH, Jürgen: Journalismus als Präzisionsjournalismus. Sozialwissenschaftliche Methodenlehre in der Journalistenausbildung. In: WILKE, Jürgen (Hrsg.): Zwischenbilanz der Journalistenausbildung. München, 1987, S. 145–166, hier S. 147; vgl. auch LEßMÖLLMANN, Annette: Datenjournalismus: Chance für den Journalismus von morgen. (2012) http://www.halem-verlag.de/2012/datenjournalismus-chance-fur-den-journalismus-von-morgen/ [abgerufen am 17.04.2013].

Page 6: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

6

Hinter diesen Fragen verbirgt sich eine übergeordnete Thematik: Wie arbeiten

Datenjournalisten und wie sollten sie arbeiten? Um diese extrem weite Fragestellung für den

Rahmen einer Bachelorarbeit fassbar zu machen, wird ein spezieller Ansatz gewählt: Der

datenjournalistische Arbeitsprozess wird mit einem Standardprozess für Data-Mining

verglichen. Als roter Faden wird dabei die Leitfrage verfolgt, ob dieser Standardprozess als

Vorlage für eine datenjournalistische Leitlinie geeignet ist. Diese Leitfrage enthält die

übergeordnete Thematik und gibt ihr gleichzeitig eine konkrete Form.

Unter einer Leitlinie wird in dieser Arbeit eine Handlungsempfehlung verstanden, die als

Orientierungshilfe dient und bei Befolgung dazu führt, dass bestimmte Qualitätskriterien

eingehalten werden. Um eine Orientierungshilfe geben zu können, müssen die typischen

Arbeitsabläufe bekannt sein. Hier findet sich demnach die Frage wieder, wie

Datenjournalisten arbeiten. Um zu beurteilen, ob eine Leitlinie sinnvoll ist, muss außerdem

geklärt sein, welche Qualitätskriterien gelten, also wie Datenjournalisten arbeiten sollten. Da

Datenanalyse sehr stark mit Wissenschaft assoziiert ist, muss für die Klärung der

Qualitätskriterien auch die Beziehung von Wissenschaft und Datenjournalismus reflektiert

werden. Somit schließt sich der Bogen zu den Ausgangsfragen, in denen diese Beziehung eine

wichtige Rolle spielt.

1.2 Ziel dieser Arbeit Ziel dieser Arbeit ist es herauszufinden, ob sich CRISP-DM als Ausgangspunkt für eine

datenjournalistische Best-Practice-Leitlinie eignet. Als Maß für die Eignung wird zum einen

die Ähnlichkeit von CRISP-DM und datenjournalistischem Arbeitsprozess betrachtet. Zum

anderen wird diskutiert, inwiefern CRISP-DM zur Erreichung datenjournalistischer

Qualitätskriterien beitragen kann. Durch Interviews mit erfahrenen Datenjournalisten werden

auch praktische Aspekte aus dem Arbeitsalltag in die Beurteilung der Eignung mit einbezogen.

Durch Literaturstudium werden im Theorieteil der Arbeit die Gemeinsamkeiten und

Unterschiede von datenjournalistischer Arbeitsweise und CRISP-DM herausgearbeitet.

Außerdem werden datenjournalistische Qualitätskriterien aus den Kriterien für Journalismus

und Wissenschaft abgeleitet. Durch die Ergebnisse der Experteninterviews werden im

empirischen Teil die Kenntnisse über Gemeinsamkeiten und Unterschiede von CRISP-DM

und datenjournalistischem Arbeitsprozess erweitert. Anschließend wird die Eignung von

Page 7: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

7

CRISP-DM als Anhaltspunkt für eine Leitlinie mit Blick auf die theoretischen Überlegungen

sowie Einschätzungen der befragten Datenjournalisten diskutiert.

1.3 Forschungsstandrekonstruktion Soweit der Autorin nach ausführlicher Recherche bekannt ist, gibt es bisher kaum groß

angelegte Forschungsarbeiten zum Thema Datenjournalismus. Eines der wenigen größeren

Projekte wurde vom Zentrum für Journalismus und Kommunikationsmanagement (JoKom)

der Donau-Universität Krems durchgeführt. Insgesamt 1022 Journalistinnen und Journalisten

aus Deutschland, Österreich und der Schweiz wurden gefragt, wie sie mit Daten arbeiten und

wie sie das Potential von Daten für den Journalismus einschätzen.3 Aitamurto, Sirkkunen und

Lehtonen untersuchen in ihrer Studie für das Finnish Strategic Centre for Science, Technology

and Innovation in the field of ICT die Situation des Datenjournalismus in verschiedenen

Ländern mittels Literaturstudium und Experteninterviews. Dabei gehen sie auch auf den

datenjournalistischen Workflow sowie Best Practices ein.4 Das European Journalism Center in

Kooperation mit dem Datenjournalisten Mirko Lorenz untersucht derzeit in einer Online-

Umfrage, wie ein Curriculum für datenjournalistische Trainings aussehen sollte.5

Neben einigen Artikeln in Fachzeitschriften gibt es vor allem im Netz eine ganze Reihe von

Erläuterungen sowie Definitions- und Einordnungsversuchen zum Thema Datenjournalismus.

Als Standardwerke, die vor allem den Charakter von Handlungsanleitungen haben, könnten

vielleicht am ehesten das „Data Journalism Handbook“6 und Brant Houstons „Computer-

Assisted Reporting: A Practical Guide“ 7 bezeichnet werden. Die meisten Tipps und

Anleitungen finden sich jedoch auf Blogs und in Vortragsfolien im Internet.

Wissenschaftliche Arbeiten sind rar.

3 Vgl. DONAU-UNIVERSITÄT KREMS: Datenjournalismus in Österreich: Potentiale noch nicht ausgeschöpft. (05.10.2012) http://www.donau-uni.ac.at/de/department/wissenkommunikation/news/id/18611/index.php [abgerufen am 17.08.2013]. 4 Vgl. AITAMURTO, Tanja, Esa SIRKKUNEN und Pauliina LEHTONEN: Trends in Data Journalism. (2011) http://virtual.vtt.fi/virtual/nextmedia/Deliverables-2011/D3.2.1.2.B_Hyperlocal_Trends_In%20Data_Journalism.pdf [abgerufen am 22.04.2013] S. 11f. 5 Vgl. EUROPEAN JOURNALISM CENTRE und Mirko LORENZ: DATA-DRIVEN JOURNALISM: How should a curriculum for data journalism trainings look like? http://www.surveymonkey.com/s.aspx?sm=2jRFF7W5Re%2bj9s5jn3WJcvb9JzKs0HiuTX3JnhrJb3o%3d#q5 [abgerufen am 17.08.2013]; BONEGROU, Liliana: What are the training needs for data-driven journalism? (2011) Präsentation auf der Open Knowledge Conference, 2011, Berlin. 6 EUOPEAN JOURNALISM CENTRE und OPEN KNOWLEDGE FOUNDATION: The Data Journalism Handbook. http://datajournalismhandbook.org/ [abgerufen am 17.04.2013]. 7 HOUSTON, Brant: Computer-assisted reporting: a practical guide. Boston [u.a.], 2004.

Page 8: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

8

Im deutschsprachigen Raum sind nach Kenntnis der Autorin vor allem einige

Abschlussarbeiten über Datenjournalismus entstanden.8 Thematisch kommt die Bachelorarbeit

von Alexander Haase an der Hochschule Mittweida der vorliegenden Arbeit am nächsten. In

seiner Arbeit geht er auf die Verwandtschaft von Datenjournalismus und Wissensentdeckung

in Datenbanken (KDD) ein und entwirft einen Workflow für Datenjournalisten, der an KDD-

Methoden angelehnt ist. Seine Handlungsempfehlungen sollen „ungeübten Journalisten den

Einstieg in komplexere, datenjournalistische Projekte erleichtern“9. Einen empirischen Teil

umfasst die Arbeit von Haase im Gegensatz zu der vorliegenden Arbeit nicht.

2 Theoretische Erschließung des Forschungsfeldes

2.1 Begriffsdefinitionen

2.1.1 Arbeitsprozess, Arbeitsschritt und Handlung

In dieser Arbeit werden verschiedene Arbeitsprozesse miteinander verglichen. Unter einem

Arbeitsprozess wird die zeitliche Abfolge verschiedener Handlungen zur Erfüllung einer

Aufgabe verstanden. Die Begriffe Arbeitsprozess, Arbeitsablauf und Workflow werden im

Folgenden äquivalent verwendet.

Arbeitsprozesse lassen sich in einzelne Schritte unterteilen, die der Erfüllung bestimmter

Aufgaben dienen. Diese Schritte beinhalten wiederum eine Abfolge mehrerer Handlungen, die

nochmals beliebig fein in Teilhandlungen zerlegt werden können. Hinter Handlungen verbirgt

sich also fast immer ein Verbund oder ein Netz von Teilhandlungen.10 Solche Handlungsnetze

oder -verbünde lassen sich entweder ganz allgemein oder sehr detailliert beschreiben. Balog

spricht vom „Akkordeoneffekt“, der „in jeder Handlungsbeschreibung latent enthalten ist, ‚da

8 BONS, Katharina: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien. Diplomarbeit an der TU Dortmund, 2012; KRAMPE, Anna-Lena: Journalistische Datens(ch)ätze. Definition, Einordnung und Qualitätskriterien von Datenjournalismus. Masterarbeit an der Hamburg Media School, 2011; IHLE, Anne: Datenjournalismus - ein neues journalistisches Arbeitsfeld? Bachelorarbeit an der TU Ilmenau, 2011; KAWALKOWSKI, Blasius: Trend oder Zukunft: Daten als zentraler Gegenstand der journalistischen Berichterstattung. Eine Untersuchung zu den Perspektiven und Möglichkeiten des Datenjournalismus. Bachelorarbeit an der Hochschule Bonn-Rhein-Sieg, 2012. 9 HAASE, Alexander: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus. Bachelorarbeit an der Hochschule Mittweida, 2011, S. 33. 10 Vgl. BUCHER, Hans-Jürgen: Journalismus als kommunikatives Handeln. In: LÖFFELHOLZ, Martin (Hrsg.): Theorien des Journalismus: ein diskursives Handbuch. Wiesbaden, 2000, S. 245–273, hier S. 253; vgl. auch HÖFFE, Otfried (Hrsg.): Lexikon der Ethik. München, 1997, S. 123f.

Page 9: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

9

eine Handlung, genau wie das besagte Musikinstrument, bis auf ein Minimum

zusammengedrängt, aber auch ganz weit auseinandergezogen werden kann.’“11

Dies hat unmittelbaren Einfluss auf die Vergleichbarkeit von Arbeitsprozessen, deren

Arbeitsschritte unterschiedlich detailliert beschrieben sein können. Während für den einen

Prozess vielleicht die Einzelheiten der Handlungsverbünde bekannt sind, liegt für einen

anderen Prozess eventuell nur eine sehr grobe Beschreibung vor. Auf diese Problematik wird

an den entsprechenden Stellen der vorliegenden Arbeit hingewiesen.

Bei der Beschreibung der Arbeitsprozesse in dieser Arbeit werden vor allem der Vollzug der

Handlungen und deren Ziele betrachtet.12 Die Werkzeuge der Handlungen sind vor allem beim

Vergleich von datenjournalistischer und herkömmlicher Recherche von Interesse. Um

übergeordnete Intentionen von Handlungen beziehungsweise ihre Prägung durch Wert- und

Normvorstellungen geht es in den Abschnitten über Qualitätskriterien.13

2.1.2 Daten

„Vor diesem Hintergrund der Omnipräsenz von Daten ist es erstaunlich, wie wenig die Frage

gestellt wird, was Daten, insbesondere wissenschaftliche Daten, eigentlich sind.“14

Sibylle Anderl

Daten kommen in vielen Kontexten unseres Lebens vor. Entsprechend vielfältig sind auch die

möglichen Perspektiven bei der Definition dieses Begriffs. In der Informationstechnologie

wird unter Daten „eine beliebige Aneinanderreihung von Zeichen, die nach definierten Regeln

verarbeitet, gespeichert oder transportiert werden“15 verstanden. Da Datenjournalismus meist

computergestützt arbeitet (siehe auch Abschnitt 2.1.8), trifft diese Definition für die

verwendeten Daten in der Regel zu. Sie vernachlässigt jedoch den für diese Arbeit

wesentlichen Aspekt, dass Daten stets einen Entstehungskontext haben. Zweckmäßiger für

diese Arbeit ist daher die Perspektive der wissenschaftlich erhobenen Daten. Diese sind das

Ergebnis von Messungen natürlicher Phänomene oder von Erhebungen über menschliches

11 Feinberg zit. nach BALOG, Andreas: Rekonstruktion von Handlungen: Alltagsintuitionen und soziologische Begriffsbildung. Opladen, 1989, S. 109. 12 Zu den formalen Elementen einer Handlung vgl. auch HÖFFE (Hrsg.): Lexikon der Ethik, S. 123f. 13 Zu den Wert- und Normvorstellungen journalistischen Handelns vgl. z.B. ALTMEPPEN, Klaus-Dieter: Entscheidungen und Koordinationen. In: LÖFFELHOLZ, Martin (Hrsg.): Theorien des Journalismus: Ein diskursives Handbuch. Wiesbaden, 2004, S. 293–310, hier S. 300. 14 ANDERL, Sibylle: Der Datenmythos. In: Planckton. (2013) http://blogs.faz.net/planckton/2013/04/11/der-datenmythos-681/ [abgerufen am 22.04.2013]. 15 MAELICKE, Bernd (Hrsg.): Lexikon der Sozialwirtschaft. Baden-Baden, 2008, S. 213f.; vgl. auch FISCHER, Peter: Lexikon der Informatik. Berlin, Heidelberg, 2011, S. 207.

Page 10: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

10

Verhalten. 16 Für die vorliegende Arbeit soll diese Definition noch um „Angaben über

Personen, Gegenstände oder Institutionen“17 ergänzt werden, die nicht in wissenschaftlichem

Rahmen erhoben wurden. Daten in diesem Sinne sind durch die Art der Erhebung immer

Störfaktoren ausgesetzt.18

2.1.3 Journalismus

Journalismus wird in dieser Arbeit als gesellschaftliches Teilsystem mit bestimmten Aufgaben

gesehen. Je nachdem, welchem Ansatz man folgt, hat dieses System entweder Funktionen, die

sich historisch entwickelt haben, beispielsweise die „Herstellung von Öffentlichkeit“19 und die

Sicherung der Partizipation aller am gesellschaftlichen Ganzen.20 Oder aber die Aufgaben des

Journalismus sind durch die fundamentalen Werte einer demokratisch-pluralistischen

Gesellschaft gegeben. Daraus ergeben sich Aufgaben wie Kritik und Kontrolle der Regierung

sowie ein Beitrag zur Meinungs- und Willensbildung.

Die Beschreibung der Aufgaben und Ziele reicht jedoch nicht aus, um das System

Journalismus hinreichend zu definieren. Wesentlich dafür ist auch die Kenntnis der in diesem

System wirkenden Akteure. Um das Verhältnis dieser Akteure zu verdeutlichen, bietet sich ein

abgeändertes Weischenbergsches Zwiebelmodell an, wie es auch Bons in ihrer Diplomarbeit

verwendet.21 Sie benutzt eine Kombination von Weischenberg-Adaptionen nach Esser und

Huber.22 Die äußere Schale dieses Modells symbolisiert den gesellschaftlichen Rahmen, in

dem Journalismus sich bewegt. Durch die darin liegende Schale wird der Einfluss der

Rezipienten symbolisiert. 23 Die wiederum darin enthaltene Medienstrukturschale

berücksichtigt rechtliche und ökonomische Einflussfaktoren auf den Journalismus. Noch

weiter innen spiegelt die Institutionsschale die Einflüsse am Arbeitsplatz von Journalisten

wider. Im Inneren dieser Zwiebelschalenstruktur steht das Subjekt, also der Journalist. Für die

16 Vgl. HILLMANN, Karl-Heinz: Wörterbuch der Soziologie. Stuttgart, 1994, S. 135. 17 MAELICKE (Hrsg.): Lexikon der Sozialwirtschaft, S. 213f. 18 Vgl. ANDERL: Der Datenmythos. 19 PÖTTKER, Horst: Öffentlichkeit durch Wissenschaft. Zum Programm der Journalistik. In: Publizistik. 43 (1998), S. 229–249, hier S. 237. 20 Vgl. PÖTTKER, Horst: Kompensation von Komplexität. Journalismustheorie als Begründung journalistischer Qualitätsmaßstäbe. In: LÖFFELHOLZ, Martin (Hrsg.): Theorien des Journalismus. Ein diskursives Handbuch. Wiesbaden, 2000, S. 375–390, hier S. 377f.; WEISCHENBERG, Siegfried, Maja MALIK und Armin SCHOLL: Journalismus in Deutschland 2005. Zentrale Befunde der aktuellen Repräsentativbefragung deutscher Journalisten. In: Media Perspektiven. 7 (2006), S. 346–361, hier S. 346. 21 Vgl. BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 6; vgl. auch WEISCHENBERG, Siegfried: Mediensysteme, Medienethik, Medieninstitutionen. Opladen, 1992, S. 67f. 22 Vgl. BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 6. 23 Vgl. HUBER, Christian: Das Journalismus-Netzwerk: wie mediale Infrastrukturen journalistische Qualität beeinflussen. Innsbruck [u.a.], 1998, S. 48f.

Page 11: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

11

vorliegende Arbeit wird im Inneren der Subjektschale noch die journalistische Handlung

hinzugefügt. Damit soll verdeutlicht werden, dass nicht nur die äußeren Schalen auf den

Journalisten wirken,24 sondern auch er als Subjekt seine Handlungen durch seine persönlichen

Einstellungen und Ziele beeinflusst. Außerdem betont diese Anordnung die zentrale Stellung

der journalistischen Handlung in dieser Arbeit. Auch wenn auf die Einflüsse der umgebenden

Schalen im Rahmen dieser Arbeit nicht im Einzelnen eingegangen werden kann, so ist es doch

elementar, die Handlungen in ihrem Kontext zu sehen. Nur so können sie eingeordnet und

weiterführende Fragestellungen im Hinblick auf die verschiedenen Schalen entwickelt werden.

Abbildung 1 Abgeändertes Zwiebelmodell nach Weischenberg

2.1.4 Journalistische Recherche

Das Kernstück journalistischer Arbeit ist die Recherche – zumindest sollte sie es nach

Auffassung des Netzwerks Recherche sein. 25 Eine einheitliche Definition des Begriffs

„Recherche“ existiert nicht. Konsens herrscht lediglich darüber, dass sie das Einholen von

Informationen umfasst.26 Dazu zählt insbesondere auch, dass bereits vorliegendes Material

24 Vgl. ESSER, Frank: Die Kräfte hinter den Schlagzeilen. Englischer und deutscher Journalismus im Vergleich. Freiburg [u.a.], 1998, S. 27; vgl. auch BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 5f. 25 Vgl. NETZWERK RECHERCHE: Leitlinien Recherche-Journalismus. (2010) http://www.netzwerkrecherche.de/nr-Positionen--Positionen-des-netzwerk-recherche/Leitlinien-Recherche-Journalismus/ [abgerufen am 20.08.2013]; vgl. auch LEIF, Thomas (Hrsg.): Mehr Leidenschaft: Recherche. Skandal-Geschichten und Enthüllungs-Berichte. Ein Handbuch zur Recherche und Informationsbeschaffung. Wiesbaden, 2003, S. 17. 26 Vgl. BRENDEL, Detlef und Bernd E. GROBE: Journalistisches Grundwissen: Darstellung der Formen und Mittel journalistischer Arbeit und Einführung in die Anwendung empirischer Daten in den Massenmedien. München, 1976, S. 33; HALLER, Michael: Recherchieren: ein Handbuch für Journalisten. Konstanz, 2000, S. 39; MACHILL, Marcel, Markus BEILER und Martin ZENKER: Journalistische Recherche im Internet: Bestandsaufnahme journalistischer Arbeitsweisen in Zeitungen, Hörfunk, Fernsehen und Online. Berlin, 2008, S. 32; BRENDEL, Matthias und Frank BRENDEL: Richtig recherchieren: wie Profis Informationen suchen und besorgen. Ein Handbuch für Journalisten, Rechercheure und Öffentlichkeitsarbeiter. Frankfurt am Main, 2000, S. 11; ebd., S. 14.

Page 12: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

12

ergänzt wird27 und solche Informationen offengelegt werden, „die für das Verständnis eines

Themas und seiner Einordnung wichtig sind“28. Weitere Merkmale, die in der Literatur als

Definitionskriterien genannt werden, sind die Überprüfung und Bewertung von

Informationen,29 die Evaluation der Relevanz eines Themas,30 das Ziel der Veröffentlichung31

oder das zutage förden von bisher Unbekanntem.32 In der vorliegenden Arbeit werden die

charakteristischen Arbeitsschritte journalistischer Recherche betrachtet. Es scheint daher

sinnvoll, die folgende, eher weite Definition zu wählen, die vordergründig die Handlungen des

Journalisten bei der Recherche umfasst:

Ein Vorgang wird als journalistische Recherche bezeichnet, wenn mit dem direkten oder

indirekten Ziel einer journalistischen Veröffentlichung Informationen eingeholt, überprüft und

beurteilt werden.

Diese sehr allgemein gehaltene Definition gibt die Mindestanforderungen an eine

journalistische Recherche an. Sie lässt offen, wie umfangreich die beschafften Informationen

sind und wie tiefgreifend das Verständnis der zugrunde liegenden Zusammenhänge ist.

2.1.5 Wissenschaft

Wie der Journalismus kann auch die Wissenschaft als gesellschaftliches Teilsystem betrachtet

werden.33 Diesem kommen jedoch andere Aufgaben zu. Das Ziel von Wissenschaft ist „die

Erkenntnisgewinnung“34 und die Formulierung von „als intersubjektiv wahr anerkannte[n]

Aussagen über die Welt“35. Manche Forscher betrachten neue Erkenntnisse als Selbstzweck,36

doch der Wissenschaft kommt auch die Aufgabe zu, Ergebnisse zu produzieren, die zur

Weiterentwicklung der Gesellschaft beitragen.

27 Vgl. LEIF, Thomas: Leidenschaft: Recherche. Skandal-Geschichten und Enthüllungs-Berichte. Opladen [u.a.], 1998, S. 16; MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 34. 28 KLAMMER, Bernd: Empirische Sozialforschung: eine Einführung für Kommunikationswissenschaftler und Journalisten. Konstanz, 2005, S. 31. 29 Vgl. BRENDEL/GROBE: Journalistisches Grundwissen, S. 33; LEIF: Leidenschaft, S. 16f.; HALLER, Michael: Recherchieren. Konstanz, 2004, S. 39; BRENDEL/BRENDEL: Richtig recherchieren, S. 14; MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 34; ebd., S. 32; HALLER: Recherchieren, S. 40. 30 Vgl. MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 34. 31 Vgl. ebd., S. 32; HALLER: Recherchieren, S. 51. 32 Vgl. LEIF: Leidenschaft, S. 16f. 33 Vgl. SCHIMANK, Uwe: Wissenschaft als gesellschaftliches Teilsystem. In: MAASEN, Sabine (Hrsg.): Handbuch Wissenschaftssoziologie. Wiesbaden, 2012, S. 113–124, hier S. 113ff. 34 KLAMMER: Empirische Sozialforschung, S. 61. 35 SCHIMANK: Wissenschaft als gesellschaftliches Teilsystem, S. 114f.; vgl. auch KLAMMER: Empirische Sozialforschung, S. 61. 36 Vgl. SCHIMANK: Wissenschaft als gesellschaftliches Teilsystem, S. 116.

Page 13: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

13

Ein charakteristisches Merkmal des Wissenschaftssystems ist seine Selbstreferentialität:

Publikationen dürfen nur auf als wahr erachteten Aussagen aus anderen Publikationen

aufbauen.37 Auch eine „eklatante Ineffizienz“38 ist charakteristisch für den wissenschaftlichen

Forschungsprozess. Von den zahlreichen Publikationen wird nur eine äußerst geringe Zahl

Teil des von der „Fachgemeinschaft anerkannten Wissenskanons“39. Wissenschaft folgt bei

der Erkenntnissuche bestimmten Regeln. Darunter fallen spezielle technische Vorschriften wie

etwa „Signifikanzniveaus bei statistischen Tests“40 oder auch generelle forschungsethische

Maximen.41

Um die Funktionsweise des Wissenschaftssystems zu verstehen, muss klar sein, dass es – wie

auch der Journalismus – äußeren Einflüssen unterliegt. Dazu gehören ethische, administrative,

ökonomische und politische Faktoren. Zur Bewältigung dieser äußeren Ansprüche hat die

Wissenschaft verschiedene Prozeduren der Selbstkontrolle wie „Promotions- und

Habilitationsverfahren, peer review, Evaluationen, Begutachtungen von Drittmittelanträgen,

Preise und Auszeichnungen, wissenschaftliche Beiräte“ 42 entwickelt. Ähnlich wie der

Journalist im Weischenbergschen Zwiebelmodell ist also auch der Forscher durch

gesamtgesellschaftliche Normen, rechtliche Vorgaben, ökonomische Zwänge, Strukturen des

eigenen Systems und der Institutionen sowie durch die eigenen Vorstellungen beeinflusst.

2.1.6 Statistik

Statistik wird in dieser Arbeit als Wissenschaft43 bzw. Hilfswissenschaft44 angesehen.45 Als

solche beschäftigt sie sich mit dem Sammeln, Analysieren, Präsentieren und Interpretieren

von Daten.46 Hudec und Neumann sehen in Modellen „zur Gewinnung, Beschreibung und

37 Vgl. ebd. 38 Ebd. 39 Ebd. 40 Ebd. 41 Vgl. ebd., S. 116f. 42 BARLÖSIUS, Eva: Wissenschaft als Feld. In: MAASEN, Sabine (Hrsg.): Handbuch Wissenschaftssoziologie. Wiesbaden, 2012, S. 125–136, hier S. 127. 43 Vgl. ANDERSON, David R., Dennis J. SWEENEY und Thomas A. WILLIAMS: statistics (science). In: Encyclopedia Britannica. (2007) http://www.britannica.com/EBchecked/topic/564172/statistics [abgerufen am 03.07.2013]; DUDEN: Statistik. http://www.duden.de/rechtschreibung/Statistik [abgerufen am 03.07.2013]. 44 Vgl. KLAMMER: Empirische Sozialforschung, S. 17; KLAMMER, Bernd: Journalistik und Statistik. In: SCHÄFER, Ulrich P. (Hrsg.): Journalismus in Theorie und Praxis: Beiträge zur universitären Journalistenausbildung. Festschrift für Kurt Koszyk. Konstanz, 1999, S. 227–242, hier S. 230; FERSCHL, Franz: Deskriptive Statistik. Würzburg [u.a.], 1978, S. 13. 45 Manchmal wird Statistik auch als Zusammenfassung von Methoden oder als Teilbereich der Mathematik bezeichnet. Vgl. dazu KAMPS, Udo: Definition»Statistik«. Gabler Wirtschaftslexikon. http://wirtschaftslexikon.gabler.de/Definition/statistik.html [abgerufen am 03.07.2013]; KLAMMER: Empirische Sozialforschung, S. 90; von diesem Bedeutungsfeld abzugrenzen ist die „schriftlich fixierte Zusammenstellung, Aufstellung der Ergebnisse von Massenuntersuchungen“ (DUDEN: Statistik.), die ebenfalls mit Statistik bezeichnet wird. 46 Vgl. ANDERSON/SWEENEY/WILLIAMS: statistics (science).

Page 14: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

14

Analyse von Daten“47 den Gegenstand der Statistik. Statistische Modelle geben den Daten

eine Struktur und beinhalten eine Verteilung der Daten um diese Struktur. So muss

beispielsweise das Modell einer linearen Gleichung zwangsläufig eine Fehlerverteilung

beinhalten.48

Eingesetzt wird die Statistik in „Politik, Wirtschaft und Gesellschaft und allen Geistes-,

Sozial- und Naturwissenschaften einschließlich Medizin und Technik, in denen mit Zahlen

oder Bewertungen gearbeitet wird“49. In der Wirtschaft bietet sie eine ganze Reihe von

Möglichkeiten von der Marktforschung bis hin zur Hilfe bei strategischen Entscheidungen von

Unternehmen.50 Zu den stark wachsenden Bereichen in diesem Feld gehört das Data-Mining,

mit dessen Hilfe beispielsweise aus Kundendaten Erkenntnisse gewonnen werden können, die

für den Erfolg des Betriebs von Interesse sind.51

2.1.7 Data-Mining und Wissensentdeckung in Datenbanken

„We are drowning in information and starving for knowledge.“ 52

Rutherford D. Rogers

Technische Neuerungen haben in den vergangenen Jahren die Produktion und Analyse von

Daten schnell vorangetrieben. Ester schreibt: „Kommerzielle Geräte wie etwa Scannerkassen

sowie wissenschaftliche Instrumente wie z.B. Erdbeobachtungssatelliten oder

Gensequenzierungsautomaten generieren immer größere Mengen von immer komplexeren

Daten.“ 53 Aus diesen Daten durch „(semi)automatische Extraktion“ 54 gültiges, bisher

unbekanntes und potenziell nützliches Wissen zu gewinnen, ist Motivation und Aufgabe des

Knowledge Discovery in Databases (KDD).55

In der Literatur herrscht Uneinigkeit darüber, wie die Begriffe Data-Mining und Knowledge-

Discovery in Databases (KDD, zu dt. Wissensentdeckung in Datenbanken) zu differenzieren

47 HUDEC, Marcus und Christian NEUMANN: Was ist Statistik? Geschichte, Grundlagen, Anwendungen. http://www.stat4u.at/download/1417/WasIstStatistik.pdf [abgerufen am 20.08.2013]. 48 Nach Erläuterungen von Prof. Claus Weihs, Fakultät Statistik, TU Dortmund. 49 KAMPS: Definition»Statistik«. Gabler Wirtschaftslexikon. 50 Vgl. HUDEC/NEUMANN: Was ist Statistik? Geschichte, Grundlagen, Anwendungen. 51 Vgl. ebd. 52 Zit. nach HASTIE, Trevor, Robert TIBSHIRANI und Jerome H. FRIEDMAN: The elements of statistical learning: data mining, inference, and prediction. New York, NY, 2009, S. xi. 53 ESTER, Martin und Jörg SANDER: Knowledge discovery in databases: Techniken und Anwendungen. Berlin [u.a.], 2000, S. 1. 54 Ebd. 55 Vgl. ebd.; vgl. dazu auch HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 32.

Page 15: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

15

sind.56 Ester sieht Data-Mining als den eigentlichen Analyseschritt im KDD-Prozess, der

zusätzlich noch Phasen wie Vorverarbeitung der Daten oder Evaluation der Ergebnisse

enthält.57 Andere Quellen hingegen verwenden die Begriffe KDD und Data-Mining synonym58

oder scheinen unter Data-Mining eher das zu verstehen, was bei Ester als KDD bezeichnet

wird.59 Letzteres trifft auch für den in Abschnitt 2.3.2 beschriebenen Standardprozess für

Data-Mining zu, der nach Fayyad et al. eher als Standardprozess für KDD bezeichnet werden

müsste.

Da die Schritte des KDD-Prozesses nach Ester stark denen des in Abschnitt 2.3.2

beschriebenen Standardprozesses ähneln, wird an dieser Stelle nicht näher auf sie eingegangen.

Angemerkt werden soll jedoch, dass Fayyad et al. KDD als nichttrivialen Prozess bezeichnen

und betonen, dass es sich nicht lediglich um eine geradlinige Berechnung vordefinierter

Größen, wie zum Beispiel Mittelwerten handelt. 60 Es muss darüber hinaus eine Art

Recherche oder Schlussfolgerung („some search or inference“) geben.61

Data-Mining und KDD befinden sich an der Schnittstelle von maschinellem Lernen,

Mustererkennung, Datenbanken, Statistik, künstlicher Intelligenz, Datenvisualisierung und

High-Performance-Computing.62 Anwendung finden sie in den verschiedensten Bereichen in

Wissenschaft und Industrie,63 beispielsweise bei der Berechnung von Luftströmungen aus

Satellitendaten in den Erdwissenschaften oder der Betrugserkennung bei

Kreditkartentransaktionen.64

56 Da es für Data-Mining keinen befriedigenden deutschen Begriff gibt (verwendet wird manchmal Datenmustererkennung) und das englische Wort auch in der deutschen Fachliteratur Verwendung findet, wird in dieser Arbeit der englische Begriff beibehalten. 57 Vgl. ESTER/SANDER: Knowledge discovery in databases, S. 2; FAYYAD, Usama, Gregory PIATETSKY-SHAPIRO und Padhraic SMYTH: From Data Mining to Knowledge Discovery in Databases. In: AI Magazine. 17 (1996), S. 37–54, hier S. 37. 58 Vgl. ENYCLOPAEDIA BRITANNICA: data mining (computer science). In: Encyclopedia Britannica http://www.britannica.com/EBchecked/topic/1056150/data-mining [abgerufen am 29.04.2013]. 59 Vgl. HASTIE/TIBSHIRANI/FRIEDMAN: The elements of statistical learning, S. xi; JAESUNG, SIM: Critical success factors in data mining projects. Dissertation an der University of North Texas, 2003, S. 6; CHAKRABARTI, Soumen u. a.: Data Mining Curriculum: A proposal (Version 0.91). (2004) http://www.cs.uiuc.edu/~hanj/kdd_curriculum.pdf [abgerufen am 20.08.2013]; BISSANTZ, Nicolas und Jürgen HAGEDORN: Data Mining (Datenmustererkennung). In: Wirtschaftsinformatik. 51/1 (2009), S. 139–144, hier S. 139. 60 Vgl. FAYYAD/PIATETSKY-SHAPIRO/SMYTH: From Data Mining to Knowledge Discovery in Databases, S. 41. 61 Vgl. ebd. 62 Vgl. ebd., S. 39; vgl. auch ebd., S. 40; ESTER/SANDER: Knowledge discovery in databases, S. 1f.; CHAKRABARTI u. a.: Data Mining Curriculum: A proposal (Version 0.91), S. 1ff.; JAESUNG, SIM: Critical success factors in data mining projects, S. 6. 63 Vgl. FAYYAD/PIATETSKY-SHAPIRO/SMYTH: From Data Mining to Knowledge Discovery in Databases, S. 37f.; ESTER/SANDER: Knowledge discovery in databases, S. 6ff.; JAESUNG, SIM: Critical success factors in data mining projects, S. 5f.; CHAKRABARTI u. a.: Data Mining Curriculum: A proposal (Version 0.91), S. 3. 64 Vgl. ESTER/SANDER: Knowledge discovery in databases, S. 6ff.

Page 16: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

16

2.1.8 Datenjournalismus

„Is data journalism? Is it journalism to publish a raw database? Here, at last, is the definitive,

two-part answer: 1. Who cares? 2. I hope my competitors waste their time arguing about this

for as long as possible.“ 65

Adrian Holovaty

Es gibt einige Beispiele, die immer wieder genannt werden, wenn es zu erklären gilt, was

Datenjournalismus ist. Aus der deutschsprachigen Medienwelt gehören dazu die interaktive

ZEIT ONLINE-Anwendung „Verräterisches Handy“66 und die Fluglärmkarte der TAZ.67 Doch

was der Kern des Datenjournalismus ist, wird durch das bloße Nennen von Beispielen68 nicht

klar, zumal datenjournalistische Produkte sehr unterschiedlich sein können. Im Folgenden

wird ein kurzer Überblick über die historische Entwicklung des Datenjournalismus gegeben

und anschließend aus verschiedenen Definitionsansätzen eine eigene für diese Arbeit gültige

Definition entworfen.

Daten spielen schon sehr lange eine Rolle in der journalistischen Berichterstattung,

beispielsweise in Form des Stau- oder Wetterberichts, Börsenkursen oder

Tabellenplatzierungen im Sportjournalismus.69 Hier soll die Entwicklung des Phänomens

Datenjournalismus jedoch erst ab dem Aufkommen des Computer-Assisted Reporting (CAR)

betrachtet werden.

Computer-Assisted Reporting

CAR wird im englischsprachigen Raum verstärkt seit den 60er Jahren praktiziert.70 Bei dieser

computergestützten Recherche werden Auffällig- und Unregelmäßigkeiten in großen

Datensätzen gesucht, „die als möglicher Anlass für eine tiefergehende Recherche dienen

65 ROGERS, Simon: Facts are sacred: the power of data. London, 2013, S. 10. 66 Der Grünenpolitiker Malte Spitz hatte seine Vorratsdaten bei der Telekom eingeklagt und ZEIT ONLINE zur Verfügung gestellt. Die Redaktion erstellte daraus ein Tool, mit dem man das Bewegungsprofil des Politikers nachvollziehen kann. Vgl. ZEIT ONLINE: Verräterisches Handy. (2011) http://www.zeit.de/datenschutz/malte-spitz-vorratsdaten [abgerufen am 20.08.2013]. 67 Die Fluglärmkarte zeigt die voraussichtliche Lärmbelästigung durch den neuen Flughafen BBI an. In dem Zeitraum, in dem diese Arbeit geschrieben wurde, war nur der Verweis auf die Fluglärmkarte, nicht jedoch die Fluglärmkarte selbst, abrufbar. Vgl. dazu TAZ: Flughafen BER. (2013) http://www.taz.de/Fluglaerm-BBI/!t195/ [abgerufen am 20.08.2013]. 68 Mehr Beispiele gibt es beispielsweise auf der Seite http://www.datenjournal.de/dossier/beispiele.html [abgerufen am 20.08.2013] von Online-Journalismus-Studierenden der Hochschule Darmstadt. Laufende Entwicklungen im Datenjournalismus verfolgt Lorent Matzat auf seinem Blog http://datenjournalist.de/ [abgerufen am 20.08.2013]. 69 Vgl. MATZAT, Lorenz: Datenjournalismus vor dem Internet: Wetterbericht, Finanzdaten und Co. (2010) http://datenjournalist.de/datenjournalismus-vor-dem-internet-wetterbericht-finanzdaten-und-co/ [abgerufen am 20.08.2013]. 70 Vgl. MATZAT, Lorenz: Datenjournalismus. In: Bundeszentrale für politische Bildung. (2011) http://www.bpb.de/gesellschaft/medien/opendata/64069/datenjournalismus?p=all [abgerufen am 04.08.2013].

Page 17: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

17

könnten.“71 Als eine wegweisende CAR-Recherche wird häufig die des CBS-Korrespondenten

Walter Cronkite während der Präsidentschaftswahl 1952 genannt.72 Entgegen den damaligen

Medienberichten sagte Cronkite den Sieg von Eisenhower anhand von vorläufigen Briefwahl-

Ergebnissen („early returns“) korrekt voraus.73 In den USA wurde CAR durch die Gründung

der Society of Investigative Reporters and Editors (IRE) im Jahr 1975 weiter gefördert.74

Präzisionsjournalismus

Ein weiterer CAR-Pionier, der zudem den Begriff vom Präzisionsjournalismus prägte, ist

Philip Meyer. Er schrieb 1973 das Buch Precision Journalism, in dem er die Nutzung

statistischer Methoden durch die Medien anpreist. Präzisionsjournalismus bedeutet, dass

sozial- und verhaltenswissenschaftliche Forschungsmethoden auf die journalistische Praxis

angewandt werden.75 Nach Meyers Vorstellung sollen Journalisten selbst Daten erheben und

zu Meinungsforschern werden.76 Auf diese Weise sollen sie „in die Lage versetzt werden,

gesellschaftliche Veränderungsprozesse wissenschaftlich fundiert zu beschreiben und zu

beurteilen, anstatt sie spekulativ zu interpretieren.“77 Solche Vorteile werden heute vielfach

auch dem Datenjournalismus zugesprochen.78

Meyers Ansatz ist umstritten. Kritiker bemängeln, dass der Zeit- und Aktualitätsdruck sowie

der organisatorische Rahmen im Journalismus diesen verwissenschaftlichen Arbeitsansatz

behindern.79 Haas geht so weit zu sagen, dass das System Journalismus sich mit diesem

Ansatz selbst aufgibt, „indem es versucht, das zu tun, was professionelle Wissenschaftler in

jedem Falle besser können. Es übernimmt also Aufgaben, die es nicht erfüllen kann, und gibt

dafür seine systematischen Stärken auf.“80 Haas befürchtet nicht nur die Selbstaufgabe des

Journalismus, sondern auch „Verwässerung von Sozialwissenschaft“81. Die Diskussion über

71 Ebd. 72 Vgl. COX, Melisma: The development of computer-assisted reporting. (2000) http://com.miami.edu/car/cox00.pdf [abgerufen am 17.04.2013]. 73 Vgl. ebd. 74 Vgl. WORMER, Holger: Figures, statistics and the journalist: an affair between love and fear. Some perspectives of statistical consulting in journalism. In: Advances in Statistical Analysis. 91/4 (2007), S. 391–397, hier S. 394; INVESTIGATIVE REPORTERS AND EDITORS: About IRE. http://www.ire.org/about/ [abgerufen am 04.08.2013]; heute gibt es in den USA sogar ein National Institute of Computer Assisted Reporting (NICAR) an der Missouri School of Journalism. Vgl. dazu INVESTIGATIVE REPORTERS AND EDITORS: NICAR. http://www.ire.org/nicar/ [abgerufen am 17.04.2013]. 75 Vgl. MEYER, Philip: Precision journalism: a reporter’s introduction to social science methods. Lanham [u.a.], 2002, S. 2. 76 Vgl. ebd., S. 2f. 77 KLAMMER: Empirische Sozialforschung, S. 20. 78 Vgl. BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 8. 79 Vgl. KLAMMER: Empirische Sozialforschung, S. 20. 80 HAAS, Hannes: Empirischer Journalismus: Verfahren zur Erkundung gesellschaftlicher Wirklichkeit. Wien [u.a.], 1999, S. 111. 81 Ebd.

Page 18: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

18

den Präzisionsjournalismus wirft eine grundlegende Debatte über das Verhältnis von

Journalismus und Wissenschaft, insbesondere das ihrer Methoden, auf.82

Der Begriff des Data-Driven Journalism wurde in Europa vor allem durch die britische

Zeitung THE GUARDIAN geprägt, die 2009 mit dem Crowdsourcing-Projekt „Investigate your

MP’s expenses“83 sowie kurze Zeit später mit der Aufbereitung der Afghanistan- und Irak-

War-Logs84 viel beachtete datenjournalistische Projekte schuf.85 Im deutschen Sprachraum hat

sich als Äquivalent zum Data-Driven Journalism der Begriff Datenjournalismus durchgesetzt,

auch wenn die Übersetzung Datengetriebener Journalismus von manchen Journalisten

bevorzugt wird.86

Der Datenjournalismus ist also nicht aus heiterem Himmel entstanden, sondern hat seine

Wurzeln im Computer-Assisted Reporting und im Präzisionsjournalismus. Ob es zwischen

diesen Begriffen überhaupt eine klare Trennung gibt, ist umstritten. Datenjournalismus steht

im Verdacht, nur ein „Buzzword“87, also ein Modewort für etwas zu sein, was es schon lange

gibt. Der deutsche Datenjournalist Mirko Lorenz räumt ein, dass man darüber streiten kann,

ob es sich wirklich um ein neues Phänomen handelt, sagt aber zugleich: „there is something in

the air that hints that this new trend might be bigger and lasting for some time.“88 Der

Journalist Marc Patzwald meint, die Grundidee sei zwar gar nicht so neu, die Vorgehensweise

habe sich allerdings im Zeitalter des Internets geändert.89 Diese Idee eines alten und eines

neuen Datenjournalismus vertreten auch die Datenjournalisten Lorenz Matzat und Simon

Rogers. Der neue Datenjournalismus hat für sie immer etwas mit dem Internet90 bzw. einer

82 Klammer beschäftigt sich in Empirische Sozialforschung eingehend mit dem Verhältnis von Journalismus und Wissenschaft. 83 ROGERS, Simon: How to crowdsource MPs’ expenses. In: the Guardian. (18.06.2009) http://www.theguardian.com/news/datablog/2009/jun/18/mps-expenses-houseofcommons [abgerufen am 21.08.2013]. Zahlreiche Leser des Guardian halfen dabei, auf hunderttausenden Seiten mit Spesenabrechnungen von Parlamentsmitgliedern Unregelmäßigkeiten zu finden. 84 Afghanistan: the war logs. In: the Guardian. (04.08.2010) http://www.theguardian.com/world/the-war-logs [abgerufen am 21.08.2013]; Iraq: The war logs. In: the Guardian. (22.10.2010) http://www.theguardian.com/world/iraq-war-logs [abgerufen am 21.08.2013]; die „Afghanistan-Protokolle“ wurden auch vom Spiegel aufbereitet: GEBAUER, Matthias u. a.: Enthüllung brisanter Kriegsdokumente: Die Afghanistan-Protokolle. In: Spiegel Online. (25.07.2010) http://www.spiegel.de/politik/ausland/enthuellung-brisanter-kriegsdokumente-die-afghanistan-protokolle-a-708311.html [abgerufen am 21.08.2013]. 85 Der Guardian betreibt ein eigenes Data-Blog und hat ein eigenständiges Datenressort. 86 Vgl. z.B. MATZAT: Datenjournalismus. 87 LORENZ, Mirko: Status and Outlook for data-driven Journalism. (2010) http://de.slideshare.net/duarteromero/datadriven-journalism-what-is-there-to-learn-12056926 [abgerufen am 21.08.2013]. 88 Ebd. 89 Vgl. PATZWALD, MARC: Erzählen nach Zahlen. http://www.epd.de/fachdienst/fachdienst-medien/schwerpunktartikel/erz%C3%A4hlen-nach-zahlen [abgerufen am 13.06.2013]. 90 Vgl. MATZAT, Lorenz: Man macht sich überprüfbar. In: medium - magazin für journalisten. (2011) http://www.mediummagazin.de/archiv/2011-2/ausgabe-01022011/man%20-macht-sich-uberprufbar/ [abgerufen am 18.04.2013].

Page 19: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

19

speziellen Verwendung von Computern zu tun.91 Ob sich Datenjournalismus eindeutig von

CAR und Präzisionsjournalismus abgrenzen lässt, oder ob es sich um eine Weiterentwicklung

des gleichen Phänomens handelt, kann an dieser Stelle nicht abschließend geklärt werden.

Sicher ist aber, dass sich die Methoden im Umgang mit Daten sowie der Zugang zu

Datenquellen mit den wachsenden technischen Möglichkeiten stets weiterentwickelt haben.92

Im Folgenden wird eine für diese Arbeit gültige Definition hergeleitet. Dazu werden zunächst

Kriterien herausgearbeitet, die datenjournalistische Stücke charakterisieren.

Unstrittig ist, dass Daten beim datenjournalistischen Stück in irgendeiner Form eine Rolle

spielen.93 Matzat und Langer definieren Datenjournalismus als „Journalismus, der durch Daten

ermöglicht und vorangetrieben wird“ 94 und bei dem „Datensätze zum Gegenstand des

Berichts“95 gemacht werden. Es geht jedoch nicht darum, Daten um ihrer selbst willen zu

präsentieren. Sie dienen dazu, eine Geschichte zu finden, die dann dem Rezipienten vermittelt

wird. 96 Lorenz gibt als Kurzdefinition für Datenjournalismus sogar an: „Aus Daten

Geschichten machen“97.

Häufig wird im Zusammenhang mit Datenjournalismus das Erzeugen eines Mehrwerts

erwähnt. 98 Lorenz spricht von einem Verfeinerungsprozess, bei dem Rohdaten in etwas

Bedeutsames verwandelt werden und für das Publikum an Wert gewinnen.99

Die Bereinigung, Analyse und Kombination von Daten sind weitere wichtige Kriterien für das

Vorliegen eines datenjournalistischen Produkts. 100 Nach Langer ist für Datenjournalismus

91 Vgl. ROGERS: Facts are sacred, S. 12. 92 Vgl. LEßMÖLLMANN: Datenjournalismus: Chance für den Journalismus von morgen. 93 Vgl. z.B. ELMER, Christina: Kleine Einführung Datenjournalismus. Vortragsfolien WPK-Workshop: Data Stories I, Berlin, 2013. 94 MATZAT, Lorenz und Ulrike LANGER: Aus Zahlen werden Informationen: Datenjournalismus. In: JAKUBETZ, Christian, Ulrike LANGER und Ralf HOHLFELD (Hrsg.): Der Universalcode. Journalismus im digitalen Zeitalter. München, 2011, S. 333–358, hier S. 333. 95 MATZAT: Man macht sich überprüfbar. 96 Hirst gibt auf seinem Blog unterschiedliche Definitionsvorschläge, die alle den Aspekt des Geschichtenerzählens beinhalten: HIRST, Tony: Several Takes on Defining Data Journalism. (2013) http://schoolofdata.org/2013/06/11/several-takes-on-defining-data-journalism/ [abgerufen am 13.06.2013]; vgl. auch MATZAT: Man macht sich überprüfbar.; LEßMÖLLMANN: Datenjournalismus: Chance für den Journalismus von morgen.; WALTER, Nicole: Goldschürfer im Netz. Ein Gespräch mit den Datenjournalisten Matzat und Venohr. In: Fluter. (19.03.2013) http://www.fluter.de/de/120/berufe/11408/ [abgerufen am 13.06.2013]; LORENZ: Status and Outlook for data-driven Journalism., S. 10; EUROPEAN JOURNALISM CENTRE: About - F.A.Q. What is data driven journalism? http://datadrivenjournalism.net/about/faq [abgerufen am 17.04.2013]. 97 LORENZ, Mirko: Datenjournalismus: Lohnt der Aufwand? (18.10.2011) http://de.slideshare.net/mirkolorenz/datenjournalismus-lohnt-der-aufwand [abgerufen am 18.04.2013]. 98 Vgl. MATZAT, Lorenz: Data Driven Journalism: Versuch einer Definition. (2010) http://datenjournalist.de/data-driven-journalism-versuch-einer-definition/ [abgerufen am 18.04.2013]; HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 32. 99 Vgl. LORENZ: Status and Outlook for data-driven Journalism., S. 12.

Page 20: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

20

charakteristisch, dass er Daten „nicht bloß kursorisch, sondern systematisch auswertet“101. Für

den Datenjournalisten Sebastian Mondial bedeutet Datenjournalismus, „sich nicht mit selektiv

vorgefertigten Daten zufriedenzugeben, sondern möglichst alle Rohdaten auszuwerten [...]“102.

Charakteristisch ist außerdem die Nutzung bestimmter Programme und Techniken bei

Beschaffung, Analyse und grafischer Aufbereitung der Daten. Häufig liegen diese im Netz im

Excel- oder CSV-Format vor und können direkt weiterverarbeitet werden. Datenjournalisten

sammeln aber auch Daten von Webseiten mit sogenannten Scraper-Programmen103 oder lesen

sie mittels Software aus PDF-Dokumenten aus. Die gängigsten Analyse-Instrumente sind

Tabellenkalkulationsprogramme wie Excel oder OpenCalc. Auch bei der Visualisierung von

Daten, egal ob interaktiv oder nicht, spielen Programme eine wichtige Rolle. Häufig

verwendet werden beispielsweise QGIS oder GoogleFusionTables für die räumliche

Darstellung von Daten auf Landkarten.

Einzelne datenjournalistische Akteure erwähnen, dass sie sich mit großen Datenmengen

beschäftigen. Dies scheint also ein nicht unbedingt zwingendes, aber doch typisches Merkmal

datenjournalistischer Produkte zu sein.104

Umstritten ist die Frage, ob datenjournalistische Stücke zwangsläufig interaktiv sein müssen105

und somit auf das Medium Internet begrenzt sind. Laut Leßmöllmann sind „die Komponenten

des Interaktiven und des eigenen Nachrecherchierens“106 nur online zu finden, jedoch könne

auch jeder Printjournalist sich datenjournalistischer Methoden bedienen und am Ende daraus

„eine wunderbare Print-Grafik“107 erstellen.

100 Vgl. z.B. MATZAT, Lorenz: Einführung in Datenjournalismus. (16.04.2010) http://de.slideshare.net/wir_sie/einfhrung-in-datenjournalismus-data-driven-journalism [abgerufen am 18.04.2013] Folie 5; DATENJOURNAL: Ein Einstieg in den Datenjournalismus. Interview mit Bernd Helfert. (2011) http://www.datenjournal.de/dossier/einstieg.html [abgerufen am 17.04.2013]; EUROPEAN JOURNALISM CENTRE: About - F.A.Q. What is data driven journalism?. 101 LANGER, Ulrike: Schaubild statt Klickstrecke. In: Medium Magazin. (2011) http://www.mediummagazin.de/archiv/2011-2/ausgabe-01022011/schaubild-statt-klickstrecke/ [abgerufen am 21.08.2013]. 102 Zit. nach ebd. 103 Vgl. EUROPEAN JOURNALISM CENTRE: About - F.A.Q. What is data driven journalism?. 104 Vgl. DATENJOURNAL: Ein Einstieg in den Datenjournalismus. Interview mit Bernd Helfert.; WALTER: Goldschürfer im Netz. 105 Vgl. ELMER: Kleine Einführung Datenjournalismus.; MATZAT: Einführung in Datenjournalismus. Folie 5; BUNZ, Mercedes: Das offene Geheimnis: Zur Politik der Wahrheit im Datenjournalismus. In: GEISELBERGER, Heinrich und Dirk BAECKER (Hrsg.): WikiLeaks und die Folgen. Netz, Medien, Politik. Berlin, 2011, S. 134–151, hier S. 137; LANGER: Schaubild statt Klickstrecke.; WALTER: Goldschürfer im Netz; MATZAT: Data Driven Journalism: Versuch einer Definition. 106 Zit. nach PATZWALD, MARC: Erzählen nach Zahlen. 107 Ebd.

Page 21: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

21

Ob Visualisierung überhaupt zwingend für einen datenjournalistischen Beitrag ist, bleibt

ebenfalls umstritten. Sie wird zwar sehr häufig als Charakteristikum angeführt,108 manche

Datenjournalisten vertreten jedoch die Auffassung, dass sie kein zentrales Merkmal ist.

Rogers beispielsweise schreibt: „It’s (still) all about the stories. Data journalism is not

graphics and visualisations. It’s about telling the story in the best way possible. Sometimes

that will be a visualisation or map. [...] But sometimes it’s a news story. Sometimes, just

publishing the number is enough. If data journalism is about anything, it’s the flexibility to

search for new ways of storytelling.“109

Die Veröffentlichung von Rohdaten grenzt den Datenjournalismus von anderen

Journalismusformen ab. 110 Da die Veröffentlichung der kompletten Daten aus

Datenschutzgründen nicht immer möglich ist, kann die Veröffentlichung von Rohdaten jedoch

keine zwangsläufige Eigenschaft datenjournalistischer Stücke sein. Eine weitere optionale

Eigenschaft von Datenjournalismus ist die Einbeziehung von Rezipienten bei der Beschaffung

oder Auswertung von Daten, das sogenannte Crowdsourcing.111

Der Online-Journalist Andreas Griess unterscheidet grundlegende und optionale Aspekte, die

ein datenjournalistisches Stück ausmachen.112 Auch Bons und Krampe treffen eine solche

Unterscheidung.113 Welche Kriterien allerdings grundlegend und welche optional sind, darüber

herrscht Uneinigkeit. Tabelle 2 in Anhang I gibt eine Übersicht darüber, wie die oben

erläuterten Kriterien bei Krampe, Bons und Griess verwendet werden und wie sie in die

Datenjournalismus-Definition der vorliegenden Arbeit einfließen.

Je nachdem, welcher Aspekt des Phänomens betont wird, kann Datenjournalismus eher

recherche- oder darstellungsbetont definiert werden. So wird Datenjournalismus einerseits

manchmal als „Recherche-Ansatz“, „(Arbeits)-prozess“ oder „Recherche-

108 Vgl. z.B. ELMER: Kleine Einführung Datenjournalismus.; LANGER: Schaubild statt Klickstrecke.; MATZAT: Data Driven Journalism: Versuch einer Definition.; MATZAT: Man macht sich überprüfbar.; EUROPEAN JOURNALISM CENTRE: About - F.A.Q. What is data driven journalism?; MATZAT: Einführung in Datenjournalismus. Folie 5. 109 ROGERS, Simon: Data journalism at the Guardian: what is it and how do we do it? In: the Guardian. (28.07.2011) http://www.theguardian.com/news/datablog/2011/jul/28/data-journalism [abgerufen am 21.08.2013]. 110 Vgl. ELMER: Kleine Einführung Datenjournalismus.; LANGER: Schaubild statt Klickstrecke.; MATZAT: Man macht sich überprüfbar.; EUROPEAN JOURNALISM CENTRE: About - F.A.Q. What is data driven journalism?; DATENJOURNAL: Ein Einstieg in den Datenjournalismus. Interview mit Bernd Helfert.; MATZAT: Einführung in Datenjournalismus. Folie 5. 111 Vgl. MATZAT: Data Driven Journalism: Versuch einer Definition.; MATZAT: Einführung in Datenjournalismus. Folie 5. 112 Vgl. GRIESS, Andreas: Datenjournalismus in Deutschland. (27.06.2012) http://de.slideshare.net/agriess/datenjournalismus-in-deutschland [abgerufen am 13.06.2013] Folie 3. 113 Vgl. BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 14; KRAMPE: Journalistische Datens(ch)ätze. Definition, Einordnung und Qualitätskriterien von Datenjournalismus, S. 22.

Page 22: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

22

methode“ bezeichnet. Andererseits werden „Veröffentlichungs-„ oder

„Darstellungsform“ sowie „Genre“ als mögliche Kategorien genannt. 114 Ein etwas

abweichender Ansatz konzentriert sich stärker auf die verwendeten Techniken im

Datenjournalismus und beschreibt ihn eher als Menge von Werkzeugen oder Fähigkeiten.115

Matzat sieht Datenjournalismus in der Schnittmenge von visuellem Journalismus oder

Infografiken, multimedialem und interaktivem Storytelling sowie investigativem

Journalismus.116 Da in dieser Arbeit hauptsächlich der datenjournalistische Arbeitsprozess und

der Umgang mit Daten betrachtet werden soll, wird der Datenjournalismus vorläufig als

Recherchemethode klassifiziert. Für diese Arbeit ergibt sich damit folgende Definition:

Datenjournalismus ist eine Recherchemethode, bei der Daten Quelle und

Berichterstattungsgegenstand sind. Die oft großen Datenmengen werden einer

computergestützten Analyse (inklusive Bereinigung, Strukturierung und evtl. Verknüpfung)

unterzogen. Durch diese Analyse in Kombination mit klassischen journalistischen

Recherchemethoden (z.B. der Befragung) entsteht ein Mehrwert. Dieser kann im Endprodukt

entweder in Form einer journalistischen Geschichte enthalten sein oder dem Rezipienten zum

individuellen Entdecken z.B. in interaktiver Form angeboten werden. Datenjournalistische

Produkte sind hinsichtlich ihrer Veröffentlichungsform nicht festgelegt, auch wenn interaktive

Visualisierungen im Internet typisch sind. Die Datenquellen werden im fertigen Produkt so

weit wie möglich transparent gemacht und die Rohdaten im Idealfall veröffentlicht.

Die Beschaffung von Daten wurde in der Definition implizit vorausgesetzt und daher nicht

extra erwähnt. In der Realität kann sie aber einen erheblichen Aufwand bedeuten und

bestimmte, für den Datenjournalismus typische Techniken erfordern. Der Aspekt des

„Crowdsourcing“ wurde in die Definition nicht mit aufgenommen, da er der

Literaturrecherche nach kein Schlüsselelement des Datenjournalismus zu sein scheint.

114 Vgl. MATZAT: Data Driven Journalism: Versuch einer Definition.; LORENZ: Status and Outlook for data-driven Journalism.; BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 13; ebd., S. 3; PATZWALD, MARC: Erzählen nach Zahlen.; IHLE: Datenjournalismus - ein neues journalistisches Arbeitsfeld?, S. 63f. 115 Vgl. THIBODEAUX: 5 tips for getting started in data journalism.; VERMANEN, Jerry: Why Is Data Journalism Important? Updating Your Skills Set. In: The Data Journalism Handbook http://datajournalismhandbook.org/1.0/en/introduction_2.html [abgerufen am 21.08.2013]. 116 Vgl. MATZAT: Man macht sich überprüfbar.

Page 23: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

23

2.2 Qualitätskriterien

2.2.1 Journalismus

Qualität im Journalismus ist ein schwieriges Thema. Um das zu verdeutlichen, wird häufig ein

Zitat von Ruß-Mohl bemüht: „Qualität im Journalismus definieren zu wollen, gleicht dem

Versuch, einen Pudding an die Wand zu nageln.“117 Das Thema ist so problematisch, da

Qualität im Journalismus immer perspektivabhängig und multidimensional ist.118

Klammer bemerkt, dass sich journalistische Qualität entweder auf das fertige Produkt oder auf

den Arbeitsprozess von Journalisten beziehen kann.119 Da die Qualität des Endprodukts das

Ergebnis der „Qualitätssicherung in jeder Vorstufe“120 ist, betrachtet er die Qualität in Bezug

auf den Arbeitsprozess. Dieser Ansatz wird auch in der vorliegenden Arbeit verfolgt.

Arnold beschreibt drei Perspektiven, aus denen heraus sich journalistische Qualität

bestimmen lässt: Bei der marktnahen, publikumsorientierten Perspektive gilt die Maxime:

„Gut ist, was sich gut verkauft“121. Bei der funktional-systemorientierten Perspektive werden

Qualitätskriterien aus der Funktion des Journalismus in der Gesellschaft abgeleitet. Im

normativ-demokratieorientierten Ansatz werden die Qualitätskriterien „mit bestimmten

fundamentalen Werten einer demokratisch-pluralistischen Gesellschaft“ 122 begründet. So

besteht die Aufgabe der Medien nach der Rechtsprechung des Bundesverfassungsgerichts

darin, zum Prozess öffentlicher Meinungs- und Willensbildung beizutragen, die im Volk

117 RUß-MOHL, Stefan: Am eigenen Schopfe ... Qualitätssicherung im Journalismus - Grundfragen, Ansätze, Näherungsversuche. In: Publizistik. 37 (1992), S. 83–96, hier S. 85. 118 Vgl. KLAMMER: Empirische Sozialforschung, S. 68; LUBLINSKI, Jan: Einführung. Pudding an der Wand. In: KIENZLEN, Grit, Jan LUBLINSKI und Volker STOLLORZ (Hrsg.): Fakt, Fiktion, Fälschung. Trends im Wissenschaftsjournalismus. Konstanz, 2007, S. 21–24, hier S. 22; LEHMKUHL, Markus: „Die Wissenschaft hat festgestellt ...“ - zur Qualität der Berichterstattung in der Regionalpresse. In: KIENZLEN, Grit, Jan LUBLINSKI und Volker STOLLORZ (Hrsg.): Fakt, Fiktion, Fälschung. Trends im Wissenschaftsjournalismus. Konstanz, 2007, S. 50–55, hier S. 50; BECK, Klaus: Journalistische Qualität in der Wirtschaftskrise. Konstanz, 2010, S. 16; BUCHER, Hans-Jürgen: Journalistische Qualität und Theorien des Journalismus. In: BUCHER, Hans-Jürgen (Hrsg.): Qualität im Journalismus: Grundlagen - Dimensionen - Praxismodelle. Wiesbaden, 2003, S. 11–34, hier S. 11f.; HELD, Barbara und Stefan RUß-MOHL: Qualitätsmanagement als Mittel der Erfolgssicherung. In: FASEL, Christoph (Hrsg.): Qualität und Erfolg im Journalismus. Konstanz, 2005, S. 49–63, hier S. 55; WORMER, Holger: Improving Health Care Journalism. In: GIGERENZER, Gerd und John A. MUIR GRAY (Hrsg.): Better doctors, better patients, better decisions. Envisioning health care 2020. Cambridge, Mass. [u.a.], 2011, S. 169–188, hier S. 172; ARNOLD, Klaus: Qualitätsjournalismus: die Zeitung und ihr Publikum. Konstanz, 2009, S. 134ff. 119 Vgl. KLAMMER: Empirische Sozialforschung, S. 67. 120 Ebd., S. 68. 121 KRASSUSKI, Lisa: Qualitätskriterien in der Umweltberichterstattung, Bachelorarbeit an der TU Dortmund 2010, S. 8; vgl. auch ARNOLD, Klaus: Qualität im Journalismus – ein integratives Konzept. In: Publizistik. 53/4 (2008), S. 488–508, hier S. 499. 122 ARNOLD: Qualität im Journalismus – ein integratives Konzept, S. 496.

Page 24: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

24

vertretenen Meinungen widerzuspiegeln und das Parlament und die Regierung der Kritik und

Kontrolle zu unterziehen.123

Trotz der vielen unterschiedlichen Ansätze und Theorien zur Qualitätsfrage im Journalismus

gibt es doch einige Kriterien, die sehr häufig genannt werden. Im Wesentlichen handelt es sich

dabei um die vier Qualitätsdimensionen nach Rager. Sie umfassen Aktualität, Relevanz,

Richtigkeit und Vermittlung.124 Aktualität bezieht sich zum einen auf den Neuigkeitswert

einer Information,125 zum anderen auf die „Zeit, die zwischen Ereignis und Berichterstattung

über das Ereignis vergeht.“ 126 Rager sieht in der Aktualität „die zentrale Dimension

journalistischen Handelns überhaupt“, die den Journalismus von anderen gesellschaftlichen

Systemen, zum Beispiel Wissenschaft und Politik, abhebt.127 Das Kriterium der Relevanz

fordert von Journalisten „eine professionelle und möglichst wenig willkürliche Auswahl“128

von Themen und Nachrichten. 129 In der Praxis haben sich dafür bestimmte Kriterien

herausgebildet, die durch die Nachrichtenwerttheorie beschrieben werden.130 Da der Anspruch

auf Wahrheit und Objektivität in der Berichterstattung heute erkenntnistheoretisch nicht mehr

haltbar ist, wird heute in der Journalistik eher von Richtigkeit und intersubjektiver

Wahrhaftigkeit oder Nachprüfbarkeit gesprochen. 131 Für Rager bedeutet Richtigkeit,

„möglichst fehlerfrei und frei von logischen Widerspru ̈chen zu berichten und Meinungen

möglichst unverfälscht wiederzugeben.“132 Sorgfalt und Transparenz, so Klammer, sind zwei

wichtige Aspekte von Richtigkeit. 133 In der journalistischen Praxis wird meist eher

pragmatisch versucht, Richtigkeit dadurch zu gewährleisten, dass mindestens zwei

unabhängige Quellen befragt werden. 134 Laut Rager muss der Journalismus relevanten

123 Vgl. ebd.; BRANAHL, Udo: Recht und Moral im Journalismus. Der Beitrag des Rechts zur Förderung von „gutem“ beruflichen Verhalten des Journalisten in der Bundesrepublik Deutschland. Medien-Ethik. Beschreibungen, Analysen, Konzepte für den deutschsprachigen Journalismus. In: HALLER Michael und Helmut HOLZHEY (Hrsg.): Medien-Ethik. Beschreibungen, Analysen, Konzepte für den deutschsprachigen Journalismus. Opladen, 1992, S. 224–241, hier S. 231. 124 Vgl. RAGER, Günther: Dimensionen der Qualität. Weg aus den allseits offenen Richterskalen? In: BENTELE, Günter und Manfred RÜHL (Hrsg.): Publizistik in der Gesellschaft. Konstanz, 1994; vgl. dazu auch KLAMMER: Empirische Sozialforschung, S. 30; HALLER: Recherchieren, S. 84. 125 Vgl. KLAMMER: Empirische Sozialforschung, S. 68. 126 Ebd., S. 68–69. 127 Vgl. RAGER: Dimensionen der Qualität. Weg aus den allseits offenen Richterskalen?, S. 196. 128 Ebd., S. 198. 129 Vgl. auch KLAMMER: Empirische Sozialforschung, S. 70. 130 Vgl. RAGER: Dimensionen der Qualität. Weg aus den allseits offenen Richterskalen?, S. 198. 131 Vgl. KLAMMER: Empirische Sozialforschung, S. 70; LUBLINSKI, Jan: Wissenschaftsjournalismus im Hörfunk: Redaktionsorganisation und Thematisierungsprozesse. Konstanz, 2004, S. 86; RAGER: Dimensionen der Qualität. Weg aus den allseits offenen Richterskalen?, S. 200. 132 RAGER: Dimensionen der Qualität. Weg aus den allseits offenen Richterskalen?, S. 200; vgl. auch KRASSUSKI: Qualitätskriterien in der Umweltberichterstattung, S. 11. 133 Vgl. KLAMMER: Empirische Sozialforschung, S. 71. 134 Vgl. ebd.; MAST, Claudia: ABC des Journalismus: ein Handbuch. Konstanz, 2008, S. 242.

Page 25: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

25

Themen durch eine gelungene Vermittlung zu der ihnen gebührenden Beachtung verhelfen.135

Klammer weist darauf hin, dass zwischen diesen Qualitätskriterien allerlei Zielkonflikte

bestehen. „Richtigkeit kann beispielsweise leicht mit der Qualitätsdimension Aktualität in

Konflikt geraten, wenn abzuwägen ist, ob ein noch nicht ausrecherchiertes Thema

veröffentlicht werden soll.“ 136 Grundsätzlich wird von Journalisten eine skeptische

Grundhaltung sowie die ständige Überprüfung der vorliegenden Informationen gefordert.137

2.2.2 Wissenschaft

„Ein Naturwissenschaftler wird durch seine Arbeit dazu erzogen, an allem, was er tut und

herausbringt, zu zweifeln, ... besonders an dem, was seinem Herzen nahe liegt.“ 138

Forschung ist im idealisierten Sinne eine Suche nach Wahrheit. 139 Einen Anhaltspunkt dafür,

welche Qualitätskriterien es bei dieser Suche zu beherzigen gilt, liefert die Deutsche

Forschungsgemeinschaft (DFG). Sie ist die Selbstverwaltungsorganisation der Wissenschaft

in Deutschland140 und hat als solche 1998 sechzehn Empfehlungen zur Sicherung guter

wissenschaftlicher Praxis veröffentlicht.141 Die im Folgenden präsentierten Qualitätskriterien

beruhen im Wesentlichen auf den Empfehlungen der DFG, den zehn wissenschaftlichen

Qualitätskriterien bei Balzert142 sowie den Erläuterungen von Klammer zu Gütekriterien in der

empirischen Sozialforschung.143

Die Gültigkeit oder Validität gibt an, ob bei einer wissenschaftlichen Untersuchung das

gemessen wird, was gemessen werden soll.144 Sie zeigt also an, „wie angemessen eine

Fragestellung bearbeitet, wie genau das zu bestimmende Merkmal tatsächlich gemessen

wird.“145 Zuverlässigkeit oder Reliabilität ist ein Kriterium dafür, dass „bei Wiederholung des

135 Vgl. RAGER: Dimensionen der Qualität. Weg aus den allseits offenen Richterskalen?, S. 202. 136 KLAMMER: Empirische Sozialforschung, S. 72. 137 Vgl. HALLER: Recherchieren, S. 58; vgl. auch MEIER, Klaus: Internet-Journalismus. Konstanz, 2002, S. 327. 138 MAIER-LEIBNITZ, Heinz: Der geteilte Plato: ein Atomphysiker zum Streit um den Fortschritt. Zürich, 1981, S. 12. 139 Vgl. DEUTSCHE FORSCHUNGSGEMEINSCHAFT: Vorschläge zur Sicherung guter wissenschaftlicher Praxis. Proposals for Safeguarding Good Scientific Practice. (1998) http://www.dfg.de/download/pdf/dfg_im_profil/reden_stellungnahmen/download/empfehlung_wiss_praxis_0198.pdf [abgerufen am 21.08.2013]. 140 Vgl. DEUTSCHE FORSCHUNGSGEMEINSCHAFT: Wer wir sind. http://www.dfg.de/dfg_profil/aufgaben/wer_wir_sind/index.html [abgerufen am 27.07.2013]. 141 Vgl. DEUTSCHE FORSCHUNGSGEMEINSCHAFT: Vorschläge zur Sicherung guter wissenschaftlicher Praxis. Proposals for Safeguarding Good Scientific Practice. 142 Vgl. BALZERT, Helmut: Wissenschaftliches Arbeiten: Wissenschaft, Quellen, Artefakte, Organisation, Präsentation. Herdecke [u.a.], 2008, S. 9ff. 143 Vgl. KLAMMER: Empirische Sozialforschung, S. 29ff. 144 Vgl. BALZERT: Wissenschaftliches Arbeiten, S. 23. 145 KLAMMER: Empirische Sozialforschung, S. 63; vgl. auch BALZERT: Wissenschaftliches Arbeiten, S. 23.

Page 26: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

26

Vorgehens gleiche Ergebnisse erzielt werden.“146 Man bezeichnet sie auch als „Maß für die

Reproduzierbarkeit von Meßergebnissen [sic!].“147 Je höher der Grad an Reliabilität, desto

zuverlässiger messen die Messinstrumente und desto stabiler sind die gewonnen

Messergebnisse.148 Im Zusammenhang mit wissenschaftlichen Qualitätskriterien ist oft von

Objektivität die Rede. 149 Damit ist gemeint, dass die Wertvorstellungen, Vorurteile,

Meinungen und Erwartungen des Forschers „möglichst keinen Einfluss bei der Gewinnung

von Erkenntnissen haben“150 sollen. Objektivität wird hier also im Sinne von intersubjektiver

Überprüfbarkeit verstanden. Um diese so weit wie möglich zu gewährleisten, ist die

Offenlegung der Methode in der Wissenschaft eine wichtige Forderung.151 Die Prinzipien der

Transparenz und Nachvollziehbarkeit spielen in der Wissenschaft eine zentrale Rolle.152

Damit Ergebnisse in der wissenschaftlichen Gemeinschaft diskutiert werden können, muss der

Weg der Informationsgewinnung transparent gemacht und die Methoden müssen offengelegt

werden.153 Nur Ergebnisse, die durch Veröffentlichung der „Kritik und Überprüfung“154

ausgesetzt wurden, gelten in der Wissenschaft als anerkannt. Eigene und fremde Vorarbeiten

müssen dabei vollständig und korrekt nachgewiesen werden. 155 Ehrlichkeit ist „das

Fundament der Wissenschaft als eines sozialen Systems“156. Dies gilt für die Ehrlichkeit

gegenüber anderen ebenso wie gegenüber sich selbst. Bei der eigenen Arbeit sind ständige

Selbstkritik und die Überprüfung der eigenen Vorurteile unerlässlich.157 In den Empfehlungen

der DFG wird Originalität als das bezeichnet „was die Qualität wissenschaftlicher Leistung

ausmacht“ 158. Die Autoren sprechen auch von der „Innovationshöhe“ 159 eines Beitrags.

Relevanz können Forschungsergebnisse zum einen für das Forschungsgebiet und zum

anderen für die praktische Anwendung besitzen. Balzert stuft als relevant ein, „was im

Fachgebiet neues Wissen schafft“ oder hilft, „Praxisprobleme zu lösen“160.

146 KLAMMER: Empirische Sozialforschung, S. 64. 147 Ebd., S. 65. 148 Vgl. BALZERT: Wissenschaftliches Arbeiten, S. 22. 149 Vgl. ebd., S. 13. 150 KLAMMER: Empirische Sozialforschung, S. 28. 151 Vgl. ebd., S. 61. 152 Vgl. ebd., S. 28 Klammer bezieht sich hier auf die empirische Sozialforschung. Nach Auffassung der Autorin lässt sich dieser Grundsatz jedoch auf alle wissenschaftlichen Bereiche übertragen. 153 Vgl. ebd., S. 29. 154 DEUTSCHE FORSCHUNGSGEMEINSCHAFT: Vorschläge zur Sicherung guter wissenschaftlicher Praxis. Proposals for Safeguarding Good Scientific Practice, S. 30. 155 Vgl. ebd., S. 19. 156 Ebd., S. 27. 157 Vgl. ebd.; ebd., S. 30. 158 DEUTSCHE FORSCHUNGSGEMEINSCHAFT: Vorschläge zur Sicherung guter wissenschaftlicher Praxis. Proposals for Safeguarding Good Scientific Practice, S. 11. 159 Ebd. 160 BALZERT: Wissenschaftliches Arbeiten, S. 29.

Page 27: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

27

Wie diese Qualitätskriterien zu messen sind, ist unklar.161 Die Wissenschaft hat jedoch einige

Grundsätze und Strategien entwickelt, welche die Einhaltung der Kriterien anstreben. Ein

Grundsatz, der in den Empfehlungen der DFG immer wieder genannt wird, ist „Qualität vor

Quantität“. 162 Qualität, so die DFG, lässt sich nicht an der Zahl der Veröffentlichungen oder

dem Impact Factor der Zeitschriften, in denen veröffentlicht wurde, messen.163 Daher ist eine

intensive inhaltliche Auseinandersetzung mit den Veröffentlichungen, wie sie im Peer-

Review-Verfahren angestrebt wird, unersetzlich.164

Anders als beim Journalismus gibt es unter den Gütekriterien der Wissenschaft keine

Zielkonflikte, denn sie bauen aufeinander auf. Nach Klammer ist Objektivität Voraussetzung

für Zuverlässigkeit, welche wiederum Voraussetzung für Gültigkeit ist.165

2.2.3 Vergleich der Qualitätskriterien

Auch wenn Journalismus und Wissenschaft zwei gesellschaftliche Systeme mit

unterschiedlichen Zielen und Aufgaben sind (siehe Abschnitte 2.1.3 und 2.1.5), so weisen die

Qualitätskriterien dieser Systeme doch einige Überschneidungen auf. Das Ziel von

Wissenschaft ist die Erkenntnisgewinnung166 bzw. die Suche nach Wahrheit.167 Objektivität,

Gültigkeit und Zuverlässigkeit sind dabei die angestrebten Kriterien. Journalisten wollen

bisher Unbekanntes ans Licht fördern168 und überprüfen dabei im Idealfall stets die Richtigkeit

der aufgedeckten Fakten. In beiden Fällen ist ein intersubjektiv nachprüfbares Ergebnis das

Ziel. Relevanz spielt, wenn auch in unterschiedlicher Weise, ebenfalls in beiden Systemen

eine wichtige Rolle. Im Journalismus soll die Information dem Rezipienten dienen. In seiner

klassischen Funktion als Gatekeeper wählt der Redakteur gemäß der Nachrichtenwerttheorie

diejenigen Informationen aus, die er als besonders wichtig für das Publikum erachtet. Die

Relevanz einer wissenschaftlichen Arbeit wird an ihrem Beitrag zur Wissenserweiterung und

ihren Anwendungsmöglichkeiten gemessen. Gemein ist Forschern und Journalisten außerdem

eine skeptische Grundhaltung sowie im Idealfall eine ständige Selbstreflektion und

Selbstkritik.

161 Vgl. KRASSUSKI: Qualitätskriterien in der Umweltberichterstattung, S. 11. Krassuski bezieht sich an dieser Stelle auf ein unveröffentlichtes Manuskript von Wormer. 162 DEUTSCHE FORSCHUNGSGEMEINSCHAFT: Vorschläge zur Sicherung guter wissenschaftlicher Praxis. Proposals for Safeguarding Good Scientific Practice, S. 10. 163 Vgl. ebd., S. 11. 164 Vgl. ebd. 165 Vgl. KLAMMER: Empirische Sozialforschung, S. 66f. 166 Vgl. ebd., S. 61. 167 Vgl. DEUTSCHE FORSCHUNGSGEMEINSCHAFT: Vorschläge zur Sicherung guter wissenschaftlicher Praxis. Proposals for Safeguarding Good Scientific Practice, S. 27. 168 Vgl. LEIF: Leidenschaft, S. 16f.

Page 28: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

28

Sehr unterschiedlich ist die Rolle des Faktors Zeit in beiden Systemen. Während im

Journalismus Aktualität von zentraler Bedeutung ist, betonen die Empfehlungen der DFG,

dass die Qualität nicht dem Publikationsdruck zum Opfer fallen darf. In der Wissenschaft

herrscht de facto auch Zeitdruck (schließlich gebührt demjenigen der Ruhm, der die

Entdeckung als Erster macht). Dennoch arbeiten beiden Systeme auf unterschiedlichen

Zeitskalen: Journalistische Produkte werden meist innerhalb von Stunden, Tagen oder

höchstens Wochen produziert. Wissenschaftliche Forschung benötigt oft Monate und Jahre,

bis sie zu einer Veröffentlichung gereift ist.

Damit der Journalismus seiner Aufgabe nachkommen und alle Menschen zur

gesellschaftlichen Teilhabe befähigen kann, muss er Themen verständlich und ansprechend

darstellen. Die Art der Vermittlung ist also elementar. Zwar spielt Verständlichkeit auch in der

Wissenschaft eine Rolle, jedoch nur im Rahmen eines ohnehin schon interessierten

Fachpublikums. 169

Die Vorgehensweise in der Wissenschaft ist insgesamt stärker reglementiert als diejenige im

Journalismus, was sich beispielsweise im Peer-Review-Verfahren niederschlägt.170 Zudem

haben Transparenz und die Offenlegung des Erkenntniswegs in der Wissenschaft einen enorm

hohen Stellenwert.171 Im Journalismus hingegen steht das Endprodukt im Fokus des Interesses.

Der Rechercheweg wird in der Regel nicht angegeben.172 Die Angabe von Quellen ist im

Journalismus nur teilweise üblich und nur, sofern dies nicht im Widerspruch zum Schutz der

Informanten steht.

2.2.4 Datenjournalismus

Die in Abschnitt 2.1.8 eingeführte Definition von Datenjournalismus erfüllt alle in Abschnitt

2.1.4 genannten Kriterien einer journalistischen Recherche. Als solche wird sie von

Journalisten in oder für Redaktionen betrieben und spielt sich somit im System Journalismus

ab. Diese Punkte legen nahe, dass für den Datenjournalismus die in Abschnitt 2.2.1

eingeführten Qualitätskriterien des Journalismus gelten.173

169 Vgl. KLAMMER: Empirische Sozialforschung, S. 31. 170 Vgl. ebd., S. 29. 171 Vgl. ebd., S. 62. 172 zit. nach ebd., S. 31. 173 Anna-Lena Krampe betrachtet in ihrer Masterarbeit sogenannte primäre Qualitätskriterien, die sich in großen Teilen mit den hier betrachteten Kriterien Decken und sekundäre Qualitätskriterien, die sich auf die äußeren Umstände, beispielsweise die Ausbildung im Bereich des Datenjournalismus beziehen. Diese sekundären Aspekte werden in dieser

Page 29: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

29

In Abschnitt 2.1.8 wurde die Nähe des Datenjournalismus zum Präzisionsjournalismus

erläutert, bei dem der Journalist die Rolle eines Sozialforschers einnimmt. In Anbetracht

dieser Verortung kann man sich also fragen, ob für Datenjournalisten zusätzlich auch

wissenschaftliche Qualitätskriterien gelten sollten. Oben wurde bereits erläutert, dass

Journalismus und Wissenschaft den Wahrheits- und den Neuigkeitsgedanken teilen. Im

Journalismus spielen darüber hinaus Aktualität und Vermittlung eine Rolle. In der

Wissenschaft taucht vor allem die Transparenz als zusätzliches Kriterium auf. Muss sie für

den Datenjournalismus also einfach zum Kanon der Qualitätskriterien hinzugefügt werden?

Dass dieser Schritt sinnvoll ist, ergibt sich aus den folgenden Überlegungen.

Die Qualitätskriterien von Journalismus und Wissenschaft weichen, wie in Abschnitt 2.2.3

erläutert wurde, zumindest im Hinblick auf den Wahrheitsgedanken nicht sehr weit

voneinander ab. Was sich wirklich stark unterscheidet, sind die Anforderungen, die erfüllt sein

müssen, damit ein Qualitätskriterium als zufriedenstellend umgesetzt angesehen wird.

Während in der Wissenschaft Ergebnisse erst nach einem Peer-Review-Verfahren und der

Diskussion durch die Community als halbwegs gesichert gelten, reicht dafür im Journalismus

oft die Aussage zweier unabhängiger Quellen. Die Frage ist also weniger, ob

wissenschaftliche Qualitätskriterien für Datenjournalisten gelten, sondern ob man von ihnen

einen ebenso stark reglementierten Prozess zur Qualitätssicherung verlangen sollte wie von

Wissenschaftlern. In der Praxis ist ein solcher Prozess allein aufgrund des Aktualitätsdrucks

nicht umsetzbar. Die Forderung nach der Befolgung eines solchen Prozesses würde

Datenjournalismus also unmöglich machen. Was bedeutet das für datenjournalistische

Ergebnisse? Dürfen sie nicht veröffentlicht werden, weil sie mit wissenschaftlichen

Werkzeugen gewonnen wurden, aber nicht den reglementierten Prozess wissenschaftlicher

Überprüfung durchlaufen haben? Dies ist klar zu verneinen. Ergebnisse dürfen lediglich nicht

so präsentiert werden, als wären sie wissenschaftlich geprüft. So wie im Journalismus

allgemein die Sorgfaltspflicht die Pflicht zur Wahrheit ersetzt, sollte daher im

Datenjournalismus die Offenlegung der eigenen Vorgehensweise den wissenschaftlichen

Überprüfungsprozess ersetzen. Das wissenschaftliche Qualitätskriterium der Transparenz gilt

also auch für den Datenjournalismus. Dass Rohdaten bei datenjournalistischen Projekten in

der Regel veröffentlicht werden, trägt zur Erfüllung dieses Kriteriums bei.174

Arbeit aus forschungsökonomischen Gründen außer Acht gelassen. Vgl. KRAMPE: Journalistische Datens(ch)ätze. Definition, Einordnung und Qualitätskriterien von Datenjournalismus, S. 67. 174 Vgl. dazu auch IHLE: Datenjournalismus - ein neues journalistisches Arbeitsfeld?, S. 67.

Page 30: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

30

Weiter oben wurde argumentiert, dass die Nähe des Datenjournalismus zu wissenschaftlichen

Methoden die Forderung nach einem wissenschaftlichen Überprüfungsprozess nahelegt. Es

könnte jedoch auch argumentiert werden, dass unabhängig von den Methoden alle anderen

journalistischen Bereiche ebenfalls eines solchen Überprüfungsprozesses bedürfen. Da aber

auch hier ein solcher Prozess nicht geleistet werden kann, folgt aus dieser Überlegung für

nicht-datenjournalistische Projekte ebenfalls die Forderung nach maximaler Transparenz

(sofern mit dem Informantenschutz vereinbar).

Gelten für den Datenjournalismus also überhaupt andere Qualitätsmaßstäbe als für den

Journalismus im Allgemeinen? Wenn, dann nur insofern, als die Transparenz aus zwei

Gründen eine besonders wichtige Rolle spielt: Zum einen verwendet Datenjournalismus

Methoden, die bisher nicht zu den journalistischen Kernkompetenzen zählten. Transparenz

kann helfen, eventuelle Zweifel an dieser neuen Vorgehensweise auszuräumen. Zum anderen

kommt dem Datenjournalismus aufgrund seiner Faktenbasiertheit ein besonderer

Wahrhaftigkeitsanspruch zu. Dass dieser aber nicht unbedingt der gleiche ist wie bei

wissenschaftlichen Ergebnissen, gilt es durch die Offenlegung der Methoden klarzustellen.

In die Frage danach, ob Datenjournalisten wissenschaftlich arbeiten sollten, mischt sich häufig

eine Skepsis, ob sie die Methoden, deren Beherrschung nicht zu den klassischen

journalistischen Kernkompetenzen gehört, korrekt anwenden können. Die Beherrschung der

Analysemethoden stellt in der Tat besondere Anforderungen an Datenjournalisten. Im Grunde

gilt hier aber nur das, was für alle Journalisten gilt: Man muss seine Werkzeuge

beherrschen.175 Grundsätzlich gilt es, mit größtmöglicher Sorgfalt vorzugehen und im Zweifel

einen Fachmann zu fragen.

Zusammenfassend lässt sich sagen, dass für Datenjournalisten die gleichen Qualitätskriterien

gelten wie für andere Journalisten auch. Eine Umsetzung der Qualitätskriterien wie sie in der

Wissenschaft üblich ist, kann im System Journalismus nicht gefordert werden. So wie bereits

die Pflicht zur Sorgfalt im Journalismus die Pflicht zur Wahrheit ersetzt, sollte die Pflicht zur

Transparenz die Pflicht zur wissenschaftlichen Vorgehensweise ersetzen. Dies gilt nicht nur,

aber insbesondere für den Datenjournalismus.

175 Bei Klammer finden sich einige Aussagen dazu, was Journalisten generell über den Umgang mit Daten wissen sollten. Vgl. z.B. KLAMMER: Empirische Sozialforschung, S. 10, 17, 18. Welche Anforderungen Datenjournalisten im Einzelnen erfüllen müssen, kann in dieser Arbeit nicht weiter behandelt werden. Vgl. dazu z.B. BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 28f.

Page 31: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

31

2.3 Arbeitsprozesse

2.3.1 Journalistischer Rechercheprozess

2.3.1.1 Schritte des journalistischen Rechercheprozess

Wie in Abschnitt 2.2.4 dargelegt wurde, ist Datenjournalismus nach den Definitionen dieser

Arbeit ein journalistischer Rechercheprozess. Es stellt sich daher die Frage, in wie weit sich

die in der Literatur genannten Arbeitsschritte des herkömmlichen (nicht-datenjournalistischen)

Rechercheprozesses auf den Datenjournalismus anwenden lassen. Im Folgenden werden

zunächst die typischen Arbeitschritte der herkömmlichen journalistischen Recherche erläutert.

Inwieweit diese mit dem Datenjournalismus kompatibel sind, wird später in Abschnitt 2.4.1

diskutiert.

Recherche variiert von Fall zu Fall in einer Weise, die es schwierig macht, ein allgemeines

Schema für sie zu finden. Mast schreibt: „Recherche ist ein lebendiger und oft auch spontaner

Prozess, der kaum jemals nach einem einheitlichen Muster ablaufen kann“176. Ludwig spricht

von einer „rollenden Planung“177, die sich im Verlauf je nach Bedarf stärker oder schwächer

ändern kann. Wie die Recherche aussieht, hängt vom Berufsbild des einzelnen Journalisten,178

vom Rechercheziel, der Thematik sowie von finanziellen und zeitlichen Einschränkungen

ab.179 Es gibt jedoch gewisse Muster „die oftmals wiederkehren und an denen sich ein

Journalist orientieren kann“ 180 . Leif beispielsweise stellt einen Acht-Punkte-Plan der

Recherche vor und fügt relativierend hinzu: „Dieses systematische Vorgehen ist keine

Musterlösung [...]. Dennoch ist das dargestellte Verfahren eine sehr gute und mannigfach

erprobte Variante, um zeitlich und qualitativ zu einem wesentlich effektiveren Arbeitsergebnis

zu kommen“181.

Im Folgenden werden einige dieser typischen Rechercheschritte erläutert. Sie lassen sich

letztlich alle auf drei zentrale Handlungen zurückführen, die auf die Beantwortung der sechs

W-Fragen (Wer? Was? Wann? Wo? Wie? Warum?) abzielen: 1) Das Einholen von

Informationen 2) Die Bewertung und Einordnung von Informationen, Quellen und

Hypothesen 3) Reflektion über Zusammenhänge, Motive und Ursachen. Die im Folgenden

176 MAST: ABC des Journalismus, S. 240; vgl. auch KLAMMER: Empirische Sozialforschung, S. 29. 177 LUDWIG, Johannes: Investigativer Journalismus. Konstanz, 2007, S. 81. 178 Vgl. MAST: ABC des Journalismus, S. 239. 179 Vgl. ebd., S. 240; vgl. auch LUDWIG: Investigativer Journalismus, S. 81. 180 MAST: ABC des Journalismus, S. 240. 181 LEIF: Leidenschaft, S. 22.

Page 32: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

32

erläuterten Arbeitsschritte überlappen sich teilweise inhaltlich. Dennoch können sie als

Anhaltpunkt bei der Vorgehensweise dienen. Wie die kombinierbaren Bausteine eines

Baukastens, müssen sie nicht immer alle im Arbeitsprozess vorkommen.182 Einen Anspruch

auf Vollständigkeit der aufgelisteten Schritte kann es angesichts der Flexibilität des Prozesses

nicht geben.

I) Recherche-Impuls / Ausgangsfrage

Laut Leif kann eine Recherche auf vier unterschiedliche Weisen angestoßen werden. Der

Impuls kann aus dem Alltagsgeschäft, zum Beispiel aus einer Agenturmeldung stammen.

Recherchen können auch durch Redaktionskonferenzen oder externe Informanten angestoßen

werden. Oder aber man widmet sich der Frage: „Was ist eigentlich aus dem damaligen Thema

XY geworden“183. Haller sieht die Rolle des Journalisten bei der Themenfindung eher

passiv. 184 Für Machill hingegen ist die Themenwahl „immer eine aktive Suche mit

gleichzeitiger Bewertung der Relevanz“185.

II) Einschätzung der Relevanz des Themas/ der Informationen

Laut Leif dient die Einschätzung der Themen-Relevanz zum einen dazu, „die grobe

Stoßrichtung“ vorzugeben. Zum anderen soll sie helfen, „die meist knapp bemessenen

redaktionellen Mittel angemessen einzusetzen“186. Der Journalist muss sich also fragen, ob das

Thema wichtig und interessant genug ist, um den Aufwand einer Recherche zu

rechtfertigen.187

III) Sich einen Überblick über das Thema/ die Akteure verschaffen

Schon vor der eigentlichen Recherche sollte der Journalist sich „Gedanken über die für die

Recherche notwendigen Basiskenntnisse machen. Auf welchen Gebieten muss er sich

Grundlagenwissen verschaffen, um überhaupt einigermaßen kompetente Gespräche führen zu

können, um wesentliche von überflüssigen Dokumenten unterscheiden zu können?“188 Meier

empfiehlt, sich zu Beginn der Recherche einen Überblick über die Konfliktparteien zu

verschaffen.189

182 Vgl. ebd., S. 22f. 183 Ebd., S. 17; vgl. auch HALLER: Recherchieren, S. 84. 184 Vgl. MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 35. 185 Ebd. 186 LEIF: Leidenschaft, S. 17. 187 Vgl. ebd.; vgl. auch HALLER: Recherchieren, S. 84; MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 34. 188 BRENDEL/BRENDEL: Richtig recherchieren, S. 81. 189 Vgl. MEIER: Internet-Journalismus, S. 326.

Page 33: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

33

IV) Planung der Recherche

In jedem Fall sollten zu Beginn die Kernfragen der Recherche identifiziert werden.190 Jeker

schreibt: „Bei der konkreten Recherche ist zunächst am Schreibtisch – und ohne Computer –

zu überlegen: Welche Frage will ich in den Griff bekommen?“191 Außerdem gilt es, sofern

nicht bereits geschehen, sich „über mögliche Quellen und Interessen bewusst werden“192. Auf

Basis dieser Überlegungen kann dann das passende Werkzeug für die Recherche ausgewählt

und ein absehbarer Recherchetypus bestimmt werden.193 Ludwig empfiehlt zudem, Kosten-

Nutzen-Überlegungen anzustellen und einen konkreten Rechercheplan bzw. eine

Planungsskizze zu erstellen.194

V) Überprüfung der Sachinformationen

Nach Leif beginnt grundsätzlich jede Recherche „mit der Überprüfung der dem jeweiligen

Thema zugrunde liegenden ersten Sachverhalts-Informationen“195. Dieser Schritt umfasst

sowohl die Fakten- als auch die Quellenkontrolle und orientiert sich an den „den ersten vier

der sechs berühmten, uralten ‚W’-Fragen“196: Wer? Was? Wann? Wo? Der Journalist sollte

sich fragen, ob sich die Informationen objektivierbar belegen lassen und wie distanziert die

Quelle zum Sachverhalt ist.197

VI) Erweiterung der Sachinformationen

In diesem Schritt werden die Sachverhaltsinformationen erweitert, vertieft und

vervollständigt.198 Dazu muss der Journalist zunächst den eigenen Erkenntnisstand einschätzen

und offene Fragen erkennen. Nach Leif geht es darum, eine „genauere Beschreibung des

Geschehens zustande zu bringen“ und die so „verdichteten Informationen so präzis wie

möglich miteinander zu verknüpfen“199. In diesem Schritt geht es maßgeblich um die Wie-

Frage.200

190 Vgl. ebd., S. 348. 191 JEKER, Rebecca: Online-Recherche. Strategien für die journalistische Recherche im Internet. In: Medienheft. (2001) http://www.medienheft.ch/uploads/media/k16_JekerRebecca.pdf [abgerufen am 21.08.2013]. 192 Ebd. 193 Vgl. BRENDEL/BRENDEL: Richtig recherchieren, S. 101; JEKER: Online-Recherche. Strategien für die journalistische Recherche im Internet.; LUDWIG: Investigativer Journalismus, S. 82. 194 Vgl. LUDWIG: Investigativer Journalismus, S. 82. 195 LEIF: Leidenschaft, S. 18; vgl. auch HALLER: Recherchieren, S. 84; HALLER, Michael (Hrsg.): Recherche-Werkstatt. Konstanz, 2001, S. 11; MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 34; MEIER: Internet-Journalismus, S. 326; ebd., S. 348. 196 HALLER: Recherchieren, S. 59. 197 Vgl. LEIF: Leidenschaft, S. 18; vgl. auch HALLER: Recherchieren, S. 59. 198 Vgl. HALLER: Recherchieren, S. 84; MAST: ABC des Journalismus, S. 240ff.; MEIER: Internet-Journalismus, S. 348; MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 34. 199 LEIF: Leidenschaft, S. 19. 200 Vgl. ebd.; HALLER (Hrsg.): Recherche-Werkstatt, S. 35.

Page 34: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

34

VII) Aufstellen von Hypothesen

In diesem Arbeitsschritt werden die kausalen Zusammenhänge ergründet und in Hypothesen

über die Verantwortlichen und Betroffenen sowie die Ursachen, Folgen, Ziele und Gründe

ihres Handelns formuliert.201 Der Journalist beschäftigt sich nun mit der Deutungsebene,202

beleuchtet die Hintergründe und versucht herauszufinden, warum die am Geschehen

Beteiligten so gehandelt haben.203 Machill fordert, nicht nur für die Warum-Frage, sondern für

alle offenen W-Fragen Hypothesen auf Basis der vorliegenden Informationen zu bilden.204

VIII) Hypothesenüberprüfung

In diesem Schritt werden die Hypothesen durch weitere Recherchehandlungen überprüft.205

Gelingt dies nicht anhand des vorliegenden Materials, muss die Informationsbasis erweitert

werden, beispielsweise durch Interviews mit den am Geschehen Beteiligten.206

IX) Recherche-Abschluss

Die Recherche zu einem Abschluss zu bringen ist manchmal schwierig, denn offene Fragen

gibt es immer. Mast zitiert das Projektteam Lokaljournalisten: „Die Recherche ist nicht dann

zu Ende, wenn der Journalist alles weiß (dann dauert sie nämlich ewig), sondern wenn alle

naheliegenden Fragen beantwortet und die Zusammenhänge plausibel gemacht werden

können.“207 Ludwig rät abschließend zu einer rechtlichen Bewertung der Ergebnisse „im

Hinblick auf potentielle Gegenwehr“ sowie zu einer strategischen und ethischen Beurteilung

der geplanten Veröffentlichung.208

X) Produktion und Veröffentlichung des journalistischen Beitrags

Hauptziel des journalistischen Rechercheprozesses ist letztendlich die Umsetzung der

Nachforschungen, beispielsweise als Meldung, Bericht, Feature oder Reportage.209 Wie die

Produktionsschritte im Detail aussehen, unterscheidet sich nicht nur je nach Darstellungsform,

sondern auch je nach Art des verwendeten Mediums (Print, Online, Radio, Fernsehen).

201 Vgl. MAST: ABC des Journalismus, S. 240ff.; LEIF: Leidenschaft, S. 20; vgl. auch MEIER: Internet-Journalismus, S. 326. 202 Vgl. LEIF: Leidenschaft, S. 20. 203 Vgl. HALLER (Hrsg.): Recherche-Werkstatt, S. 65; vgl. auch HALLER: Recherchieren, S. 84. 204 Vgl. MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 34. 205 Vgl. z.B. HALLER: Recherchieren, S. 84. 206 Vgl. LEIF: Leidenschaft, S. 21; MEIER: Internet-Journalismus, S. 326; MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 34; BRENDEL/BRENDEL: Richtig recherchieren, S. 15. 207 MAST: ABC des Journalismus, S. 249; vgl. auch LEIF: Leidenschaft, S. 21f. 208 Vgl. LUDWIG: Investigativer Journalismus, S. 82. 209 Vgl. LEIF: Leidenschaft, S. 22; vgl. auch HALLER: Recherchieren, S. 84; MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 34.

Page 35: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

35

XI) Begleitende Dokumentation

Als wichtiger Bestandteil des Rechercheprozesses wird in der Literatur die Dokumentation der

einzelnen Arbeitsschritte genannt.210 Zum einen wappnet der Journalist sich auf diese Art

gegen eventuelle spätere Anfeindungen oder Zweifel. Zum anderen kann somit bei folgenden

Recherchen auf die schriftlich festgehaltenen Informationen und Quellenangaben

zurückgegriffen werden.211

Der Ablauf und die Umsetzung der Rechercheschritte sind bestimmt durch Strategien wie

„von außen nach innen“ und „in die Tiefe, nicht in die Breite“ recherchieren. 212 Zudem gibt

es unterschiedliche Methoden, wie beispielsweise das „Pendeln“ oder das „Puzzlespiel“. 213

Der Recherchetyp kann von einer einfachen Basis- und Erweiterungsrecherche214 bis hin zur

verdeckten Recherche oder Enthüllung reichen. 215

Die Schritte des journalistischen Rechercheprozesses können mit verschiedenen Werkzeugen

umgesetzt werden. Dazu gehören heutzutage die E-Mail-Korrespondenz, das Gespräch

(persönlich oder per Telefon) sowie das Konsultieren von Online-Quellen, Büchern,

Zeitschriften oder Datenbanken. 216 Wie diese Werkzeuge während der journalistischen

Recherche genutzt werden, war und ist Gegenstand verschiedener Untersuchungen.217 Die

Frage nach den unterschiedlichen Werkzeugen von herkömmlicher und datenjournalistischer

Recherche wird in Abschnitt 2.4.1 aufgegriffen.

2.3.2 CRISP-DM: Ein Standardprozess für Data-Mining

Wie in den Abschnitten 1.1 und 1.2 erläutert, wird in dieser Arbeit ein Vergleich zwischen

datenjournalistischer Arbeitsweise und einem Standardprozess für Data-Mining vorgenommen.

Für den späteren Vergleich wird im Folgenden dieser Standardprozess beschrieben.

CRISP-DM ist ein Akronym für „CRoss-Industry Standard Process for Data Mining“, was in

etwa übersetzt werden kann mit „Industrieübergreifender Standard-Prozess für Data-

210 Vgl. LUDWIG: Investigativer Journalismus, S. 79; LEIF: Leidenschaft, S. 23. 211 Vgl. z.B. BRENDEL/BRENDEL: Richtig recherchieren, S. 69. 212 Vgl. MEIER: Internet-Journalismus, S. 325. 213 Vgl. MAST: ABC des Journalismus, S. 242; BRENDEL/BRENDEL: Richtig recherchieren, S. 104; ebd., S. 121. 214 Vgl. HALLER: Recherchieren, S. 69. 215 Vgl. MAST: ABC des Journalismus, S. 242; Erläuterungen zu verschiedenen Recherchetypen finden sich auch ebd., S. 244, 246; HALLER (Hrsg.): Recherche-Werkstatt, S. 97, 125, 159, 169, 189. 216 Vgl. z.B. BRENDEL/BRENDEL: Richtig recherchieren, S. 14; KLAMMER: Empirische Sozialforschung, S. 31. 217 Machill et al. beispielsweise untersuchen, wie Zeitungs-, Fernseh- und Hörfunkjournalisten das Internet bei der Recherche nutzen. Für eine Übersicht über weitere Studien siehe auch STIGLER, SOPHIE: Recherchestrategien im Netz. Das Suchvorgehen von Fachexperten, Netzexperten und Laien im Test. Masterarbeit an der TU Dortmund, 2013, S. 26ff..

Page 36: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

36

Mining“.218 Der Standardprozess wurde Ende der 90er Jahre von drei Pionieren des Data-

Mining-Marktes (NCR, SPSS und Daimler AG) entwickelt. 219 Industrielle Data-Mining-

Projekte werden meist von einem Datenanalysten für Unternehmen durchgeführt, die aus den

eigenen Daten Erkenntnisse gewinnen und daraus einen Nutzen für das Unternehmen ziehen

möchten. Ziel eines solchen Projekts kann es zum Beispiel sein, Kunden vom Wechsel zu

einem anderen Anbieter abzuhalten.220 Die Erschaffer von CRISP-DM wollten durch die

Einführung eines Standards verhindern, dass jeder Neuling im Bereich Data-Mining immer

wieder alles durch Versuch und Irrtum von neuem herausfinden muss.221Außer CRISP-DM

wurden noch einige andere Standardprozesse entwickelt. 222 Mehrere Umfragen auf der

Internetseite des KDD-Pioniers Piatetsky-Shapiro weisen jedoch darauf hin, dass CRISP-DM

der meist genutzte Standardprozess sein könnte.223 Die Erfinder des Konzepts schreiben

dessen Erfolg dem starken Anwendungsbezug zu.224

Die vier Ebenen von CRISP-DM

Das CRISP-DM-Konzept ist in vier Ebenen gegliedert, die den Data-Mining-Prozess vom

allgemeinen bis hin zum speziellen Vorgehen beschreiben. Auf der ersten, allgemeinsten

Ebene stehen die Phasen des Data-Mining-Prozesses. Sie bestehen jeweils aus mehreren

generischen Aufgaben, die möglichst alle denkbaren Data-Mining-Prozesse und –

Anwendungen abdecken sollen und somit die zweite Ebene bilden. Die dritte Ebene

beschreibt, wie diese Aufgaben sich in jeweils unterschiedlichen Situationen unterscheiden.225

„Auf der vierten Ebene, der Ebene der Prozessinstanz, werden die Aktionen, Entscheidungen

und Ergebnisse eines tatsächlichen Data-Mining-Projekts aufgezeichnet. Eine Prozessinstanz

ist entsprechend den Aufgaben strukturiert, die auf den höheren Ebenen definiert sind, stellt

jedoch dar, was in einem bestimmten Projekt tatsächlich geschehen ist, statt allgemein zu

bleiben.226 Die vier Ebenen sind in Abbildung 2 dargestellt.

218 Unter Data-Mining wird hier offenbar der gesamte Prozess der Wissensgewinnung in Datenbanken verstanden (siehe dazu auch Kapitel 2.1.7). 219 Vgl. CHAPMAN, Pete u. a.: CRISP-DM 1.0. (2000) http://www.the-modeling-agency.com/crisp-dm.pdf [abgerufen am 21.08.2013]. 220 Vgl. ebd., S. 14. 221 Vgl. ebd., S. 1. 222 Dazu zählt beispielsweise der SEMMA-Prozess der Software-Firma SAS: http://www.sas.com/offices/europe/uk/technologies/analytics/datamining/miner/semma.html [abgerufen am 5.8.2013] 223 Vgl. PIATETSKY-SHAPIRO, Gregory: Poll: Data Mining Methodology. In: KDnuggets. (2007) http://www.kdnuggets.com/polls/2007/data_mining_methodology.htm [abgerufen am 21.08.2013]. 224 Vgl. CHAPMAN u. a.: CRISP-DM 1.0, S. 2. 225 Vgl. IBM: CRISP-DM 1.0. Data Mining Schritt für Schritt - ein Leitfaden. (2011) ftp://public.dhe.ibm.com/common/ssi/ecm/de/ytw03084dede/YTW03084DEDE.PDF [abgerufen am 21.08.2013]. 226 Vgl. IBM: CRISP-DM 1.0. Data Mining Schritt für Schritt - Ein Leitfaden., S. 3; vgl. auch CHAPMAN u. a.: CRISP-DM 1.0, S. 6.

Page 37: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

37

Abbildung 2 Die vier Ebenen von CRISP-DM (eigene Darstellung nach Chapman et al.227)

Zu der Phase „Datenaufbereitung“ gehört zum Beispiel die generische Aufgabe „Daten

bereinigen“. Bei den speziellen Aufgaben muss dann unterschieden werden, ob zum Beispiel

„numerische oder kategoriale Werte bereinigt werden sollen“228. Auf der vierten Ebene

könnte dann zum Beispiel festgehalten werden, dass dem vorliegenden Projekt

Beobachtungen mit fehlenden oder unsinnigen Werten ausgeschlossen wurden.229

Die sechs Phasen von CRISP-DM

Im letzten Abschnitt wurden bereits die Phasen von CRISP-DM als oberste von vier Ebenen

eingeführt. In Abbildung 3 sind die sechs Phasen von CRISP-DM in einem Flussdiagramm

dargestellt. Die Pfeile bezeichnen dabei die häufigsten Beziehungen zwischen ihnen.230 Die

Autoren betonen jedoch, dass Beziehungen prinzipiell zwischen allen Phasen bestehen

können.231 Der äußere Kreis symbolisiert die zyklische Natur von Data-Mining insgesamt.232

Im Folgenden werden die generischen Aufgaben der sechs Phasen erläutert.

227 Vgl. CHAPMAN u. a.: CRISP-DM 1.0, S. 6. 228 IBM: CRISP-DM 1.0. Data Mining Schritt für Schritt - Ein Leitfaden., S. 3. 229 Vgl. WEIHS, CLAUS: Data Mining Konzept CRISP-DM. Skript TU Dortmund SoSe 2003, 2003, S. 24. 230 Vgl. CHAPMAN u. a.: CRISP-DM 1.0, S. 10. 231 Vgl. ebd. 232 Vgl. ebd.

Page 38: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

38

Abbildung 3 Die sechs iterativen Phasen von CRISP-DM (Eigene Darstellung nach Capman et al.233)

I) Untersuchung der Geschäftsziele (Business Understanding)234

Geschäftsziele bestimmen

Situation beurteilen

Data-Mining-Ziele bestimmen

Projektplan erstellen

In dieser Phase müssen die Ziele und Anforderungen des Projekts aus geschäftlicher

Perspektive („business perspective“235) verstanden werden. Aus diesem Verständnis heraus

wird das konkrete Data-Mining-Problem definiert und ein vorläufiger Plan zum Erreichen der

Ziele formuliert.

II) Datenuntersuchung (Data Understanding)

Anfangsdaten erfassen

Daten beschreiben

Daten untersuchen

Datenqualität prüfen

 

233 Vgl. ebd., S. 10. 234 Deutsche Übersetzung der Phasenbezeichnungen nach IBM: CRISP-DM 1.0. Data Mining Schritt für Schritt - Ein Leitfaden. 235 CHAPMAN u. a.: CRISP-DM 1.0, S. 14.

Page 39: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

39

Diese Phase beginnt mit der Datenerfassung. Die weiteren Arbeitsschritte dienen dazu, mit

den Daten vertraut zu werden, die Qualität der Daten zu beurteilen, erste Einblicke in die

Daten zu gewinnen und interessante Teilmengen in den Daten zu entdecken. Unter der

Aufgabe „Daten beschreiben“ verstehen Chapman et al. , dass die oberflächlichen

Eigenschaften der Daten wie Format, Umfang, Art der Einträge untersucht und dokumentiert

werden.236 Beim Erkunden der Daten werden erste einfache Analysen durchgeführt, die sich

entweder direkt auf die Data-Mining-Aufgabe des Projekts beziehen, oder der Aufbereitung

der Daten dienen. Erste Visualisierungen können hierbei hilfreich sein.237 Bei der Überprüfung

der Datenqualität sollte geklärt werden, ob die Daten vollständig sind sowie ob und – wenn ja

– wie häufig Fehler auftreten.238

III) Datenaufbereitung (Data Preparation)

Daten auswählen

Daten bereinigen

Daten erstellen

Daten integrieren

Daten formatieren

Diese Phase umfasst alle Schritte, die nötig sind, um aus den Rohdaten den Datensatz zu

erstellen, der letztendlich zur Modellierung oder der eigentlichen Analyse dienen soll (Zur

Definition des Modell-Begriffs in der Statistik, siehe Abschnitt 2.1.6). „Zu den Aufgaben

gehören die Auswahl von Tabellen, Datensätzen und Attributen sowie die Transformation und

Bereinigung von Daten für Modellierungstool[s]“239.

IV) Modellierung (Modeling)

Modellierungsverfahren auswählen

Testdesign generieren

Modell erstellen

Modell beurteilen

236 Vgl. ebd., S. 18. 237 Vgl. ebd., S. 19. 238 Vgl. ebd. 239 IBM: CRISP-DM 1.0. Data Mining Schritt für Schritt - Ein Leitfaden., S. 5.

Page 40: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

40

In dieser Phase werden Modellierungstechniken wie zum Beispiel Clustering, künstliche

neuronale Netzwerke oder Nächste-Nachbarn-Algorithmen entsprechend des Problemtyps

ausgewählt und angewendet. 240 Mit ihrer Hilfe wird ein Modell erstellt und dessen Parameter

so gut wie möglich angepasst. Da manche Techniken bestimmte Anforderungen an die Daten

stellen, ist häufig eine erneute Datenaufbereitung erforderlich.

V) Auswertung (Evaluation)

Ergebnisse auswerten

Prozess prüfen

Weitere Schritte festlegen

Um sicherzugehen, dass das in IV) entwickelte Modell die geschäftlichen Anforderungen

erfüllt, wird es in dieser Phase sorgfältig ausgewertet und die einzelnen Schritte, die zu seiner

Entwicklung geführt haben, werden überprüft. Dabei wird insbesondere kontrolliert, ob ein

wichtiges Geschäftsziel nicht genug berücksichtigt wurde. Am Ende dieser Phase wird

entschieden, wie die Ergebnisse des Data-Mining genutzt werden sollen.

VI) Bereitstellung (Deployment)

Bereitstellung planen

Monitoring und Wartung planen

Schlussbericht erstellen

Projekt prüfen

Das vom Modell erzeugte Wissen wird in dieser Phase so organisiert und präsentiert, dass der

Kunde es verwerten kann. In manchen Fällen reicht es, einen Bericht über das Projekt zu

schreiben. In anderen Fällen muss vielleicht ein Computerprogramm geschrieben werden, mit

dem der Data-Mining-Prozess jederzeit im Unternehmen wiederholbar ist. Oft nimmt nicht

der Datenanalyst, sondern der Kunde die Bereitstellung vor.241

240 Einen Überblick über typische Data-Mining-Probleme und Lösungsansätze bietet CHAPMAN u. a.: CRISP-DM 1.0, S. 66ff. 241 Vgl. ebd., S. 28 f.

Page 41: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

41

2.3.3 Datenjournalistischer Arbeitsprozess

Für den anstehenden Vergleich von Datenjournalismus mit klassischer journalistischer

Recherche und CRISP-DM soll hier nun der datenjournalistische Arbeitsprozess beschrieben

werden. Diese Beschreibung beruht auf der Extraktion typischer Arbeitsschritte aus

Literaturquellen.242 Wie schon bei der journalistischen Recherche, können manche dieser

Arbeitsschritte wegfallen mehrfach oder in unterschiedlicher Reihenfolge erfolgen.243

I) Ausgangsfrage oder -hypothese haben

Häufig werden in der Literatur zwei verschiedene Ausgangspunkte für eine

datenjournalistische Recherche genannt. Entweder die Fragestellung oder das Thema existiert

schon und soll anhand von Daten überprüft werden, oder die Recherche wird „durch den

Datensatz selbst angestoßen“244. Laut Thibodeaux beginnen großartige datenjournalistische

Projekte meist nicht mit großartigen Datensätzen, sondern mit bedeutsamen Fragen.245 Meyer

geht so weit zu sagen, dass man ohne Theorie in den ungeordneten Rohdaten zu ersticken

droht.246

II) Daten beschaffen

Die Beschaffung von Daten kann auf die unterschiedlichsten Weisen geschehen, sei es durch

öffentlich zugängliche Quellen im Netz, durch Inanspruchnahme des

Informationsfreiheitsgesetzes oder sonstige Informanten.247 Manche Datenjournalisten lesen

auch mit Hilfe von „Scraper“-Programmen gezielt Daten aus dem Netz aus.248 Manchmal kann

es sogar nötig sein, die Daten für eine bestimmte Story selbst zu erheben.249 Dabei kann in

manchen Fällen das Crowdsourcing, also die Online-Mitarbeit vieler Freiwilliger an einem

242 Die hier beschriebenen Arbeitsschritte haben teilweise Ähnlichkeiten mit dem von Alexander Haase in Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 32 ff. in Anlehnung an den KDD-Prozess entwickelten Workflow. Allerdings ist bei Haase nicht ganz klar, ob es sich bei dem Workflow um einen Ist- oder Soll-Arbeitsprozess handelt. 243 Vgl. BRADSHAW, Paul und Liisa ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age. Harlow, Essex, New York, 2011, S. 51. 244 BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 23; vgl. auch BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 52; AITAMURTO/SIRKKUNEN/LEHTONEN: Trends in Data Journalism., S. 10; THE GUARDIAN: How to be a data journalist. http://www.guardian.co.uk/news/datablog/2010/oct/01/data-journalism-how-to-guide [abgerufen am 17.04.2013]; HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 33. 245 Vgl. THIBODEAUX: 5 tips for getting started in data journalism. 246 Vgl. MEYER: Precision journalism, S. 13. 247 Vgl. z.B. HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 35ff.; ROGERS: Facts are sacred, S. 286. 248 Vgl. z.B. BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 56; THE GUARDIAN: How to be a data journalist. 249 Vgl. BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 55.

Page 42: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

42

Projekt, von Nutzen sein.250 Liegt der Recherche eine Hypothese zugrunde, sollte bei der

Datenbeschaffung stets geprüft werden, ob die Daten geeignet sind, um die Hypothese zu

überprüfen.251

III) Daten vorbereiten und bereinigen

Liegen die Daten vor, so gilt es, sie in eine „einheitliche, maschinenlesbare Form“ zu bringen

und zu bereinigen.252 Beispielsweise müssen uneinheitliche Benennungen innerhalb eines

Datensatzes geändert werden. 253 Leßmöllmann spricht davon, die Daten „journalistisch

urbar“ zu machen und zitiert damit den britischen Datenjournalisten Simon Rogers.254 Zu

diesem Arbeitsschritt gehört auch, dass die Daten in das richtige Format gebracht werden.255

Manchmal müssen Daten beispielsweise erst aus einem PDF extrahiert und beispielsweise in

ein CSV-Format überführt werden, bevor mit dem eigentlichen bereinigen begonnen werden

kann.256

IV) Daten verstehen

Vor der weiteren Verarbeitung ist es wichtig, die Daten und ihren Kontext genau zu

verstehen.257 Dazu gehört beispielsweise, sich zu vergegenwärtigen, welche Definitionen bei

der Erhebung verwendet und welche Fälle dadurch ein- bzw. ausgeschlossen wurden.258 Im

Idealfall gibt es ein „data dictionary“ zu den Daten, also eine Datei, die viele dieser

Informationen enthält. 259 In den Bereich „Daten verstehen“ fällt auch der von Elmer

angegebene Arbeitsschritt „Aussagekraft und Vollständigkeit prüfen“.260 Dabei kann auch

bereits ersichtlich werden, dass für ein besseres Verständnis des Themas weitere Daten

beschafft werden müssen.261

250 Das Projekt Harassmap beispielsweise sammelt Berichte über sexuelle Übergriffe gegen Frauen in Ägypten auf einer interaktiven Landkarte. http://harassmap.org/en/ [abgerufen am 5.8.2013] 251 Vgl. AITAMURTO/SIRKKUNEN/LEHTONEN: Trends in Data Journalism., S. 11. 252 Vgl. BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 24; vgl. auch ELMER: Kleine Einführung Datenjournalismus.; AITAMURTO/SIRKKUNEN/LEHTONEN: Trends in Data Journalism., S. 10f. 253 Vgl. ROGERS: Facts are sacred, S. 291ff.; vgl. dazu auch HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 38f. 254 Vgl. LEßMÖLLMANN: Datenjournalismus: Chance für den Journalismus von morgen. 255 Vgl. BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 56. 256 Vgl. z.B. ROGERS: Facts are sacred, S. 290 f.; HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 37 f. 257 Vgl. z.B. THE GUARDIAN: How to be a data journalist. 258 Vgl. EGAWHARY, Elena und Cynthia O’MURCHU: Data Journalism (CAR). (2012) http://issuu.com/tcij/docs/data_journalism_book [abgerufen am 22.04.2013]; vgl. auch HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 34. 259 Vgl. DOIG, Steve: Basic Steps in Working with Data. In: Data Journalism Handbook. (2012) http://datajournalismhandbook.org/1.0/en/understanding_data_2.html [abgerufen am 21.08.2013]. 260 Vgl. ELMER: Kleine Einführung Datenjournalismus. 261 Vgl. ROGERS: Facts are sacred, S. 288.

Page 43: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

43

V) Daten analysieren und verknüpfen

Die Analyse und Auswertung von Daten ist vielleicht das Kernstück des datenjournalistischen

Arbeitsprozesses. Sie scheint für die Erzeugung eines Mehrwerts unentbehrlich. „Analysieren

heißt, die Daten zu sortieren, Veränderungen, Durchschnitte, Verhältnisse, Kennzahlen oder

Mittelwerte auszurechnen und nach Auffälligkeiten zu suchen“ 262, schreibt Bons. Um solche

Auffälligkeiten zu finden, werden Daten häufig visualisiert263 (siehe auch Schritt X). Auch das

Berechnen vergleichbarer Parameter264 und das Filtern von Daten265 sind in dieser Phase von

Bedeutung. In manchen Fällen kann es nötig sein, mehrere Datensätze miteinander zu

verknüpfen.266 Typisches Beispiel für solch eine Verknüpfung (engl. Mash-up) ist das

Zusammenführen von ortsabhängigen Informationen mit den entsprechenden Geodaten.

VI) Daten in einen Kontext setzen und interpretieren

Laut Leßmöllmann ist die Einordnung und Interpretation der Daten unerlässlich für die

Erarbeitung einer journalistischen Geschichte: „Dazu gehört auch, sie [die Daten] mit anderen

Daten, aber auch mit Kontextinformationen und Hintergrundwissen in Beziehung zu setzen,

sie also einzuordnen [...], um dann schließlich Schlüsse daraus zu ziehen, die gesellschaftlich

relevant sind.“267

VII) Die journalistische Geschichte in den Daten identifizieren

Die Identifikation der journalistischen Geschichte in den Daten ist nicht klar von Aspekten

wie Daten verstehen, analysieren und in einen Kontext setzen abzugrenzen. Es handelt sich

hier vermutlich eher um einen Findungsprozess innerhalb des Arbeitsprozesses als um einen

einzelnen Schritt. Obwohl er schwer fassbar ist, scheint dieser Aspekt doch zentral zu sein.

Datenjournalisten erwähnen Aspekte wie „journalistische Themen finden“268, „Recherche-

Thesen identifizieren“269 oder „gesellschaftlich relevante Schlüsse ziehen“270. Bradshaw und

262 BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 24. 263 Vgl. auch HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 32. 264 Vgl. ELMER: Kleine Einführung Datenjournalismus. 265 Vgl. ebd.; LORENZ: Status and Outlook for data-driven Journalism., S. 13. 266 Vgl. AITAMURTO/SIRKKUNEN/LEHTONEN: Trends in Data Journalism., S. 10f.; THE GUARDIAN: How to be a data journalist.; BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 51; ROGERS: Facts are sacred, S. 290f.; MATZAT: Data Driven Journalism: Versuch einer Definition. 267 LEßMÖLLMANN: Datenjournalismus: Chance für den Journalismus von morgen.; vgl. auch ROGERS: Facts are sacred, S. 288; BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 58; HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 40f. 268 SÖFJER, Jan: Journalist: Datenjournalismus - Sprich mit Daten. In: Journalist. (2010). 269 ELMER: Kleine Einführung Datenjournalismus. 270 LEßMÖLLMANN: Datenjournalismus: Chance für den Journalismus von morgen.

Page 44: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

44

Rohumaa schreiben: „Once you got the data, you need to see if there is a story buried within

it.“271

VIII) Recherche jenseits der Daten

Dieser Arbeitsschritt ist von dem Punkt „Daten in einen Kontext setzen und

interpretieren“ nicht unbedingt zu trennen. Er wird jedoch einzeln aufgeführt, um die

journalistische Komponente des datenjournalistischen Arbeitens hervorzuheben. Oft stößt die

Analyse von Daten eine Recherche mit klassischen journalistischen Methoden wie Interviews

und Befragungen an.272

IX) Ergebnisse überprüfen

Wichtiger Teil des datenjournalistischen Arbeitsprozesses ist die Überprüfung der Ergebnisse

und Berechnungen. Bradshaw und Rohumaa schreiben: „As a journalist you should double-

check your findings whenever possible with statisticians in the field you’re covering.“273 Zur

Überprüfung kann beispielsweise das Hinzuziehen einer zweiten Quelle gehören oder die

Überprüfung eines Ergebnisses vor Ort.274

X) Daten visualisieren

Die Visualisierung von Daten wurde für diese Arbeit nicht zur Bedingung für das Vorliegen

eines datenjournalistischen Erzeugnisses gemacht. Dieser Schritt muss also nicht zum

Arbeitsprozess gehören, wird es in der Regel aber tun. Wie unter Punkt V) erwähnt, ist

Visualisierung nicht nur bei der Veröffentlichung ein wichtiges Instrument, sondern kann

auch schon bei der Analyse hilfreich sein, „um Muster oder Auffälligkeiten zu entdecken“275.

Je nach Ressourcen des datenjournalistischen Projekts kann dieser Schritt sehr unterschiedlich

ausfallen. Von ihnen hängt unter anderem ab, ob der Datenjournalist selbst die Visualisierung

umsetzt oder ob sich ein Designer oder Programmierer des Projekts annimmt.276

271 BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 56; vgl. auch ROGERS: Facts are sacred, S. 293. 272 Im Workshop „Data Stories“, der im April 2013 in Hamburg stattfand, betonte Elmer diesen Aspekt. 273 BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 58; vgl. auch ROGERS: Facts are sacred, S. 288, 293; BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 24. 274 Vgl. LAFLEUR, Jennifer: A guide to Bulletproofing Your Data. In: GitHub https://github.com/propublica/guides [abgerufen am 17.08.2013]. 275 BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 24; vgl. auch BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 60. 276 Vgl. AITAMURTO/SIRKKUNEN/LEHTONEN: Trends in Data Journalism., S. 10f.; THE GUARDIAN: How to be a data journalist.; BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 60.

Page 45: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

45

XI) Endprodukt erstellen und veröffentlichen

Dieser Arbeitsschritt kann sich stark mit dem Punkt „Daten visualisieren“ überschneiden,

muss es aber nicht. Am Ende des Prozesses kann eine Geschichte, eine Grafik oder eine

andere Art der Visualisierung stehen. 277 Dabei können die Daten entweder eher im

Hintergrund stehen oder sie erzählen selbst die Geschichte und der Journalist muss sie nur so

aufbereiten, dass diese Geschichte möglichst klar zum Vorschein kommt.278 Sofern die Daten

nicht ohnehin mit veröffentlicht werden, sollte die Quelle der Daten genannt werden.279

XII) Rohdaten veröffentlichen und archivieren

Die Veröffentlichung von Rohdaten wird von vielen Datenjournalisten und Forschern als

wichtiger Arbeitsschritt angegeben. 280 Dieser Arbeitsschritt kann aber manchmal aus

datenschutzrechtlichen Gründen nicht oder nur bedingt umsetzbar sein. Bons weist darauf hin,

dass die Archivierung von Daten und Rechercheergebnissen bisher oft noch zu kurz kommt,

für Recherchen zu einem späteren Zeitpunkt aber sehr nützlich sein könnte.281

2.4 Arbeitsweisen im Vergleich

2.4.1 Datenjournalismus und herkömmliche journalistische Recherche

In Abschnitt 2.3.1 wurde die Frage aufgeworfen, inwiefern die Grundzüge der herkömmlichen

journalistischen Recherche auf den Datenjournalismus übertragbar sind. Dieser Frage soll hier

weiter nachgegangen werden. Tabelle 1 listet noch einmal die herausgearbeiteten Schritte

beider Prozesse auf.

Als vielleicht wichtigster Punkt lässt sich zunächst festhalten, dass die herkömmliche

journalistische Recherche, also die „Recherche jenseits der Daten“, im datenjournalistischen

Arbeitsprozess stets als Teilmenge enthalten ist. Doch in welchem Verhältnis steht der

gesamte datenjournalistische Ablauf zur herkömmlichen Recherche? Recherche-Impuls am

Anfang und Veröffentlichung eines Produkts am Ende jedenfalls haben beide Prozesse

gemeinsam.

277 Vgl. ROGERS: Facts are sacred, S. 293; vgl. auch ebd., S. 288; LEßMÖLLMANN: Datenjournalismus: Chance für den Journalismus von morgen. 278 Vgl. BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 50. 279 Vgl. MATZAT: Data Driven Journalism: Versuch einer Definition.; LANGER: Schaubild statt Klickstrecke. 280 Vgl. KRAMPE: Journalistische Datens(ch)ätze. Definition, Einordnung und Qualitätskriterien von Datenjournalismus, S. 14; BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 25; MATZAT: Data Driven Journalism: Versuch einer Definition.; AITAMURTO/SIRKKUNEN/LEHTONEN: Trends in Data Journalism., S. 11. 281 Vgl. BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 25.

Page 46: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

46

Tabelle 1 Vergleich allgemeiner Rechercheprozess und datenjournalistischer Arbeitsprozess

Herkömmliche journalistische Recherche Datenjournalistischer Arbeitsprozess

1. Recherche-Impuls / Ausgangsfrage

2. Einschätzung der Relevanz

3. Schaffen eines Überblicks

4. Planung der Recherche

5. Überprüfung der Sachinformationen

6. Erweiterung der Sachinformationen

7. Hypothesenbildung

8. Hypothesenüberprüfung

9. Recherche-Abschluss

10. Produktion und Veröffentlichung

11. Begleitende Dokumentation

I. Ausgangsfrage oder –hypothese

haben

II. Daten beschaffen

III. Daten vorbereiten und bereinigen

IV. Daten verstehen

V. Daten analysieren und verknüpfen

VI. Daten in Kontext setzen und

interpretieren

VII. Journalistische Geschichte in den

Daten identifizieren

VIII. Recherche jenseits der Daten

IX. Ergebnisse überprüfen

X. Daten visualisieren

XI. Endprodukt erstellen und

veröffentlichen

XII. Rohdaten veröffentlichen und

archivieren

Im Folgenden werden daher vor allem die Schritte diskutiert, durch welche sich die

datenjournalistische von der herkömmlichen Recherche abhebt. Für diese Diskussion muss

klar sein, dass die Schritte beider Prozesse unterschiedlich komplex und daher nicht direkt

miteinander vergleichbar sind. Die Schritte 2 bis 8 des herkömmlichen Rechercheprozesses

beinhalten jeweils ein bestimmtes Ziel, zum Beispiel die Überprüfung einer Hypothese (Die

Nummerierung gibt keine Reihenfolge der Schritte an, sondern dient nur der Benennung). Die

Überschrift gibt also an, was am Ende des Schrittes erreicht worden sein soll, nicht aber auf

welche Weise. Die Schritte II, III, IV, V, VI, X und XII des datenjournalistischen Prozesses

hingegen beschreiben die durchgeführte Handlung, zum Beispiel Daten vorbereiten und

bereinigen, nicht aber das übergeordnete Ziel im Rechercheprozess. Bis auf die

Veröffentlichung der Rohdaten (Schritt XII) lassen sich jedoch alle diese datenjournalistischen

Schritte den Schritten des allgemeinen Rechercheprozesses unterordnen. So kann

beispielsweise das Analysieren und Verknüpfen von Daten dabei helfen, sich einen Überblick

über ein Thema zu verschaffen oder die gegebenen Informationen durch neu berechnete

Page 47: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

47

Größen zu erweitern. Außerdem ist die Analyse Grundlage für die Bildung von Hypothesen

und kann auch zu deren Überprüfung dienen.

Das Veröffentlichen von Rohdaten (Schritt XII) ist eine Besonderheit des Datenjournalismus.

Bei nicht-datenjournalistischen Projekten werden in der Regel die Originaldokumente

bestenfalls archiviert, nicht aber mitveröffentlicht. Auch der Punkt VII „Journalistische

Geschichte in den Daten identifizieren“ fällt aus der Reihe. Obwohl er ein Ziel und keine

konkrete Handlung beschreibt, gibt es im herkömmlichen Rechercheprozess kein direktes

Äquivalent dazu. Eher ist dieser Schritt eine Mischung aus Recherche-Impuls, Relevanz-

Einschätzung und Hypothesenbildung.

Die datenjournalistischen Arbeitsschritte lassen sich im Wesentlichen den Schritten des

klassischen Rechercheprozesses zuordnen, da sie die gleichen Ziele verfolgen. Im

Datenjournalismus werden jedoch spezielle Mittel bei der Informationsbeschaffung und

Vermittlung angewandt. Die grundlegende Übereinstimmung bestätigt die Einordnung von

Datenjournalismus als journalistischem Rechercheprozess. Dass Datenjournalisten nach

Prinzipien wie „von außen nach innen“ vorgehen, kann aus dem Vergleich nicht abgeleitet,

sondern nur in Konsequenz gemutmaßt werden. Alleinstellungsmerkmal des

Datenjournalismus ist die Veröffentlichung der Rohdaten sowie das Auffinden von

Geschichten in den Daten. Über den Ablauf und die Beschaffenheit der speziell

datenjournalistischen Arbeitsschritte gibt der herkömmliche Rechercheprozess keine Auskunft.

Diese Schritte lassen sich eher im Data-Mining-Standardprozess CRISP-DM wiederfinden.

2.4.2 Datenjournalistischer Arbeitsprozess und CRISP-DM

Mit CRISP-DM wurde ein sehr detaillierter Standardprozess entwickelt. Über den

datenjournalistischen Arbeitsprozess hingegen gibt es in der Literatur eher bruchstückhafte

Informationen. Die unterschiedliche Informationslage macht einen Vergleich allein auf

Literaturbasis schwierig. Die zu diesem Vergleich angestellten Überlegungen sind im Detail in

Anhang II in Form von Schaubildern dargestellt. Im Folgenden werden die aus den

Überlegungen resultierenden Thesen über die Zusammenhänge zwischen beiden Prozessen

vorgestellt. Diese werden in Abschnitt 6.3 um die Aussagen von Experten ergänzt.

In Abschnitt 2.1.7 wurde Data-Mining als die Extraktion von gültigem, bisher unbekanntem

und potentiell nützlichem Wissen bezeichnet. Diese Beschreibung erinnert an die Definition

von Datenjournalismus, die in Abschnitt 2.1.8 für diese Arbeit aufgestellt wurde. Dort war

Page 48: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

48

von der Generierung eines Mehrwerts aus den Daten die Rede. Allein in ihrer Definition

weisen Data-Mining und Datenjournalismus also eine gewisse Ähnlichkeit auf. Auch bei den

Begrifflichkeiten gibt es einige Übereinstimmungen. So ist beispielweise in beiden Fällen von

„Daten verstehen“ bzw. „Data Understanding“ die Rede. Geschäftsziele (Business Objectives)

hingegen tauchen im datenjournalistischen Arbeitsprozess nicht auf und die journalistische

Geschichte kommt als Begriff bei CRISP-DM nicht vor. Da der eine Prozess in der Industrie,

der andere im Journalismus beheimatet ist, überraschen die unterschiedlichen

Begrifflichkeiten nicht weiter.

Auch wenn die Kontexte der Prozesse sowie die Begriffe teilweise unterschiedlich sind, so ist

zu vermuten, dass sich viele Arbeitsschritte in analoger oder ähnlicher Weise auf den jeweils

anderen Prozess übertragen lassen. So ist beispielsweise anzunehmen, dass die journalistische

Geschichte oder das journalistische Produkt für Journalisten eine Art Geschäftsziel darstellt.

In ähnlicher Weise könnte die Veröffentlichung als Analogon zur Bereitstellung interpretiert

werden. Unklar ist, welcher Analysetechniken Datenjournalisten sich bedienen und ob diese

Techniken als Modellierung im Data-Mining-Sinn bezeichnet werden können. Aus den

unterschiedlichen Kontexten der beiden Prozesse resultiert, dass die journalistischen Aspekte

wie „Recherche jenseits der Daten“ oder „journalistische Geschichte in den Daten finden“ bei

CRISP-DM nicht zu finden sind. Auch die Veröffentlichung der Rohdaten scheint eine

Eigenheit des Datenjournalismus zu sein.

Im CRISP-DM-Prozess spielt insgesamt die Dokumentation der einzelnen Arbeitsschritte eine

wichtige Rolle. Es ist vorgesehen, dass Entscheidungen, Ergebnisse und Erfahrungen

sorgfältig protokolliert werden. Inwiefern Datenjournalisten ihre Arbeit durch Notizen,

Berichte oder Protokolle dokumentieren, lässt sich aus den vorliegenden Informationen nicht

befriedigend ersehen. Da Recherche als kreativer und spontaner Prozess gilt (siehe Abschnitt

2.3.1), ist zu vermuten, dass bei datenjournalistischen Projekten weniger strukturiert und

geplant vorgegangen wird als bei CRISP-DM, sondern eher dynamisch reagierend und kreativ.

Aus dem gleichen Grund fallen vermutlich auch Dokumentation, Planung und selbstreflexive

Prüfung im Datenjournalismus weniger ausführlich und reglementiert aus. Da es bisher keinen

Standardprozess für den Datenjournalismus gibt, könnte es sein, dass Datenjournalisten

bestimmte Schritte im Ansatz zwar ausführen, diese jedoch nicht bewusst als eigenständige

Schritte wahrnehmen und benennen.

Page 49: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

49

Zusammenfassend lässt sich sagen, dass viele Schritte von CRISP-DM sich auf den

Datenjournalismus übertragen zu lassen scheinen. Zu einigen speziell journalistischen

Schritten enthält CRISP-DM kein Äquivalent. An manchen Stellen reicht die Literatur nicht

aus, um einen aussagekräftigen Vergleich anzustellen. Ob beispielsweise Datenjournalisten

Modellierung im Sinne von CRISP-DM anwenden, soll durch den empirischen Teil dieser

Arbeit geklärt werden.

3 Forschungsfragen

„Nur wer weiß, was er herausbekommen möchte, kann auch danach fragen.“ 282

Jochen Gläser, Grit Laudel

Im Theorieteil der Arbeit wurde der datenjournalistische Arbeitsprozess mit einem

Standardprozess für Data-Mining und der herkömmlichen journalistischen Recherche

verglichen (Kapitel 2.4.1 und 2.4.2, Abbildung 4).

Abbildung 4 Im Theorieteil vorgenommene Vergleiche

Die Leitfrage dieser Arbeit ist die nach der Eignung von CRISP-DM als Vorlage für eine

datenjournalistische Leitlinie. Der empirische Teil der Arbeit konzentriert sich daher auf den

linken Teil dieses Dreiecks (Abbildung 1). Beide Seiten dieses Dreiecks in einer empirischen

Untersuchung detailliert behandeln zu wollen, würde nicht nur den Rahmen dieser Arbeit,

sondern auch den zeitlichen Rahmen einer einzelnen Befragung sprengen (Zur Wahl des

Erhebungsinstruments siehe Kapitel 4.1). Es werden daher folgende Forschungsfragen

formuliert:

282 GLÄSER, Jochen und Grit LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen. Wiesbaden, 2010.

Page 50: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

50

Forschungsfrage 1: Welche Schritte sind typisch für den datenjournalistischen

Arbeitsprozess?

Aussagen über den datenjournalistischen Arbeitsprozess kommen in der Literatur zwar vor,

oft allerdings nur in Form einzelner Fragmente oder einer sehr groben Unterteilung des

Arbeitsprozesses. Eine systematische Betrachtung wie bei Rogers 283 ist selten zu finden.

Insbesondere im theoretischen Vergleich mit CRISP-DM fehlten daher Detailinformationen

über das datenjournalistische Vorgehen. Die Forschungsfrage soll helfen, diese Wissenslücke

zu schließen und den Weg für weitere Untersuchungen des datenjournalistischen

Arbeitsprozesses ebnen.

Forschungsfrage 2: Welche Übereinstimmungen und welche Unterschiede existieren

zwischen dem datenjournalistischen Arbeitsprozess und CRISP-DM?

Wie in Kapitel 2.4.2 beschrieben wurde, legt der theoretische Vergleich nahe, dass sich einige

der CRISP-DM-Schritte im datenjournalistischen Arbeitsprozess in ähnlicher Form

wiederfinden. Um einschätzen zu können, ob der sorgfältig ausgearbeitete Data-Mining-

Standardprozess ein Anhaltspunkt für eine datenjournalistische Leitlinie sein könnte, müssen

die Übereinstimmungen und Unterschiede genauer herausgearbeitet werden.

Forschungsfrage 3: Ist CRISP-DM als Ausgangspunkt für die Entwicklung eines

datenjournalistischen Leitfadens geeignet?

Das Literaturstudium legt nahe, dass CRISP-DM in abgewandelter Form als Leitfaden für

datenjournalistische Projekte dienen könnte. Aber sehen das auch jene so, die Praxiserfahrung

auf diesem Gebiet haben? Diese Frage soll Aufschluss darüber geben, ob Datenjournalisten

CRISP-DM als hilfreich für ihr Arbeitsgebiet erachten.

Forschungsfrage 4: In welchem Verhältnis stehen herkömmliche und

datenjournalistische Recherche zueinander?

Die theoretischen Überlegungen legen nahe, dass datenjournalistische und herkömmliche

Recherche sich weniger in ihren Zielen, sondern mehr in ihren Methoden unterscheiden. Diese

Hypothese soll um die Einschätzung der Experten ergänzt werden. Aus

forschungsökonomischen Gründen wird dieser Aspekt im empirischen Teil jedoch weniger

ausführlich behandelt als die ersten drei Forschungsfragen.

283 Vgl. ROGERS: Facts are sacred, S. 288.

Page 51: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

51

Diese Forschungsfragen dienen der Erkundung und Beschreibung 284 eines noch relativ

unbekannten empirischen Sachverhalts.285 Sie sollen einerseits helfen, Wissenslücken über den

datenjournalistischen Arbeitsprozess zu verkleinern.286 Andererseits sollen sie eine Idee davon

liefern, welche Wissenslücken es in zukünftigen Forschungsvorhaben zu schließen gilt.

Insbesondere Forschungsfrage 3 ist über das wissenschaftliche Interesse hinaus auch im

Verwertungszusammenhang begründet: 287 Könnte man mit Hilfe von CRISP-DM eine

Leitlinie des Datenjournalismus entwickeln, die praktische Anwendung in Redaktionen

findet?

4 Entwicklung der empirischen Methode 4.1 Das teilstandardisierte Experteninterview

Als empirische Methode für die Beantwortung der aus dem Theorieteil entwickelten

Forschungsfragen wurde das teilstandardisierte Experteninterview gewählt. Teil- und

nichtstandardisierte Interviews sind in der Durchführung und Auswertung wesentlich

aufwendiger als standardisierte Befragungen, haben dafür aber bestimmte Vorteile: „Die

Befragten selbst teilen in ihren Ausführungen mit, was sie über den Untersuchungsgegenstand

wissen, welche Aspekte sie für bedeutsam halten, welche Gefühle und Einstellungen sie

hegen.“288 Wenn über den Untersuchungsgegenstand noch wenig bekannt ist, bildet dies einen

entscheidenden Vorteil gegenüber dem standardisierten Interview: Da „der Forscher [beim

standardisierten Interview] nicht mehr herausbekommt, als er in den Fragebogen

hineingesteckt hat“289 läuft er Gefahr, wichtige Aspekte zu übersehen. Da der Arbeitsprozess

von Datenjournalisten bisher noch kaum erforscht ist, die Forschungsfragen jedoch die

Beantwortung konkreter Fragen erforderlich machen, ist also das teilstandardisierte Interview

das Mittel der Wahl.

Teilstandardisierte Befragungen basieren auf einem Interview-Leitfaden, in dem die zu

stellenden Fragen festgehalten sind. Man spricht daher auch von Leitfadeninterviews. In

welcher Reihenfolge die Fragen gestellt werden, bleibt dem Interviewer und dem

284 Vgl. KROMREY, Helmut: Empirische Sozialforschung: Modelle und Methoden der standardisierten Datenerhebung und Datenauswertung. Stuttgart, 2009, S. 107f. 285 Vgl. ebd., S. 108. 286 Vgl. GLÄSER/LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen, S. 65. 287 Vgl. dazu auch MIKOS, Lothar: Qualitative Medienforschung: ein Handbuch. Konstanz, 2005, S. 175. 288 WAGNER, Hans: Qualitative Methoden in der Kommunikationswissenschaft: ein Lehr- und Studienbuch. München, 2008, S. 319f. 289 Ebd., S. 319.

Page 52: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

52

Gesprächsverlauf überlassen.290 Es müssen nicht alle Fragen in jedem Interview gestellt

werden. Auf die potenziellen Fehler bei der Durchführung von Leitfadeninterviews mit

Experten soll in Abschnitt 5.1 eingegangen werden.

4.2 Leitfragen und Operationalisierung Von den noch recht allgemeinen Forschungsfragen gilt es, eine Brücke zum

Erhebungsinstrument, in diesem Fall dem Interviewleitfaden, zu schlagen. Im Folgenden

werden dazu die Gegenstände der Forschungsfragen auf ihre Bedeutungsdimensionen hin

untersucht.291 Es wird diskutiert, mittels welcher Variablen die für diese Arbeit relevanten

Dimensionen 292 gemessen werden können. Der Untersuchungsgegenstand wird also

operationalisiert, d.h. messbar gemacht. Aufbauend auf diesen Überlegungen werden die

Forschungsfragen in konkretere Leitfragen übersetzt. Diese Leitfragen dienen sowohl zur

Orientierung bei der Entwicklung der konkreten Interviewfragen als auch bei der Auswertung

der durch die Interviews gewonnenen Ergebnisse.293 Für die Forschungsfragen dieser Arbeit

ergeben sich folgende Überlegungen:

Forschungsfrage 1: Welche Arbeitsschritte sind typisch für den datenjournalistischen

Arbeitsprozess?

Leitfrage 1.1: Welche Arbeitsschritte kommen immer oder häufig bei der Produktion

datenjournalistischer Beiträge vor?

Ob ein Arbeitsschritt typisch ist, soll in dieser Untersuchung durch die Variable

„Häufigkeit“ gemessen werden. Als typisch sollen solche Handlungen gelten, die immer oder

häufig in datenjournalistischen Projekten vorkommen. Von Interesse sind vor allem die Art

der Durchführung und das Ziel der Handlung. Um eine möglichst gute Vergleichbarkeit mit

CRISP-DM herzustellen, sollten die genannten Arbeitsschritte in etwa den Komplexitätsgrad

der generischen Aufgaben von CRISP-DM haben. Je nachdem, wie das Antwortverhalten der

Experten ausfällt, muss dieser Komplexitätsgrad durch Nachfragen angestrebt werden.

290 Vgl. ebd. 291 Vgl. KROMREY: Empirische Sozialforschung, S. 116. 292 Vgl. ebd. 293 Vgl. GLÄSER/LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen, S. 91.

Page 53: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

53

Forschungsfrage 2: Welche Übereinstimmungen und Unterschiede existieren zwischen

dem datenjournalistischen Arbeitsprozess und CRISP-DM?

Leitfrage 2.1: Welche generischen Aufgaben des CRISP-DM Prozesses stimmen ganz oder

teilweise mit Arbeitsschritten des Datenjournalismus über ein?

Leitfrage 2.2: Wie übertragen Datenjournalisten die generischen Aufgaben von CRISP-DM

in ihren Alltag?

Leitfrage 2.3: Welche typischen Arbeitsschritte des datenjournalistischen Arbeitsprozesses

kommen nicht in CRISP-DM vor?

Zum einen soll unabhängig von der Betitelung der Arbeitsphasen geprüft werden, inwiefern

die Handlungen der beiden Arbeitsprozesse übereinstimmen. Zum anderen sollen die

Interviews Auskunft darüber geben, welche Aktivitäten die Datenjournalisten mit den

Überschriften der CRISP-DM-Phasen assoziieren. Diese Interpretation der verwendeten

Begriffe ist für eine eventuelle Übertragbarkeit des Prozesses als Leitfaden wichtig.

Die Schritte von CRISP-DM werden auf dem Level der generischen Aufgaben betrachtet.

Dieser Ansatz scheint sinnvoll, da die generischen Aufgaben formuliert wurden, um sich gut

auf unterschiedliche Data-Mining Projekte übertragen zu lassen. Somit ist der Prozess auf

dieser Ebene möglicherweise auch auf den datenjournalistischen Arbeitsprozess gut

übertragbar. Ein Vergleich auf Ebene der sechs übergeordneten Phasen von CRISP-DM

scheint nicht aussagekräftig genug.

Als erwarteter Antwortbereich werden verschiedene Ausprägungen der Variablen „Grad der

Übereinstimmung“ sowie die Schilderungen ähnlicher oder analoger Handlungen im

Datenjournalismus erwartet. Die Frage nach Gründen für Gemeinsamkeiten und Unterschiede

wurde aus forschungsökonomischer Sicht nicht mit in die Forschungsfrage aufgenommen.

Sofern die Interviews Hinweise auf die Gründe für abweichende oder übereinstimmende

Handlungen enthalten, werden diese jedoch in der Auswertung berücksichtigt.

Forschungsfrage 3: Ist CRISP-DM als Ausgangspunkt für die Entwicklung einer

datenjournalistischen Leitlinie geeignet?

Leitfrage 3.1: Kann für Datenjournalismus überhaupt eine Leitlinie entwickelt werden?

Page 54: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

54

Leitfrage 3.2: Wie hoch ist der Grad der Übereinstimmung zwischen CRISP-DM und dem

datenjournalistischen Arbeitsprozess?

Leitfrage 3.3: Würde eine höhere Übereinstimmung des datenjournalistischen

Arbeitsprozesses mit CRISP-DM gemäß den Qualitätskriterien des Datenjournalismus eine

Verbesserung bedeuten?

Leitfrage 3.4: Welche Gründe sprechen für oder gegen CRISP-DM als Ausgangspunkt für die

Entwicklung einer Leitlinie?

Nur wenn Leitfrage 3.1 bejaht wird, ergibt es Sinn, mit der eigentlichen Forschungsfrage

fortzufahren. Wie in Abschnitt 1.2 erläutert wurde, werden in dieser Arbeit zwei Kriterien für

die Beurteilung der Eignung von CRISP-DM herangezogen. Zum einen kann der Grad der

Übereinstimmung als Indikator gelten (Leitfrage 3.2). Zum anderen ist von Interesse, ob

CRISP-DM zur Erfüllung datenjournalistischer Qualitätskriterien beitragen könnte (Leitfrage

3.3). Leitfrage 3.4 zielt auf weitere, bislang nicht berücksichtigte Indikatoren ab, die für oder

gegen für die Eignung von CRISP-DM sprechen könnten.

Forschungsfrage 4: In welchem Verhältnis stehen herkömmliche und

datenjournalistische Recherche zueinander?

Leitfrage 4.1: Inwiefern unterscheiden sich die Ziele und Methoden von herkömmlicher und

datenjournalistischer Recherche?

Aus den theoretischen Überlegungen ergab sich die Hypothese, dass sich die Ziele von

herkömmlicher und datenjournalistischer Recherche weitestgehend decken, die verwendeten

Methoden jedoch unterschiedlich sind. Leitfrage 4.1 zielt auf die Verfeinerung dieser These ab.

4.3 Entwicklung des Interviewleitfadens Laut Gläser und Laudel können pro Stunde je nach Komplexität des Themas 8 bis 15 Fragen

behandelt werden.294 Im vorliegenden Leitfaden wurden 11 Fragen für 45 Minuten angesetzt.

Dabei wurden für den CRISP-DM-Vergleich mehrere Nachfragen eingeplant.

Nach dem Prinzip der „informierten Einwilligung“ wurden die Befragten zu Beginn des

Interviews über das Ziel der Arbeit, die Funktion des Interviews dabei und den Umgang mit 294 Vgl. GLÄSER/LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen, S. 144.

Page 55: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

55

ihren persönlichen Daten aufgeklärt. 295 Durch Überleitungen wurde versucht, einen

natürlichen Gesprächsverlauf zu erzeugen. 296 Außerdem wurden häufiger sogenannte

Plattformfragen verwendet. Sie enthalten einen oder mehrere Aussagesätze und eine inhaltlich

anschließende Frage, womit vermieden wird, alle „Informationen in den Fragesatz zu

stopfen“297. Insgesamt wurde darauf geachtet, die Fragen möglichst offen,298 neutral,299 klar

und einfach zu formulieren.300 Es wurden möglichst häufig unterstellende Fragen verwendet,

die den Interviewpartner von Entscheidungen entlasten und „umständliche und den

Gesprächsfluss zerstörende Filterfragen“301 vermeiden. „Eine Ablehnung der Unterstellungen“,

so Gläser und Laudel, „liegt meist im Spektrum der normalen Antwortmöglichkeiten und

erfordert keinen zusätzlichen Aufwand“.302 Der für diese Arbeit verwendete Interviewleitfaden

ist in Anhang III beigefügt. Anhang IV beinhaltet Erläuterungen zu den Formulierungen der

einzelnen Fragen sowie zu ihrer Positionierung innerhalb des Leitfadens.

4.4 Die Stichprobe

4.4.1 Wer ist ein Experte?

Um eine Stichprobe für die Experteninterviews auszuwählen, muss zwangsläufig definiert

sein, wer als Experte für das zu erforschende Thema gilt. Bogner und Menz leiten aus drei

verschiedene Zugängen zum Expertenbegriff eine eigene Definition her, die auch für diese

Arbeit sinnvoll erscheint. Ein Experte verfügt laut dieser Definition über drei Arten von

Wissen: technisches, Prozess- und Deutungswissen, „das sich auf sein spezifisches

professionelles oder berufliches Handlungsfeld bezieht“303. Nur ein geringer Teil davon ist

„reflexiv zugängliches Fach- und Sonderwissen“304. Außerdem ist der Einfluss des Experten

entscheidend: „[...] der Experte besitzt die Möglichkeit zur (zumindest partiellen)

Durchsetzung seiner Orientierungen.“ 305 Es gilt für den Forscher also zu identifizieren,

welche Personen auf dem betrachteten Gebiet Macht- und Einflusspotentiale besitzen.

295 Vgl. ebd. 296 Vgl. ebd., S. 143. 297 Ebd., S. 140. 298 Vgl. ebd., S. 131. 299 Vgl. ebd., S. 135. 300 Vgl. ebd., S. 140f. 301 Ebd., S. 133. 302 Ebd. 303 BOGNER, Alexander (Hrsg.): Das Experteninterview: Theorie, Methode, Anwendung. Wiesbaden, 2005, S. 46. 304 Ebd. 305 Ebd.

Page 56: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

56

4.4.2 Auswahl der Experten

Die Gruppe derer, die sie beruflich intensiv mit Datenjournalismus befassen, ist in

Deutschland bisher noch recht überschaubar. Bei der Literaturrecherche in gedruckten

Veröffentlichungen sowie im Internet werden häufig die gleichen Namen genannt. Auch in

den bisherigen Forschungsarbeiten zum Thema Datenjournalismus wird ein ähnlicher

Personenkreis erwähnt. Viele Datenjournalisten nutzen den Kurznachrichtendienst Twitter

und erwähnen oder folgen sich dort gegenseitig. Dieser Dienst konnte somit als Instrument

genutzt werden, um einen Überblick über die Szene zu gewinnen. Hilfreich waren auch Blogs,

wie zum Beispiel DATENJOURNALIST.DE von der Datenjournalismus-Agentur OPENDATACITY,

auf dem aktuelle Entwicklungen im Datenjournalismus kommentiert werden.

Auf diese Art wurde ein Pool potenzieller Interviewpartner erstellt (siehe Tabelle 1 in Anhang

VII). Daraus wurden diejenigen Personen ausgewählt, die bisher noch möglichst selten zu

Forschungszwecken befragt wurden, gleichzeitig aber über eine möglichst umfassende

Berufserfahrung verfügen. Um in den Interviews Angaben über typische datenjournalistische

Arbeitsschritte erhalten zu können, war ein großer Erfahrungsschatz – möglichst aus mehreren

Jahren Berufsalltag – besonders wichtig. Alle drei in dieser Arbeit befragten Experten erfüllen

diese Voraussetzung.

Christina Elmer ist nach eigenen Angaben seit 2007 als Datenjournalistin tätig. Derzeit ist sie

als Redakteurin im Ressort Wissenschaft bei SPIEGEL ONLINE angestellt und verwendet etwa

50 Prozent ihrer Arbeitszeit auf datenjournalistische Projekte. Zuvor arbeitete sie als

Datenjournalistin bei der DPA, der DPA-INFOGRAFIK und beim STERN.

Julius Tröger gibt an, seit 2011 als Datenjournalist tätig zu sein. Als fest angestellter Reporter

im Lokal-Ressort der BERLINER MORGENPOST verwendet er etwa 75 Prozent seiner Arbeitszeit

auf datenjournalistische Projekte.

Sascha Venohr führt seit etwa drei Jahren datenjournalistische Projekte bei ZEIT ONLINE durch.

In der Entwicklungsredaktion ist er als Head of Data Journalism angestellt und betreibt als

solcher während seiner Arbeitszeit zu etwa 60 Prozent Datenjournalismus.

Alle drei Experten verfügen über das von Bogner und Menz erwähnte Einflusspotenzial auf

ihrem Gebiet. Christina Elmer beispielsweise wird häufig als Referentin zum Thema

Page 57: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

57

Datenjournalismus zu Konferenzen und Workshops eingeladen. Das ZEIT ONLINE-Projekt

„Verräterisches Handy“, an dem Sascha Venohr maßgeblich beteiligt war, wird in zahlreichen

Veröffentlichungen als Paradebeispiel für Datenjournalismus genannt und erhielt unter

anderem den Grimme Online Award. Auch Julius Trögers erhielt bereits zahlreiche

Auszeichnungen, unter anderem wurde er 2012 vom MEDIUM MAGAZIN unter die Top 30

Nachwuchsjournalisten gewählt.

5 Durchführung der empirischen Erhebung

5.1 Regeln bei der Durchführung von teilstandardisierten

Experteninterviews Bei der Befragung wurde versucht, die Regeln der Interviewführung für qualitative

Forschungsinterviews nach Gläser und Laudel einzuhalten.306 Eine Übersicht der beachteten

Regeln befindet sich in Anhang IX. In einem Interview-Pretest mit einer Person, die nicht zum

Expertenkreis für diese Studie zählt, fiel der Autorin auf, dass sie durch die ausführlichen

theoretischen Vorüberlegungen sehr konkrete Ideen von der datenjournalistische Arbeitsweise

mitbrachte. Daraus entstand die Versuchung, bestimmte Antworten zu raten und dem

Interviewten nahezulegen.307 Die Autorin war sich durch den Pretest dieser Tendenz bewusst

und versuchte, dieser in den Interviews durch offenes Fragen sowie das Eingehen auf neue,

durch die Experten genannte Aspekte entgegenzusteuern.

5.2 Ablauf der Befragungen Die erste Kontaktaufnahme mit den Befragten erfolgte per E-Mail bzw. bei Julius Tröger über

den Kurznachrichtendienst Twitter. Im Anschreiben wurden das Forschungsvorhaben sowie

die Funktion der Interviews dabei kurz erläutert. Hierbei wurde versucht, einerseits durch

Informationen das Interesse der Interviewpartner zu wecken, andererseits nicht zu viel zu

verraten, um das spätere Antwortverhalten im Interview nicht zu beeinflussen. Außerdem

wurde in den Anschreiben jeweils auf die speziellen datenjournalistischen Erfahrungen des

potenziellen Interviewpartners Bezug genommen. Auf insgesamt fünf Anfragen folgten drei

Zusagen. Zwei angeschriebene potenzielle Interviewpartner reagierten nicht.

306 Vgl. GLÄSER/LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen, S. 172ff. 307 Vgl. dazu auch ebd., S. 132.

Page 58: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

58

Die Gespräche mit Christina Elmer und Julius Tröger fanden in den Cafeterien der jeweiligen

Medienhäuser statt, in welchen die Befragten angestellt sind (SPIEGEL und BERLINER

MORGENPOST). Das Interview mit Sascha Venohr wurde in einem Besprechungsraum der ZEIT

ONLINE-Redaktion durchgeführt. Während der Gespräche gab es keine größeren

Unterbrechungen oder Störungen. Alle Befragten stimmten der Tonaufnahme des Interviews

zu. Mit einer Interviewdauer von 55-60 Minuten wurde der anfängliche angestrebte Rahmen

von 45 Minuten zwar etwas überzogen, jedoch hatten alle Interviewpartner so viel Zeit

eingeplant, dass kein Zeitdruck entstand. So konnten auch die optionalen Fragen des

Fragebogens zumindest gestreift werden. Die Interviews fanden am 31.7.2013 (Christina

Elmer) und 7.8.2013 (Julius Tröger und Sascha Venohr) statt. Alle Befragten füllten direkt vor

Ort einen kurzen Fragebogen zu beruflichen Angaben (siehe Anhang V) aus.

5.3 Vorgehensweise bei der Auswertung

5.3.1 Transkription

Alle Interview-Mitschnitte wurden vollständig transkribiert, um das Datenmaterial für die

Interpretation verfügbar zu machen. 308 Für die Transkription gibt es keine allgemein

anerkannten Regeln, da diese vom Untersuchungsziel abhängig sind. 309 Eine minutiöse

phonetische Umschrift aller sprachlichen Äußerungen ist für diese Arbeit nicht sinnvoll, da

vor allem der Inhalt der Äußerungen und nicht ihre sprachliche Form von Interesse ist. Es

wurde daher Standardorthografie und keine literarische Umschrift verwendet (z.B. „Hast

du“ statt „Haste“). Einzig die Äußerung „ne“ als rhetorisch bestärkende Interjektion, die den

Gesprächspartner zur Zustimmung bewegen soll, wurde als umgangssprachliches Element

beibehalten. Nichtverbale Äußerungen und längere Pausen im Gespräch wurden nur dann

vermerkt, wenn sie der Antwort eine andere Bedeutung verleihen.310 Ansonsten wurden die

Antworten nicht grammatisch bereinigt. Kürzere Denkpausen in den Antworten wurden mit

„...“ gekennzeichnet.

308 Vgl. AYAß, Ruth: Transkription. In: MIKOS, Lothar (Hrsg.): Qualitative Medienforschung: ein Handbuch. Konstanz, 2005, S. 377–386, hier S. 378. 309 Vgl. ebd., S. 377; GLÄSER/LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen, S. 193. 310 Diese Vorgehensweise orientiert sich an den Regeln von GLÄSER/LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen, S. 193ff.

Page 59: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

59

5.3.2 Extraktion

Den Interview-Transkripten wurden durch qualitative Inhaltsanalyse inhaltliche Informationen

entnommen und diese weiterverarbeitet. Dabei wurde in Anlehnung an das

Extraktionsverfahren von Gläser und Laudel vorgegangen: Mit Hilfe eines Suchrasters wurden

Informationen aus dem Ursprungstext entnommen, 311 wobei sich das Raster nach den

theoretischen Vorüberlegungen richtet.312 Anders als beim häufig genutzten Mayringschen

Verfahren können die Kategorien im Laufe der Extraktion verändert, ergänzt, nicht jedoch

verworfen werden.313 Somit soll zum einen garantiert werden, dass auch Informationen

berücksichtigt werden können, die bei den theoretischen Vorüberlegungen nicht bedacht

wurden.314 Zum anderen soll verhindert werden, dass die theoretischen Überlegungen aus dem

Blickfeld verschwinden.

Die Extraktion wurde teilweise computergestützt mit dem an der Universität Hamburg

entwickelten freien Computerprogramm CATMA (Computer Aided Textual Markup &

Analysis) vorgenommen. Mit Hilfe des Programms wurden die Passagen der Interview-

Transkripte, die für die Forschungsfragen relevant erschienen, mit unterschiedlichen

Markierungen (sogenannten Tags) versehen. Die verwendeten Tags spiegeln dabei die

theoretischen Vorüberlegungen wider und bilden das Suchraster für die Extraktion.

Anschließend wurden alle mit einem bestimmten Tag versehenen Passagen gesammelt

ausgegeben. Diese Passagen wurden je nach Länge entweder als wörtliches Zitat oder

Paraphrase in eine Tabelle eingetragen, die in den Spalten die drei Befragten und in den Zeilen

die unterschiedlichen Tags enthielt. So wurden die Aussagen der Befragten zu gleichen Tags

in übersichtlicher Form nebeneinander dargestellt. Diese übersichtliche Tabellenform konnte

anschließend genutzt werden, um Parallelen und Unterschiede in den Antworten

herauszuarbeiten. Die Extraktionstabelle sowie die Interview-Transkripte werden der Arbeit in

digitaler Form auf der anhängenden Daten-CD beigefügt.315

311 Vgl. ebd., S. 200. 312 Vgl. ebd. 313 Vgl. ebd., S. 204f. 314 Vgl. ebd., S. 201. 315 Da nicht alle Befragten mit der Veröffentlichung der Transkripte bzw. der wörtlichen Zitation längerer Passagen einverstanden waren, wird die Daten-CD nur den Gutachtern dieser Arbeit zur wissenschaftlichen Überprüfung zur Verfügung gestellt.

Page 60: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

60

6 Ergebnisse der empirischen Erhebung

6.1 Der datenjournalistische Arbeitsprozess

In den Experteninterviews wurden die Befragten gebeten, Arbeitsschritte zu nennen, die ihrer

Erfahrung nach projektübergreifend immer wieder vorkommen. Keiner der Befragten nannte

auf diese Frage hin direkt alle in Abschnitt 2.3.3 erarbeiteten datenjournalistischen

Arbeitsschritte. Nimmt man jedoch die Antworten aller Befragten zusammen und

berücksichtigt auch die Aspekte, die im Zusammenhang mit Beispielen erwähnt wurden,316 so

finden sich alle Schritte aus dem Theorieteil in den Antworten der Experten wieder. Darüber

hinaus ergeben sich aus den Interviews einige interessante Ergänzungen, die hier erläutert

werden.

Insbesondere bei Elmer und Tröger wird eine Unterteilung der Arbeit in eine Datenrecherche

und eine Recherche mit herkömmlichen journalistischen Methoden deutlich. 317 Die

Datenrecherche fördere im erfolgreichen Fall Ansätze für eine weiterführende Recherche

zutage und liefere die Informationsbasis für anschließende Gespräche mit Akteuren.318 Tröger

und Venohr erwähnen in diesem Zusammenhang einen bisher nicht berücksichtigten Schritt,

der sich aus der Datenrecherche ergeben kann: Manchmal würden sich die Daten als nicht

interessant oder nicht vertrauenswürdig genug erweisen. Es könne sich außerdem

herausstellen, dass das Projekt zu aufwendig werde. In solchen Fällen werde unter Umständen

nach einer anfänglichen Datenrecherche das Projekt fallen gelassen.319 Elmer wies zudem

darauf hin, dass es während des Projekts immer wieder nötig sein kann, zwischen Datenarbeit

und herkömmlichen Recherchemethoden zu wechseln.320

Im Theorieteil wurde der Arbeitsschritt „Journalistische Geschichte in den Daten

finden“ erwähnt. Aus den Interviews ergibt sich die Ergänzung, dass in datenjournalistischen

Projekten nicht immer unbedingt eine bestimmte Geschichte von der Redaktion erzählt bzw.

ein bestimmter Blickwinkel eingenommen wird. Insbesondere Venohr weist darauf hin, dass

ein großer Datensatz Antworten auf viele unterschiedliche Fragen liefern kann. Die Wahl der 316 Dass ein Arbeitsschritt in einem Beispiel erwähnt wird, gibt natürlich keinen Aufschluss darüber, ob er auch häufig vorkommt. Schritte, die sowohl in der Literatur als auch in den Beispielen der Interviewten genannten werden, kommen jedoch offenbar zumindest projektübergreifend vor und können somit unter Vorbehalt auch als typische Schritte angenommen werden. Häufig wurde auch die Vorgehensweise in Bezug auf die Beispiele von den Befragten recht allgemein formuliert. 317 Vgl. z.B. Transkript Elmer Z. 36-39. 318 Vgl. Transkript Tröger Z. 190-192, Z. 265-268; Transkript Elmer Z. 266-270. 319 Vgl. Transkript Tröger Z. 270-273; Transkript Venohr Z. 163-173. 320 Vgl. Transkript Elmer Z. 449-452.

Page 61: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

61

Frage werde dabei häufig dem Leser überlassen. Als Beispiel dafür erwähnt Venohr ein ZEIT

ONLINE-Projekt, das einen Überblick über die Aktivitäten aller Bundestagsabgeordneten

liefert und bei dem der Leser sich gezielt über einzelne Abgeordnete informieren kann.321

Auffällig ist die starke Betonung der Visualisierung als Analysemethode bei allen drei

Interviewten.322 Dies weist darauf hin, dass es in der Tat einen starken Bezug zu dem von

Haase erwähnten Visual-Analytics-Ansatz gibt, bei dem die Fähigkeit des Menschen zur

Mustererkennung aus visuellen Darstellungen genutzt wird. 323 Zusätzlich werden

Analysemethoden wie Filtern, Sortieren, das Anfertigen von Verteilungsdiagrammen, die

Suche nach Extremwerten sowie die Verwendung von Pivot-Tabellen, Excel-Funktionen und

Datenbankabfragen genannt. 324 Elmer und Tröger weisen außerdem darauf hin, dass

insbesondere Lücken in den Daten für sie von Interesse seien, weil sich dahinter oft

Geschichten verbergen würden.325 Elmer gab an, dass sie sich bei der Berichterstattung eher

auf sehr deutliche Auffälligkeiten beschränkt. Bei Ergebnissen mit großen Fehlerbalken oder

Unsicherheiten laufe man Gefahr, beim Publikum einen falschen Eindruck zu erwecken.326

Die Befragten erwähnen einige Aspekte der Datenvorbereitung- und Untersuchung, welche im

Theorieteil noch nicht behandelt wurden. Für Elmer gehört in den allermeisten Fällen die

Berechnung eines vergleichbaren Indikators im Vorfeld der eigentlichen Analyse mit zur

Arbeit. Als Beispiel nennt sie die Berechnung eines Verhältnisses von Krankheitsfällen zu

Einwohnerzahlen.327 Venohr und Tröger erwähnen die Verkleinerung des Datensatzes als

wichtigen Aspekt. Diese könne nötig sein, um die Daten möglichst kompakt zum Download

bereitstellen zu können. Zur Datenvorbereitung könne daher auch gehören, Werte

zusammenzufassen, redundante Daten auszusortieren oder ein kompakteres Format zu

wählen.328

Die Befragten gaben einige Beispiele dazu, wie sie die Datenqualität bzw. die Qualität ihrer

Ergebnisse überprüfen. Das Hinzuziehen einer weiteren unabhängigen Quelle sei je nach

Datenlage nicht immer möglich. In solchen Fällen müsse die Zuverlässigkeit der Quelle

bestmöglich nach journalistischen Kriterien beurteilt werden. Zusätzlich könnten bestimmte

321 Vgl. Transkript Venohr Z. 221-224; Transkript Tröger Z. 62-64. 322 Vgl. Transkript Tröger Z. 257-259; Transkript Elmer Z. 490-491; Transkript Venohr Z. 107-109. 323 Vgl. HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 32. 324 Vgl. Transkript Elmer Z. 490-491, Z. 129-133; Transkript Tröger Z. 206-208, Z. 251-252, Z. 259-262. 325 Vgl. Transkript Tröger Z. 190-192; Transkript Elmer Z. 523-526. 326 Vgl. Transkript Elmer Z. 541-551. 327 Vgl. Transkript Elmer Z. 102-105. 328 Vgl. Transkript Tröger Z. 519-520, Z. 571-573; Transkript Venohr Z. 366-370.

Page 62: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

62

Datenbankabfragen (z.B. nach doppelten Einträgen) oder Prüfsummen Anhaltspunkte für die

Beurteilung der Datenqualität liefern.329 Bei der Beurteilung von Daten oder Ergebnissen

ziehen die Befragten außerdem Kollegen aus den entsprechenden Fachressorts sowie externe

Fachleute zu Rate.330

Zur ihrer Arbeitsweise generell betonen alle Befragten, dass sie nicht nach einem bestimmten

Prozedere vorgehen, sondern, dass jedes Projekt anders ist und neue Herausforderungen birgt,

die es zu meistern gilt. „Learning by Doing“ scheint bei datenjournalistischen Projekten ein

häufiges Prinzip zu sein.331

In den Interviews von Elmer und Venohr klingt an, dass die Befragten sich bei ihrer

Arbeitsweise bewusst oder unbewusst Strategien aus der Software-Entwicklung bedienen,

indem sie verschiedene Versionen ihrer Arbeit speichern und für sich nachvollziehbar machen,

wie sie von einem Bearbeitungsschritt zum nächsten gekommen sind.332

6.2 Verhältnis von datenjournalistischer und herkömmlicher Recherche

Im vorherigen Abschnitt wurde bereits erwähnt, dass journalistische Recherche mit

herkömmlichen Methoden wie der Befragung stets Teil von datenjournalistischen Projekten

ist. Eine Besonderheit datenjournalistischer Projekte liegt jedoch laut Elmer in der besseren

Ausgangsbasis bei Beginn der Befragungen: „Ja im Prinzip ist es eigentlich eine ganz normale

journalistische Recherche mit dem aber, finde ich, großen Unterschied, dass ich eine ganz

andere Position habe, aus der ich komme. Also ich habe schon auch dann eine sehr klare

These ja aus meinen Daten irgendwie gezogen und kann anders konfrontieren.“333 Dadurch

könne man sich gar nicht mehr auf einer oberflächlichen Ebene abspeisen lassen, fügt Elmer

hinzu. In eine ähnliche Richtung argumentiert Venohr, der dem Datenjournalismus einen

besonderen Wahrhaftigkeitsanspruch zuspricht. Dieser Anspruch resultiere daraus, dass der

Datenjournalismus auf Fakten basiere und habe zur Folge, dass man seine Standpunkte

„felsenfest vertreten“ könne.334 Venohr sieht einen weiteren Unterschied zu herkömmlichen

journalistischen Projekten in der Detailversessenheit des Datenjournalismus. Diese sei nötig,

329 Vgl. Transkript Venohr Z. 178-181; Transkript Elmer Z. 208-211; Transkript Tröger Z. 172-174. 330 Vgl. Transkript Tröger Z. 357-358, Z. 502-505; Transkript Venohr Z. 328-330. 331 Vgl. Transkript Elmer Z. 449-452; Transkript Tröger Z. 113-114, Z. 406; Transkript Venohr Z. 585-592. 332 Vgl. Transkript Elmer Z. 686-692; Transkript Venohr Z. 615-620. 333 Transkript Elmer Z. 265-268. 334 Vgl. Transkript Venohr Z. 487-491, Z. 498-501, Z. 503-505.

Page 63: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

63

da in großen Anwendungen wie der Abgeordneten-Bilanz von ZEIT ONLINE nicht eine

einzelne Geschichte erzählt werde, sondern gesicherte Informationen für alle Geschichten

geliefert werden müssten, die der Leser in den Daten entdecken kann. Die übergeordneten

Ziele von datenjournalistischer und herkömmlicher Recherche seien jedoch die

gleichen. 335 Tröger sieht die Unterschiede zwischen herkömmlicher Recherche und

datenjournalistischer Vorgehensweise vor allem beim Beginn von Projekten: „Also am

Anfang ist es, glaube ich, schon anders. Wenn man Webtechniken zum Beispiel einsetzt, ein

bisschen mit Programmierung arbeitet, Statistik-Tools und so weiter [...]. Aber dann, wie

gesagt, wenn man die Geschichte hat oder wenn man denkt man hat eine oder auch ein paar

Fragen hat oder Dinge verstehen möchte, dann ist es, glaube ich, relativ gleich.“336 Dann gehe

es darum, weitere Stimmen einzufordern, Beteiligte zu konfrontieren und ihnen Gelegenheit

zur Stellungnahme zu bieten, so Tröger.337

6.3 CRISP-DM und der datenjournalistische Arbeitsprozess

In diesem Abschnitt wird erläutert, was die Experteninterviews im Hinblick auf

Übereinstimmungen und Unterschiede von CRISP-DM und datenjournalistischem

Arbeitsprozess ergeben haben. Außerdem wird anhand einiger Beispiele gezeigt, wie die

Befragten den Prozess in den „datenjournalistischen Alltags-Sprech“338 übersetzt haben.

Keiner der Befragten war bis zum Interviewzeitpunkt intensiver mit den Themen Data-Mining

oder Wissensentdeckung in Datenbanken in Berührung gekommen. Dementsprechend war

auch der Standardprozess CRISP-DM allen unbekannt. Übereinstimmung besteht unter den

Befragten dahingehend, dass CRISP-DM den auf Daten bezogenen Teil datenjournalistischer

Projekte ziemlich gut abbildet. Venohr und Tröger gaben an, dass viele der CRISP-DM-

Schritte von Datenjournalisten unbewusst gemacht werden und bekräftigen dadurch die im

Theorieteil geäußerte, dahin gehende Vermutung.339

Auch die Vermutung, dass Dokumentation bei der datenjournalistischen Arbeit eine weniger

wichtige Rolle spielt als bei CRISP-DM vorgesehen, wurde durch die Experteninterviews

bekräftigt. Eine Dokumentation findet bei den Befragten, wenn überhaupt, eher in Form

335 Vgl. Transkript Venohr Z. 197-201, Z. 224-227. 336 Transkript Tröger Z. 332-342. 337 Vgl. Transkript Tröger Z. 315-318, Z. 322-324. 338 Transkript Venohr Z. 685. 339 Vgl. Transkript Tröger Z. 743-744, Z. 725-726; Transkript Elmer Z. 740-750; Transkript Venohr Z. 689-694.

Page 64: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

64

unterschiedlicher Dateiversionen oder in Form von Notizen in Excel-Dateien statt. Elmer

erwähnte, dass sie sich außerdem während des Projekts an zentraler Stelle alles notiert, worauf

sie später in der Aufbereitung hinweisen will, beispielsweise Lücken in den Daten. Im Fall des

STERN-Gesundheitsatlas seien außerdem für die weiterführende Recherche Exzerpte mit den

wichtigsten Ergebnissen der Datenrecherche erstellt worden.340

Alle Befragten gaben an, dass ihr Arbeitsablauf nicht in so einer festen strukturierten Form

abläuft, wie es das CRISP-DM-Schema auf den ersten Blick suggeriert. Obwohl von der

Autorin jeweils darauf hingewiesen wurde, dass es sich bei CRISP-DM um einen stark

iterativen und keinesfalls linearen Prozess handelt, wurde dieser Aspekt in allen Interviews

sehr betont.341

Auf die Frage nach den datenjournalistischen Arbeitsschritten, die in CRISP-DM nicht

enthalten sind, wurde wie erwartet unter anderem die journalistische Recherche jenseits der

Daten genannt. Darüber hinaus betonten alle Befragten das Fehlen der journalistischen

Umsetzung und Aufbereitung für das Publikum. Dieser Aspekt lässt sich laut Elmer nicht in

einen einzelnen Schritt fassen, sondern begleitet das ganze Projekt kontinuierlich und

gegebenenfalls in Absprache mit Designern oder Programmierern. Dabei gehe es um Fragen

von Design, Layout, User-Interaction sowie der technischen Komptabilität mit verschiedenen

Endgeräten und unterschiedlicher Software. Neben technischen Aspekten müsse der Journalist

sich fragen, wie er das Thema verständlich und ansprechend darreichen kann. Auch die

Interaktion zwischen Redaktion und Nutzer nach der Veröffentlichung kommt laut Venohr bei

CRISP-DM zu kurz.342 Ebenfalls zu kurz bei CRISP-DM kommt nach Ansicht der Befragten

die Datenbeschaffung. Häufig sei gar nicht klar, ob es überhaupt Daten zu der entsprechenden

Fragestellung gebe oder welche Daten am besten geeignet seien, um eine Aussage über den

Sachverhalt zu treffen.343 Manchmal müsse man die Daten auch erst selbst zusammentragen,

erwähnte Venohr mit Blick auf das Dispozinsen-Projekt von ZEIT ONLINE.344

340 Vgl. Transkript Tröger Z. 756-758; Transkript Elmer Z. 72-75, Z. 432-434, Z. 677-680; Transkript Venohr Z. 614-617. 341 Vgl. Transkript Venohr Z. 680-683; Transkript Elmer Z. 701-702; Transkript Tröger Z. 406. 342 Vgl. Transkript Elmer Z. 755-761, Z. 562-564, Z. 764-767; Transkript Tröger Z. 734-737; Transkript Venohr Z. 574-577, Z. 646-648. 343 Vgl. Transkript Elmer Z. 664-668; Transkript Venohr Z. 561-566. 344 Dispozinsen-Projekt bei ZEIT ONLINE: http://www.zeit.de/2013/29/banken-dispo-zinsen-wucher [abgerufen am 14.08.2013]. Vgl. auch Transkript Venohr Z. 561-566.

Page 65: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

65

Im Folgenden wird in stark zusammengefasster und exemplarischer Form dargestellt, wie die

Befragten auf die sechs CRISP-DM-Phasen reagiert haben und wie die Arbeitsschritte in die

datenjournalistische Alltagssprache übersetzt wurden.

Untersuchung der Geschäftsziele

Mit der Aufgabe „Geschäftsziele untersuchen“ assoziierten sowohl Elmer als auch Venohr

den so genannten „Küchenzuruf“, also das prägnante Zusammenfassen des Projekts in Teaser-

Form. Tröger nannte als Projektziel, den „Lesern eine spannende Geschichte zu liefern“. Für

Venohr gibt es bei allen datenjournalistischen Projekten außerdem das übergeordnete Ziel,

dass diese die Marke von ZEIT ONLINE als innovatives, optisch ansprechendes und

faktenbasiertes Medium stärken.345

Ob verfügbares Personal und Budget zu Beginn des Projekts abgeschätzt würden, hänge von

seinem Umfang ab. Welche Informationen in technischer Hinsicht genau aus den Daten

gewonnen werden sollten, also die Data-Mining-Ziele, sei nicht unbedingt zu Beginn des

Projekts klar, da häufig erst nach dem ersten Kontakt mit dem Daten Auffälligkeiten entdeckt

würden. Elmer und Tröger gaben an, keine Projektpläne zu verwenden. Für Venohr hingegen

spielen solche Pläne mit festen Fristen eine wichtige Rolle, da seine Projekte häufig an die

Print-Ausgabe der ZEIT gekoppelt sind und daher der Redaktionsschluss beachtet werden

muss.346

Datenuntersuchung

Die Datenerfassung wurde, wie bereits erwähnt, von den Experten als besonders wichtig und

bei CRISP-DM als nicht genug berücksichtigt eingestuft. Eine explizite Datenbeschreibung

findet nach Aussagen der Befragten eher nicht statt. Die Schritte „Daten untersuchen“ und

„Datenqualität prüfen“ wurden von den Befragten jeweils zusammen behandelt und finden

sich bei allen im eigenen Arbeitsprozess wieder. Einige der dabei genannten Methoden zur

Untersuchung der Datenqualität wurden in Abschnitt 6.1 erläutert.347

Datenaufbereitung

Der Punkt „Daten auswählen“ wurde in zwei von drei Interviews eher übergangen. Da er aber

in den genannten Beispielen implizit immer wieder vorkommt, ist anzunehmen, dass er wegen

seiner Selbstverständlichkeit nicht weiter beachtet wurde. Alle restlichen Aufgaben dieser 345 Vgl. Transkript Elmer Z. 365-368; Transkript Venohr Z. 260-262, Z. 270-275; Transkript Tröger Z. 413-415. 346 Vgl. Transkript Tröger Z. 424-426; Transkript Venohr Z. 299-301, Z. 307-311. 347 Vgl. Transkript Venohr Z. 333-335; Transkript Elmer Z. 409-410; Transkript Tröger Z. 496-501.

Page 66: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

66

Phase („Daten bereinigen“, „Daten erstellen“, „Daten integrieren“, „Daten formatieren“)

ließen sich von den Befragten auf ihren eigenen Arbeitsprozess übertragen. Bei der

Datenbereinigung wurde insbesondere auf Probleme durch unterschiedliche Formate

(Zeichenformate wie beispielsweise UTF8, Datumsformate) sowie inkonsistente

Benennungen in den Daten hingewiesen.348

Modellierung

Die Interviews stützen die Vermutung, dass in der Phase der Modellierung die wenigsten

Gemeinsamkeiten zwischen CRISP-DM und datenjournalistischem Arbeitsprozess bestehen.

Im vorherigen Abschnitt wurde bereits erläutert, welche Analysemethoden von den

Datenjournalisten vorrangig genannt wurden. Diese haben nur wenige Schnittmengen mit den

bei der Data-Mining-Modellierung verwendeten Methoden. Lediglich Venohr gab an,

Erfahrung mit einer Methode zu haben, die auch typisch für Data-Mining ist, dem Clustering

von Objekten.349

Auswertung

Die Auswertung der Ergebnisse und die Prüfung des Prozesses wurden von den Befragten in

ihren Antworten ebenfalls zum Teil übergreifend behandelt. In diesem Zusammenhang wurde

zum einen das Aufspüren von Fehlern in den bisherigen Ergebnissen genannt, zum anderen

aber auch der Realitätsabgleich der bisherigen Ergebnisse durch das Befragen von Fachleuten

oder Beteiligten. Venohr assoziiert mit dieser Phase auch bereits eine technische Überprüfung

dessen, ob die Ergebnisse bei unterschiedlichen technischen Voraussetzungen der Endgeräte

korrekt dargestellt werden.350

Bereitstellung

Unter der Bereitstellung verstehen alle Befragten die Veröffentlichung des journalistischen

Produkts. Diese gelte es sowohl technisch als auch inhaltlich zu planen. Wie bereits erwähnt

wurde, ist dies für Elmer ein Aspekt, der sich über die gesamte Dauer des Projekts erstreckt.

Für Venohr ist die Begleitung des Projekts nach der Veröffentlichung von großer Relevanz,

also eine Art Monitoring und Wartung. Dazu gehöre das Antworten auf Kommentare,

eventuelle Fehlerbeseitigungen sowie das Bewerben des Projekts über Social-Media-Kanäle.

Alle Befragten gaben an, dass im Anschluss an die Projekte eine redaktionsinterne Reflektion

stattfindet, die jedoch nicht auf bestimmte Weise strukturiert ist oder einen Schlussbericht 348 Vgl. Transkript Tröger Z. 520-524; Transkript Venohr Z 351-354. 349 Vgl. Transkript Venohr Z. 399-406. 350 Vgl. Transkript Elmer Z. 571-573; Transkript Tröger Z. 650-655; Transkript Venohr Z. 431-435.

Page 67: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

67

beinhaltet. Für Tröger findet die Überprüfung des Projekts darüber hinaus vor allem durch die

Rezipienten und deren Feedback statt.351

6.4 Fazit zu CRISP-DM-Vergleich und Einschätzung der Experten

Im letzten Teil der Interviews wurden die Experten gefragt, ob sie generell eine Leitlinie im

Sinne einer Handlungsempfehlung ohne bindenden Charakter für den Datenjournalismus als

sinnvoll erachten.

Einerseits waren sich alle Experten darin einig, dass es nicht sinnvoll ist, einen festen Katalog,

eine Liste oder ein vorgegebenes Schema in die Redaktionen zu geben, das im Verlauf eines

Projekts abgearbeitet werden soll. Dazu sind nach Ansicht der Befragten datenjournalistische

Projekte zu unterschiedlich und stellen immer wieder neue Herausforderungen an die

Beteiligten.352 Laut Tröger gelten zudem ohnehin schon gewisse journalistische Workflows,

wie beispielswiese das Vier-Augen-Prinzip für datenjournalistische Projekte.

Andererseits schränkten alle Befragten ihre Ablehnung eines Leitfadens auf die eine oder

andere Art ein. Elmer hält eine Art Checkliste für sinnvoll, die an bestimmte wichtige Punkte

im Arbeitsprozess erinnert. Diese könne helfen, „Fehler zu vermeiden oder, dass jemand in

eine Richtung losrennt und am Ende dann irgendwo ganz fies scheitert oder so.“353 Tröger

räumt ein, dass er sich im Hinblick auf seine Erfahrungen mit dem Flugroutenradar354 für das

nächste größere Projekt gewisse Standardisierungen wünschen würde, die Fristen und

Zuständigkeiten im Projekt regeln.355 Für Venohr ist ein Leitfaden eher von pädagogischem

Interesse: „Ich glaube eher, dass so eine Liste eher wirklich etwas für Lehrbücher ist um

einfach eine Philosophie zu transportieren. Aber ich glaube, es gibt am Ende nicht diese

zwingende Logik, die immer greift.“356 Es gebe so viele projektspezifische Probleme, dass

man, keinen ZEIT ONLINE-Guide zum Abhaken erstellen könne. Venohr findet es aber wichtig,

„es überhaupt mal durch zu deklinieren, damit man auch mal diese Schritte erzählen kann,

berichten kann.“357

351 Vgl. Transkript Tröger Z. 680, Z. 701-703, Z. 713-716; Transkript Venohr Z. 449, Z. 453-455, Z. 460-461, Z. 465-467, Z. 552-555; Transkript Elmer Z. 579-581, Z. 655-656. 352 Vgl. Transkript Elmer Z. 711-716; Transkript Tröger Z. Z. 726-728, Z. 776-789, Z. 804-806; Transkript Venohr Z. 638-641. 353 Transkript Elmer Z. 716-717. 354 http://flugroutenradar.morgenpost.de/#mein-standort/2013-08-13/52.410074,13.129318 [abgerufen am 15.8.2013]. 355 Vgl. Transkript Tröger Z. 707-713, Z. 787-797. 356 Transkript Venohr Z. 643-645. 357 Transkript Venohr Z. 660-661, Z. 658-660.

Page 68: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

68

In den Rahmen dieser Einschätzungen fällt auch die Beurteilung von CRISP-DM als Vorlage

für eine datenjournalistische Leitlinie. Wie bereits erwähnt, sehen alle Befragten eine hohe

Übereinstimmung von CRISP-DM mit der datenbezogenen Arbeit in ihrem Alltag. Tröger ist

jedoch der Ansicht, dass die aufgelisteten Punkte selbstverständlich sind: „... wer seine Daten

nicht prüft und seine Daten einfach nicht bereinigt, der macht seinen Job falsch. [...] Du kannst

ja auch nicht einem Redakteur irgendwie hinlegen: Mindestens zwei Quellen abhaken

bitte.“ Elmer sagt, dass CRISP-DM als Ausgangspunkt für eine Checkliste bis auf die bereits

erwähnten fehlenden Punkte „ziemlich gut“ passe. Venohr findet CRISP-DM als Ansatzpunkt

für einen Leitfaden zu pädagogischen Zwecken „nicht verkehrt“. Es sei jedoch wichtig darauf

hinzuweisen, dass die Schritte des Prozesses nur Grundbausteine sind, die in ganz

unterschiedlicher Weise angeordnet sein können.358

7 Diskussion der Gesamtergebnisse und Ausblick

Im Zentrum dieser Arbeit standen zwei übergeordnete Fragen: Wie arbeiten Datenjournalisten

und wie sollten sie arbeiten? Als konkreter Ansatz für die Beantwortung dieser Fragen wurde

in dieser Arbeit die Eignung des Data-Mining-Standardprozesses CRISP-DM als

Ausgangspunkt für einen datenjournalistischen Leitfaden untersucht. In den folgenden

Abschnitten wird diskutiert, was Literaturstudium und Experteninterviews im Hinblick auf die

Forschungsfragen dieser Arbeit ergeben haben.

7.1 Arbeitsweisen zwischen herkömmlicher Recherche und CRISP-DM

In den Forschungsfragen 1, 3 und 4 dieser Arbeit wurde danach gefragt, welche typischen

Arbeitsschritte den datenjournalistischen Arbeitsprozess charakterisieren und wie dieser

Prozess zwischen herkömmlicher Recherche und CRISP-DM einzuordnen ist. In den

Experteninterviews wurde deutlich, dass datenjournalistisches Arbeiten stets sowohl Elemente

der Datenbearbeitung als auch der herkömmlichen Recherche enthält.

Die Befragten betonen sehr stark, dass jedes Projekt anders und daher die Angabe einer

bestimmten Anzahl oder Reihenfolge von Arbeitsschritten unmöglich ist. Wie die

358 Vgl. Transkript Venohr Z. 680-683.

Page 69: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

69

herkömmliche journalistische Recherche scheint auch die datenjournalistische Recherche ein

„lebendiger und oft auch spontaner Prozess “359 zu sein. Beide Recherche-Arten verfolgen

zudem die gleichen übergeordneten Ziele, wie die Aufdeckung neuer relevanter Informationen

oder die Erstellung eines verständlichen, ansprechenden Produkts. Unterschiedlich sind die

Wege, auf denen diese Ziele erreicht werden.

Offensichtlichster Unterschied ist die Datenarbeit. Die Ergebnisse dieser Arbeit legen nahe,

dass durch diese Datenarbeit eine Informationsbasis geschaffen wird, die besonders belastbar

ist und daher eine zielgerichtetere Konfrontation der beteiligten Akteure erlaubt als bei nicht-

datenjournalistischen Projekten. In den Interviews wurde zudem der Aspekt genannt, dass

manche datenjournalistischen Projekte sehr aufwendig sind, da sie alle Geschichten inhaltlich

absichern müssen, die der Leser potenziell in ihnen finden kann. Wie Literatur und

Experteninterviews gezeigt haben, können datenjournalistische Projekte unterschiedlichste

Veröffentlichungsformen annehmen. Dass hier oft neue Wege des Storytelling beschritten

werden, unterscheidet sie ebenfalls von herkömmlichen journalistischen Projekten.

Das Literaturstudium in Abschnitt 2.4.2 sowie die Befragung der Experten legen nahe, dass

sich viele Schritte des Standardprozesses CRISP-DM auf den Daten-Teil datenjournalistischen

Arbeitens übertragen lassen. Die beiden Prozesse weisen jedoch auch Unterschiede auf:

Journalisten setzen bei der Datenanalyse – neben eher einfachen Sortier-, Filter- und

Berechnungsvorgängen – stark auf den Einsatz von Visualisierungen und die menschliche

Fähigkeit der Mustererkennung setzen. Dies deckt sich mit Haases Einschätzung, nach der für

Datenjournalisten der Visual-Analytics-Ansatz eine große Rolle spielt. 360 Die speziellen

Modellierungsmethoden des Data-Mining scheinen im Datenjournalismus hingegen kaum

eine Rolle zu spielen. Auch scheint die Dokumentation der Arbeitsschritte im

Datenjournalismus weniger ausgeprägt zu sein als bei CRISP-DM vorgesehen. Wichtig ist den

Befragten jedoch die Nachvollziehbarkeit der einzelnen Datenbearbeitungsschritte, die vor

allem durch persönliche Notizen und Datei-Versionsverwaltung gewährleistet wird.

359 MAST: ABC des Journalismus, S. 240; vgl. auch KLAMMER: Empirische Sozialforschung, S. 29. 360 Vgl. HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 32ff.

Page 70: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

70

7.2 Ansprüche an datenjournalistische Arbeitsweisen

Forschungsfrage 3 zielte auf die Beurteilung der Eignung von CRISP-DM als Ausgangspunkt

für eine datenjournalistische Leitlinie ab. In Abschnitt 1.1 wurde erläutert, dass für die

Beantwortung dieser Frage die gültigen Qualitätskriterien bestimmt werden müssen. Daher

wurde in Abschnitt 2.2.4 solche Kriterien für den Datenjournalismus abgeleitet. Für ihn gelten

in erster Linie journalistische Qualitätskriterien wie Aktualität, Relevanz, Richtigkeit und

Vermittlung.

Es wurde erörtert, dass ein streng reglementierter Arbeitsprozess, wie er in der Wissenschaft

üblich ist, im System Journalismus nicht gefordert werden kann. Stattdessen wurde ergänzend

zur journalistischen Sorgfaltspflicht eine Pflicht zur Transparenz abgeleitet, die nicht

spezifisch aber besonders bedeutsam für den Datenjournalismus ist.

Die Reaktionen der Experten legen nahe, dass eine detaillierte Dokumentation der eigenen

Arbeitsschritte – wie sie bei CRISP-DM gefordert wird – für die Qualitätssicherung im

Datenjournalismus förderlich wäre. Es wird jedoch auch deutlich, dass in diesem Punkt ein

Reibungsverhältnis zum Kriterium der Aktualität vorliegt.361 Wie dieser Konflikt bestmöglich

gelöst werden kann, muss an dieser Stelle vorerst offen bleiben.

In Abschnitt 2.2.4 wurde definiert, dass eine Leitlinie bei der Erfüllung der gültigen

Qualitätskriterien helfen soll. In diesem Zusammenhang ist die von Tröger erwähnte

Diskussion um die grundsätzliche Frage „Wie viel Projektmanagement gehört in den

Newsroom?“ von großem Interesse.362 Wie stark journalistische Vorgehensweise reglementiert

und strukturiert sein sollte, wird laut Tröger auf der US-amerikanischen Datenjournalismus-

Mailingliste des NICAR (National Institute for Computer-Assisted Reporting) aktuell stark

diskutiert.

361 Vgl. Transkript Venohr Z. 694-707. 362 Vgl. Transkript Tröger Z. 460-465

Page 71: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

71

7.3 CRISP-DM als Leitlinien-Vorlage

In Forschungsfrage 3 wurde nach der Eignung von CRISP-DM als Ausgangspunkt für eine

datenjournalistische Leitlinie gefragt. Als Kriterien für die Eignung wurden in Abschnitt 1.2

die Ähnlichkeit zwischen CRISP-DM und dem datenjournalistischen Arbeitsprozess sowie der

Beitrag von CRISP-DM zur Erfüllung datenjournalistischer Qualitätskriterien definiert.

Für die Beantwortung der eigentlichen Forschungsfrage musste jedoch zunächst geklärt

werden, ob es generell eine datenjournalistische Leitlinie geben kann. In den

Experteninterviews wurde deutlich, dass die Befragten ein abzuarbeitendes Schema für den

Berufsalltag durchweg ablehnen. Es scheint jedoch sinnvoll, den von Venohr eingebrachten

Aspekt einer pädagogischen Leitlinie aufzugreifen, die für die Ausbildung gedacht ist und

eine bestimmte Philosophie für den späteren Berufsalltag transportiert. Optimalerweise würde

eine solche Leitlinie so gestaltet sein, dass sie später im Alltag bei Bedarf wieder zur Hand

genommen werden kann und dann die von Elmer als sinnvoll erachtete Checklisten für

bestimmte Arbeitsschritte enthält.

Im ersten Kapitel wurde gefordert, dass eine Leitlinie Orientierung bieten muss. Dies könnte

eine datenjournalistische Leitlinie dadurch erfüllen, dass sie diejenigen Schritte der

Datenbearbeitung erläutert, die von den befragten Experten auf ihren Berufsalltag übertragen

werden konnten. Sie sollte darüber hinaus verdeutlichen, wie Datenrecherche und

herkömmliche Recherche zusammenhängen können. Außerdem muss sie die Flexibilität des

datenjournalistischen Workflows widerspiegeln. 363 Venohr schlug vor, den CRISP-DM-

Prozess einmal für verschiedene Fälle zu sortieren und somit deutlich zu machen, dass es sich

bei den Schritten um Grundbausteine handelt, die in verschiedenen Reihenfolgen auftreten

können.

Wie die Befragten mehrfach betonten, stellt jedes Projekt neue Anforderungen an die

Beteiligten. Es kann daher keine vollständige Checkliste geben, welche Punkte wann in einem

Projekt abzuarbeiten sind. Eine Leitlinie könnte jedoch auf häufig gemachte Fehler im

Umgang mit Daten hinweisen, wie sie in Anhang Anhang IX dargestellt sind. Zusätzlich

könnten Beispiele für bestimmte Problemtypen aus der datenjournalistischen Alltagspraxis

gegeben werden. Ziel dessen wäre es, beim Leser eine Sensibilität dafür herzustellen, welche

Arten von Problemen vorkommen können. Zudem könnte ein Katalog von Kriterien

363 Vgl. dazu auch HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 33.

Page 72: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

72

angegeben werden, der bei der Beurteilung der Datenqualität und -zuverlässigkeit hilft. Neben

dem herkömmlichen journalistischen Hinterfragen der Motive und der Unabhängigkeit der

Quelle, könnten hier die Qualitätskriterien der amtlichen Statistik (siehe Anhang XI) als

Orientierung zu Rate gezogen werden. Als zentraler Punkt wäre an dieser Stelle darauf

hinzuweisen, dass der Entstehungskontext der Daten unbedingt genau verstanden werden

muss. 364

Da die Aufbereitung datenjournalistischer Projekte von der Textform bis zur aufwendigen

personalisierbaren Anwendung reichen kann, scheint die Entwicklung einer Leitlinie für

diesen wichtigen Teil der datenjournalistischer Arbeit derzeit nicht möglich. Es könnten

höchstens Stolpersteine bei der Visualisierung von Daten (siehe Anhang IX) genannt und

Erfahrungen mit technischen Umsetzungsaspekten aus bisherigen datenjournalistischen

Projekten gesammelt werden. Hilfreich wäre darüber hinaus vielleicht eine Sammlung von

Beispielen verschiedener möglicher Umsetzungsformen.365

Die bisher skizzierte Leitlinie wäre vielleicht in der Lage, angehenden Datenjournalisten beim

datenbezogenen Teil ihrer Arbeit als Orientierung zu dienen und diesen mit der

herkömmlichen Recherche sowie der Umsetzung in Verbindung zu setzen. Aber würde sie

auch dazu beitragen, die datenjournalistischen Qualitätskriterien zu erfüllen? Da die skizzierte

Leitlinie sich vor allem auf den Daten-Teil des Projekts bezieht, kann sie zur gelungenen

Vermittlung des Themas höchstens indirekt beitragen, indem sie den Journalisten dazu anleitet,

alle nötigen Aspekte des Themas zu durchdringen. Auch das Kriterium der Aktualität kann

eine solche Leitlinie nur indirekt beeinflussen: Unter Umständen verkürzt sie die Projektdauer

indem sie vermeidet, dass der Journalist – wie Elmer es nennt – in die völlig falsche Richtung

losrennt. Einen direkteren Einfluss könnte sie auf die Qualitätskriterien Richtigkeit und

Relevanz haben.

Indem sie Hilfestellung bei der Einschätzung der Datenqualität, deren Bereinigung und

Analyse gibt, könnte sie dazu beitragen richtige, zuverlässige und relevante Ergebnisse zutage

zu fördern. Der Fall ist jedoch komplizierter gelagert als beispielsweise in der

evidenzbasierten Medizin. Dort gilt eine Studie als maximal zuverlässig, wenn sie

randomisiert und kontrolliert vorgenommen wird.366 Man könnte auf die Idee kommen, ein

364 Vgl. dazu auch ANDERL: Der Datenmythos. 365 Einen sehr schönen Überblick über die Umsetzung verschiedener datenjournalistischer Projekte beim Guardian bietet das Buch ROGERS: Facts are sacred. 366 Vgl. z.B. OXFORD CENTRE FOR EVIDENCE-BASED MEDICINE: Levels of Evidence. (01.07.2013) http://www.cebm.net/?o=1025 [abgerufen am 21.08.2013].

Page 73: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

73

analoges Schema für den Datenjournalismus entwickeln zu wollen, bei dem in jedem

Arbeitsschritt „Zuverlässigkeits-Punkte“ gesammelt werden. Die Untersuchungen dieser

Arbeit haben jedoch gezeigt, dass der datenjournalistische Arbeitsprozess für solch ein

Unterfangen viel zu stark von Fall zu Fall variiert. Es kann daher keine datenjournalistische

Leitlinie geben, die durch starres Abarbeiten zur Erfüllung der Qualitätskriterien führt. Damit

ein richtiges und relevantes Endprodukt entsteht, wird zusätzlich vom Datenjournalisten viel

eigenes Einschätzungsvermögen und Fachwissen verlangt.

7.4 Reflexion des Forschungsprozesses Bei allen Ergebnissen und Schlussfolgerungen dieser Arbeit muss unbedingt beachtet werden,

dass die empirischen Ergebnisse nicht repräsentativ sind. Es handelt sich bei dieser Arbeit

lediglich um eine Voruntersuchung, die Anregungen für weitere Forschung liefern soll. Es

darf außerdem nicht vernachlässigt werden, dass von Aussagen über Handlungen nicht

unmittelbar auf die tatsächlichen Handlungen geschlossen werden kann. Zwischen diesen

beiden Aspekten liegt der Filter der Erinnerung und Bewertung der befragten Personen.

Dieses Problem könnte nur durch eine Beobachtung ausgeschlossen werden, die im Rahmen

dieser Arbeit aus forschungsökonomischen Gründen keine Option darstellte.

Auch einige mögliche Verfälschungen bei der Datenerhebung und Auswertung sollten

unbedingt bedacht werden. Bei allen Interviews herrschte eine sehr konstruktive Atmosphäre

und große Hilfs- und Kooperationsbereitschaft von Seiten der Befragten. Aus den

Interviewfragen war zwangsläufig ersichtlich, dass die Autorin sich bereits ausführlicher mit

dem Data-Mining-Standardprozess beschäftigt hatte. Es könnte sein, dass die Befragten daher

eher wohlwollend auf die Fragen nach der Vergleichbarkeit und Anwendbarkeit von CRISP-

DM im Datenjournalismus geantwortet haben, um diese Vorarbeit zu wertschätzen. Da jedoch

alle Befragten eine Leitlinie für ihren Berufsalltag deutlich abgelehnt haben, kann diese

Gefahr bis zu einem gewissen Grad ausgeschlossen werden. Auch bestand zu keinem der

Befragten im Vorfeld der Befragung eine nähere Bekanntschaft, die das Antwortverhalten

hätte beeinflussen können. Lediglich Christina Elmer und die Autorin waren sich durch einen

Workshop einige Monate vor der Befragung persönlich begegnet. Während der Gespräche

wurde offenbar, dass die Befragten sich untereinander kennen. Es liegt also eine ungewollte

Vorauswahl der Stichprobe vor, die das Ergebnis insofern beeinflussen könnte, als dass die

Befragten durch fachlichen Austausch eventuell ähnliche Ansichten teilen.

Page 74: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

74

An manchen Stellen in den Interviews war zu merken, dass die Befragten bestimmte

Vorstellungen davon hatten, wie sie vielleicht besser arbeiten sollten. Dies zeigte sich wie

vermutet besonders im Zusammenhang mit der Frage nach der Dokumentation der eigenen

Projekte. Solche vermuteten Erwartungshaltungen können sozial erwünschtes

Antwortverhalten auslösen. Da aber häufig entgegen dieser Erwartungshaltungen geantwortet

wurde, kann auch dieser Effekt bis zu einem gewissen Grad ausgeschlossen werden.

Es liegt in der Natur von Befragungen, dass der Interviewer das Antwortverhalten beeinflusst.

In diesem Fall wird der Effekt noch dadurch verstärkt, dass die Arbeitsschritte von CRISP-

DM während der Interviews durch die Autorin auf Wunsch erläutert wurden. Die dabei

gewählte Erklärweise beinhaltet zwangsweise eine Interpretation der Arbeitsschritte und wirkt

sich zudem direkt auf das Antwortverhalten aus. Diese subjektive Verfälschung musste in

Kauf genommen werden, da nur so den Befragten in angemessener Zeit der ganze CRISP-

DM-Ablauf nahegebracht werden konnte.

Eine weitere Fehlerquelle stellt die Extraktion der Ergebnisse aus den Interview-

Transkriptionen dar. Die Zuordnung von Aussagen zu bestimmten Kategorien beinhaltet

zwangsläufig eine Interpretation durch den Forscher. Eine Überprüfung der Intercoder-

Reliabilität würde Auskunft über die Stärke dieses Effekts geben, war jedoch aus

forschungsökonomischen Gründen nicht realisierbar.

Nachdenklich stimmen sollte die Tatsache, dass die Experten mit den CRISP-DM-Schritten

teilweise unterschiedliche Aufgaben in ihrem eigenen Arbeitsprozess assoziierten. Diese

Tatsache wirft die Frage auf, inwiefern CRISP-DM geeignet ist, speziell den

datenjournalistischen Arbeitsprozess zu beschreiben. Die generischen Aufgaben sind

absichtlich sehr allgemein gehalten und lassen sich vielleicht auf noch ganz andere

Arbeitsprozesse übertragen. Daten spielen schließlich in vielen Arbeitsprozessen eine Rolle.

Page 75: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

75

7.5 Fazit Durch die Experteninterviews wurde deutlich, dass die strikte Befolgung einer

datenjournalistischen Leitlinie im Berufsalltag als unsinnig angesehen wird. Unter den

Befragten bestand Konsens darin, dass datenjournalistische Projekte dafür zu stark von Fall zu

Fall variieren. Sinnvoll erscheint jedoch die Entwicklung einer pädagogischen Leitlinie für die

Journalisten-Ausbildung, welche die Grundzüge datenjournalistischen Arbeitens aufzeigt und

für mögliche Problemstellungen sensibilisiert. Obwohl die Experten eine Leitlinie im Sinne

einer abzuarbeitenden Liste durchweg ablehnten, wurde an manchen Stellen in den Interviews

der Wunsch nach einer stärkeren Strukturierung des Arbeitsprozesses geäußert. Einzelne

Elemente der pädagogischen Leitlinie könnten in diesen Bereichen als Orientierungshilfe

dienen, indem sie beispielsweise wichtige Fragen auflisten, die es in bestimmten

Projektphasen zu bedenken gilt. Solche Checklisten könnten jedoch nie vollständig sein und

würden daher eher als Anregung und Gedächtnisstütze dienen.

Für eine solche pädagogische Leitlinie kann CRISP-DM hinsichtlich der in Abschnitt 1.2

formulierten Kriterien als geeignete Vorlage bezeichnet werden. Für den Daten-Teil der

Recherche besteht eine weitreichende Übereinstimmung zum datenjournalistischen

Arbeitsprozess. Außerdem könnte eine an CRISP-DM orientierte pädagogische Leitlinie, wie

in Abschnitt 7.3 erörtert, zur Erfüllung datenjournalistischer Qualitätskriterien beitragen.

Selbst wenn die Übereinstimmung von CRISP-DM mit dem datenjournalistischen

Arbeitsprozess – wie in Abschnitt 7.4 vermutet – nicht besonders spezifisch ist, so kann

CRISP-DM dennoch als Gerüst fungieren. Für die Entwicklung einer Leitlinie gilt es, dieses

Gerüst mit Beispielen, Hinweisen und Erklärungen in datenjournalistischer Alltagssprache –

wie in Abschnitt 7.3 skizziert – zu füllen. Es muss nicht nur klar sein, welcher Schritt

unternommen werden muss, sondern auch wie. Außerdem gilt es, Verknüpfungen und

Ergänzungen zu den Aspekten zu schaffen, die durch CRISP-DM nicht berücksichtigt werden.

Dazu zählen die oftmals aufwendige Beschaffung von Daten, die Recherche mittels

herkömmlicher journalistischer Methoden und die Aufbereitung für den Rezipienten. In

Anhang XII wurde eine Literatursammlung zusammengestellt, die bei der konkreten

Formulierung einer solchen Leitlinie Anhaltspunkte bieten könnte.

Page 76: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

76

7.6 Ausblick und Forschungsdesiderate

Eine Frage, die sich im Hinblick auf das Fazit dieser Arbeit aufdrängt ist die, inwiefern

Datenjournalisten im Redaktionsalltag den theoretischen Anforderungen einer Lehrbuch-

Leitlinie gerecht werden können. Machill schreibt: „Wenn man aber journalistische Recherche

untersuchen möchte, so wird man nicht den Idealtypus des Journalisten finden, sondern

arbeitende Journalisten, die den Zwängen ihres Arbeitgebers unterworfen sind und

dementsprechend ihr Recherchehandeln aufbauen.“367 Darüber hinaus unterliegen Journalisten,

wie in Abschnitt 2.1.3 dieser Arbeit erörtert wurde, weiteren gesellschaftlichen und

ökonomischen Einflüssen. Ob „guter“ Datenjournalismus umgesetzt werden kann, liegt

außerdem in der Journalisten-Ausbildung begründet. Was müssen Datenjournalisten können?

Gibt es die dafür benötigten Ausbildungsmöglichkeiten? Diese Fragen konnten im Rahmen

der vorliegenden Arbeit nicht behandelt werden. Offen bleibt auch die Frage nach der

Funktion des Datenjournalismus. Hilft er Journalisten dabei, eine Wachhund-Funktion

einzunehmen?

Dass diese Arbeit an einem Lehrstuhl für Wissenschaftsjournalismus entsteht, legt außerdem

die Frage nahe, ob Datenjournalismus für Wissenschaftsjournalisten von besonderer

Bedeutung ist. Sind sie prädestiniert dafür, datenjournalistische Methoden zu nutzen, weil sie

„keine Angst vor Zahlen“ haben? Welche Datenquellen, Chancen und Hindernisse bietet der

Datenjournalismus speziell für Wissenschaftsjournalisten?

Diese Fragen bilden den Ausgangspunkt für weitere Forschungsarbeiten, die unbedingt

unternommen werden sollten, denn wie auch immer die Rolle des Datenjournalismus in

Zukunft beschaffen sein mag: Er ist aus unserer datenüberfluteten Welt nicht mehr

wegzudenken.

 

367 MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 36; Vgl. dazu auch MAST: ABC des Journalismus, S. 249 ff.

Page 77: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

77

8 Bibliographie

Afghanistan: the war logs. In: the Guardian. (04.08.2010), http://www.theguardian.com/world/the-war-logs [abgerufen am 21.08.2013]. AITAMURTO, Tanja, Esa SIRKKUNEN und Pauliina LEHTONEN: Trends in Data Journalism. (2011), http://virtual.vtt.fi/virtual/nextmedia/Deliverables-2011/D3.2.1.2.B_Hyperlocal_Trends_In%20Data_Journalism.pdf [abgerufen am 22.04.2013]. ALTMEPPEN, Klaus-Dieter: Entscheidungen und Koordinationen. In: LÖFFELHOLZ, Martin (Hrsg.): Theorien des Journalismus: Ein diskursives Handbuch. 1. Aufl. Wiesbaden: VS, Verl. für Sozialwissenschaften 2004, S. 293–310. ANDERL, Sibylle: Der Datenmythos. In: Planckton. (2013), http://blogs.faz.net/planckton/2013/04/11/der-datenmythos-681/ [abgerufen am 22.04.2013]. ANDERSON, David R., Dennis J. SWEENEY und Thomas A. WILLIAMS: statistics (science). In: Encyclopedia Britannica. (2007), http://www.britannica.com/EBchecked/topic/564172/statistics [abgerufen am 03.07.2013]. ARNOLD, Klaus: Qualität im Journalismus – ein integratives Konzept. In: Publizistik. 53/4 (2008), S. 488–508. ARNOLD, Klaus: Qualitätsjournalismus: die Zeitung und ihr Publikum. Konstanz: UVK Verl.-Ges. 2009. AYAß, Ruth: Transkription. In: MIKOS, Lothar (Hrsg.): Qualitative Medienforschung: ein Handbuch. Konstanz: UVK-Verl.-Ges. 2005, S. 377–386. BALOG, Andreas: Rekonstruktion von Handlungen: Alltagsintuitionen und soziologische Begriffsbildung. Opladen: Westdt. Verl. 1989. BALZERT, Helmut: Wissenschaftliches Arbeiten: Wissenschaft, Quellen, Artefakte, Organisation, Präsentation. 1. Aufl., 2. korrigierter Nachdr. Herdecke [u.a.]: W3L-Verl. 2008. BECK, Klaus: Journalistische Qualität in der Wirtschaftskrise. Konstanz: UVK-Verl.-Ges. 2010. BISSANTZ, Nicolas und Jürgen HAGEDORN: Data Mining (Datenmustererkennung). In: Wirtschaftsinformatik. 51/1 (2009), S. 139–144. BOGNER, Alexander (Hrsg.): Das Experteninterview: Theorie, Methode, Anwendung. 2. Aufl. Wiesbaden: VS, Verl. für Sozialwiss. 2005. BONEGROU, Liliana: What are the training needs for data-driven journalism? (2011), http://de.slideshare.net/lilianabounegru/preliminary-results-of-ejc-survey-on-training-needs-for-data-journalism [abgerufen am 22.08.2013]. BONS, Katharina: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien. Diplomarbeit an der TU Dortmund 2012.

Page 78: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

78

BRADSHAW, Paul und Liisa ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age. Harlow, Essex, New York: Longman 2011. BRANAHL, Udo: Recht und Moral im Journalismus. Der Beitrag des Rechts zur Förderung von „gutem“ beruflichen Verhalten des Journalisten in der Bundesrepublik Deutschland. Medien-Ethik. Beschreibungen, Analysen, Konzepte für den deutschsprachigen Journalismus. In: HALLER Michael und Helmut HOLZHEY (Hrsg.): Medien-Ethik. Beschreibungen, Analysen, Konzepte für den deutschsprachigen Journalismus. Opladen: Westdt. Verlag 1992, S. 224–241 BRENDEL, Detlef und Bernd E. GROBE: Journalistisches Grundwissen: Darstellung der Formen und Mittel journalistischer Arbeit und Einführung in die Anwendung empirischer Daten in den Massenmedien. 1. Aufl. München: Verl. Dokumentation 1976. BRENDEL, Matthias und Frank BRENDEL: Richtig recherchieren: wie Profis Informationen suchen und besorgen. Ein Handbuch für Journalisten, Rechercheure und Öffentlichkeitsarbeiter. 4., erw. Aufl. Frankfurt am Main: FAZ-Inst. für Management-, Markt- und Medieninformationen 2000. BUCHER, Hans-Jürgen: Journalismus als kommunikatives Handeln. In: LÖFFELHOLZ, Martin (Hrsg.): Theorien des Journalismus: ein diskursives Handbuch. 1. Aufl. Wiesbaden: Westdt. Verl. 2000, S. 245–273. BUCHER, Hans-Jürgen: Journalistische Qualität und Theorien des Journalismus. In: BUCHER, Hans-Jürgen (Hrsg.): Qualität im Journalismus: Grundlagen - Dimensionen - Praxismodelle. 1. Aufl. Wiesbaden: Westdt. Verl. 2003, S. 11–34. BUNZ, Mercedes: Das offene Geheimnis: Zur Politik der Wahrheit im Datenjournalismus. In: GEISELBERGER, Heinrich und Dirk BAECKER (Hrsg.): WikiLeaks und die Folgen. Netz, Medien, Politik. Berlin: Suhrkamp 2011, S. 134–151. CHAKRABARTI, Soumen u. a.: Data Mining Curriculum: A proposal (Version 0.91). (2004), http://www.cs.uiuc.edu/~hanj/kdd_curriculum.pdf [abgerufen am 20.08.2013]. CHAPMAN, Pete u. a.: CRISP-DM 1.0. (2000), http://www.the-modeling-agency.com/crisp-dm.pdf [abgerufen am 21.08.2013]. COX, Melisma: The development of computer-assisted reporting. (2000), http://com.miami.edu/car/cox00.pdf [abgerufen am 17.04.2013]. DATENJOURNAL: Ein Einstieg in den Datenjournalismus. Interview mit Bernd Helfert. (2011), http://www.datenjournal.de/dossier/einstieg.html [abgerufen am 17.04.2013]. DEUTSCHE FORSCHUNGSGEMEINSCHAFT: Vorschläge zur Sicherung guter wissenschaftlicher Praxis. Proposals for Safeguarding Good Scientific Practice. (1998), http://www.dfg.de/download/pdf/dfg_im_profil/reden_stellungnahmen/download/empfehlung_wiss_praxis_0198.pdf [abgerufen am 21.08.2013]. DEUTSCHE FORSCHUNGSGEMEINSCHAFT: Wer wir sind., http://www.dfg.de/dfg_profil/aufgaben/wer_wir_sind/index.html [abgerufen am 27.07.2013].

Page 79: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

79

DOIG, Steve: Basic Steps in Working with Data. In: Data Journalism Handbook. (2012), http://datajournalismhandbook.org/1.0/en/understanding_data_2.html [abgerufen am 21.08.2013]. DONAU-UNIVERSITÄT KREMS: Datenjournalismus in Österreich: Potentiale noch nicht ausgeschöpft. (05.10.2012), http://www.donau-uni.ac.at/de/department/wissenkommunikation/news/id/18611/index.php [abgerufen am 17.08.2013]. DUDEN: Statistik., http://www.duden.de/rechtschreibung/Statistik [abgerufen am 03.07.2013]. EGAWHARY, Elena und Cynthia O’MURCHU: Data Journalism (CAR). (2012), http://issuu.com/tcij/docs/data_journalism_book [abgerufen am 22.04.2013]. ELMER, Christina: Kleine Einführung Datenjournalismus. Vortragsfolien WPK-Workshop: Data Stories I, Berlin 2013. ENYCLOPAEDIA BRITANNICA: data mining (computer science). In: Encyclopedia Britannica, http://www.britannica.com/EBchecked/topic/1056150/data-mining [abgerufen am 29.04.2013]. ESSER, Frank: Die Kräfte hinter den Schlagzeilen. Englischer und deutscher Journalismus im Vergleich. Freiburg [u.a.]: Alber 1998. ESTER, Martin und Jörg SANDER: Knowledge discovery in databases: Techniken und Anwendungen. Berlin [u.a.]: Springer 2000. EUOPEAN JOURNALISM CENTRE und OPEN KNOWLEDGE FOUNDATION: The Data Journalism Handbook., http://datajournalismhandbook.org/ [abgerufen am 17.04.2013]. EUROPEAN JOURNALISM CENTRE: About - F.A.Q. What is data driven journalism?, http://datadrivenjournalism.net/about/faq [abgerufen am 17.04.2013]. EUROPEAN JOURNALISM CENTRE und Mirko LORENZ: DATA-DRIVEN JOURNALISM: How should a curriculum for data journalism trainings look like?, http://www.surveymonkey.com/s.aspx?sm=2jRFF7W5Re%2bj9s5jn3WJcvb9JzKs0HiuTX3JnhrJb3o%3d#q5 [abgerufen am 17.08.2013]. BARLÖSIUS, Eva: Wissenschaft als Feld. In: MAASEN, Sabine (Hrsg.): Handbuch Wissenschaftssoziologie. Wiesbaden: Springer Fachmedien Wiesbaden 2012, S. 125–136. FAYYAD, Usama, Gregory PIATETSKY-SHAPIRO und Padhraic SMYTH: From Data Mining to Knowledge Discovery in Databases. In: AI Magazine. 17 (1996), S. 37–54. FERSCHL, Franz: Deskriptive Statistik. Würzburg [u.a.]: Physica-Verl. 1978. FISCHER, Peter: Lexikon der Informatik. Berlin, Heidelberg: Springer-Verlag Berlin Heidelberg 2011. GEBAUER, Matthias u. a.: Enthüllung brisanter Kriegsdokumente: Die Afghanistan-Protokolle. In: Spiegel Online. (25.07.2010), http://www.spiegel.de/politik/ausland/enthuellung-brisanter-kriegsdokumente-die-afghanistan-protokolle-a-708311.html [abgerufen am 21.08.2013].

Page 80: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

80

GLÄSER, Jochen: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen. 4. Aufl. Wiesbaden: VS-Verl. 2010. GLÄSER, Jochen und Grit LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen. 4. Aufl. Wiesbaden: VS-Verl. 2010. GRIESS, Andreas: Datenjournalismus in Deutschland. (27.06.2012), http://de.slideshare.net/agriess/datenjournalismus-in-deutschland [abgerufen am 13.06.2013]. THE GUARDIAN: How to be a data journalist., http://www.guardian.co.uk/news/datablog/2010/oct/01/data-journalism-how-to-guide [abgerufen am 17.04.2013]. HAAS, Hannes: Empirischer Journalismus: Verfahren zur Erkundung gesellschaftlicher Wirklichkeit. Wien [u.a.]: Böhlau 1999. HAASE, Alexander: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus. Bachelorarbeit an der Hochschule Mittweida 2011. HALLER, Michael (Hrsg.): Recherche-Werkstatt. Konstanz: UVK 2001. HALLER, Michael: Recherchieren. 6., überarb. Aufl. Konstanz: UVK Verl.-Ges. 2004. HASTIE, Trevor, Robert TIBSHIRANI und Jerome H. FRIEDMAN: The elements of statistical learning: data mining, inference, and prediction. New York, NY: Springer 2009. HELD, Barbara und Stefan RUß-MOHL: Qualitätsmanagement als Mittel der Erfolgssicherung. In: FASEL, Christoph (Hrsg.): Qualität und Erfolg im Journalismus. Konstanz 2005, S. 49–63. HILLMANN, Karl-Heinz: Wörterbuch der Soziologie. 4., überarb. und erg. Aufl. Stuttgart: Kröner 1994. HIRST, Tony: Several Takes on Defining Data Journalism. (2013), http://schoolofdata.org/2013/06/11/several-takes-on-defining-data-journalism/ [abgerufen am 13.06.2013]. HÖFFE, Otfried (Hrsg.): Lexikon der Ethik. 5., neubearb. und erw. Aufl. München: Beck 1997. HOUSTON, Brant: Computer-assisted reporting: a practical guide. 3. ed. Aufl. Boston [u.a.]: Bedford/St. Martin’s 2004. HUBER, Christian: Das Journalismus-Netzwerk: wie mediale Infrastrukturen journalistische Qualität beeinflussen. Innsbruck [u.a.]: Studien-Verl. 1998. HUDEC, Marcus und Christian NEUMANN: Was ist Statistik? Geschichte, Grundlagen, Anwendungen., http://www.stat4u.at/download/1417/WasIstStatistik.pdf [abgerufen am 20.08.2013]. IBM: CRISP-DM 1.0. Data Mining Schritt für Schritt - ein Leitfaden. (2011), ftp://public.dhe.ibm.com/common/ssi/ecm/de/ytw03084dede/YTW03084DEDE.PDF [abgerufen am 21.08.2013].

Page 81: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

81

IBM: CRISP-DM 1.0. Data Mining Schritt für Schritt - Ein Leitfaden. IHLE, Anne: Datenjournalismus - ein neues journalistisches Arbeitsfeld? Bachelorarbeit an der TU Ilmenau 2011. INVESTIGATIVE REPORTERS AND EDITORS: About IRE., http://www.ire.org/about/ [abgerufen am 04.08.2013]. INVESTIGATIVE REPORTERS AND EDITORS: NICAR., http://www.ire.org/nicar/ [abgerufen am 17.04.2013]. Iraq: The war logs. In: the Guardian. (22.10.2010), http://www.theguardian.com/world/iraq-war-logs [abgerufen am 21.08.2013]. JAESUNG, SIM: Critical success factors in data mining projects. Dissertation an der University of North Texas 2003. JEKER, Rebecca: Online-Recherche. Strategien für die journalistische Recherche im Internet. In: Medienheft. (2001), http://www.medienheft.ch/uploads/media/k16_JekerRebecca.pdf [abgerufen am 21.08.2013]. KAMPS, Udo: Definition»Statistik«. Gabler Wirtschaftslexikon., http://wirtschaftslexikon.gabler.de/Definition/statistik.html [abgerufen am 03.07.2013]. KAWALKOWSKI, Blasius: Trend oder Zukunft: Daten als zentraler Gegenstand der journalistischen Berichterstattung. Eine Untersuchung zu den Perspektiven und Möglichkeiten des Datenjournalismus. Bachelorarbeit an der Hochschule Bonn-Rhein-Sieg 2012. KLAMMER, Bernd: Empirische Sozialforschung: eine Einführung für Kommunikationswissenschaftler und Journalisten. Konstanz: UVK Verl.-Ges. 2005. KLAMMER, Bernd: Journalistik und Statistik. In: SCHÄFER, Ulrich P. (Hrsg.): Journalismus in Theorie und Praxis: Beiträge zur universitären Journalistenausbildung. Festschrift für Kurt Koszyk. Konstanz: UVK-Medien 1999, S. 227–242. KRÄMER, Walter: So lügt man mit Statistik. Ungekürzte Taschenbuchausg., 12. Aufl. Aufl. München [u.a.]: Piper 2009. KRAMPE, Anna-Lena: Journalistische Datens(ch)ätze. Definition, Einordnung und Qualitätskriterien von Datenjournalismus. Masterarbeit an der Hamburg Media School 2011. KRASSUSKI, Lisa: Qualitätskriterien in der Umweltberichterstattung. Bachelorarbeit an der TU Dortmund 2010. KROMREY, Helmut: Empirische Sozialforschung: Modelle und Methoden der standardisierten Datenerhebung und Datenauswertung. 12., überarb. und erg. Aufl. Stuttgart: Lucius & Lucius 2009. LAFLEUR, Jennifer: A guide to Bulletproofing Your Data. In: GitHub, https://github.com/propublica/guides [abgerufen am 17.08.2013]. LANGER, Ulrike: Schaubild statt Klickstrecke. In: Medium Magazin. (2011), http://www.mediummagazin.de/archiv/2011-2/ausgabe-01022011/schaubild-statt-klickstrecke/

Page 82: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

82

[abgerufen am 21.08.2013]. LEHMKUHL, Markus: „Die Wissenschaft hat festgestellt ...“ - zur Qualität der Berichterstattung in der Regionalpresse. In: KIENZLEN, Grit, Jan LUBLINSKI und Volker STOLLORZ (Hrsg.): Fakt, Fiktion, Fälschung. Trends im Wissenschaftsjournalismus. Konstanz: UVK-Verl.-Ges. 2007, S. 50–55. LEIF, Thomas: Leidenschaft: Recherche. Skandal-Geschichten und Enthüllungs-Berichte. Opladen [u.a.]: Westdt. Verl. 1998. LEIF, Thomas (Hrsg.): Mehr Leidenschaft: Recherche. Skandal-Geschichten und Enthüllungs-Berichte. Ein Handbuch zur Recherche und Informationsbeschaffung. 1. Aufl. Wiesbaden: Westdeutscher Verl. 2003. LEßMÖLLMANN, Annette: Datenjournalismus: Chance für den Journalismus von morgen. (2012), http://www.halem-verlag.de/2012/datenjournalismus-chance-fur-den-journalismus-von-morgen/ [abgerufen am 17.04.2013]. LORENZ, Mirko: Datenjournalismus: Lohnt der Aufwand? (18.10.2011), http://de.slideshare.net/mirkolorenz/datenjournalismus-lohnt-der-aufwand [abgerufen am 18.04.2013]. LORENZ, Mirko: Status and Outlook for data-driven Journalism. (2010), http://de.slideshare.net/duarteromero/datadriven-journalism-what-is-there-to-learn-12056926 [abgerufen am 21.08.2013]. LUBLINSKI, Jan: Einführung. Pudding an der Wand. In: KIENZLEN, Grit, Jan LUBLINSKI und Volker STOLLORZ (Hrsg.): Fakt, Fiktion, Fälschung. Trends im Wissenschaftsjournalismus. Konstanz: UVK-Verl.-Ges. 2007, S. 21–24. LUBLINSKI, Jan: Wissenschaftsjournalismus im Hörfunk: Redaktionsorganisation und Thematisierungsprozesse. Konstanz: UVK Verl.-Ges. 2004. LUDWIG, Johannes: Investigativer Journalismus. 2., überarb. Aufl. Konstanz: UVK-Verl.-Ges. 2007. MAASEN, Sabine: Handbuch Wissenschaftssoziologie. Wiesbaden: Springer Fachmedien Wiesbaden 2012. MACHILL, Marcel, Markus BEILER und Martin ZENKER: Journalistische Recherche im Internet: Bestandsaufnahme journalistischer Arbeitsweisen in Zeitungen, Hörfunk, Fernsehen und Online. Berlin: Vistas 2008. MAELICKE, Bernd (Hrsg.): Lexikon der Sozialwirtschaft. 1. Aufl. Baden-Baden: Nomos 2008. MAIER-LEIBNITZ, Heinz: Der geteilte Plato: ein Atomphysiker zum Streit um den Fortschritt. Zürich: Ed. Interfrom [u.a.] 1981. MAST, Claudia: ABC des Journalismus: ein Handbuch. 11., überarb. Aufl. Konstanz: UVK-Verl.-Ges. 2008. MATZAT, Lorenz: Data Driven Journalism: Versuch einer Definition. (2010),

Page 83: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

83

http://datenjournalist.de/data-driven-journalism-versuch-einer-definition/ [abgerufen am 18.04.2013]. MATZAT, Lorenz: Datenjournalismus vor dem Internet: Wetterbericht, Finanzdaten und Co. (2010), http://datenjournalist.de/datenjournalismus-vor-dem-internet-wetterbericht-finanzdaten-und-co/ [abgerufen am 20.08.2013]. MATZAT, Lorenz: Datenjournalismus. In: Bundeszentrale für politische Bildung. (2011), http://www.bpb.de/gesellschaft/medien/opendata/64069/datenjournalismus?p=all [abgerufen am 04.08.2013]. MATZAT, Lorenz: Einführung in Datenjournalismus. (16.04.2010), http://de.slideshare.net/wir_sie/einfhrung-in-datenjournalismus-data-driven-journalism [abgerufen am 18.04.2013]. MATZAT, Lorenz und Ulrike LANGER: Aus Zahlen werden Informationen: Datenjournalismus. In: JAKUBETZ, Christian, Ulrike LANGER und Ralf HOHLFELD (Hrsg.): Der Universalcode. Journalismus im digitalen Zeitalter. München: Euryclia 2011, S. 333–358. MATZAT, Lorenz: Man macht sich überprüfbar. In: medium - magazin für journalisten. (2011), http://www.mediummagazin.de/archiv/2011-2/ausgabe-01022011/man%20-macht-sich-uberprufbar/ [abgerufen am 18.04.2013]. MEIER, Klaus: Internet-Journalismus. 3., überarb. und erw. Aufl. Aufl. Konstanz: UVK-Verl.-Ges. 2002. MEYER, Philip: Precision journalism: a reporter’s introduction to social science methods. 4. ed. Aufl. Lanham [u.a.]: Rowman & Littlefield Publ. 2002. MIKOS, Lothar: Qualitative Medienforschung: ein Handbuch. Konstanz: UVK-Verl.-Ges. 2005. NETZWERK RECHERCHE: Leitlinien Recherche-Journalismus. (2010), http://www.netzwerkrecherche.de/nr-Positionen--Positionen-des-netzwerk-recherche/Leitlinien-Recherche-Journalismus/ [abgerufen am 20.08.2013]. OXFORD CENTRE FOR EVIDENCE-BASED MEDICINE: Levels of Evidence. (01.07.2013), http://www.cebm.net/?o=1025 [abgerufen am 21.08.2013]. PATZWALD, MARC: Erzählen nach Zahlen., http://www.epd.de/fachdienst/fachdienst-medien/schwerpunktartikel/erz%C3%A4hlen-nach-zahlen [abgerufen am 13.06.2013]. PIATETSKY-SHAPIRO, Gregory: Poll: Data Mining Methodology. In: KDnuggets. (2007), http://www.kdnuggets.com/polls/2007/data_mining_methodology.htm [abgerufen am 21.08.2013]. PÖTTKER, Horst: Kompensation von Komplexität. Journalismustheorie als Begründung journalistischer Qualitätsmaßstäbe. In: LÖFFELHOLZ, Martin (Hrsg.): Theorien des Journalismus. Ein diskursives Handbuch. Wiesbaden 2000, S. 375–390. PÖTTKER, Horst: Öffentlichkeit durch Wissenschaft. Zum Programm der Journalistik. In: Publizistik. 43 (1998), S. 229–249.

Page 84: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

84

RAGER, Günther: Dimensionen der Qualität. Weg aus den allseits offenen Richterskalen? In: BENTELE, Günter und Manfred RÜHL (Hrsg.): Publizistik in der Gesellschaft. Konstanz 1994. ROGERS, Simon: Data journalism at the Guardian: what is it and how do we do it? In: the Guardian. (28.07.2011), http://www.theguardian.com/news/datablog/2011/jul/28/data-journalism [abgerufen am 21.08.2013]. ROGERS, Simon: Facts are sacred: the power of data. London: Faber and Faber 2013. ROGERS, Simon: How to crowdsource MPs’ expenses. In: the Guardian. (18.06.2009), http://www.theguardian.com/news/datablog/2009/jun/18/mps-expenses-houseofcommons [abgerufen am 21.08.2013]. RUß-MOHL, Stefan: Am eigenen Schopfe ... Qualitätssicherung im Journalismus - Grundfragen, Ansätze, Näherungsversuche. In: Publizistik. 37 (1992), S. 83–96. SCHIMANK, Uwe: Wissenschaft als gesellschaftliches Teilsystem. In: MAASEN, Sabine (Hrsg.): Handbuch Wissenschaftssoziologie. Wiesbaden: Springer Fachmedien Wiesbaden 2012, S. 113–124. SÖFJER, Jan: Journalist: Datenjournalismus - Sprich mit Daten. In: Journalist. (2010). STATISTISCHE ÄMTER DES BUNDES UND DER LÄNDER: Die Qualitätsstandards der amtlichen Statistik. (2006), http://www.statistikportal.de/statistik-portal/qualistandards.pdf [abgerufen am 22.08.2013]. STIGLER, SOPHIE: Recherchestrategien im Netz. Das Suchvorgehen von Fachexperten, Netzexperten und Laien im Test. Masterarbeit an der TU Dortmund 2013. TAZ: Flughafen BER. (2013), http://www.taz.de/Fluglaerm-BBI/!t195/ [abgerufen am 20.08.2013]. THIBODEAUX, Troy: 5 tips for getting started in data journalism. (06.10.2011), http://www.poynter.org/how-tos/digital-strategies/147734/5-tips-for-getting-started-in-data-journalism/ [abgerufen am 22.04.2013]. VERMANEN, Jerry: Why Is Data Journalism Important? Updating Your Skills Set. In: The Data Journalism Handbook, http://datajournalismhandbook.org/1.0/en/introduction_2.html [abgerufen am 21.08.2013]. WAGNER, Hans: Qualitative Methoden in der Kommunikationswissenschaft: ein Lehr- und Studienbuch. Vollst. überarb., erw. und erg. Neuaufl. Aufl. München: Fischer 2008. WALTER, Nicole: Goldschürfer im Netz. Ein Gespräch mit den Datenjournalisten Matzat und Venohr. In: Fluter. (19.03.2013), http://www.fluter.de/de/120/berufe/11408/ [abgerufen am 13.06.2013]. WEIHS, CLAUS: Data Mining Konzept CRISP-DM. Skript TU Dortmund SoSe 2003 2003. WEISCHENBERG, Siegfried, Maja MALIK und Armin SCHOLL: Journalismus in Deutschland 2005. Zentrale Befunde der aktuellen Repräsentativbefragung deutscher Journalisten. In: Media Perspektiven. 7 (2006), S. 346–361.

Page 85: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

85

WEISCHENBERG, Siegfried: Mediensysteme, Medienethik, Medieninstitutionen. Opladen: Westdt. Verl. 1992. WORMER, Holger: Figures, statistics and the journalist: an affair between love and fear. Some perspectives of statistical consulting in journalism. In: Advances in Statistical Analysis. 91/4 (2007), S. 391–397. WORMER, Holger: Improving Health Care Journalism. In: GIGERENZER, Gerd und John A. MUIR GRAY (Hrsg.): Better doctors, better patients, better decisions. Envisioning health care 2020. Cambridge, Mass. [u.a.]: MIT Press 2011, S. 169–188. ZEH, Jürgen: Journalismus als Präzisionsjournalismus. Sozialwissenschaftliche Methodenlehre in der Journalistenausbildung. In: WILKE, Jürgen (Hrsg.): Zwischenbilanz der Journalistenausbildung. München: Ölschläger 1987, S. 145–166. ZEIT ONLINE: Verräterisches Handy. (2011), http://www.zeit.de/datenschutz/malte-spitz-vorratsdaten [abgerufen am 20.08.2013].

Page 86: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

i

Anhang I. Tabelle der Definitionskriterien Tabelle 2 Übersicht Definitionskriterien Datenjournalismus

Kriterien Krampe Bons Griess Behrend

Daten sind Quellmaterial und Berichterstattungs-gegenstand

grundlegend grundlegend grundlegend grundlegend

Aus den Daten werden Geschichten generiert

- - grundlegend optional

Gewinnung eines Mehrwerts optional - - grundlegend

Quellen werden transparent gemacht - - optional optional

Veröffentlichung von Rohdaten grundlegend optional optional optional

Interaktivität des daten-journalistischen Produkts

grundlegend - optional optional

Analyse der Daten grundlegend grundlegend - grundlegend

Verknüpfung von Daten optional - - optional

Visualisierung grundlegend optional grundlegend optional

Beschaffung der Daten grundlegend - - -

Recherche (jenseits der Daten) grundlegend grundlegend grundlegend grundlegend

Einsatz von Software/ Computern grundlegend grundlegend - grundlegend

Bearbeitung großer Datenmengen grundlegend - - optional

Textlicher Output optional - - optional

Crowdsourcing - - - -

Das Symbol „-“ gibt an, dass der Aspekt in der jeweiligen Definition nicht direkt

angesprochen wurde. In der rechten Spalte ist aufgeführt, wie die Kriterien in die für

diese Arbeit gültige Definition einfließen.

Page 87: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

ii

Anhang II. Skizzen: Datenjournalistischer Arbeitsprozess und CRISP-DM

Die nachfolgenden Skizzen stellen die vermuteten Schnittmengen zwischen

datenjournalistischem Arbeitsprozess und den generischen Aufgaben von CRISP-DM dar.

Überschneidungen der datenjournalistischen Arbeitsschritte untereinander wurden der

Übersichtlichkeit halber nicht dargestellt. Jede Skizze behandelt die Aufgaben einer der

CRISP-DM-Phasen.

Page 88: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

iii

Page 89: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

iv

Page 90: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

v

 Anhang III. Interviewleitfaden

Page 91: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

vi

Page 92: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

vii

Page 93: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

viii

Anhang IV. Erläuterungen zu den Interviewfragen

Frage 1: An welchem Ihrer bisherigen datenjournalistischen Projekte haben Sie

besonders gerne gearbeitet?

Die erste Frage des Leitfadens fungiert als sogenannte Eisbrecherfrage und soll als solche

eine gute Gesprächsatmosphäre herstellen. In diesem Fall wird nach einem Projekt

gefragt, an dem der Befragte besonders gern gearbeitet hat. Die Frage zielt nicht direkt

auf die Beantwortung einer Forschungsfrage ab, gewährleistet aber, dass der Interviewte

für den weiteren Gesprächsverlauf ein Beispiel wählt, über das er gerne spricht.

Frage 2: Ich würde gerne genauer auf den Ablauf dieses Projekts eingehen. Welche

Schritte haben Sie dabei vom Beginn bis zum fertigen journalistischen Produkt hin

unternommen?

Diese Frage zielt auf die Beantwortung der Hauptforschungsfrage nach den typischen

Schritten im datenjournalistischen Arbeitsprozess ab. Dass zunächst nach dem Verlauf

eines bestimmten Projekts gefragt wird, hat zwei Gründe. Zum einen soll dem Befragten

so der Einstieg in die Reflektion über die eigene Arbeitsweise erleichtert werden. Zum

anderen liefert dieses Beispiel zusätzliche Anhaltspunkte darüber, wie Datenjournalisten

tatsächlich arbeiten – unabhängig davon, ob sie selbst diese Schritte als typisch

einschätzen.

Frage 3: Welche Arbeitsschritte kommen Ihrer Erfahrung nach unabhängig vom

Projekt immer wieder vor?

Der Befragte wird gebeten, solche Arbeitsschritte zu nennen, die projektübergreifend bei

seiner Arbeit als Datenjournalist immer wieder vorkommen. Es kann kritisiert werden,

dass die Aufmerksamkeit des Interviewten zuvor zu stark auf das Beispielprojekt

fokussiert wurde und die typischen Arbeitsschritte sich folglich zu stark auf diesen

Einzelfall beziehen. Dieses Risiko besteht und muss bei der Auswertung mit in Betracht

gezogen werden. Die Vorteile des Einstiegsbeispiels wurden hier jedoch als überwiegend

angesehen.

Fragen 4 und 5: Haben Sie sich schon einmal konkret mit Data-Mining-Techniken

oder Wissensentdeckung in Datenbanken beschäftigt? Falls ja: Haben Sie schon

einmal etwas von diesem oder einem ähnlichen Standardprozess gehört?

Page 94: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

ix

Durch diese Frage sollen unnötige Erläuterungen der Interviewerin vermieden werden.

Zum anderen steht dahinter die Frage, was Datenjournalisten überhaupt über Data-Mining

wissen. Auch könnten die Fragen Hinweise darauf geben, ob Datenjournalisten je nach

Data-Mining-Vorwissen unterschiedliche Arbeitsweise angeben oder die Rolle von

CRISP-DM unterschiedlich einschätzen.

Frage(n) 6: Gibt es bei Ihrer datenjournalistischen Arbeit eine Phase, die man als

XY (z.B. „Untersuchung der Geschäftsziele“) bezeichnen könnte?

Dem Befragten wird ein Schema des CRISP-DM Prozesses mit den sechs Phasen sowie

den generischen Aufgaben jeder Phase vorgelegt (siehe Anhang VI). Der Befragte soll

formulieren, welche Schritte aus dem eigenen Arbeitsprozess er mit den vorgelegten

Phasen assoziiert. Dieses Vorgehen zielt auf die Beantwortung der Forschungsfrage nach

den Gemeinsamkeiten und Unterschieden von CRISP-DM ab. Durch die Assoziationen

der Datenjournalisten wird geprüft, wie Datenjournalisten die generischen Aufgaben von

CRISP-DM auf ihren Arbeitsalltag übertragen. Außerdem werden durch die freie

Assoziation vermutlich solche Handlungen genannt, die den Datenjournalisten von sich

aus als wichtig erscheinen. Durch Nachfragen sollen die Inhalte der generischen

Aufgaben von CRISP-DM genauer mit den assoziierten Arbeitsschritten der

Datenjournalisten verglichen werden. Diese beiden Ebenen des Vergleichs wurden bereits

in Abschnitt 4.2 thematisiert. Die Betrachtung des CRISP-DM-Schemas steht im

Fragebogen nach den Fragen zum Arbeitsprozess, um eine gedankliche Fixierung auf

CRISP-DM zu vermeiden.

Frage 7: Welche Aspekte aus Ihrem Arbeitsalltag als Datenjournalist kommen hier

bei CRISP-DM nicht vor?

Zu Beginn hatte der Befragte bereits die von ihm für typisch gehaltenen Arbeitsschritte

des Datenjournalismus aufgezählt. Aus einem Vergleich dieser Auflistung mit CRISP-

DM ließe sich also schließen, welche Schritte fehlen. Dennoch ist diese Frage wichtig, da

durch sie vielleicht zutage tritt, welche Unterschiede den Datenjournalisten als Erstes ins

Auge fallen oder welche als besonders wichtig erachtet werden.

Frage 8: Bei CRISP-DM ist vorgesehen, dass jeder Schritt und jede Entscheidung

dokumentiert wird. Im Journalismus steht traditionell eher das Endprodukt im

Fokus und nicht der Weg dorthin. Mich würde interessieren, wie das bei Ihrer

Arbeit ist. Wie dokumentieren Sie ihre Projekte?

Page 95: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

x

Diese Frage wird als heikel eingestuft, da sie implizit eine Erwartungshaltung

transportieren könnte. Die Befragten könnten annehmen, es sei sozial erwünscht, die

eigenen Projekte zu dokumentieren, um zum Beispiel bei späterer Kritik weniger

angreifbar zu sein. Daher wird auf Empfehlung von Gläser und Laudel hin versucht, die

Tendenz zur sozial erwünschten Antwort zu neutralisieren.368 Durch den Hinweis, dass

im Journalismus traditionell mehr das Endprodukt im Fokus steht, wird suggeriert, dass

eine ausführliche Dokumentation des Arbeitsprozesses nicht unbedingt üblich ist.

Fragen 9 und 10: Glauben Sie, dass man eine hilfreiche Leitlinie für den

Datenjournalismus erstellen könnte? Wenn ja: Wie geeignet ist Ihrer Meinung nach

CRISP-DM als Vorlage für eine solche Leitlinie?

Frage 9 dient als Filterfrage.369 Aufgrund der Antwort wird entschieden, ob es Sinn ergibt,

nach den Gründen für oder gegen CRISP-DM als Leitlinie zu fragen.

Frage 11: Möchten Sie noch etwas ergänzen, was wir bei unserem Gespräch bisher

nicht genug berücksichtigt haben?

Diese Schlussfrage hat zwei Vorteile: Sie ist für den Interviewpartner wahrscheinlich

angenehm und erhöht die Offenheit des Interviews, „indem sie noch einmal zur

Generierung von Informationen anregt, die in der Vorbereitung nicht vorhergesehen

wurden“370.

Optionale Fragen: In welchem Verhältnis stehen Ihrer Meinung nach

datenjournalistische und nicht-datenjournalistische Recherche? Inwiefern

unterscheiden sich die Ziele/Vorgehensweisen datenjournalistischer und anderer

Recherchen?

Da der Fragebogen bereits sehr lang war, wurden die Fragen zu Forschungsfrage 4 nur als

optional mit aufgenommen. Eine sehr offenen Frage („In welchem Verhältnis stehen ...?“)

wird ergänzt durch zwei etwas bestimmtere Fragen nach den unterschiedlichen Zielen

und Vorgehensweisen.

368 Vgl. GLÄSER/LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen, S. 138. 369 Vgl. ebd., S. 132. 370 Ebd., S. 149.

Page 96: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

xi

Anhang V. Fragebogen zu beruflichen Angaben

Page 97: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

xii

Anhang VI. CRISP-DM-Übersicht Untersuchung der Geschäftsziele

• Geschäftsziele bestimmen

• Situation beurteilen

• Data-Mining-Ziele bestimmen

• Projektplan erstellen

Datenuntersuchung

• Anfangsdaten erfassen

• Daten beschreiben

• Daten untersuchen

• Datenqualität prüfen

Datenaufbereitung

• Daten auswählen

• Daten bereinigen

• Daten erstellen

• Daten integrieren

• Daten formatieren

Modellierung

• Modellierungsverfahren auswählen

• Testdesign generieren

• Modell erstellen

• Modell beurteilen

Auswertung

• Ergebnisse auswerten

• Prozess prüfen

• Weitere Schritte festlegen

Bereitstellung

• Bereitstellung planen

• Monitoring und Wartung planen

• Schlussbericht erstellen

• Projekt prüfen

Page 98: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

xiii

Anhang VII. Potentielle Interviewpartner Tabelle 3 Potentielle Interviewpartner

Name Medium Interviewt (mindestens) von

Christina Elmer Spiegel-Online Bons, Ihle

Lorenz Matzat Open Data City Bons, Krampe, Ihle

Lars-Marten Nagel Welt-Investigativteam Bons

Sascha Venohr Zeit Online Bons

Björn Schwentker Freier Journalist (u.a Dradio

Wissen) Bons

Marco Maas Open Data City Krampe, Ihle

Mirko Lorenz u.a. Trainer für Datenjournalismus Ihle, Laut Website

„heavily overbooked“

Gregor Aisch Programmierer, arbeitet u.a. mit

Mirko Lorenz zusammen. -

Sebastian Mondial Freier Datenjournalist,

Recherche-Spezialist und Trainer Ihle

Julius Tröger Berliner Morgenpost Bons

Judith Pulg Ehemals WDR, jetzt

Koordinationsstelle Uni Augsburg Bons

Sebastian Heiser taz Krampe, Ihle

Anette Leßmöllmann

Professorin für Journalistik/

Wissenschaftsjournalismus,

Hochschule Darmstadt

-

Ulrike Langer Medien-Journalistin -

Lorenz Lorenz-

Meyer

Professor für Online-Journalismus

/ Hochschule Darmstadt Krampe

Page 99: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

xiv

Anhang IX. Regeln der Interviewführung nach Gläser und Laudel

• Aktives Zuhören! Durch verbale und nicht-verbale Signale soll der Befragte in

seinem Redefluss bestärkt werden.371

• Nicht unterbrechen! Nachfragen sollten erst gestellt werden, wenn der Befragte

die Antwort beendet hat. Durch die Unterbrechung wird die Antwort sonst

vielleicht in eine ganz andere Richtung gelenkt.372

• Pausen zulassen! Pausen werden in der Alltagskommunikation vermieden.

Während des Interviews müssen sie jedoch ausgehalten werden, da Nachdenken

Zeit braucht.373

• Flexibel fragen! Durch Übergänge soll ein möglichst natürlicher

Gesprächsverlauf geschaffen werden, um den Eindruck eines Verhörs zu

vermeiden.374

• Nicht Verstandenes klären! Es bieten sich geschlossene Frageformen an, wie

z.B. „Habe ich Sie richtig verstanden, dass ...?“375

• Details erfragen! Es bietet sich an, Teile der Antwort zu wiederholen und um

Präzisierung zu bitten.376

• Kurze und eindeutige Nachfragen stellen! Multiple Fragen können den

Befragten leicht überfordern.377

• Kompetenz zeigen! Experteninterviews sollten besonders sorgfältig vorbereitet

werden, um zumindest den Stand eines informierten Laien zu erreichen.378

• Bewertungen vermeiden! Um das Antwortverhalten des Interviewpartners nicht

zu beeinflussen, darf der Interviewer weder negative noch positive Wertungen

ausdrücken.379

 

371 Vgl. GLÄSER/LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen, S. 173. 372 Vgl. ebd. 373 Vgl. ebd. S. 173f. 374 Vgl. ebd. S. 174. 375 Vgl. ebd. S. 174f. 376 Vgl. ebd. S. 175. 377 Vgl. ebd. S. 177. 378 Vgl. ebd. 379 Vgl. ebd.

Page 100: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

xv

Anhang X. Häufige Fehler im Umgang mit Daten Probleme des Studiendesigns übersehen

Sollen Daten aus einer Studie weiter verarbeitet werden, so gilt es das Studiendesign

genau zu prüfen. Sibylle Anderl betont im FAZ-Blog, wie wichtig das Wissen über die

Entstehung der Daten beim wissenschaftlichen Arbeiten mit ihnen ist.380 Bei Umfragen

können etwa die Fragesituation, Suggestivfragen oder sogar die Anzahl der

Antwortmöglichkeiten das Antwortverhalten stark beeinflusst haben.381 Kritisch geprüft

werden sollte auch, ob die Stichprobe versehentlich auf ungewollte Art und Weise

vorsortiert wurde, weil die Befragung beispielsweise zu einem bestimmten Zeitpunkt an

einem bestimmten Ort durchgeführt wurde.382 Ein wichtiges Element des Studiendesigns

sind auch die verwendeten Definitionen.383 Es gilt zu prüfen welche Definitionen genau

verwendet wurden und ob sie wirklich das aussagen, was sie auf den ersten Blick zu

sagen scheinen. Lohnenswert ist auch die Frage, wer diese Definition aus welchem Grund

so gewählt haben könnte und welche Schlussfolgerungen eine alternative Definition zur

Folge hätte.384

Zahlen schrumpfen, aufblähen und verschleiern

Das in Bezug setzen von Zahlen zueinander bietet allerlei Spielraum. So kann eine Zahl

groß oder klein erscheinen, je nachdem mit welcher anderen Zahl sie verglichen wird.

Prozentangaben sind besonders geeignet um den wahren Charakter von Zahlen zu

verschleiern. So klingt beispielsweise ein um 50% gestiegener Frauenanteil in einem

Unternehmen sehr beeindruckend. Dahinter kann sich jedoch verbergen, dass statt vier

nun sechs Frauen im Unternehmen arbeiten. 385 Wachstumsraten von Wachstumsraten

können Anstiege sehr viel dramatischer erscheinen lassen386 und je nachdem welcher

Mittelwert gewählt wird, kann beispielsweise ein Durchschnittseinkommen sehr

unterschiedlich ausfallen.387 Vorsicht ist auch geboten bei Zahlen, die eine Exaktheit

suggerieren, die in dem Zusammenhang gar nicht zweckmäßig oder realistisch ist.388

380 Vgl. ANDERL: Der Datenmythos. 381 Vgl. KRÄMER, Walter: So lügt man mit Statistik. München [u.a.], 2009, S. 121ff. 382 Vgl. ebd., S. 98. 383 Vgl. ebd., S. 139ff. 384 Vgl. ebd., S. 27ff. 385 Vgl. ebd., S. 53. 386 Vgl. ebd., S. 57ff. 387 Vgl. ebd., S. 64ff. 388 Vgl. ebd., S. 15ff.

Page 101: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

xvi

Fehlschlüsse ziehen durch statistischen Fauxpas Manchmal nicht direkt zu erkennen sind Prozentangaben, die sich auf eine irreführende

Basis beziehen. Dass die meisten Unfälle bei moderaten Geschwindigkeiten und nicht bei

Tempo 200 passieren, bedeutet beispielsweise nicht, dass moderate Geschwindigkeiten

gefährlicher sind. 389 Ebenfalls nicht immer gleich zu erkennen ist es, wenn eine

Stichprobe nicht zufällig ausgewählt wurde und dadurch scheinbare Signifikanz erzeugt

wird. Dass im Umkreis eines Atomkraftwerks mehr Krebsfälle vorkommen als im

Bevölkerungsdurchschnitt, heißt nicht automatisch, dass Atomkraftwerke Krebs

verursachen. Vielleicht treten im Umkreis anderer Atomkraftwerke unterdurchschnittlich

viele Fälle auf, werden hier jedoch nicht berücksichtigt.390 Statistisch bedenklich ist auch

eine zu gewagte Extrapolation von Werten in die Vergangenheit oder Zukunft391 sowie

das Schaffen von künstlichen Superlativen durch das Einschränken der

Vergleichsmenge.392 Gibt es nur einen Viehzüchter im Dorf, so hat er auch zwangsläufig

die schönsten Kühe. Ein Klassiker im falschen Umgang mit Daten ist die Verwechslung

von Korrelation und Kausalität. So sollte man sich stets fragen: Gibt es wirklich

Anhaltspunkte für eine Kausalität? Und wenn ja, in welche Richtung wirkt sie?393

Irreführende Visualisierung Trends können bei der Visualisierung auf vielfältige Arten manipuliert werden: Je

nachdem welche Daten mit einbezogen werden, steigt oder fällt der Trend. Anstieg oder

Abfall können durch teilweises Abschneiden der vertikalen Achse noch verstärkt

werden.394 Außerdem können Anstiege, Abfälle und Konstanz auch durch das Dehnen

oder Stauchen von Teilen der Achsen suggeriert werden.395 Bei der mehrdimensionalen

Darstellung von Daten kann schnell ein falscher Eindruck entstehen. Verdoppelt man die

Seitenlänge eines Würfels um eine doppelt so große Zahl zu veranschaulichen, so hat der

Würfel das achtfache Volumen.396 Der Eindruck vom Größenverhältnis der Zahlen wird

also verfälscht. Wer mit Karten arbeitet, sollte sich stets bewusst machen, wie Projektion

und Mittelpunkt gewählt sind und warum.397

389 Vgl. ebd., S. 34. 390 Vgl. ebd., S. 183ff. 391 Vgl. ebd., S. 82ff. 392 Vgl. ebd., S. 87ff. 393 Vgl. ebd., S. 165ff. 394 Vgl. ebd., S. 38. 395 Vgl. ebd., S. 47. 396 Vgl. ebd., S. 113. 397 Vgl. ebd., S. 155ff.

Page 102: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

xvii

Falsches Rechnen mit Prozenten

Neben irreführenden Darstellungen, gibt es auch Rechenfehler, die häufig auftreten. Dazu

gehört beispielsweise das Umrechnen von Prozenten in Anteile. Der Satz „60% der

Deutschen mögen Vanilleeis“ bedeutet beispielsweis nicht, dass jeder sechste Deutsche

Vanilleeis mag.398 Häufig werden auch Prozente mit Prozentpunkten verwechselt. Ein

Anstieg der Frauenquote von 30 auf 33% bedeutet beispielsweise einen Zuwachs von 3

Prozentpunkten oder um 10 Prozent.399

398 Vgl. ebd., S. 52f. 399 Vgl. ebd., S. 58f.

Page 103: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

xviii

Anhang XI. Qualitätskriterien der amtlichen Statistik

Für amtliche Statistiken gelten nach dem Bundesstatistikgesetz die Grundsätze der

„wissenschaftlichen Unabhängigkeit, Neutralität und Objektivität“ 400 . Die Qualität

statistischer Produkte soll durch die im Europäischen Statistischen System (ESS)401

entwickelten Kriterien gewährleistet werden.402 Diese werden im Folgenden erläutert.

Relevanz

Die Ergebnisse der amtlichen Statistik sind dann relevant, wenn sie den Anforderungen

der Nutzer entsprechen.403 Dazu zählen Ministerien und andere politische Institutionen

ebenso wie Wissenschaft, Medien und potentiell die gesamte Öffentlichkeit. Durch

Befragungen der Nutzer soll die Zufriedenheit mit den Ergebnissen gesteigert werden.404

Genauigkeit

Auch wenn Statistiken die Realität möglichst „genau und zuverlässig wiederspiegeln“405

sollen, sind sie doch stets fehlerbehaftet. Bei der amtlichen Statistik wird eine bestimmte

Genauigkeit festgelegt und angestrebt, die für den Verwendungszweck angemessen

erscheint. Fehler werden so weit wie möglich analysiert und die Ergebnisse der Analyse

veröffentlicht.406

Aktualität und Pünktlichkeit

Amtliche Statistiken sollen „möglichst zeitnah“407 verbreitet werden. Ist die Aktualität

eines Ereignisses besonders wichtig, so werden vorläufige Ergebnisse veröffentlicht.408

Wie schon bei den Qualitätskriterien des Journalismus steht auch hier die Aktualität im

Zielkonflikt mir anderen Kriterien wie zum Beispiel Genauigkeit.409

400 Die Qualitätsstandards der amtlichen Statistik, S. 8. 401 Unter dem Europäischen Statistischen System versteht man die Kooperation des statistischen Amts der Europäischen Union (Eurostat), den nationalen statistischen Ämtern sowie weiteren Einrichtungen der EU-Mitgliedsstaaten, die für die Entwicklung, Erstellung und Verbreitung europäischer Statistiken zuständig sind (Quelle: http://epp.eurostat.ec.europa.eu/portal/page/portal/ess_eurostat/introduction). 402 Vgl. STATISTISCHE ÄMTER DES BUNDES UND DER LÄNDER: Die Qualitätsstandards der amtlichen Statistik. (2006), http://www.statistikportal.de/statistik-portal/qualistandards.pdf [abgerufen am 22.08.2013], S 13. 403 Vgl. ebd. 404 Vgl. ebd. 405 Vgl. ebd. 406 Vgl. ebd., S. 14. 407 Ebd. 408 Vgl. ebd. 409 Vgl. ebd., S. 15f.

Page 104: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

xix

Verfügbarkeit und Transparenz

Die Ergebnisse der amtlichen Statistik sollen für die Nutzer leicht zugänglich sein. Es

werden daher möglichst vielfältige Verbreitungswege genutzt und

„Standardinformationen kostenlos zur Verfügung gestellt“ 410 . Zu allen Ergebnissen

müssen Konzept und Methoden vollständig dokumentiert sein.411

Vergleichbarkeit

Die Ergebnisse der amtlichen Statistik sollen zeitlich, räumlich und fachlich vergleichbar

sein.412 Daher werden beispielsweise für Definitionen und Einheiten wenn möglich

internationale Standards verwendet.

Kohärenz

Statistiken aus unterschiedlichen Quellen sollen möglichst widerspruchsfrei miteinander

kombinierbar sein. 413 Auch deshalb sollten also beispielsweise bei Monats- und

Jahreserhebungen die gleichen Definitionen verwendet werden.

410 Ebd., S. 15. 411 Vgl ebd., S. 14. 412 Vgl. ebd., S. 15. 413 Vgl. ebd.

Page 105: Ein Standardprozess für den Datenjournalismus?annabehrend.de/Bachelorarbeit_Behrend_DDJ.pdf · Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele Definitionsversuche

xx

Anhang XII. Hilfreiche Quellen für die Erstellung einer Leitlinie

• Haase stellt in seiner Arbeit einen Workflow vor, „der sich an den Möglichkeiten

von Visual Analytics auf Basis des KDD-Modells orientiert und eine effektive

und erfolgreiche Realisierung von Projekten auf Datenbasis sichern soll.“414

Dabei nennt er beispielsweise zu definierende Zielvorgaben des Projekts,

mögliche Datenfehler und Visualisierungstechniken. Außerdem zitiert er ein 5-

Sterne-System, das die Offenheit der Datenveröffentlichung beurteilt.415

• Sirkkunen et al. erwähnen fünf „Best practice“-Aspekte. Dazu zählen

beispielsweise die Veröffentlichung von Metadaten und das Schaffen eines

Partizipationskanals für die Leser.416

• ProPublica, ein US-amerikanisches Non-Profit-Newsdesk für investigativen

Journalismus, hat eine Checkliste für das Überprüfen von Daten veröffentlicht.

Der „Guide to Bulletproofing Your Data“ enthält unter anderem konkrete

Empfehlungen zu Konsistenschecks und allgemeine Empfehlungen zur

Vorgehensweise bei datenjournalistischen Projekten.417

• Als Anhaltspunkt für die Beurteilung der Gültigkeit von Studienergebnissen im

Journalismus listet Klammer die Standards zur Qualitätssicherung in der Markt-

und Sozialforschung auf. 418 An anderer Stelle gibt er verschiedene

Qualitätskriterien an, die beim journalistischen Umgang mit Statistik einzuhalten

sind.419

 

414 HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 33ff. 415 Vgl. ebd., S. 43. 416 Vgl. AITAMURTO/SIRKKUNEN/LEHTONEN: Trends in Data Journalism., S. 11f. 417 Vgl. LAFLEUR: A guide to Bulletproofing Your Data. 418 Vgl. KLAMMER: Empirische Sozialforschung, S. 312f. 419 Vgl. KLAMMER: Journalistik und Statistik, S. 237ff.