BODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang Both

Preview:

Citation preview

Berliner Datenportal 2014

Dr. Wolfgang Both

Senatsverwaltung für Wirtschaft, Technologie und Forschung, Berlin

Agenda

• Open Data Initiative Berlin• Definition offene Daten• Empfehlungen Lizenzmodelle• Checkliste zur Auswahl von Daten• Portalstatistik

Open Data Initiative Berlin

• 2010: Start der Aktivitäten, Apps4Berlin-Wettbewerb, Online Voting, Vorstudie FhG FOKUS

• 2011: Pilotprojekt Open Data, Start des Datenportals, politische Deklaration im Koalitionsvertrag

• 2012: Budget für Regelbetrieb, ressortübergreifende Arbeitsgruppe

• 2013: Freischaltung Regelbetrieb, AG: Definition offene Dokumente, Bewertung Lizenzmodelle, Abschlussbericht

• 2014: eGovernment-Gesetz in Vorbereitung, §13 zu Open Data, 800 Datensätze im Datenportal

Relaunch Datenportal 2013

Ergebnisse der AG Open Data

• Abgestimmte Definition zu offenen Daten, offenen Formaten und Metadaten

• Empfehlungen für Lizenz- und Nutzungsbestimmungen

• Checkliste für die Publikation von Datenbeständen• Mitarbeit am eGovernment-Gesetz Berlin• Entwicklung von Weiterbildungsmaßnahmen• Zusammenfassung im Abschlussbericht (

http://www.berlin.de/projektzukunft/fileadmin/user_upload/pdf/sonstiges/Open_Data/AG_Open-Data_Abschlussbericht_2014.pdf)

Offene DatenOffene Daten (in Anlehnung an die Open Definition)

Unter „offenen Daten“ versteht man sämtliche Datenbestände* der öffentlichen Hand und anderer Institutionen, die im Interesse der Allgemeinheit anlasslos unter definierten Nutzungsbedingungen zur freien Nutzung, Weiterverbreitung und Weiterverwendung zugänglich gemacht werden. Dies sind alle Daten und Dokumente, die eine Behörde im Rahmen ihres öffentlichen Auftrages und ihrer Zuständigkeit erstellt.

* Davon ausgenommen sind Daten mit Personenbezug, mit Sicherheitsrelevanz sowie Geschäfts- und Betriebsgeheimnisse. Ebenfalls ausgenommen sind (temporäre) Datenbestände, die der Unterstützung interner Arbeitsabläufe dienen.

Rohdaten

Rohdaten, Primärdaten, Sekundärdaten

Unter Rohdaten (auch Primärdaten, Urdaten, Messwerte) versteht man die direkt erfassten (Sensor) oder erhobenen Daten ohne weitere Qualitätsprüfung oder Verarbeitung.

Sekundärdaten sind dagegen ersten Verarbeitungsschritten (Sortierung, Qualitätsprüfung, Eliminierung von Ausreißern oder Messfehlern, Anonymisierung, …) unterworfen, ohne dass jedoch zwingend eine Interpretation vorliegen muss. So sind Daten der amtlichen Statistik meist anonymisierte Mikrodaten, um aus Datenschutzgründen eine bestimmte Kohorten- oder Raumgröße nicht zu unterschreiten.

DatensatzEin Datensatz fasst strukturierte Daten zu einem abgegrenzten Sachverhalt zusammen. Dabei handelt es sich oftmals um Zahlen(reihen), Codelisten oder ähnliches in Form einer Liste, Tabelle oder Matrix. Ein Datensatz kann mit Primär- oder Sekundärdaten befüllt sein. Er kann mit einem Kopf und/oder einer Legende zur Beschreibung/Erläuterung des Inhalts versehen sein. Eine Auswertung/Visualisierung ist mit einfachen statistischen Mitteln möglich.

Zu einem Datensatz zählen immer auch eine oder mehrere digitale Ressourcen, etwa Excel-, CSV- oder XML-Dateien. Unter „Ressource“ wird auch die programmierbare Schnittstelle (application programming interface – API) eingeordnet, da über sie eine unmittelbare Anbindung an einen Datensatz hergestellt wird.

Dokument

Ein „Dokument“ ist eine unstrukturierte (digital vorliegende) Datei mit einer beliebigen Folge von Zeichenketten. In ihrer adressatenspezifischen Aufbereitung stellen sie Sekundärdaten dar. In Aufbau und Darstellung orientieren sie sich am menschlichen Leser. Dazu zählen insbesondere Texte, die ggf. mit Daten (in Form von Tabellen oder Grafiken) angereichert sind. Diese eingebetteten Datensätze können in den Metadaten eines Dokuments zusätzlich beschrieben werden. Um eine Maschinenlesbarkeit sicherzustellen, sind bestimmte Datenformate zu verwenden. Zur Auswertung von Dokumenten sind komplexe semantische Verfahren erforderlich.

Metadaten

Metadaten sind Daten, die Informationen über die Merkmale von Datensätzen oder Dokumenten enthalten (aber nicht die Daten selbst). Im Bibliothekswesen enthält der Metadatensatz eines Buches neben Autor und Titel Angaben zu Verlag, Erscheinungsjahr, Auflage oder der ISBN. Über einen Verweis (Signatur) kann das Objekt lokalisiert werden. Der Verweis kann auch Informationen zu einer Kategorie (Roman, Sachbuch, Reisebeschreibung, Technik, …) enthalten. Dateien, die mit MS-Office-Anwendungen erstellt wurden, enthalten ebenfalls Metainformationen (Dateieigenschaften, wie Verfasser, Datum, Änderung, Dateiname, Zeichenumfang, …).

Maschinenlesbarkeit

Ein wichtiges Kriterium für Offene Daten ist die Maschinenlesbarkeit. Darunter wird deren softwaregestützte Erkennung und Verarbeitung in Prozessoren/Computern verstanden. Hierzu zählen neben speziellen Datenformaten auch Strichcode oder 2D-Code.

Nutzungsrechte

• Im Sinne von „offenen Daten“ sind die bereitgestellten Informationen frei in der Weiterverwendung, -verarbeitung und Verknüpfung.

• Frei auch im Sinne von Kostenfreiheit

• Wir empfehlen die Creative Commons Lizenz einzusetzen. Berlin verbindet die freie Nutzung (nur) mit der Auflage der Quellennennung.

Publikation von Daten

Checkliste•Fällt die Information in den öffentlichen Auftrag der Einrichtung?•Ist die Information in der freien Verfügung der Einrichtung?•Stehen einer Publikation rechtliche Regelungen entgegen? (Datenschutz, Geschäftsgeheimnis)•Liegt die Information in einem offenen Format vor? (sonst vorher umwandeln)

Weiterbildung• Identifikation von Zielgruppen

– Führungskräfte– Datenarbeiter– Sachbearbeiter

• Erarbeitung spezifischer Weiterbildungs-angebote mit der VAK– Werkstattgespräch mit Führungskräften– Ausbau der CMS-Imperia-Werkzeuge– Schulung bei Office-Anwendungen (offene Formate)

Online Voting 2010

Besuchte Datenkategorien

Sept.13-März14

Wunsch- vs. besuchte Datenkategorien

DatasetsWahllokale zur Bundestagswahl 2013Berliner WeihnachtsmärkteFinanzamt-Atlas BerlinOrtsteilgeometrienOpen Street Map Daten für BerlinVBB Fahrplan 2014VBB Fahrplan 2013Liste der VornamenBerliner und Brandenburger Volks- und StrassenfesteBundestagswahl 2013 nach WahlbezirkenBundestagswahl 2013 Berlin nach AbgeordnetenhauswahlkreisenErgebnisse der Bundestagswahl 2013 BerlinListe der StolpersteineBundestagswahl 2013 Berlin nach AbgeordnetenhauswahlkreisenGesundheitsberichterstattungAusschreibungen BA Lichtenberg

35271978143913171112754710570455

442405

354

353252

246245

Sept.13 – March14

Suche nach …999276

61595944423624232317161614

LORGSIwahl, wahlen, bundestagswahl, ~2013, wahllokal, wahlergebnisEinwohner, ~am Hauptwohnortmietspiegel, berliner, 2013, spandauhaushalt, haushaltsplanvbbGTFSbeteiligungsberichtweihnachtsmärktevornamenbsrstandardlastprofilfahrplanBezirkewohndauer

Sept.13 – March14

Ausblick Open Data Berlin

• Berlin eGovernment- und Organisationsgesetz in Vorbereitung, § 13 zu Open Data

• Erweiterung des Front-end Datenportal für mobile Endgeräte

• Testung einfacher Visualisierungstools für Datensätze

• Weitere Hackdays (GeoDaten, BSR-Daten)

Kontakt

Dr. Wolfgang Both

Senatsverwaltung für Wirtschaft, Technologie und Forschung

Martin-Luther-Str. 105, D-10825 Berlin

Mail: wolfgang.both@senwtf.berlin.de

Recommended