S T A T I S T I K A U S T R I A 1www.statistik.at
Amtliche Statistik
in Österreich
26. November 2008
© STATISTIK AUSTRIA
I n f o r m a t i o n e n
Wir bewegen
S T A T I S T I K A U S T R I A 2
Inhalt
1. Die Bundesanstalt Statistik Austria2. Methodische Arbeiten in Statistik Austria3. Strategische Zielsetzungen
S T A T I S T I K A U S T R I A 3
Einige historische Fakten
1829: „Statistisches Bureau“
2004: 175 Jahre Amtliche Statistik in Österreich
1. Jänner 2000: Bundesstatistikgesetz (BStatG 2000) tritt in Kraft
ÖSTAT (Österreichisches Statistisches Zentralamt): Teil der öffentlichen Verwaltung
STAT (Statistik Österreich, Statistik Austria): eine Bundesanstalt
ÖSTAT STAT
S T A T I S T I K A U S T R I A 4
Was ist Bundesstatistik?
Informationssystem des Bundes,
das statistische Daten über die wirtschaftlichen,
demographischen, sozialen, ökologischen und kulturellen
Gegebenheiten in Österreich
den Bundesorganen
zur Planung
Entscheidungsvorbereitung und
Kontrolle von Maßnahmen
sowie der Wissenschaft, der Wirtschaft und der
Öffentlichkeit bereitstellt.
§ 1 BStatG
S T A T I S T I K A U S T R I A 5
Direkte Erhebungen/Befragungen nur zulässig, wenn die Datenbeschaffung nicht anders möglich ist
Beschaffung der Daten zuerst bei den öffentlichen Registern und Verwaltungsstellen
Stichproben- statt Vollerhebungen
Freiwilligkeit statt Zwang bei Befragungen
Benutzerfreundliche Erhebungsbögen
Ziele des Bundesstatistikgesetzes (1)
Entlastung der Bürger, insb. der Unternehmen
S T A T I S T I K A U S T R I A 6
Rationalisierung, insbesondere im Personalbereich
Höhere Qualifizierung des Personals
Moderne Managementstrukturen
Auf- und Ausbau von Datenbanken und Registern
Nutzung von Verwaltungsdaten
Vermehrte Nutzung elektronischer Medien
Ziele des Bundesstatistikgesetzes (2)
Erhöhung der Effizienz
S T A T I S T I K A U S T R I A 7
Festlegung der fachlichen Grundsätze bei der Erstellung der amtlichen Statistiken
Laufende Qualitätsverbesserung, Qualifikationssteigerung
Erhöhung der Aktualität
Verpflichtung zur unentgeltlichen Veröffentlichung der statistischen Ergebnisse im Internet
Sicherstellung der fachlichen Unabhängigkeit der amtlichen Statistik
Ziele des Bundesstatistikgesetzes (3)
Sicherstellung der Qualität, Aktualität und Transparenz der amtlichen Statistik
S T A T I S T I K A U S T R I A 8
Inhaltliche, fachliche Verantwortlichkeit:
Im hoheitlichen Bereich: der nach dem Bundesministeriengesetz für die jeweilige Statistik zuständige Fachminister.
• Weisungsfreiheit der Anstalt in methodischen Fragen.
• Sicherstellung durch Aufsichtsrechte der Fachminister
Wirtschaftliche Verantwortlichkeit:• Eigenverantwortlichkeit der Anstalt
• Sicherstellung durch Aufsichtsrechte des Bundeskanzlers
Ziele des Bundesstatistikgesetzes (4)
Festlegung der Verantwortlichkeiten in der Amtlichen Statistik
S T A T I S T I K A U S T R I A 9
Tätigwerden aufgrund einer Anordnung:• unmittelbar wirksame EU-Normen
• gesetzliche Anordnung
• Anordnung durch Verordnung
Aufgrund eines Vertrages dürfen Statistiken erstellt werden • für Gebietskörperschaften
• für Anstalten öffentlichen Rechts
• für Internationale Organisationen
• für Gemeinwirtschaftliche Unternehmungen
Ziele des Bundesstatistikgesetzes (5)
Die Bundesanstalt soll grundsätzlich nur auf Anordnung oder Auftrag und gegen Kostenersatz tätig werden
S T A T I S T I K A U S T R I A 10
Statistisches System Österreichs (1)
Bundesebene:
Bundesanstalt Statistik Österreich
Andere Organe der Bundesstatistik
• Energie Control (Energiestatistik)
• Umweltbundesamt (Abfallstatistik)
Oesterreichische Nationalbank (Zahlungsbilanz, Monetärstatistik)
Bundesministerien
Arbeitsmarktservice (Arbeitslosenstatistik, Statistik der offenen Stellen)
Hauptverband der österreichischen Sozialversicherungsträger (z.B. Beschäftigungsstatistik)
Wirtschaftskammer Österreich und andere öffentlich-rechtliche Interessensvertretungen
Verbände und Interessensvertretungen
S T A T I S T I K A U S T R I A 11
Statistisches System Österreichs (2)
Landes- und Gemeindeebene:
Landesstatistik
Städtestatistik
S T A T I S T I K A U S T R I A 12
Internationales Statistik-Umfeld
NSI
NSI
NSINSI
NSI
NSI
NSI
NSI
NSI
NSI
NSI
EUEurostat / Europ. Kommission,
Rat der EU, Europ. Parlament,
Europ. Zentralbank, CEIES etc.
UNStatistical Commission,
Economic Commission for Europe (ECE), Konferenz europ. Statistiker (CES),
WHO, ILO etc.
OECDCommittee on Statistics
etc.
NGOsInternational
StatisticalInstitute (ISI) etc.
STATISTIK AUSTRIA
Die Informationsmanager NSI
NSI
NSI
NSINSI
NSI
NSI
NSI
NSI
S T A T I S T I K A U S T R I A 13
S T A T I S T I K A U S T R I A 14
Besondere Grundsätze, § 24 BStatG
Objektivität und Unparteilichkeit beim Erstellen der Statistiken
Statistische Methoden und Verfahren nach international anerkannten wissenschaftlichen Grundsätzen und Standards, ihre Offenlegung
Laufende Überprüfung der Statistiken auf Qualitätsverbesserungen
Möglichst hohe Aktualität der Statistiken Minimierung der Belastung und ausreichende Information
der Betroffenen und Auskunftspflichtigen Wahrung der Grundsätzen der Veröffentlichung gem. § 30
BStatG Vertraulichkeit von personenbezogenen Daten
Wird jährlich beurteilt
durch den Statistikrat
S T A T I S T I K A U S T R I A 15
Planung von Stichprobendesigns
Hoch- und Fehlerrechnung
Plausibilitätsprüfung und Imputation
Saisonbereinigung von Zeitreihen
Flash estimates mit Zeitreihenmodellen
Record linkage von Verwaltungsdaten mit Registern
Kleinräumige Schätzverfahren
Schulung und Beratung über stat. Methoden
Methodische Arbeiten
S T A T I S T I K A U S T R I A 16
• Mikrozensus-Arbeitskräfteerhebung (kontin.)• Gesundheit der Bevölkerung• Zeitverwendung (10-jährig)• Konsumerhebung (5-jährig)• Wohnbaufinanzierung (jährlich)• SILC Einkommen u. Lebensbed. (jährlich)• Urlaubsreisen (quartalsw.)• Berufl. Weiterbildung (mehrj.)• JVS Offene Stellen• Konjunkturerhebung im Handel (monatlich)• Leistungs- und Strukturerhebung (jährlich)• Straßengüterverkehr (laufend)
Stichproben I
S T A T I S T I K A U S T R I A 17
Stichproben II
• Verdienststrukturerhebung (4jährig)• Arbeitskostenerhebung (4jährig)• Energieverbrauch der Gemeinden (jährlich)• Energieverbrauch der Unternehmen• Allgemeine Viehzählung (jährlich)• Schweinezählung (halbjährlich)• E-Commerce (4jährig)• Innovationserhebung (4jährig)• Abfallerhebung (UBA)
S T A T I S T I K A U S T R I A 18
Charakteristika der Stichproben
• Teils verpflichtend, teils freiwillig• Zufallsauswahl• Großer Stichprobenumfang• Periodizität• Merkmalsvielfalt• Schichtung• Klumpung• Mehrstufigkeit der Auswahl• Hochrechnung• Fehlerrechnung
S T A T I S T I K A U S T R I A 19
Um
satz
US
B
Inve
stit
ion
en
ca. 280.000 aktive Unternehmen
Erhebung
Schätzung
PrimärNon Response [~5%]
~35.000 Unternehmen [13%]
~245.000 Unternehmen [87%]
…
:::::::::::::::::::::::: ::::::
Schwelle
Verwaltungsquellen
data matrix
Lag
er… ~ 120 Merkmale
Modellbasierte Schätzungen
S T A T I S T I K A U S T R I A 20
Datenschutz bei Einzeldaten
• Aggregation von (möglichst ähnlichen) Beobachtungen (Mikroaggregation)
• Vertauschen von Werten (Swapping)• Erzeugen von synthetischen Daten• Zufällige Verunreinigung von Daten (Perturbation)• Gezielte Verunreinigung von Daten mittels robuster
Ausreißererkennung (Adding noise)• Blanking und Imputation
Univariate (z.B. Mittel, Mediane) und multivariate (z.B. Korrelationen, Modelparameter) Struktur soll erhalten bleiben.
S T A T I S T I K A U S T R I A 21
Datenschutz bei Einzeldaten
• Erzeugen von sogenannten „Public use files“.• Welche Kombinationen von Beobachtungen kommen selten
vor, z.B. Beruf Generaldirektor, Wohnort Grein, Geschlecht M Identifizierbar.
• Veränderung dieser Beobachtungen.
Software:
• Τ-Argus und μ-Argus: von CBS NL• R-package ‚sdcMicro‘: in Statistik Austria entwickelt zur
Erzeugung sicherer Mikrodaten, auf dem R archive network (CRAN) verfügbar
http://cran.at.r-project.org/src/contrib/Descriptions/sdcMicro.html
S T A T I S T I K A U S T R I A 22
Datenschutz in Tabellen
Unterdrückung (Primäre Sperrung) von Zellen,
• zu deren Wert weniger als 3 Unternehmen beitragen oder• in der die größte Firma mehr als 85% des Zellwertes beiträgt
(Bsp. voestalpine im NACE… - jeder kann den Umsatz erahnen).
Problem: bei Publikation der Randsummen wird Zellenwert rückrechenbar (Randsumme minus andere Einträge in Tabelle).
S T A T I S T I K A U S T R I A 23
Datenschutz in Tabellen
Wirtschaftsklasse Region A Region B Region C
I 20 50 10
II 8 19 22
III 17 32 12
Wirtschaftsklasse Region A Region B Region C
I 20 50 10
II 8 19 G
III 17 32 12
S T A T I S T I K A U S T R I A 24
Wertunterdrückung
Wirtschaftsklasse Region A Region B Region C Österreich
I 20 50 10 80
II 8 19 G 49
III 17 32 12 61
Insgesamt 45 101 44 190
Wirtschaftsklasse Region A Region B Region C Österreich
I 20 50 10 80
II G 19 G 49
III G 32 G 61
Insgesamt 45 101 44 190
S T A T I S T I K A U S T R I A 25
Intervallwerte und kontrollierte Rundung
Wirtschaftsklasse Region A Region B Region C Österreich
I [18,24] 50 [ 6,12] 80
II [4,10] 19 [20,26] 49
III 17 32 12 61
Insgesamt 45 101 44 190
Wirtschaftsklasse Region A Region B Region C Österreich
I 20 50 10 80
II 10 20 20 50
III 15 30 15 60
Insgesamt 45 100 45 190
Tabelle kontrolliert gerundet
Tabelle mit Intervallwerten
S T A T I S T I K A U S T R I A 26
Zellverschmutzung
Wirtschaftsklasse Region A Region B Region C Österreich
I 20 50 10 80
II 7 16 26 49
III 18 35 8 61
Insgesamt 45 101 44 190
Wirtschaftsklasse Region A Region B Region C Österreich
I 20 50 10 80
II 8 19 22 49
III 17 32 12 61
Insgesamt 45 101 44 190
Verschmutzte Tabelle
Originaltabelle
S T A T I S T I K A U S T R I A 27
Datenschutz in Tabellen (2)
Unterdrückung anderer Zellen (Sekundärsperrung) z.B. mittels:
- „Quadranten“: Primär gesperrte Zellen können nicht exakt berechnet werden.
- mittels linearer Programmierung (besser): Optimierungsproblem: Z.B. so wenig wie
möglich Zellen unterdrücken unter der Nebenbedingung, dass primär gesperrte Zellen auch nicht in einem bestimmten Intervall bestimmt werden können.
Problem z.B. bei hierarchischen Tabellen: Zellenwert rückrechenbar über Hierarchien.
S T A T I S T I K A U S T R I A 28
Datenschutz in hierarchischen Tabellen
Ziel: Z.B. Sperren von möglichst wenigen Zellen und gleichzeitig keine Rückrechenmöglichkeit auch bezüglich hierarchischen Tabellen zu ermöglichen (Werte sollten auch nicht näherungsweise berechnet werden können)
Optimierungsproblem. Keine optimale Lösung, da der Rechenaufwand zu hoch – finde gute näherungsweise optimale Lösung mittels Heuristiken.
S T A T I S T I K A U S T R I A 29
Imputation
Zweck:
• Vollständige und fehlerfreie Einzeldatensätze
• Ausgleich von Verzerrungen, die z.B. durch Nonresponse entstehen
• Konsistente Tabellen
Verfahren:
• Methoden, die auf Merkmale des jeweiligen Datensatzes fußen.
• Methoden, die auf Spenderdatensätze zurückgreifen.
S T A T I S T I K A U S T R I A 30
Imputation (2)
• Methoden, die auf Verteilungsparameter des betrachteten Merkmals zurückgreifen.
• Zeitreihenmethoden
• Externe Datenquellen
• Multiple Imputation
• Neuronale Netze
S T A T I S T I K A U S T R I A 31
Saisonbereinigung
• Trend• Konjunktur• Saison • Irreguläre Schwankungen
• Saison- und Arbeitstagsbereinigung mit X12-ARIMA• Vorbehandlung der Reihen (Ausreißer, Arbeitstage)• ARIMA-Modell wird einmal pro Jahr ermittelt,
Parameter aber monatlich neu berechnet
Annahme: Zeitreihe lässt sich in Komponenten zerlegen
tttt USGY
S T A T I S T I K A U S T R I A 32
Saisonbereinigung (2)
Unterschiedliche Anzahl von Werktagen:• Jeder Werktag hat den gleichen Einfluss (z.B.
März 2001: 22 Werktage, März 2002: 25 Werktage)• Jeder Werktag hat einen spezifischen Einfluss
(z.B. Verkauf ist freitags generell höher als montags – März 2001: 5 Freitage, März 2002: 4 Freitage)
Arbeitstägige Einflüsse:
S T A T I S T I K A U S T R I A 33
Flash estimates
• Glättungsverfahren, z.B. Holt-Winters Algorithmus – Trend und Saisoneinflüsse werden fortgeschrieben
• (saisonale) ARIMA – Modelle (ohne exogene (Input-) Variable)
• ARIMAX – Modelle (Verwendung von exogenen Variablen)
• Multivariate Zeitreihenmodelle (Vektorautoregressive (VAR)↔Fehlerkorrekturmodelle (FKM))
• Schätzungen mit X12 ARIMA wiesen die beste Prognosequalität auf
S T A T I S T I K A U S T R I A 34
Record linkage
Abgleich des Unternehmensregisters mit• Firmenbuch• Mitgliedsdatei der WKO• Steuer• Sozialversicherung
Probleme für automat. Abgleich• Unterschiedliche Einheiten• Aktualität der Daten• Fehlender numerischer Schlüssel• Abgleich über Textfelder• Bigramme für Ähnlichkeitsmaß
S T A T I S T I K A U S T R I A 35
Strategien für die Zukunft
8 strategische Ziele, 2 davon beziehen sich auf Methodik und Forschung
Ziel 3: Bedeutung methodischer Forschung und Intensivierung der Zusammenarbeit zwischen amtlicher Statistik und akademischer Forschung
Ziel 5: Verstärkte Zusammenarbeit von Statistik Austria mit anderen NSI in ausgewählten statistischen, methodischen oder themenübergreifenden Bereichen
Andere Ziele Internet-basierte Datenerhebung Integration von Datenbeständen, z.B. Zusammenführen von
Erhebungsdaten mit administrativen Daten Publikation mittels Internet und online Datenbanken
S T A T I S T I K A U S T R I A 36
Strategien für die Zukunft (2)
Zentrale Forschungsgebiete Plausibilitätsprüfung und Imputation Modell-basierte Schätzverfahren Statistische Geheimhaltung
Kooperation mit Universitäten Teilnahme an FP7 Forschungsprojekten Teilnahme an Centers of Excellence
Internationale Zusammenarbeit Zusammenarbeit im ESS Aktive Rolle in Expertengruppen der EU und anderen
internat. Organisationen Unterstüttzung neuer EU-Mitglieder Zusammenarbeit mit Österreichs Nachbarstaaten
S T A T I S T I K A U S T R I A 37
Beispiele für Kooperationen
EPROS (European Programme for Research in Official Statistics): Projekte zu methodischen und anderen Themen, finanziert durch Europäische Kommission; zB DACEIS, DIECOFIS, METANET
Centers of Excellence: SDC Geheimhaltung ISAD Integration von Erhebungen und
administrativen Daten FP7-Projekt AMELI: 8 Partner, Varianzschätzung
für Laeken Indikatoren, R-package für robuste Schätzung und Imputation, Visualisierungstools für Ausreißer, Karten für Indikatoren
S T A T I S T I K A U S T R I A 38
Kooperationen mit Universitäten
Bereitstellung von Standardisierten Datensätzen („scientific use files“) Aufgabenspezifischen Datensätzen via Homepage der Statistik Austria (www.statistik.at)
Bilaterale empirische und methodische Projekte Workshops zum Erfahrungsaustausch
Nutzen für die Offizielle Statistik Transfer von Kompetenz durch gemeinsame Projekte Arbeitsteilung im Bereich von Sekundärstatistische
Analysen
Nutzen für Universitäten Datenbestand der Offiziellen Statistik liefert Materialien für
Forschung und Lehre Zugang zu Daten aus Forschungsfeldern, die sonst nicht
zugänglich sind
S T A T I S T I K A U S T R I A 39
Publikationskanäle
Internet (www.statistik.at) Pressemitteilungen, Pressekonferenzen “Statistische Nachrichten”, monatlich Jahrbuch Berichte, Schnellberichte Folder, gezielte Informationen Maßgeschneiderte Produkte (z.B.
“Firmennachrichten“) Internationale Organizationen (EUROSTAT, OECD,
UNECE)
S T A T I S T I K A U S T R I A 40
Zusammenfassung
Seit 1829 Statistisches Zentralamt Ausgliederung 2000, Bundesanstalt Statistik
Österreich Zentralisiertes statistisches System, Eingebettet in das Europäische Statistische System Anbieter von umfassender Information über die
wirtschaftlichen, demographischen, sozialen, ökologischen und kulturellen Gegebenheiten in Österreich
Starker Wandel in Aufgaben und Methoden durch sich ändernde Herausforderungen und Möglichkeiten
Umfangreiches Methodenspektrum Interessante und vielfältige Tätigkeitsbereiche für
Statistiker Kooperationen mit Partnern aus der Wissenschaft Zugang zu Daten über Homepage der Statistik Austria
S T A T I S T I K A U S T R I A 41
Danke für Ihr Interesse
www.statistik.at