CUbRIK and History of Europe

  • Published on
    19-Jun-2015

  • View
    245

  • Download
    0

Embed Size (px)

DESCRIPTION

CUbRIK presented during the Poster session of the Workshop Mehr Personen Mehr Daten Mehr Repositorien ("More poeple - more data - more repositories") - 4-6 March in Berlin, at Brandenburg Academy of Sciences

Transcript

  • 1. Von zweifelhaften Informationen zuneuen ZusammenhngenZum Aufbau eines Personendatenrepositoriums imKontext der europischen IntegrationL. Wieneke, F. Clavert, N. Carboni

2. Inhalt Hintergrund CUbRIK Anforderungen an ein Repositorium fr Identitten Praktische Umsetzung Ausblick und Erfahrungen3 3. CUbRIK29/09/2011 Title 4 4. CUbRIK 36 month large-scale integratingproject started in October 2011 partially funded by the EuropeanCommissions 7th FrameworkICT Programme for Researchand Technological Developmentwww.cubrikproject.eu 5 5. CUbRIK: Human Computation6 6. CUbRIK: Entwicklungsprozess History of Europe7 7. CUbRIK: Social Graph Gemeinsames Auftreten vonPersonen in einem Dokument (Bild)schafft Verbindung Aufbau mit bestehendem Material Kontinuierliche Erweiterung Angereichert mit Ort, Zeit,Organisationen und Biographien Technische und analytischeFunktion Identitten als Fixpunkte des SG8 8. CUbRIK: Social Graph Time based roles (e.g. VIAFpresident of EU parliament DBPediabetween XX and YY) Person WorldCatPerson Entitypedia B Membership of interestgroups A GND DateTime, Place (Location) Controlled Keywords Events (e.g. Treaty of Rome ) 9 9. CUbRIK HoE Repositorium29/09/2011 Title10 10. Anforderungen an ein Repositorium fr Identitten Leicht-gewichtig Erweiterbar Modellierung von o Unsicherheit (1967?, [Paris?]) o Mehrdeutigkeit o Zuverlssigkeit (Vermutung/Fakt jeweils mit Argumentation) o Provenienz o Mehrsprachigkeit Raum und Zeit (hierarchisches Raum-Modell)11 11. Medien, Personen, Organisationen 12 12. Praktische Umsetzung 29/09/2011 Title13 13. Erschlieung der Personennamen Ist-Situation ca. 1800 Personen in 6500 Bildern Schwach strukturierte Daten Inkohrente Verwendung von Namen Francisco Fernndez Ordoez Francisco Fernndez Ordez Francisco Fernandez Ordonez Francisco Fernandez Ordoez Keine eindeutige Referenzierung (PID) 14 14. Personennamen Workflow Clement Attlee, Harry Truman, Joseph StalineClement Attlee, Harry Truman, Joseph Staline 1. Extraktion von1. Extraktion von Personennamen ausPersonennamen aus OpenCalais Python ScriptOpenCalais Python Script BeschriftungBeschriftung Clement AttleeClement Attlee Harry TrumanHarry Truman Joseph StalineJoseph Staline Anker JrgensenAnker Jrgensen Google2. Suberung der Daten 2. Suberung der DatenAnker JrgensenAnker JrgensenRefine Anker JorgensenAnker Jorgensen3. Verbindung und 3. Verbindung undVerifizierung Philippe MaystadtGooglePhilippe Maystadtn Verifizierung Philippe MaystadtPhilippe Maystadtn(Reconciliation) Refine (Reconciliation) 15 15. Ausblick & Diskussion 29/09/2011 Title 16 16. Ausblick Umsetzung der bestehenden Daten in den SocialGraph Entwicklung eines Toolsets zur Annotation,automatischen Erkennung und manuellen Korrekturvon Informationen, Verbindung mit CrowdsourcingVerfahren Entwicklung von Tools zur Visualisierung undErkundung des Social Graph17 17. Diskussion Wie knnen wir Quellen und Argumentationen frAnnotationen abbilden? PID fr Personen, wo ist der Stein von Rosetta?19 18. Thank you for listening29/09/2011 Title 20 19. 29/09/2011 Titre 21 20. Beispiele Refine: Clustering 22 21. Beispiele Refine: Reconciliation & Matching23 22. Beispiele Refine: Reconciliation & Matching24

Recommended

View more >