Transcript
Page 1: CUbRIK and History of Europe

Von zweifelhaften Informationen zu

neuen ZusammenhängenZum Aufbau eines Personendatenrepositoriums

im Kontext der europäischen Integration

L. Wieneke, F. Clavert, N. Carboni

Page 2: CUbRIK and History of Europe
Page 3: CUbRIK and History of Europe

3

Inhalt

• Hintergrund CUbRIK

• Anforderungen an ein Repositorium für Identitäten

• Praktische Umsetzung

• Ausblick und Erfahrungen

Page 4: CUbRIK and History of Europe

4

CUbRIK

29/09/2011 – Title

Page 5: CUbRIK and History of Europe

5

CUbRIK 36 month large-scale integrating

project started in October 2011 partially funded by the European

Commission’s 7th Framework ICT Programme for Research and Technological Development

www.cubrikproject.eu

Page 6: CUbRIK and History of Europe

6

CUbRIK: Human Computation

Page 7: CUbRIK and History of Europe

7

CUbRIK: Entwicklungsprozess History of Europe

Page 8: CUbRIK and History of Europe

8

CUbRIK: Social Graph

• Gemeinsames Auftreten von

Personen in einem Dokument (Bild)

schafft Verbindung

• Aufbau mit bestehendem Material

• Kontinuierliche Erweiterung

• Angereichert mit Ort, Zeit,

Organisationen und Biographien

• Technische und analytische

Funktion

• Identitäten als Fixpunkte des SG

Page 9: CUbRIK and History of Europe

9

CUbRIK: Social Graph

Person

APerson

B

• VIAF• DBPedia• WorldCat• Entitypedia• GND

• DateTime, Place (Location)• Controlled Keywords• Events (e.g. Treaty of Rome …)

• Time based roles (e.g. president of EU parliament between XX and YY)

• Membership of interest groups

Page 10: CUbRIK and History of Europe

10

CUbRIK HoE Repositorium

29/09/2011 – Title

Page 11: CUbRIK and History of Europe

11

Anforderungen an ein Repositorium für Identitäten

• Leicht-gewichtig

• Erweiterbar

• Modellierung von

o Unsicherheit (1967?, [Paris?])

o Mehrdeutigkeit

o Zuverlässigkeit (Vermutung/Fakt jeweils mit Argumentation)

o Provenienz

o Mehrsprachigkeit

• Raum und Zeit (hierarchisches Raum-Modell)

Page 12: CUbRIK and History of Europe

12

Medien, Personen, Organisationen

Page 13: CUbRIK and History of Europe

13

Praktische Umsetzung

29/09/2011 – Title

Page 14: CUbRIK and History of Europe

14

Erschließung der Personennamen

• Ist-Situation

– ca. 1800 Personen in 6500 Bildern

– Schwach strukturierte Daten

– Inkohärente Verwendung von Namen

• Francisco Fernández Ordoñez

• Francisco Fernández Ordóñez

• Francisco Fernandez Ordonez

• Francisco Fernandez Ordoñez

– Keine eindeutige Referenzierung (PID)

Page 15: CUbRIK and History of Europe

15

Personennamen Workflow

1. Extraktion von Personennamen aus

Beschriftung

1. Extraktion von Personennamen aus

BeschriftungOpenCalais Python ScriptOpenCalais Python Script

Clement Attlee, Harry Truman, Joseph StalineClement Attlee, Harry Truman, Joseph Staline

Clement AttleeClement Attlee Harry TrumanHarry Truman Joseph StalineJoseph Staline

2. Säuberung der Daten2. Säuberung der Daten

3. Verbindung und Verifizierung

(Reconciliation)

3. Verbindung und Verifizierung

(Reconciliation)

Anker JørgensenAnker Jørgensen

Anker JorgensenAnker JorgensenAnker JørgensenAnker JørgensenGoogle

Refine

Philippe MaystadtPhilippe Maystadt GoogleRefine

Philippe MaystadtnPhilippe Maystadtn

Page 16: CUbRIK and History of Europe

16

Ausblick & Diskussion

29/09/2011 – Title

Page 17: CUbRIK and History of Europe

17

Ausblick

• Umsetzung der bestehenden Daten in den Social

Graph

• Entwicklung eines Toolsets zur Annotation,

automatischen Erkennung und manuellen Korrektur

von Informationen, Verbindung mit Crowdsourcing

Verfahren

• Entwicklung von Tools zur Visualisierung und

Erkundung des Social Graph

Page 18: CUbRIK and History of Europe

19

Diskussion

• Wie können wir Quellen und Argumentationen für

Annotationen abbilden?

• PID für Personen, wo ist der Stein von Rosetta?

Page 19: CUbRIK and History of Europe

20

Thank you for listening

29/09/2011 – Title

Page 20: CUbRIK and History of Europe

2129/09/2011 – Titre

Page 21: CUbRIK and History of Europe

22

Beispiele Refine: Clustering

Page 22: CUbRIK and History of Europe

23

Beispiele Refine: Reconciliation & Matching

Page 23: CUbRIK and History of Europe

24

Beispiele Refine: Reconciliation & Matching


Recommended