26
etb . eun . org 12.03.2001 Kluck (HUB/IZ) 1 ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB Metadaten und Heterogenitäts- behandlung als wesentliche Elemente zur Entwicklung eines Europäischen Schul Portals - Das Projekt European Schools Treasury Browser – ETB Präsentation auf der 7ten Jahrestagung der IuK Initiative Trier 11.-14.03.2001 Michael Kluck Humboldt-Universität Abteilung Pädagogik u. Informatik (HUB) InformationsZentrum Sozialwissenschaften Bonn (IZ)

Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

Embed Size (px)

Citation preview

Page 1: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

1

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

Metadaten und Heterogenitäts-behandlung als wesentliche

Elemente zur Entwicklung eines Europäischen Schul Portals - Das

Projekt European Schools Treasury Browser – ETB

Präsentation auf der 7ten Jahrestagung der IuK Initiative Trier 11.-14.03.2001

Michael KluckHumboldt-Universität Abteilung Pädagogik u. Informatik (HUB)

InformationsZentrum Sozialwissenschaften Bonn (IZ)

Page 2: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

2

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

Einleitung (I)Einleitung (I) Das ETB Projekt ist in den Kontext des Europäischen

Schulnetzes (EUN) eingebettet. www.eun.org Das Europäische Schulnetz bildet den Rahmen für

die Kooperation zwischen den Europäischen Bildungsministerien zur Förderung des Einsatzes von IuK-Technologie im Bildungswesen.

EUN beruht auf einem Europäischen Netzwerk nationaler und regionaler Computernetzwerke von Materialiensammlungen zu Schulen.

Page 3: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

3

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

BUILD THE BUILD THE ““SCHOOLNET INFORMATION SPACESCHOOLNET INFORMATION SPACE””

Page 4: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

4

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

Einleitung (II)Einleitung (II) ETB erarbeitet die technologischen und strukturellen

Voraussetzungen für dieses Netzwerk der Netzwerke. Aufbauend auf einem vorhergehenden Projekt soll ETB

die technische Infrastruktur und die inhaltsbe-zogene Integration der verschiedenen Dienstleistun-gen und ihrer kulturellen und sprachlichen Kontexte bereitstellen.

Diese Präsentation konzentriert sich auf die Integra-tion der Inhalte der beteiligten Netzwerke und Mate-rialsammlungen.

Die wichtigsten Nutzergruppen sind Lehrer und Schüler.

Page 5: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

5

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

Entwicklung eines gemeinsamenEntwicklung eines gemeinsamenMetadatensatzesMetadatensatzes

Kontext and Zielsetzung:Bereitstellung ähnlich strukturierter InformationenErleichterung gezielter SucheVermeidung von Vermischung einer spezifischen

Suche und dem unstrukturierten Universum des Internet:

- Thema versus Personennamen (i.e. Ohm, Kierkegaard)- Unterschiedliche fachspezifische Bedeutungen (z.B.

Leistung, Disziplin)- Fachspezifische Bedeutung versus allgemeinsprachliche

Bedeutung (i.e. Lehre, services)

Page 6: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

6

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

ETB Metadaten Abgeleitet von den Dublin Core Metadaten-

Elementen und dem EUN Metadatensatz (entwickelt im vorangehenden EUN Projekt)

Weitgehend minimalisiert, aber mit PflichtfeldernM = PflichtkategorieO = Wahlkategorie

RDF Syntax wird benutzt.

Page 7: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

7

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

ETB Metadatenelemente (I)Title Titel MCreator Autor MSubject Gegenstand O

or M?!Description Beschreibung MPublisher Veröffentlichung OContributor Mitwirkender ODate Datum OType Typ O

Page 8: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

8

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

ETB Metadatenelemente (II)Format Format O Identifier Identifikation MSource Quelle OLanguage Sprache MRelation Bezug zu OCoverage Abdeckung ORights ManagementRechte OAudience Anwender OEUN User Level Schulstufe O

Page 9: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

9

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

ETB Metadatenelemente (III) Element Gegenstand (subject)

Neben frei vergebenen KeywordsETB ThesaurusbegriffeTon- oder Video-Clip, der den Inhalt einer

Audio-, audiovisuellen, Bild- oder multimedialen Quelle charakterisiert.

Page 10: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

10

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

ETB Metadatenelemente (IV)• Element Schulstufe (EUN user level)

- Schulstufe oder Altersgruppe in der die Ressource eingesetzt wird

- Vorschule- Primarstufe- Erwachsenenbildung- Sekundarstufe- Berufsbildung- Hochschulbildung- Jugendliche (Material für Kinder und Jugendliche im

Allgemeinen)- Erwachsene (Material für Erwachsene im Allgemeinen)

Page 11: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

11

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

Produktion der Metadaten Direkter Eintrag durch die Autoren (unter

Benutzung vorgegebener Regeln/Definitionen oder eines Online-Formulars)

Generierung durch die Datensammlungen selbst während des Inputs

Extraktion aus bestehenden unkodierten Daten unter Anwendung von Extraktions-regeln

Page 12: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

12

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

Metadaten-Extraktion und AbbildungMetadaten-Extraktion und Abbildung Für verschiedene Datensammlungen, die

unterschiedliche Metadatenstrukturen haben, werden Abbildungsschemata in den ETB Metadatensatz festgelegt.

Für Datensammlungen ohne Metadatenschemata werden Metadaten aus den Eintragungen in den Dokumenten extrahiert, soweit strukturierte Elemente der Ressourcen ermittelt werden können und ein Algorithmus für ihre Konvertierung in Metadatenfelder angewendet werden kann.

Page 13: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

13

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

Metadatenaustausch via NNTPMetadatenaustausch via NNTP

Page 14: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

14

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

Page 15: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

15

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

Technische Ziele von ETBTechnische Ziele von ETB Ein neuer Ansatz für ein Europäisches Netzwerk von

Datensammlungen Ein Netzwerk basierend auf “Verteilen” nicht

“Einsammeln” Mehrwert für die Benutzer durch einen Thesaurus Erhaltung der vollen örtlichen Kompetenz bezüglich

der Editionspolitik Kontrollinstrumente für die Garantie einer hohen

Qualität Größere Publizität Unterstützung der Multilingualität

Page 16: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

16

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

ETB Thesaurus (I)ETB Thesaurus (I) Suchprobleme

Problem der natürlichen Sprache:- Synonyme, Homonyme, Polyseme, Phrasen,

Komposita, SchreibungsvariantenFehlen einer RelevanzkontrolleMultilingualität

Page 17: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

17

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

ETB Thesaurus (II)ETB Thesaurus (II) Vorteile eines Thesaurus

Effektive Kontrolle der Indexierungssprache (Vorzugsbenennungen, zwischensprachliche Äquivalenz)

Systematische Darstellung der Deskriptoren (leichte Navigation durch die Terminologie)

Indexierung und Suche mit Hilfe der Postkoordination von Begriffen

Umsetzung der Empfehlungen von Dublin CoreBasis um Heterogenitätsprobleme zu lösen

Page 18: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

18

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

ETB Thesaurus (III)ETB Thesaurus (III)Der Inhalt der Datensammlungen im EUN

Kontext (= Multimedia-Material, Lehrmaterial, Schulprojekte) und die Schulen als Anwendungsbereich und Lehrer und Schüler als Hauptzielgruppen bedürfen einer spezifischen Terminologie.

Nur wenige Datensammlungen im Bereich Schule haben bisher eine eigene Terminologie entwickelt.

Page 19: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

19

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

Bearbeiten der HeterogenitätBearbeiten der Heterogenität (I) (I) Benutzung vorhandener Inhaltsbeschreibungen Die Befassung mit der Heterogenität auf der Ebene des Inhalts

bedeutet: Gleiche Wörter oder Phrasen können in verschiedenen

Kontexten unterschiedliche Inhalte ausdrücken (z.B. Bildung, Klasse):

- Sie können irgendwo im Volltext einer Internetquelle vorkommen.

- Sie können der Kode eines Klassifikationsschemas sein, der einem Dokument zugeordnet wurde.

- Sie können ein Indexierungsbegriff sein, der aus einem spezifischen Thesaurus stammt

Page 20: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

20

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

Bearbeiten der Heterogenität (II)Bearbeiten der Heterogenität (II)Nutzung vorhandener intellektueller Arbeit,

die von den verschiedenen Datensamm-lungen oder den Autoren der Ressourcen geleistet wurde: Indexierung oder Klassi-fizierung von Dokumenten auch wenn dies mit unterschiedlichen Schemata oder Terminologien geschehen ist.

Nutzung vorhandener Terminologien oder Klassifikationsschemata zur automatischen Erstellung von Transferbeziehungen

Page 21: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

21

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

Bearbeiten der HeterogenitätBearbeiten der Heterogenität (III) (III) Methoden zur Lösung von Heterogenitäts-

problemen intellektuelle Erstellung von Cross-Konkordanzen

zwischen relevanten Terminologien und Klassi-fikationsschemata und zwischen verschiedenen Sprachen und automatische (statistische) Generierung Transferbeziehungen

Entwicklung von Transferkomponenten zwischen diesen Terminologien und Schemata und zwischen diesen und den Wörtern, die im Volltext vorkommen (co-occurrence analysis, fuzzy methods, neural networks etc.)

Page 22: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

22

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

Mehrsprachiger ZugangMehrsprachiger Zugang (I) (I) Unter Nutzung des ETB Thesaurus und der

Bearbeitung der Heterogenität:Der ETB Thesaurus ermöglicht die Indexierung oder die Suche in jeder der enthaltenen Sprachen und die Ergebnisse können automatisch in allen anderen Sprachen gefunden werden.Die Heterogenitätsbehandlung (intellektuell oder automatisch durchgeführt) erlaubt die Benutzung jedes (sprachspezifischen) Schemas: Ergebnisse können auch in den anderen Schemata oder Sprachen gefunden werden.

Page 23: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

23

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

Mehrsprachiger Zugang (II)Mehrsprachiger Zugang (II) Nutzung der Ergebnisse der Cross-Language

Information Retrieval und seiner Evaluierung (siehe: CLEF = Cross-Language Evaluation Forum unter www.clef-campaign.org )

Page 24: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

24

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

SchlussSchluss ETB ist in eine vorhandene, sich schnell entwickeln-

de Anwendung für Praktiker (Lehrer und Schüler) mit einer guten politischen Unterstützung für den Einsatz von Iuk-Technologien im Bildungsbereich integriert.

ETB ist in die führende Forschung auf den Gebieten verteilter Netzwerke, Metadaten, (mehrsprachiges Information Retrieval, mehrsprachige Thesauri und Heterogenitätsbehandlung integriert.

Page 25: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

25

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

Vielen Dank für Ihre Aufmerksamkeit!Vielen Dank für Ihre Aufmerksamkeit! weitere Informationen

zum mehrsprachigen ETB Thesaurushttp://www.en.eun.org/eun.org2/eun/en/etb/content_frame.

cfm?lang=en&ov=3813 Zu weiteren Aspekten des ETB-Projekts

(Beschreibung ganzer Sammlungen, Qualitätsmanagement, technische Lösungen)

http://www.en.eun.org/eun.org2/eun/en/etb/sub_area_frame.cfm?sa=195&row=1

Michael Kluck‘s Veröffentlichungen http://www.educat.hu-berlin.de/~kluck/kl-personal.html

Page 26: Etb.eun.org ETB IST 1999 - 11781 IuK 2001 Metadaten + Heterogenität in ETB 12.03.2001 Kluck (HUB/IZ) 1 Metadaten und Heterogenitäts- behandlung als wesentliche

etb.eun.org

12.03.2001Kluck (HUB/IZ)

26

ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB

LiteraturhinweiseLiteraturhinweise Ardö/Koch 1999: Anders Ardö, Traugott Koch: Automatic classification applied to the full-text Internet documents in a robot-

generated subject index. In: Online Information 99. Proceedings. 23rd International Online Information Meeting. London, 7-9 Dec 1999, p.239-246. Manuscript at: http://www.lub.lu.se/~traugott/online99.htm  

Kluck et al. 2000: Michael Kluck, Jürgen Krause, Matthias Müller, in Kooperation mit Rudi Schmiede u.a. Virtuelle Fachbibliothek Sozialwissenschaften. Bonn: 2000 (= IZ-Arbeitsbericht, Nr. 19); at http://www.bonn.iz-soz.de/publications/series/working-papers/#Virtuell pdf-file for downloading.  

Koch/Vizine-Goetz 1999: Traugott Koch, Diane Vizine-Goetz: Automatic Classification and Content Navigation Support for Web Services. DESIRE II co-operates with OCLC. In: Annual Review of OCLC Research 1998 http://www.oclc.org/oclc/research/publications/review98/koch_vizine-goetz/automatic.htm  

Koch 1998: Traugott Koch: Nutzung von Klassifikationssystemen zur verbesserten Beschreibung, Organisation und Suche von Internet-Ressourcen. Buch und Bibliothek 50:5, p.326-335. Manuscript with hyperlinks at: http://www.ub2.lu.se/tk/publ/bubmanus.html

Meier 2000: Wolfgang Meier, Matthias N.O. Müller, Stefan Winkler: Virtuelle Bibliothek Sozialwissenschaften. Problembereich und Konzeption. In: Bibliotheksdienst, Vol. 34, No. 7/8, 2000, p. 1236-1244 http://www.dbi-berlin.de/dbi_pub/bd_art/bd_2000/00_07_12.htm

Krause 1999: Jürgen Krause: Sacherschließung in virtuellen Bibliotheken. Standardisierung versus Heterogenität. In: Grenzenlos in die Zukunft. 89. Deutscher Bibliothekarthag in Freiburg im Breisgau 1999. Frankfurt am Main: 2000 (ZfBB-Sonderheft 77)

Krause 1996: Jürgen Krause: Informationserschließung und -bereitstellung zwischen Deregulation, Kommerzialisierung und weltweiter Vernetzung [Schalenmodell]. Bonn: 1996 (= IZ-Arbeitsbericht, Nr. 6); at http://www.bonn.iz-soz.de/publications/series/working-papers/#Informationserschließung pdf file for downlaoding. 

Krause/Marx 2000: Jürgen Krause, Jutta Marx: Vocabulary Switching and Automatic Metadata Extraction or How to Get Useful Information from a Digital Library. In: First DELOS Workshop on Information Seeking Searching and Querying in Digital Libraries, Zürich, Switzerland, 11.-12.12.2000 (forthcoming in the proceedings) 

Krause 2000: Jürgen Krause: Information Systems for Social Science Research. A Perspective from Information Science. In: Symposium Information system for social sciences, 1.-2.10.2000, Mannheim (forthcoming in the proceedings) 

Weibel/Koch 2000: The Dublin Core Metadata Initiative. Mission, Current Activities, and Future Directions. In: D-Lib Magazine 6 (12) 2000 at: http://www.dlib.org/dlib/december00/weibel/12weibel.html