23
IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fi[email protected]

IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer [email protected]

Embed Size (px)

Citation preview

Page 1: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock

Einführung in die TEI

Franz [email protected]

Page 2: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 2

Wiederhohlung: Warum Texte kodieren?

um maschinenlesbar (explizit) zu machen, was vom Leser implizit verstanden wird

um Texte mit Informationen anzureichern um Texte nachzunutzen

in unterschiedlichen Formaten in unterschiedlichen Kontexten von unterschiedlichen Nutzern

Page 3: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 3

Was ist TEI? Consortium Encoding Standard XML

Was bietet die TEI? Guidelines Werkzeuge / Tools Und mehr…

Page 4: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 4

Die Gründung der TEI

Frühling 1987: European workshops on standardisation of historical data Herbst 1987: In the US, the NEH funds an exploratory international

workshop on the feasibility of defining "text encoding guidelines” Juni 1990: Release of the first draft (known as "P1") of the Guidelines

Vassar College, Poughkeepsie, Herbst 1987

Page 5: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 5

TEI

“The TEI was established in 1987 to develop, maintain, and promulgate hardware- and software-independent methods for encoding humanities data in electronic form.”

“Over nearly three decades the TEI has been extraordinarily successful at achieving its objective and it is now widely used by scholarly projects and libraries around the world.”

“TEI is the de facto standard for text encoding.”

http://www.tei-c.org/

Page 6: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 6

<Text Encoding Initiative> TEI P5 Guidelines (derzeit 1.646 Druckseiten)

http://www.tei-c.org/release/doc/tei-p5-doc/en/html/index.html Version 2.6.0. (letztes Update am 20. Januar 2014)

Tools: OxGarage: Konversion von und nach TEI ROMA: Erstellen von Schemata und Dokumentationen Stylesheets: Konversion von TEI-Dokumenten in diverse Formatvorlagen

SIGs, annual members meetings Journal: jTEI

http://journal.tei-c.org/journal/index TEI-L Mailingliste: [email protected]

Fragen von allen für alle auf allen Niveaus Mail-Archiv:

http://listserv.brown.edu/archives/cgi-bin/wa?A0=TEI-L http://markmail.org/list/edu.brown.listserv.tei-l

Page 7: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 7

Aufgabe

Konvertiere mittels OxGarage ein Word-Dokument deiner Wahl nach TEI P5.

Öffne das Dokument im Oxygen-XML-Editor. Bestimme innerhalb des <text/>-Elements mit Hilfe der

Guidelines (Appendices) mind. 4 Elemente: Definition und Modulzugehörigkeit mind. 4 Attribute: Definition und Attributklassen

Page 8: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 8

TEI folgt den Grundregeln von XML. TEI hat eine ‚Baumstruktur‘: ein Wurzelelement und viele descendant nodes.

Ein XML Dokument beinhaltet: Elemente, die Attribute haben können processing instructions Kommentare (begrenzt durch <!- - und - ->) entity references (begrenzt durch & und ;)

Die Zeichen < , > und & müssen immer mit &lt; , &rgt; oder &amp; wiedergegeben werden, wenn man sie als solche verwenden möchte.

Ein XML Dokument muss wohlgeformt und kann valide sein.

TEI ist XML

Page 9: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 9

TEI ist XML

Page 10: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 10

TEI Guidelines

schränken die im Prinzip unendlichen Möglichkeiten von XML ein stellen formalisierte Schemata zur Validierung von XML-Dateien

bereit

Fragen, die geklärt werden müssen: Welche Tags und Attribute werden bereitgestellt? Wie dürfen die Tags verschachtelt werden? Wie kann ich die gegebenen Möglichkeiten um eigene Regeln

erweitern?

Page 11: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 11

TEI CustomizationsAnwendung und Anpassung des TEI-XML Standards

Der TEI Standard bietet mehrere hundert Elements und Attribute. Die modulare Architektur der Guidelines erlaubt Teilgruppen von TEI-

Elementen zu definieren / auszuwählen. Diese Schemata können mit Hilfe des ROMA-Tools erstellt und

modifiziert werden: http://www.tei-c.org/Roma/ oXygen XML editor kann Dokumente mit vordefinierten Schemata

verbinden, z.B.: TEI All (umfasst alle Elements, maximales Schema) TEI Bare (umfasst nur absolut notwendige Elemente) TEI Lite (umfasst alle wichtigen und am häufigsten gebrauchten

Elemente)

Page 12: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 12

Aufgabe

Öffne im Oxygen-XML-Editor ein neues XML-TEI P5-Dokument (TEI Lite).

Ersetze die Platzhalter (Title‚ Publication information, Information about the source, Some text here) mit passenden Inhalten.

Page 13: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 13

<?xml version="1.0" encoding="UTF-8"?><TEI> <teiHeader> <fileDesc> <titleStmt> <title>Title</title> </titleStmt> <publicationStmt> <p>Publication Information</p> </publicationStmt> <sourceDesc> <p>Information about the source</p> </sourceDesc> </fileDesc> </teiHeader> <text> <body> <p>Some text here.</p> </body> </text></TEI>

TEI ist XML

Page 14: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 14

Machine readable transcript

Encoded text

Source

tran

scrip

tio n

enco

ding

visu

alis

atio n

eBook

database

scholarlyprinted edition

reading text (print)

Scholarly digital edition

SchemaAnalysis ModellingVisualisationPrescription

Standards (TEI, XML)

Standards (XSLT, CSS)

Page 15: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 15

TEI Grundstruktur

Rootelement <TEI> enthält mindestens zwei Unterelemente, nämlich

<teiHeader>für Metadaten und muss immer vorhanden sein und

<text>für Texte aller Art und/oder

<sourceDoc> für genetische Edition / topographische Transkriptionen und/oder

<facsimile>für Verknüpfung mit Bildern und/oder

<fsdDecl> ‚Feature Structure Declaration‘v.a. für Textanalysen, linguistische Merkmale u.ä.

Page 16: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 16

Der TEI-Header

<teiHeader> kann aus vier Hauptteilen bestehen:

<fileDesc> (file description)bibliographic description of the electronic text

<encodingDesc> (encoding description)description of the relation of the electronic text to its source

<profileDesc> (profile description)description of the context in which the electronic text was created, and classification information

<revisionDesc> (revision description)description of the revision history of the electronic text

N.B.: Only <fileDesc> is mantatory.

Page 17: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 17

Grundlegende Elemente

TEI-Guidelines: 3 Elements Available in All TEI Documents

<p> (paragraph): Absatz <ab> (anonymous block): Irgendein Textblock <head> (head line): Überschrift

Außerdem: <lb/> (line break): Zeilenumbruch (z.B. wenn Zeilenumbrüche der Vorlage

mit transkribiert werden) <pb/> (page break): Seitenumbruch, normalerweise der der Vorlage

… mit @n, @type, @xml:id spezifizierbar

Page 18: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 18

Strukturelle GliederungselementeTEI-Guidelines: 4 Default Text Structure

<div> (Division): Abschnitte im Dokumentz.B. Buch, Kapitel, einzelne Gedichte, Akte/Szenen u.ä.

Wichtige Attribute: @n (Nummerierung)

z.B. "1.1.2.a" (entweder aus der Quelle übernommen oder selbst erstellt) @type

z.B. "book", "chapter", "poem") @xml:id (eindeutiger Identifikator)

darf im gesamten Dokument nur einmalig vergeben werden muss mit einem Buchstaben beginnen (i.d.R. selbst vergeben oder automatisch

erzeugt)

Page 19: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 19

Hervorhebung und wörtliche Rede

<hi> (highlighted) allgemeiner Tag für Hervorhebungen z.B. für kursiv, fett, g e s p e r r t etc. spezifizierbar durch @rend

<foreign>, <emph>, <distinct> verschiedene Hervorhebungsarten bzw. Markierung ‚ungewöhnlicher‘ Textteile

(Fremdsprachiges, Betonung, Archaismen etc.) <q> (quoted)

für wörtliche Rede, Fachausdrücke, „sog.“(anstelle von Anführungsstrichen)

<quote> (quotation) und <cit> (citation) für Zitate

Page 20: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 20

Noch ein paar Elemente:

Page 21: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 21

Warum TEI?

zum Austausch von Textdaten und Resourcen zwischen Menschen zwischen Maschinen Stichwort “Interoperabilität”

zur Intergration von Textdaten und Resourcen von unterschiedlichen Medien aus unterschiedlichen Softwareumgebungen

zur Langzeitarchivierung und -verfügbarkeit Metadaten Daten, Inhalte

Page 22: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 22

Warum nicht TEI?

Page 23: IDE Spring School 2014, Rostock Einführung in die TEI Franz Fischer franz.fischer@uni-koeln.de

IDE Spring School 2014, Rostock Einführung in die TEIFolie 23

TEI P5 Guidelines:http://www.tei-c.org/release/doc/tei-p5-doc/en/html/index-toc.html

IDE: Folien, Mailinglist, Mitglieder TEI by Example (tutorial): http://www.tbe.kantl.be TEI @ Oxford (school material): http://tei.oucs.ox.ac.uk/Talks/;

z.B.: http://tei.oucs.ox.ac.uk/Talks/2014-01-toronto/ [email protected]

http://listserv.brown.edu/archives/cgi-bin/wa?A0=TEI-L http://markmail.org/list/edu.brown.listserv.tei-l

TEI… Hilfe?!