Upload
claramond-andre
View
109
Download
4
Embed Size (px)
Citation preview
IDE Spring School 2014, Rostock Einführung in die TEIFolie 2
Wiederhohlung: Warum Texte kodieren?
um maschinenlesbar (explizit) zu machen, was vom Leser implizit verstanden wird
um Texte mit Informationen anzureichern um Texte nachzunutzen
in unterschiedlichen Formaten in unterschiedlichen Kontexten von unterschiedlichen Nutzern
IDE Spring School 2014, Rostock Einführung in die TEIFolie 3
Was ist TEI? Consortium Encoding Standard XML
Was bietet die TEI? Guidelines Werkzeuge / Tools Und mehr…
IDE Spring School 2014, Rostock Einführung in die TEIFolie 4
Die Gründung der TEI
Frühling 1987: European workshops on standardisation of historical data Herbst 1987: In the US, the NEH funds an exploratory international
workshop on the feasibility of defining "text encoding guidelines” Juni 1990: Release of the first draft (known as "P1") of the Guidelines
Vassar College, Poughkeepsie, Herbst 1987
IDE Spring School 2014, Rostock Einführung in die TEIFolie 5
TEI
“The TEI was established in 1987 to develop, maintain, and promulgate hardware- and software-independent methods for encoding humanities data in electronic form.”
“Over nearly three decades the TEI has been extraordinarily successful at achieving its objective and it is now widely used by scholarly projects and libraries around the world.”
“TEI is the de facto standard for text encoding.”
http://www.tei-c.org/
IDE Spring School 2014, Rostock Einführung in die TEIFolie 6
<Text Encoding Initiative> TEI P5 Guidelines (derzeit 1.646 Druckseiten)
http://www.tei-c.org/release/doc/tei-p5-doc/en/html/index.html Version 2.6.0. (letztes Update am 20. Januar 2014)
Tools: OxGarage: Konversion von und nach TEI ROMA: Erstellen von Schemata und Dokumentationen Stylesheets: Konversion von TEI-Dokumenten in diverse Formatvorlagen
SIGs, annual members meetings Journal: jTEI
http://journal.tei-c.org/journal/index TEI-L Mailingliste: [email protected]
Fragen von allen für alle auf allen Niveaus Mail-Archiv:
http://listserv.brown.edu/archives/cgi-bin/wa?A0=TEI-L http://markmail.org/list/edu.brown.listserv.tei-l
IDE Spring School 2014, Rostock Einführung in die TEIFolie 7
Aufgabe
Konvertiere mittels OxGarage ein Word-Dokument deiner Wahl nach TEI P5.
Öffne das Dokument im Oxygen-XML-Editor. Bestimme innerhalb des <text/>-Elements mit Hilfe der
Guidelines (Appendices) mind. 4 Elemente: Definition und Modulzugehörigkeit mind. 4 Attribute: Definition und Attributklassen
IDE Spring School 2014, Rostock Einführung in die TEIFolie 8
TEI folgt den Grundregeln von XML. TEI hat eine ‚Baumstruktur‘: ein Wurzelelement und viele descendant nodes.
Ein XML Dokument beinhaltet: Elemente, die Attribute haben können processing instructions Kommentare (begrenzt durch <!- - und - ->) entity references (begrenzt durch & und ;)
Die Zeichen < , > und & müssen immer mit < , &rgt; oder & wiedergegeben werden, wenn man sie als solche verwenden möchte.
Ein XML Dokument muss wohlgeformt und kann valide sein.
TEI ist XML
IDE Spring School 2014, Rostock Einführung in die TEIFolie 9
TEI ist XML
IDE Spring School 2014, Rostock Einführung in die TEIFolie 10
TEI Guidelines
schränken die im Prinzip unendlichen Möglichkeiten von XML ein stellen formalisierte Schemata zur Validierung von XML-Dateien
bereit
Fragen, die geklärt werden müssen: Welche Tags und Attribute werden bereitgestellt? Wie dürfen die Tags verschachtelt werden? Wie kann ich die gegebenen Möglichkeiten um eigene Regeln
erweitern?
…
IDE Spring School 2014, Rostock Einführung in die TEIFolie 11
TEI CustomizationsAnwendung und Anpassung des TEI-XML Standards
Der TEI Standard bietet mehrere hundert Elements und Attribute. Die modulare Architektur der Guidelines erlaubt Teilgruppen von TEI-
Elementen zu definieren / auszuwählen. Diese Schemata können mit Hilfe des ROMA-Tools erstellt und
modifiziert werden: http://www.tei-c.org/Roma/ oXygen XML editor kann Dokumente mit vordefinierten Schemata
verbinden, z.B.: TEI All (umfasst alle Elements, maximales Schema) TEI Bare (umfasst nur absolut notwendige Elemente) TEI Lite (umfasst alle wichtigen und am häufigsten gebrauchten
Elemente)
IDE Spring School 2014, Rostock Einführung in die TEIFolie 12
Aufgabe
Öffne im Oxygen-XML-Editor ein neues XML-TEI P5-Dokument (TEI Lite).
Ersetze die Platzhalter (Title‚ Publication information, Information about the source, Some text here) mit passenden Inhalten.
IDE Spring School 2014, Rostock Einführung in die TEIFolie 13
<?xml version="1.0" encoding="UTF-8"?><TEI> <teiHeader> <fileDesc> <titleStmt> <title>Title</title> </titleStmt> <publicationStmt> <p>Publication Information</p> </publicationStmt> <sourceDesc> <p>Information about the source</p> </sourceDesc> </fileDesc> </teiHeader> <text> <body> <p>Some text here.</p> </body> </text></TEI>
TEI ist XML
IDE Spring School 2014, Rostock Einführung in die TEIFolie 14
Machine readable transcript
Encoded text
Source
tran
scrip
tio n
enco
ding
visu
alis
atio n
eBook
database
scholarlyprinted edition
reading text (print)
Scholarly digital edition
SchemaAnalysis ModellingVisualisationPrescription
Standards (TEI, XML)
Standards (XSLT, CSS)
IDE Spring School 2014, Rostock Einführung in die TEIFolie 15
TEI Grundstruktur
Rootelement <TEI> enthält mindestens zwei Unterelemente, nämlich
<teiHeader>für Metadaten und muss immer vorhanden sein und
<text>für Texte aller Art und/oder
<sourceDoc> für genetische Edition / topographische Transkriptionen und/oder
<facsimile>für Verknüpfung mit Bildern und/oder
<fsdDecl> ‚Feature Structure Declaration‘v.a. für Textanalysen, linguistische Merkmale u.ä.
IDE Spring School 2014, Rostock Einführung in die TEIFolie 16
Der TEI-Header
<teiHeader> kann aus vier Hauptteilen bestehen:
<fileDesc> (file description)bibliographic description of the electronic text
<encodingDesc> (encoding description)description of the relation of the electronic text to its source
<profileDesc> (profile description)description of the context in which the electronic text was created, and classification information
<revisionDesc> (revision description)description of the revision history of the electronic text
N.B.: Only <fileDesc> is mantatory.
IDE Spring School 2014, Rostock Einführung in die TEIFolie 17
Grundlegende Elemente
TEI-Guidelines: 3 Elements Available in All TEI Documents
<p> (paragraph): Absatz <ab> (anonymous block): Irgendein Textblock <head> (head line): Überschrift
Außerdem: <lb/> (line break): Zeilenumbruch (z.B. wenn Zeilenumbrüche der Vorlage
mit transkribiert werden) <pb/> (page break): Seitenumbruch, normalerweise der der Vorlage
… mit @n, @type, @xml:id spezifizierbar
IDE Spring School 2014, Rostock Einführung in die TEIFolie 18
Strukturelle GliederungselementeTEI-Guidelines: 4 Default Text Structure
<div> (Division): Abschnitte im Dokumentz.B. Buch, Kapitel, einzelne Gedichte, Akte/Szenen u.ä.
Wichtige Attribute: @n (Nummerierung)
z.B. "1.1.2.a" (entweder aus der Quelle übernommen oder selbst erstellt) @type
z.B. "book", "chapter", "poem") @xml:id (eindeutiger Identifikator)
darf im gesamten Dokument nur einmalig vergeben werden muss mit einem Buchstaben beginnen (i.d.R. selbst vergeben oder automatisch
erzeugt)
IDE Spring School 2014, Rostock Einführung in die TEIFolie 19
Hervorhebung und wörtliche Rede
<hi> (highlighted) allgemeiner Tag für Hervorhebungen z.B. für kursiv, fett, g e s p e r r t etc. spezifizierbar durch @rend
<foreign>, <emph>, <distinct> verschiedene Hervorhebungsarten bzw. Markierung ‚ungewöhnlicher‘ Textteile
(Fremdsprachiges, Betonung, Archaismen etc.) <q> (quoted)
für wörtliche Rede, Fachausdrücke, „sog.“(anstelle von Anführungsstrichen)
<quote> (quotation) und <cit> (citation) für Zitate
IDE Spring School 2014, Rostock Einführung in die TEIFolie 20
Noch ein paar Elemente:
IDE Spring School 2014, Rostock Einführung in die TEIFolie 21
Warum TEI?
zum Austausch von Textdaten und Resourcen zwischen Menschen zwischen Maschinen Stichwort “Interoperabilität”
zur Intergration von Textdaten und Resourcen von unterschiedlichen Medien aus unterschiedlichen Softwareumgebungen
zur Langzeitarchivierung und -verfügbarkeit Metadaten Daten, Inhalte
IDE Spring School 2014, Rostock Einführung in die TEIFolie 22
Warum nicht TEI?
IDE Spring School 2014, Rostock Einführung in die TEIFolie 23
TEI P5 Guidelines:http://www.tei-c.org/release/doc/tei-p5-doc/en/html/index-toc.html
IDE: Folien, Mailinglist, Mitglieder TEI by Example (tutorial): http://www.tbe.kantl.be TEI @ Oxford (school material): http://tei.oucs.ox.ac.uk/Talks/;
z.B.: http://tei.oucs.ox.ac.uk/Talks/2014-01-toronto/ [email protected]
http://listserv.brown.edu/archives/cgi-bin/wa?A0=TEI-L http://markmail.org/list/edu.brown.listserv.tei-l
TEI… Hilfe?!