Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Kollokationsdatenbanken für das
Sprachlernen
Alexander Geyken - BBAW
Università Cattolica del Sacro Cuore Brescia,
Dipartimento di Scienze linguistiche e
letterature straniere,
Vortrag am 23-10-2014
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Gliederung
1. Hintergrund & DWDS-Informationssystem
2. Wortprofil: die Kollokationsdatenbank des
DWDS
3. Anwendungen des Wortprofils
a. Argumentstellen werden gefüllt und
Verwendungspräferenzen werden gefunden
b. Beschreibung naher Synonyme
4. Neue Webplattform: alpha.dwds.de
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Gebäude der BBAW
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
BBAW - Geschichtliches
• Gegründet im Jahre 1700 (Leibniz)
• Internationale Anerkennung als Preußische
Akademie der Wissenschaften
• Unter ihren Mitgliedern waren: Kant, Grimm,
Humboldt, Planck, Einstein…
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
BBAW - heute
• größte außeruniversitäre Forschungseinrichtung
mit einem geistes- und sozialwissenschaftlichen
Profil in der Region Berlin.
– internationale Vereinigung von Wissenschaftlern:
Akademiemitglieder
– Knapp 30 Langzeitprojekte
– organisiert in Clustern: Zentrum Sprache, Zentrum
Alte Welt, Preußen
– Editionen, Wörterbücher, Textsammlungen
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Hintergrund
Solche Societät [Kurfürstlich-Brandenburgische
Societät der Wissenschaften] müßte nicht auf
bloße Curiosität und Wißbegierde und
unfruchtbare Experimente gerichtet sein, oder
bei der bloßen Erfindung nützlicher Dinge ohne
Application und Anbringung beruhen, […],
sondern man müßte gleich anfangs das Werk
sammt der Wissenschaft auf Nutzen richten.
(Leibniz, Denkschrift an den Kurfürsten, 1700)
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
DWDS-Projekt: Ziele
• Ziel: Aufbau eines lexikalischen
Auskunftssystems der deutschen Sprache in
Geschichte und Gegenwart
• Förderzeitraum: 2007-2025
• Anwendungsbezogenheit:
– Nutzung von computerlinguistischen/lexikologischen
Forschungsergebnissen
– Frühe Verfügbarkeit der Ergebnisse: frei über das
Internet
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
(A) Über 410 000 Wörterbucheinträge aus 5
Wörterbuchquellen
Grimmsches Wörterbuch, Etymolog. Wörterbuch,
WDG …
(B) 2,5 Milliarden Korpusbelege aus 15 Korpora
Kernkorpus 20. Jh, Zeitungen (Bild, FAZ, SZ, Welt,
Zeit), Wendekorpus …
(C) Statistische Auswertungen
Wortverlaufskurven, Wortprofile
Drei Pfeiler des DWDS-Projekts
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Die Website: www.dwds.de
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
www.dwds.de
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
www.dwds.de
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
www.dwds.de
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
www.dwds.de
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
www.dwds.de
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
www.dwds.de
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
www.dwds.de
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Gliederung
1. Hintergrund & DWDS-Informationssystem
2. Wortprofil: die Kollokationsdatenbank des
DWDS
3. Anwendungen des Wortprofils
a. Argumentstellen werden gefüllt und
Verwendungspräferenzen werden gefunden
b. Beschreibung naher Synonyme
4. Neue Webplattform: alpha.dwds.de
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
2. Wortprofil und Kollokationen
• Wortprofil ist eine große Datenbank, in der
Kollokationen zu etwa 100.000 Wörtern
gespeichert sind
• Begriff der Kollokation
– Firth 1957: „you shall know a word by the company it
keeps“
– Sinclair 1991: "idiom principle": when we speak or
write, we make use of semi-preconstructed phrases,
and these account for fluency in speech, with
grammar being used as a fall-back resource when we
run out of suitable semi-preconstructed phrases.
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
2. Wortprofil und Kollokationen
– Hausmann 2007: Kollokationen sind „normtypische
Verbindungen, die aus einer Basis und einem
Kollokator bestehen. Die Basis ist ein Wort, das ohne
Kotext definiert, gelernt und übersetzt werden kann.
Der Kollokator ist ein Wort, das beim Formulieren in
Abhängigkeit von der Basis gewählt wird und das
folglich nicht ohne die Basis definiert, gelernt und
übersetzt werden kann“.
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Beispiele für Kollokationen
• etatmäßiger Libero (der in der
Stammmannschaft auf der Position des Liberos
spielt)
• ins Tor drücken (für einen Ball, der aus kurzer
Entfernung ins Tor geschossen wird)
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Beispiele für Kollokationen
Kollokationen haben oft andere Übersetzungen
• Den Ausgleichstreffer erzielen, en: score an
equalizer; fr: égaliser
• ein Tor per Kopf erzielen; head a goal; marquer
de la tête;
• starker Raucher, heavy smoker, grand fumeur
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Kollokationen und Frequenz
• Sinclair (1966): Significant collocation is a
regular collocation between two items, such that
they co-occur more often than their respective
frequencies.
• Church & Hanks (1989): nutzen erstmals
Korpora, um Kollokationen daraus zu
“errechnen”.
• Basisidee: wenn zwei Wörter A und B
“überzufällig” häufig miteinander auftreten, sind
sie ein Kandidat für eine Kollokation
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Wortprofil - Methode
(1) Extraktion der Relationen
Angst – SUBJEKT – aufessen
Seele – OBJEKT – aufessen
aufessen – hat SUBJEKT – Angst
aufessen – hat OBJEKT – Seele
(2) Aufsummieren + statistische Signifikanz
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Wortprofil – ein komplexeres Beispiel
Jeder Aspekt des Vertrags von Rom sowie
der im Anschluß an seine
Unterzeichnung getroffenen
Entscheidung und alle Folgen und
Auswirkungen, die ein britischer Beitritt
nach sich ziehen dürfte, sind von allen
Seiten beleuchtet worden.
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
3. Wortprofil - Methode
Jeder Aspekt des Vertrags von Rom sowie der im Anschluß an seine Unterzeichnung
getroffenen Entscheidung und alle Folgen und Auswirkungen, die ein britischer
Beitritt nach sich ziehen dürfte, sind von allen Seiten beleuchtet worden.
• Aspekt – passive-clause_subject_of – beleuchten
• jeder – determiner_of – Aspekt
• Vertrag – genitive_attribute_of – Aspekt
• beleuchten – has_passive-clause_subject – Aspekt
• Aspekt – has_determinier – jeder
• Aspekt – has_genitive_attribute – Vertrag
• Aspekt – noun_coordination – Folge
• Aspekt – noun_coordination – Auswirkung
• Folge – noun_coordination – Aspekt
• Auswirkung – noun_coordination – Aspekt
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
3. Wortprofil - Methode
Automatische Analyse nicht immer möglich, daher
Filterkriterien für Wörter in syntaktischen
Relationen
– Sätze dürfen kein für die morph. Analyse
unbekanntes Wort haben
– Sätze gültig, wenn Großschreibung am Satzanfang
und wohldefiniertes Satzende.
– Wortprofilwörter müssen in einer analysierbaren
Phrase stehen
– Nomen müssen einen Determinierer besitzen
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
3. Wortprofil - Zahlen
• Korpusgröße: 1,7 Milliarden laufende Wortformen
(Grundlage: DWDS-Korpora)
• verschiedene Wortverbindungen (Tupel): 11.975.986 – Beispiel: [ schick(Adj), Kleid(Nomen), Adjektivattribut]
• Sätze mit mind. einer relevanten (statistisch salienten)
Wortverbindung: 466.005.198 (249.078.149 nach Filter)
• Anzahl abfragbarer Wörter (mit >= 1 sal. Tupel): 92.542 – genauer gesagt werden Paare aus Lemma und Wortart abgefragt; Beispiel:
schick,Adjektiv; Schick,Substantiv; schick,Verb - Imperativ)
• Anzahl syntaktischer Relationen: 12 (Adj-Nomen,
Subjekt-Verb, Verb-Objekt, Verb-Adverb…)
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Zeitung Wortformen Sätze Dokumente
SZ 454 Millionen 29 Millionen 1,09 Millionen
ZEIT 417 24 0,5
BZ 242 16 0,87
WELT 238 16 0,6
Tagesspiegel 184 10 0,4
Kernkorpus 125 7 0,079
Bild 121 12 0,54
Gesamt 1,78 Mrd 114 4,1
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
3. Wortprofil - Zahlen
• Relationsname Fundstellen in den Korpora
• Infinitivobjekt 5.341.150
• Beiordnung 29.041.024
• Genitivattribut 26.106.231
• Aktiv-Subjekt 63.161.919
• Passiv-Subjekt 5.673.062
• Akkusativobjekt 36.696.468 • Dativobjekt 6.380.605
• prädikative Ergänzung 8.668.697
• adverbialer Modifikator 75.697.355
• Adjektivattribut 84.735.054 • vergleichende Konjunktion 4.562.914
• Präpositionalphrase 110.392.845
• Verbzusatz 9.547.874
• Summe: 466.005.198
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
3. Wortprofil
Vergleichbare Arbeiten
Kilgarriff (2002-2012): word sketch (für über 10
Sprachen, auch Webkorpus für Deutsch,
andere Grammatik)
Wortschatz Uni Leipzig: nur statistische
Verfahren
Duden: Statistik + lokale linguistische
Analyseverfahren (Duden Website)
Heid et al. (2008). Etwa wie Wortprofil, aber
nicht im Internet publiziert
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Very large corpora: the sketch engine
Website: http://www.sketchengine.co.uk/
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Sketch engine vs. DWDS
Sketch engine
• Concordance lines
• Word sketches
• Sketch diff
• Thesaurus
• Mehrsprachige Korpora
• Webkorpora (dt: 2,5 Mrd)
• Statistik: logDice
DWDS
• Concordance lines
• Wortprofile
• Wortprofil-Vergleich
• -
• Nur deutsch
• Zeitungskorpora (2 Mrd)
• Statistik: logDice
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
T-score vs MI vs Dice – ex. break
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Statistik in Wortprofil: logDice
Lit.: Rychly, Pavel (2008) A lexicographer-friendly association score. In Sojka, P. & Horák, A. (eds.) Proceedings of
Second Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2008, 6-9. Brno:
Masaryk University.
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Wortprofil vs. Wörterbuch (WDG)
grau /Adj./ 1. /Mischfarbe aus Schwarz und Weiß/ die g. Haut des Elefanten; g. wie eine Maus; ein g.
Stoff, Kostüm; eine g. Uniform; er hat g. Augen; g. Gestein; g. Mauern; Am grauen Strand, am
grauen Meer /Und seitab liegt die Stadt STORM 8,194; g. Rauch-, Regenwolken; der Himmel ist
ganz g.; g. Frühlicht; Grau ist"s immer, wenn ein Morgen naht BRECHT Gedichte 278; /sprichw./
bei Nacht sind alle Katzen g. (nachts erkennt man keine äußerlichen Unterschiede) ein helles,
dunkles, düsteres, bleiches, kaltes, fahles, farbloses Grau; das Grau der Regenwolken; das Blau
des Himmels ging in Weiß und Grau über; eine Bluse in Grau; die Dame in Grau; sie kam in Grau,
bevorzugt die Farbe Grau; vgl. Grauchen 2. farblos, bleich a) durch zunehmendes Alter: g. Haar;
eine g. Haarsträhne; Sie hatte bereits einen grauen Scheitel G. HAUPTM. 4,552; ein g. Bart;
Achtung vor einem g. Haupte (einem alten Menschen) haben sein g. Haar färben; alt und g.
werden; er ist in Erhren g. geworden; der g. Star (krankhafte Trübung der Linse im Auge) /bildl./
umg. darüber, deshalb brauchst du dir keine g. Haare wachsen zu lassen (darüber brauchst du dir
keine Sorgen zu machen) b) durch Blutleere: ein g. Gesicht; mein mageres graues Gesicht und
die Trostlosigkeit meines Blickes BÖLL Wort 12; eine g. Gesichtsfarbe; Der alte Mann wurde ganz
grau im Gesicht BRECHT Dreigroschenroman 296; Sie starrte mich grau vor Haß an MARCHWITZA
Jugend 248 3. /übertr./ trostlos, trübe, öde: Es hieß warten, einen grauen Morgen und einen
grauen Tag und eine graue Woche und einen grauen Monat FEUCHTW. Tag 78; In Dresden ging
der graue Alltag wieder los RENN Kindheit 23; Grau, teurer Freund, ist alle Theorie GOETHE Faust I
2038; ihr erschien die Welt g. und öde; umg. scherzh. das g. Elend kriegen (sich tief unglücklich
fühlen, zeigen)⌝ ich kann das Grau in Grau unserer Nachkriegsepoche auf die Dauer nicht
aushalten G. HAUPTM. Sonnenuntergang I 4. weit zurückliegend, längst vergangen: in g. Vorzeit;
im g. Altertum, Mittelalter; vor g. Jahren, Zeiten; 5. unbestimmt, ungewiß: das liegt noch in g.
Ferne, Zukunft
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Wortprofil vs. Wörterbuch
WP;-WDG(sal. > 10)
• graue Eminenz
• graue Maus (fehlt im übertragenen Sinne; es gibt nur unter Lesart 1: grau wie eine
Maus)
• grauer Kapitalmarkt,
• graue Schläfen
• grauer Pfandbriefmarkt (i.S.v. geschlossener Fonds)
• Graue Ackerschnecke (limax agrestis)
• graue Zellen
• Ferner fehlen folgende Eigennamen-Kontexte:
• graue Panther (politische Partei) (sal 24,99)
• graue Wölfe (extremistische politische Gruppierung), 19,84
• graues Kloster (Gymnasium in Berlin)
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Wortprofil vs. Wörterbuch
• WP;-WDG (sal. > 5)
• graues Einerlei,
• graues Umweltpapier,
• graue Asche (von Toten oder von verbranntem Material),
• graue Habenzinsen (auf dem nicht freien Kapitalmarkt),
• grauer Markt,
• grauer Haarkranz
• grauer Nadelstreifen
• Sowie Adjektiv Modifizierer: schütteres graues Haar graues Einerlei,
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Wortprofil vs. Wörterbuch
• -WP;+WDG
• Stoff => dafür in WP: Flanell (sal=20,63), Flanellkleid, -hose, -anzug; Wolle, Sakko,
Anzug etc.
• Phrasen: g. wie eine Maus; dafür aber in WP das wesentlich häufiger gebrauchte:
graue Maus (Arminia Bielefeld hat schon seit ein paar Jahren den Ruf als "graue
Maus" der Liga weg. 2008-12-26, Zeitung:ZEIT))
• Gesichtsfarbe: selten, nur 3 Belege (1 Kernkorpus, 2 ZEIT) i.S.v. "schlecht aussehen,
z.B. Hinzu kommt der körperliche Verfall: graue Gesichtsfarbe , vorzeitiges Altern
(Altern. Kokain ist eine harte Droge. (ZEIT))
• vor Haß (nur ein Lit.-Beleg Marchwitza): Kern/ZEIT gar nicht! auch im Web nur 1
Treffer (WDG): Sie starrte mich grau vor Haß an Marchwitza Jugend 248
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Wortprofil vs. Wörterbuch
• -WP;+WDG
• Goethe: grau, treuer Freund, ist alle Theorie -- nur indirekt über grau Theorie (f=140,
s>=10,25), aber dafür Belege mit anderen Konstruktionen, z.B.
•
• Das Ethos ist kein Istzustand, es ist ein Sollzustand, trotzdem nicht graue Theorie,
sondern eine sehr praktische Sache.
• Und jede Eröffnungsvorbereitung graue Theorie sein lässt.
• Dass dies keine graue Theorie ist, zeigt ein Fall in den USA.
• Alles graue Theorie, die uns Winzer in die Illegalität treibt.
• Doch wie sich zeigte, blieb das graue Theorie.
• Leider ist dieser Lichtblick bis heute graue Theorie geblieben.
• Es spukt allenfalls in der grauen Theorie herum.
• Zwar wird gesagt, eine zweijährige „ Fütterung mit grauer Theorie" hieße so junge
Menschen überfordern — aber diese Annahme ist graue Theorie.
• Die Betriebshandelsspanne erweist sich, nämlich, als graue Theorie.
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Wortprofil vs. Wörterbuch
• Wörterbücher deuten mit Beispielen gewisse typische Kontexte zu einer
syntaktischen Relation an
• Beispiel: grau meliert im Duden (GWDS)
• g. melierte Schläfen; sein Haar war inzwischen g. meliert, was seine Erscheinung
noch würdevoller machte (Danella, Hotel 30)
• Wortprofil (verdeutlicht pos. Konnotation des Trägers in versch. Kontexten):
• Doch heute ist in der Mitte der riesigen Halle keine Eisfläche, sondern eine Bühne aufgebaut, der
Star des Abends war kein dick gepanzerter Athlet, sondern ein grau melierter Herr, und es ging
hier nicht um Tore, sondern um Politik.
• Oder dass man gute Kunden zum Essen in einen der sechs Speisesäle einlädt, wo grau melierte
Kellner auf Kosten des Hauses schon mal einen Grand Cru entkorken. (ZEIT, 31.10.2001)
• Eduardo Montes ist ein stolzer Mann. Grau meliertes Haar, hellblaues Maßhemd, fein gepunktete
Krawatte – fast zu elegant für sein profanes Chefzimmer in der Hofmannstraße.
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Gliederung
1. Hintergrund & DWDS-Informationssystem
2. Wortprofil: die Kollokationsdatenbank des
DWDS
3. Anwendungen des Wortprofils
a. Argumentstellen werden gefüllt und
Verwendungspräferenzen werden gefunden
b. Beschreibung naher Synonyme
4. Neue Webplattform: alpha.dwds.de
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
3. Anwendungen des Wortprofils
• Vor allem unter dem Druck der elektronischen Corpora begreift die
Linguistik in den letzten 50 Jahren zunehmend, in welchem Ausmaß
der Wortschatz phraseologisch geprägt ist ... Damit kommt sie der
Erfahrung des Fremdsprachlers entgegen, der immer schon merkte,
dass er viel mehr lernen muss als Wörter. (Hausmann 2006, S. 226)
• Was kann man alles begehen?
• Was ist alles schmal?
• Kann man eine Lüge begehen?
(Hausmann 2006, S. 218)
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
3a. Argumentstellen und
Verwendungspräferenzen
Anmerkung: Ehepaar wurde vom Syntaxparser fälschlicherweise
als Obj. klassifiziert; in den Belegen ist es immer Subj
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
3a. Argumentstellen und
Verwendungspräferenzen
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
• Grundidee: Nahe Synonyme haben
vergleichbare/ähnliche syntagmatische
Umgebungen
• Beispiele
– bekanntgeben / verkünden
– Kind / Kid
4b. Nahe Synonyme
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
bekanntgeben vs. verkünden
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
bekanntgeben vs. verkünden
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
bekanntgeben vs. verkünden
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
bekanntgeben vs. verkünden
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
bekanntgeben vs. verkünden
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
bekanntgeben vs. verkünden
Frequenz mit verkünden: 1128, mit
bekanntgeben: 27
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
verkünden vs bekanntgeben (sketch
engine;(WebKorpus deTenTen; 2,5 Mrd. Wörter)
10/24/2014
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
verkünden vs bekanntgeben
(sketch engine)
Square – Dativ Relation
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Verkünden + Square (sketch engine
Konkordanzen: fälschlicherweise als Dativ markiert,
eigentlich aber Subjekt
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Kind vs. Kid
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Kind vs. Kid
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Kind vs. Kid
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Kind vs. Kid
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Kind vs. Kid
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Kind vs. Kid
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Gliederung
1. Hintergrund & DWDS-Informationssystem
2. Wortprofil: die Kollokationsdatenbank des
DWDS
3. Anwendungen des Wortprofils
a. Argumentstellen werden gefüllt und
Verwendungspräferenzen werden gefunden
b. Beschreibung naher Synonyme
4. Neue Webplattform: alpha.dwds.de
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
4. Neue Webplattform (alpha-Version)
• Durch Kooperation mit Duden: ca. 50.000 neue
Stichwörter (GWDS, 1999)
– 15.000 integriert (seit 14.10.2014)
– 35.000 weitere Einträge (bis April 2015)
• Wortprofil: eine neue Ansicht
• Wortverlaufskurven über 4 Jahrhunderte
Grundlage: Referenzkorpus des Deutschen Textarchivs
www.deutschestextarchiv.de
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
4. Neue Webplattform
• Neue Veröffentlichungsplattform:
http://alpha.dwds.de
• Registrierung und Anmeldung unter:
– http://alpha.dwds.de/login
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Wörterbuchansicht (WDG + Duden)
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Wörterbuchartikel aus dem Duden
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Lexikalisches System: WDG „Plus“
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Lexikalisches System: WDG „Plus“
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Typische Verbindungen - Überblick
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Etymologische Informationen
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Wortverlauf über 400 Jahrhunderte
- www.deutschestextarchiv.de -
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Titel des Deutschen Textarchivs
auch im ebook-Format:
www.deutschestextarchiv.de
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
Zusammenfassung
Kollokationsdatenbank: DWDS-Wortprofil
– Anwendungsgebiet: Sprachproduktion
– Wichtige Ergänzung zu Wörterbüchern für die
Sprachproduktion
– Auswahl der Korpora entscheidet über die Qualität
der Ergebnisse
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de
• www.dwds.de
• alpha.dwds.de
– Registrierung und Anmeldung unter:
http://alpha.dwds.de/login
• www.deutschestextarchiv.de
Webseiten zum DWDS/DTA