80
Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de Kollokationsdatenbanken für das Sprachlernen Alexander Geyken - BBAW Università Cattolica del Sacro Cuore Brescia, Dipartimento di Scienze linguistiche e letterature straniere, Vortrag am 23-10-2014

Kollokationsdatenbanken für das Sprachlernen · grauen Tag und eine graue Woche und einen grauen Monat FEUCHTW. Tag 78; In Dresden ging der graue Alltag wieder los R ENN Kindheit

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Kollokationsdatenbanken für das

Sprachlernen

Alexander Geyken - BBAW

Università Cattolica del Sacro Cuore Brescia,

Dipartimento di Scienze linguistiche e

letterature straniere,

Vortrag am 23-10-2014

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Gliederung

1. Hintergrund & DWDS-Informationssystem

2. Wortprofil: die Kollokationsdatenbank des

DWDS

3. Anwendungen des Wortprofils

a. Argumentstellen werden gefüllt und

Verwendungspräferenzen werden gefunden

b. Beschreibung naher Synonyme

4. Neue Webplattform: alpha.dwds.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Gebäude der BBAW

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

BBAW - Geschichtliches

• Gegründet im Jahre 1700 (Leibniz)

• Internationale Anerkennung als Preußische

Akademie der Wissenschaften

• Unter ihren Mitgliedern waren: Kant, Grimm,

Humboldt, Planck, Einstein…

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

BBAW - heute

• größte außeruniversitäre Forschungseinrichtung

mit einem geistes- und sozialwissenschaftlichen

Profil in der Region Berlin.

– internationale Vereinigung von Wissenschaftlern:

Akademiemitglieder

– Knapp 30 Langzeitprojekte

– organisiert in Clustern: Zentrum Sprache, Zentrum

Alte Welt, Preußen

– Editionen, Wörterbücher, Textsammlungen

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Hintergrund

Solche Societät [Kurfürstlich-Brandenburgische

Societät der Wissenschaften] müßte nicht auf

bloße Curiosität und Wißbegierde und

unfruchtbare Experimente gerichtet sein, oder

bei der bloßen Erfindung nützlicher Dinge ohne

Application und Anbringung beruhen, […],

sondern man müßte gleich anfangs das Werk

sammt der Wissenschaft auf Nutzen richten.

(Leibniz, Denkschrift an den Kurfürsten, 1700)

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

DWDS-Projekt: Ziele

• Ziel: Aufbau eines lexikalischen

Auskunftssystems der deutschen Sprache in

Geschichte und Gegenwart

• Förderzeitraum: 2007-2025

• Anwendungsbezogenheit:

– Nutzung von computerlinguistischen/lexikologischen

Forschungsergebnissen

– Frühe Verfügbarkeit der Ergebnisse: frei über das

Internet

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

(A) Über 410 000 Wörterbucheinträge aus 5

Wörterbuchquellen

Grimmsches Wörterbuch, Etymolog. Wörterbuch,

WDG …

(B) 2,5 Milliarden Korpusbelege aus 15 Korpora

Kernkorpus 20. Jh, Zeitungen (Bild, FAZ, SZ, Welt,

Zeit), Wendekorpus …

(C) Statistische Auswertungen

Wortverlaufskurven, Wortprofile

Drei Pfeiler des DWDS-Projekts

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Die Website: www.dwds.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

www.dwds.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

www.dwds.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

www.dwds.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

www.dwds.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

www.dwds.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

www.dwds.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

www.dwds.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Gliederung

1. Hintergrund & DWDS-Informationssystem

2. Wortprofil: die Kollokationsdatenbank des

DWDS

3. Anwendungen des Wortprofils

a. Argumentstellen werden gefüllt und

Verwendungspräferenzen werden gefunden

b. Beschreibung naher Synonyme

4. Neue Webplattform: alpha.dwds.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

2. Wortprofil und Kollokationen

• Wortprofil ist eine große Datenbank, in der

Kollokationen zu etwa 100.000 Wörtern

gespeichert sind

• Begriff der Kollokation

– Firth 1957: „you shall know a word by the company it

keeps“

– Sinclair 1991: "idiom principle": when we speak or

write, we make use of semi-preconstructed phrases,

and these account for fluency in speech, with

grammar being used as a fall-back resource when we

run out of suitable semi-preconstructed phrases.

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

2. Wortprofil und Kollokationen

– Hausmann 2007: Kollokationen sind „normtypische

Verbindungen, die aus einer Basis und einem

Kollokator bestehen. Die Basis ist ein Wort, das ohne

Kotext definiert, gelernt und übersetzt werden kann.

Der Kollokator ist ein Wort, das beim Formulieren in

Abhängigkeit von der Basis gewählt wird und das

folglich nicht ohne die Basis definiert, gelernt und

übersetzt werden kann“.

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Beispiele für Kollokationen

• etatmäßiger Libero (der in der

Stammmannschaft auf der Position des Liberos

spielt)

• ins Tor drücken (für einen Ball, der aus kurzer

Entfernung ins Tor geschossen wird)

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Beispiele für Kollokationen

Kollokationen haben oft andere Übersetzungen

• Den Ausgleichstreffer erzielen, en: score an

equalizer; fr: égaliser

• ein Tor per Kopf erzielen; head a goal; marquer

de la tête;

• starker Raucher, heavy smoker, grand fumeur

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Kollokationen und Frequenz

• Sinclair (1966): Significant collocation is a

regular collocation between two items, such that

they co-occur more often than their respective

frequencies.

• Church & Hanks (1989): nutzen erstmals

Korpora, um Kollokationen daraus zu

“errechnen”.

• Basisidee: wenn zwei Wörter A und B

“überzufällig” häufig miteinander auftreten, sind

sie ein Kandidat für eine Kollokation

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Wortprofil - Methode

(1) Extraktion der Relationen

Angst – SUBJEKT – aufessen

Seele – OBJEKT – aufessen

aufessen – hat SUBJEKT – Angst

aufessen – hat OBJEKT – Seele

(2) Aufsummieren + statistische Signifikanz

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Wortprofil – ein komplexeres Beispiel

Jeder Aspekt des Vertrags von Rom sowie

der im Anschluß an seine

Unterzeichnung getroffenen

Entscheidung und alle Folgen und

Auswirkungen, die ein britischer Beitritt

nach sich ziehen dürfte, sind von allen

Seiten beleuchtet worden.

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

3. Wortprofil - Methode

Jeder Aspekt des Vertrags von Rom sowie der im Anschluß an seine Unterzeichnung

getroffenen Entscheidung und alle Folgen und Auswirkungen, die ein britischer

Beitritt nach sich ziehen dürfte, sind von allen Seiten beleuchtet worden.

• Aspekt – passive-clause_subject_of – beleuchten

• jeder – determiner_of ­– Aspekt

• Vertrag – genitive_attribute_of – Aspekt

• beleuchten – has_passive-clause_subject – Aspekt

• Aspekt – has_determinier – jeder

• Aspekt – has_genitive_attribute – Vertrag

• Aspekt – noun_coordination – Folge

• Aspekt – noun_coordination – Auswirkung

• Folge – noun_coordination – Aspekt

• Auswirkung – noun_coordination – Aspekt

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

3. Wortprofil - Methode

Automatische Analyse nicht immer möglich, daher

Filterkriterien für Wörter in syntaktischen

Relationen

– Sätze dürfen kein für die morph. Analyse

unbekanntes Wort haben

– Sätze gültig, wenn Großschreibung am Satzanfang

und wohldefiniertes Satzende.

– Wortprofilwörter müssen in einer analysierbaren

Phrase stehen

– Nomen müssen einen Determinierer besitzen

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

3. Wortprofil - Zahlen

• Korpusgröße: 1,7 Milliarden laufende Wortformen

(Grundlage: DWDS-Korpora)

• verschiedene Wortverbindungen (Tupel): 11.975.986 – Beispiel: [ schick(Adj), Kleid(Nomen), Adjektivattribut]

• Sätze mit mind. einer relevanten (statistisch salienten)

Wortverbindung: 466.005.198 (249.078.149 nach Filter)

• Anzahl abfragbarer Wörter (mit >= 1 sal. Tupel): 92.542 – genauer gesagt werden Paare aus Lemma und Wortart abgefragt; Beispiel:

schick,Adjektiv; Schick,Substantiv; schick,Verb - Imperativ)

• Anzahl syntaktischer Relationen: 12 (Adj-Nomen,

Subjekt-Verb, Verb-Objekt, Verb-Adverb…)

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Zeitung Wortformen Sätze Dokumente

SZ 454 Millionen 29 Millionen 1,09 Millionen

ZEIT 417 24 0,5

BZ 242 16 0,87

WELT 238 16 0,6

Tagesspiegel 184 10 0,4

Kernkorpus 125 7 0,079

Bild 121 12 0,54

Gesamt 1,78 Mrd 114 4,1

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

3. Wortprofil - Zahlen

• Relationsname Fundstellen in den Korpora

• Infinitivobjekt 5.341.150

• Beiordnung 29.041.024

• Genitivattribut 26.106.231

• Aktiv-Subjekt 63.161.919

• Passiv-Subjekt 5.673.062

• Akkusativobjekt 36.696.468 • Dativobjekt 6.380.605

• prädikative Ergänzung 8.668.697

• adverbialer Modifikator 75.697.355

• Adjektivattribut 84.735.054 • vergleichende Konjunktion 4.562.914

• Präpositionalphrase 110.392.845

• Verbzusatz 9.547.874

• Summe: 466.005.198

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

3. Wortprofil

Vergleichbare Arbeiten

Kilgarriff (2002-2012): word sketch (für über 10

Sprachen, auch Webkorpus für Deutsch,

andere Grammatik)

Wortschatz Uni Leipzig: nur statistische

Verfahren

Duden: Statistik + lokale linguistische

Analyseverfahren (Duden Website)

Heid et al. (2008). Etwa wie Wortprofil, aber

nicht im Internet publiziert

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Very large corpora: the sketch engine

Website: http://www.sketchengine.co.uk/

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Sketch engine vs. DWDS

Sketch engine

• Concordance lines

• Word sketches

• Sketch diff

• Thesaurus

• Mehrsprachige Korpora

• Webkorpora (dt: 2,5 Mrd)

• Statistik: logDice

DWDS

• Concordance lines

• Wortprofile

• Wortprofil-Vergleich

• -

• Nur deutsch

• Zeitungskorpora (2 Mrd)

• Statistik: logDice

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

T-score vs MI vs Dice – ex. break

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Statistik in Wortprofil: logDice

Lit.: Rychly, Pavel (2008) A lexicographer-friendly association score. In Sojka, P. & Horák, A. (eds.) Proceedings of

Second Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2008, 6-9. Brno:

Masaryk University.

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Wortprofil vs. Wörterbuch (WDG)

grau /Adj./ 1. /Mischfarbe aus Schwarz und Weiß/ die g. Haut des Elefanten; g. wie eine Maus; ein g.

Stoff, Kostüm; eine g. Uniform; er hat g. Augen; g. Gestein; g. Mauern; Am grauen Strand, am

grauen Meer /Und seitab liegt die Stadt STORM 8,194; g. Rauch-, Regenwolken; der Himmel ist

ganz g.; g. Frühlicht; Grau ist"s immer, wenn ein Morgen naht BRECHT Gedichte 278; /sprichw./

bei Nacht sind alle Katzen g. (nachts erkennt man keine äußerlichen Unterschiede) ein helles,

dunkles, düsteres, bleiches, kaltes, fahles, farbloses Grau; das Grau der Regenwolken; das Blau

des Himmels ging in Weiß und Grau über; eine Bluse in Grau; die Dame in Grau; sie kam in Grau,

bevorzugt die Farbe Grau; vgl. Grauchen 2. farblos, bleich a) durch zunehmendes Alter: g. Haar;

eine g. Haarsträhne; Sie hatte bereits einen grauen Scheitel G. HAUPTM. 4,552; ein g. Bart;

Achtung vor einem g. Haupte (einem alten Menschen) haben sein g. Haar färben; alt und g.

werden; er ist in Erhren g. geworden; der g. Star (krankhafte Trübung der Linse im Auge) /bildl./

umg. darüber, deshalb brauchst du dir keine g. Haare wachsen zu lassen (darüber brauchst du dir

keine Sorgen zu machen) b) durch Blutleere: ein g. Gesicht; mein mageres graues Gesicht und

die Trostlosigkeit meines Blickes BÖLL Wort 12; eine g. Gesichtsfarbe; Der alte Mann wurde ganz

grau im Gesicht BRECHT Dreigroschenroman 296; Sie starrte mich grau vor Haß an MARCHWITZA

Jugend 248 3. /übertr./ trostlos, trübe, öde: Es hieß warten, einen grauen Morgen und einen

grauen Tag und eine graue Woche und einen grauen Monat FEUCHTW. Tag 78; In Dresden ging

der graue Alltag wieder los RENN Kindheit 23; Grau, teurer Freund, ist alle Theorie GOETHE Faust I

2038; ihr erschien die Welt g. und öde; umg. scherzh. das g. Elend kriegen (sich tief unglücklich

fühlen, zeigen)⌝ ich kann das Grau in Grau unserer Nachkriegsepoche auf die Dauer nicht

aushalten G. HAUPTM. Sonnenuntergang I 4. weit zurückliegend, längst vergangen: in g. Vorzeit;

im g. Altertum, Mittelalter; vor g. Jahren, Zeiten; 5. unbestimmt, ungewiß: das liegt noch in g.

Ferne, Zukunft

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Wortprofil vs. Wörterbuch

WP;-WDG(sal. > 10)

• graue Eminenz

• graue Maus (fehlt im übertragenen Sinne; es gibt nur unter Lesart 1: grau wie eine

Maus)

• grauer Kapitalmarkt,

• graue Schläfen

• grauer Pfandbriefmarkt (i.S.v. geschlossener Fonds)

• Graue Ackerschnecke (limax agrestis)

• graue Zellen

• Ferner fehlen folgende Eigennamen-Kontexte:

• graue Panther (politische Partei) (sal 24,99)

• graue Wölfe (extremistische politische Gruppierung), 19,84

• graues Kloster (Gymnasium in Berlin)

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Wortprofil vs. Wörterbuch

• WP;-WDG (sal. > 5)

• graues Einerlei,

• graues Umweltpapier,

• graue Asche (von Toten oder von verbranntem Material),

• graue Habenzinsen (auf dem nicht freien Kapitalmarkt),

• grauer Markt,

• grauer Haarkranz

• grauer Nadelstreifen

• Sowie Adjektiv Modifizierer: schütteres graues Haar graues Einerlei,

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Wortprofil vs. Wörterbuch

• -WP;+WDG

• Stoff => dafür in WP: Flanell (sal=20,63), Flanellkleid, -hose, -anzug; Wolle, Sakko,

Anzug etc.

• Phrasen: g. wie eine Maus; dafür aber in WP das wesentlich häufiger gebrauchte:

graue Maus (Arminia Bielefeld hat schon seit ein paar Jahren den Ruf als "graue

Maus" der Liga weg. 2008-12-26, Zeitung:ZEIT))

• Gesichtsfarbe: selten, nur 3 Belege (1 Kernkorpus, 2 ZEIT) i.S.v. "schlecht aussehen,

z.B. Hinzu kommt der körperliche Verfall: graue Gesichtsfarbe , vorzeitiges Altern

(Altern. Kokain ist eine harte Droge. (ZEIT))

• vor Haß (nur ein Lit.-Beleg Marchwitza): Kern/ZEIT gar nicht! auch im Web nur 1

Treffer (WDG): Sie starrte mich grau vor Haß an Marchwitza Jugend 248

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Wortprofil vs. Wörterbuch

• -WP;+WDG

• Goethe: grau, treuer Freund, ist alle Theorie -- nur indirekt über grau Theorie (f=140,

s>=10,25), aber dafür Belege mit anderen Konstruktionen, z.B.

• Das Ethos ist kein Istzustand, es ist ein Sollzustand, trotzdem nicht graue Theorie,

sondern eine sehr praktische Sache.

• Und jede Eröffnungsvorbereitung graue Theorie sein lässt.

• Dass dies keine graue Theorie ist, zeigt ein Fall in den USA.

• Alles graue Theorie, die uns Winzer in die Illegalität treibt.

• Doch wie sich zeigte, blieb das graue Theorie.

• Leider ist dieser Lichtblick bis heute graue Theorie geblieben.

• Es spukt allenfalls in der grauen Theorie herum.

• Zwar wird gesagt, eine zweijährige „ Fütterung mit grauer Theorie" hieße so junge

Menschen überfordern — aber diese Annahme ist graue Theorie.

• Die Betriebshandelsspanne erweist sich, nämlich, als graue Theorie.

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Wortprofil vs. Wörterbuch

• Wörterbücher deuten mit Beispielen gewisse typische Kontexte zu einer

syntaktischen Relation an

• Beispiel: grau meliert im Duden (GWDS)

• g. melierte Schläfen; sein Haar war inzwischen g. meliert, was seine Erscheinung

noch würdevoller machte (Danella, Hotel 30)

• Wortprofil (verdeutlicht pos. Konnotation des Trägers in versch. Kontexten):

• Doch heute ist in der Mitte der riesigen Halle keine Eisfläche, sondern eine Bühne aufgebaut, der

Star des Abends war kein dick gepanzerter Athlet, sondern ein grau melierter Herr, und es ging

hier nicht um Tore, sondern um Politik.

• Oder dass man gute Kunden zum Essen in einen der sechs Speisesäle einlädt, wo grau melierte

Kellner auf Kosten des Hauses schon mal einen Grand Cru entkorken. (ZEIT, 31.10.2001)

• Eduardo Montes ist ein stolzer Mann. Grau meliertes Haar, hellblaues Maßhemd, fein gepunktete

Krawatte – fast zu elegant für sein profanes Chefzimmer in der Hofmannstraße.

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Gliederung

1. Hintergrund & DWDS-Informationssystem

2. Wortprofil: die Kollokationsdatenbank des

DWDS

3. Anwendungen des Wortprofils

a. Argumentstellen werden gefüllt und

Verwendungspräferenzen werden gefunden

b. Beschreibung naher Synonyme

4. Neue Webplattform: alpha.dwds.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

3. Anwendungen des Wortprofils

• Vor allem unter dem Druck der elektronischen Corpora begreift die

Linguistik in den letzten 50 Jahren zunehmend, in welchem Ausmaß

der Wortschatz phraseologisch geprägt ist ... Damit kommt sie der

Erfahrung des Fremdsprachlers entgegen, der immer schon merkte,

dass er viel mehr lernen muss als Wörter. (Hausmann 2006, S. 226)

• Was kann man alles begehen?

• Was ist alles schmal?

• Kann man eine Lüge begehen?

(Hausmann 2006, S. 218)

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

3a. Argumentstellen und

Verwendungspräferenzen

Anmerkung: Ehepaar wurde vom Syntaxparser fälschlicherweise

als Obj. klassifiziert; in den Belegen ist es immer Subj

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

3a. Argumentstellen und

Verwendungspräferenzen

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

• Grundidee: Nahe Synonyme haben

vergleichbare/ähnliche syntagmatische

Umgebungen

• Beispiele

– bekanntgeben / verkünden

– Kind / Kid

4b. Nahe Synonyme

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

bekanntgeben vs. verkünden

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

bekanntgeben vs. verkünden

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

bekanntgeben vs. verkünden

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

bekanntgeben vs. verkünden

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

bekanntgeben vs. verkünden

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

bekanntgeben vs. verkünden

Frequenz mit verkünden: 1128, mit

bekanntgeben: 27

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

verkünden vs bekanntgeben (sketch

engine;(WebKorpus deTenTen; 2,5 Mrd. Wörter)

10/24/2014

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

verkünden vs bekanntgeben

(sketch engine)

Square – Dativ Relation

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Verkünden + Square (sketch engine

Konkordanzen: fälschlicherweise als Dativ markiert,

eigentlich aber Subjekt

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Kind vs. Kid

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Kind vs. Kid

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Kind vs. Kid

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Kind vs. Kid

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Kind vs. Kid

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Kind vs. Kid

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Gliederung

1. Hintergrund & DWDS-Informationssystem

2. Wortprofil: die Kollokationsdatenbank des

DWDS

3. Anwendungen des Wortprofils

a. Argumentstellen werden gefüllt und

Verwendungspräferenzen werden gefunden

b. Beschreibung naher Synonyme

4. Neue Webplattform: alpha.dwds.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

4. Neue Webplattform (alpha-Version)

• Durch Kooperation mit Duden: ca. 50.000 neue

Stichwörter (GWDS, 1999)

– 15.000 integriert (seit 14.10.2014)

– 35.000 weitere Einträge (bis April 2015)

• Wortprofil: eine neue Ansicht

• Wortverlaufskurven über 4 Jahrhunderte

Grundlage: Referenzkorpus des Deutschen Textarchivs

www.deutschestextarchiv.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

4. Neue Webplattform

• Neue Veröffentlichungsplattform:

http://alpha.dwds.de

• Registrierung und Anmeldung unter:

– http://alpha.dwds.de/login

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Wörterbuchansicht (WDG + Duden)

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Wörterbuchartikel aus dem Duden

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Lexikalisches System: WDG „Plus“

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Lexikalisches System: WDG „Plus“

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Typische Verbindungen - Überblick

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Etymologische Informationen

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Wortverlauf über 400 Jahrhunderte

- www.deutschestextarchiv.de -

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Titel des Deutschen Textarchivs

auch im ebook-Format:

www.deutschestextarchiv.de

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

Zusammenfassung

Kollokationsdatenbank: DWDS-Wortprofil

– Anwendungsgebiet: Sprachproduktion

– Wichtige Ergänzung zu Wörterbüchern für die

Sprachproduktion

– Auswahl der Korpora entscheidet über die Qualität

der Ergebnisse

Berlin-Brandenburgische Akademie der Wissenschaften • Jägerstrasse 22/23 • 10117 Berlin www.bbaw.de

• www.dwds.de

• alpha.dwds.de

– Registrierung und Anmeldung unter:

http://alpha.dwds.de/login

• www.deutschestextarchiv.de

Webseiten zum DWDS/DTA