41
Harald Lüngen Leibniz-Institut für Deutsche Sprache, Mannheim KORPUSLINGUISTISCHE ERMITTLUNG VON NEOLOGISMUSKANDIDATEN IN DEREKO Workshop Neologismen: Korpuslinguistische Ermittlung und lexikographische Bearbeitung, Leibniz-Institut für Deutsche Sprache, 3.-4. Juni 2019 1 / 48

KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngenLeibniz-InstitutfürDeutscheSprache,Mannheim

KORPUSLINGUISTISCHEERMITTLUNGVONNEOLOGISMUSKANDIDATENINDEREKOWorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutsche

Sprache,3.-4.Juni2019

1 / 48

Page 2: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

1.

2.

3.

4.

Einleitung

QuantitativeMethodezurNeologismendetektion

AktuelleAnwendungderquantitativenMethode

FazitundAusblick

ÜBERBLICK

2 / 48

Page 3: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

1.EINLEITUNG

3 / 48

Page 4: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

KOOPERATION

4 / 48

Page 5: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

NeologismenwörterbuchdesProjektsNeuerWortschatz(AbteilungLexik)

MethodenderNeologismendetektiondesProjektsMethodenderKorpusanalyseund-erschließung(AbteilungDigitaleSprachwissenschaft)

KOOPERATION

5 / 48

Page 6: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

Exklusionslisten

FrequenzbasierteKeywordAnalysisBedingungenüberZeitverläufe(Voraussetzung:Zeit-annotierteKorpora)

ÜberwachtesMaschinellesLernen

KombinierteVerfahren

KORPUSLINGUISTISCHEMETHODENzurDetektionvonNeologismen,angelehntanFalketal.(2014)

6 / 48

Page 7: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

AufteilunginDekadenNeologismender90er-Jahre

Neologismender00er-Jahre

Neologismender10er-Jahre

BESONDERHEITENDESIDS-NEOLOGISMENWÖRTERBUCHSHerberg/Kinne/Steffens(2004),Steffens/al-Wadi(2015),Klosa-Kückelhaus(2019)

7 / 48

Page 8: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

“LexikalischeEinheitbzw.neueBedeutungeineretabliertenlexikalischenEinheit,dieineinembestimmtenAbschnittderSprachentwicklunginderKommunikationsgemeinschaftaufkommt,sichausbreitetundalssprachlicheNormallgemeinakzeptiertwird.”

BESONDERHEITENDESIDS-NEOLOGISMENWÖRTERBUCHSNeologismendefinition(vgl.Steffens/al-Wadi2015)

8 / 48

Page 9: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

“LexikalischeEinheitbzw.neueBedeutungeineretabliertenlexikalischenEinheit,dieineinembestimmtenAbschnittderSprachentwicklunginderKommunikationsgemeinschaftaufkommt,sichausbreitetundalssprachlicheNormallgemeinakzeptiertwird.”

BESONDERHEITENDESIDS-NEOLOGISMENWÖRTERBUCHSNeologismendefinition(vgl.Steffens/al-Wadi2015)

9 / 48

Page 10: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

NeueForm+neueBedeutungpostfaktisch,inderPipeline,-gate

EtablierteForm+neueBedeutungunterirdisch,liefern

ERSCHEINUNGSFORMEN

10 / 48

Page 11: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

2.QUANTITATIVEMETHODEZUR

NEOLOGISMENDETEKTION

11 / 48

Page 12: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

1. Grundlage:ZweiTeilkorpora,diediezweiunmittelbaraufeinanderfolgendenZeiträumeAundBrepräsentieren

2. JahresbezogeneFrequenzlistenausA+B

3. Cleaning

QUANTITATIVEMETHODE(KEIBELETAL.2010)zurErmittlungvonNeulexemkandidatenausDeReKo

12 / 48

Page 13: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

4. IdentifikationallerWortformen,dieeinenfürNeologismentypischenZeitverlaufaufweisen(komplexesquantitativesKriterium)

➞ ersteKandidatenlisteK

QUANTITATIVEMETHODE(KEIBELETAL.2010)KomplexesquantitativesKriterium

13 / 48

Page 14: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

QUANTITATIVEMETHODE(KEIBELETAL.2010)ZeitverlaufeinesNeologismus

14 / 48

Page 15: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

TEILKRITERIUMKURZFORM

BEDEUTUNG SETTING

minFreq MindestfrequenzfimGesamtkorpus

f=20

minSinceFirstOcc Mindestensg*AnzahlderJahreseitdemerstenAuftreten

g=7

minSinceMaxYear Mindestensh*JahreVorkommenseitdemJahrmitdemmaximalenAusschlag

h=15

maxFreqA maximalVorkommenimZeitraumA i=5

maxYearFreqA InkeinemJahrimZeitraumAmehr j=4

QUANTITATIVEMETHODE(KEIBELETAL.2010)KomplexesquantitativesKriterium

15 / 48

Page 16: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

6. PartitionierungdesGesamtkorpusinsechsRegionalkorpora(DE-N,DE-O,DE-S,DE-SW,AT,CH),dann

fürjedeWortformkinK:enfernek,wennesnureinegeringeDisperson(dp>Schwellwert)überdieRegionalkorporaaufweist(MaßfürDispersion:deviationofproportionsnachGrieß2008)

➞ KandidatenlisteK’

QUANTITATIVEMETHODE(KEIBELETAL.2010)FilterungvonRegionalismen

16 / 48

Page 17: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

1. fürjedeWortformk’inK’:ermittleNKWIC-ZeilenausdemPressekorpus(derzeitN=100)

führeNERaufdiesenKWIC-Zeilendurch(StanfordNER/Finkeletal.2005)

WenndiekombinierteWahrscheinlichkeit,dasskeinNameist,überSchwellwertliegt,dannentfernek’

➞ finaleKandidatenlisteK’’

QUANTITATIVEMETHODE(KEIBELETAL.2010)FilterungvonNamen

17 / 48

Page 18: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

3.AKTUELLEANWENDUNGDERQUANTITATIVEN

METHODE

18 / 48

Page 19: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

29PressequellenausD,AT,CH

Ausgabenab2001

deckendenSprachraumunddiesechsSprachregionenrechtgleichmäßigab

deckenjeweilsdieJahre2001-2018nahezudurchgängigab

Größe:7,35MilliardenTokens(Stand=(05/2019)

DATENGRUNDLAGEAusgewähltePressequelleninDeReKo-2019-I(Datenbis12/2018)

19 / 48

Page 20: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

(TEIL-)KORPUS ZEITRAUM #WORTFORMEN-TYPES

DekadeA 2001-2010 12.847.728

DekadeB 2011-2018 10.851.718

GesamtkorpusA+B 2001-2018 18.316.093

AKTUELLEANWENDUNG2019A

20 / 48

Page 21: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

6581Wortformen

Gerankt,alsTabellemitweiterenAngaben

ERGEBNIS:NEOLOGISMEN-KANDIDATENLISTE2019A

21 / 48

Page 22: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

KANDIDATENLISTEAUSDERANWENDUNG2019A

22 / 48

Page 23: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

KANDIDATENLISTEAUSDERANWENDUNG2019A

23 / 48

Page 24: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

KANDIDATENLISTEAUSDERANWENDUNG2019A

24 / 48

Page 25: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

KANDIDATENLISTEAUSDERANWENDUNG2019A

25 / 48

Page 26: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

KANDIDATENLISTEAUSDERANWENDUNG2019A

26 / 48

Page 27: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

KANDIDATENLISTEAUSDERANWENDUNG2019A

27 / 48

Page 28: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

KANDIDATENLISTEAUSDERANWENDUNG2019A

28 / 48

Page 29: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

DasersteJahrmitderEigenschaft,dassindiesemJahrunddemVorjahrmindestenszweiVorkommengefundenwurden

GibteskeinsolchesJahr,dannsetzedasJahrnachdemEndedesKorpusBalstechnischesAufkommen(inderaktuellenAnwendungalso2019)

“TECHNISCHES”AUFKOMMEN(Keibeletal.2010)

29 / 48

Page 30: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

KANDIDATENLISTEAUSDERANWENDUNG2019A

30 / 48

Page 31: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

KANDIDATENLISTEAUSDERANWENDUNG2019A

31 / 48

Page 32: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

MeTooNowitschokAnkerzentrenDieselgipfelGelbwestenDigitalsteuerKohlekommissionFortniteSkripalsChekatt

NetzwerkdurchsetzungsgesetzKavanaughsUmtauschprämienBlacKkKlansmanNetzDGMeTwoSmallfootRusslandaffäreKruschelnizkiDilrosunZygierFlixtrainAnkerzentrumDeeskalationszonenLukebakioJiankuiMangkhutMatetaLunapharmNimmerbiesteisigartigesPlastiksteuerBrückenteilzeitPloggingHonigspieleKuciaksChaschukdschiWohngipfel

OvertourismMigrationspaktsICOsgiletsmetooWiseauSagitowaBoschirowArmoushAluminiumimporteDümmehr

Deeskalationszone

KANDIDATENLISTEAUSDERANWENDUNG2019ADieersten50KandidatenmittechnischemAufkommen2018oder2019

32 / 48

Page 33: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

SelfiesNowitschokAnkerzentrenGelbwestenDieselfahrverboteSenvionMusterfeststellungsklage

DigitalsteuerGrundverordnungKohlekommissionFortniteAustrittsabkommenSkripalsNeonikotinoideLandeserstaufnahmestelleChekattLoah

NetzwerkdurchsetzungsgesetzKavanaughsIitateWaldbadenAustrittsvertragDigitalpaktVetementsUmtauschprämienRechtsstaatsverfahrenInfluencernInfluencerinDigitalwährungenLochisBlacKkKlansman

CrossbackEssureLayenbergerRedaktionsnetzwerkNetzDGMeTwoSmallfootStrabsAbbiegeassistenten

MietenwahnsinnChiasamenGenschereWintzheimer

KANDIDATENLISTEAUSDERANWENDUNG2019ADieersten44Kandidaten,dieinKandidatenliste2018berstaufPlatz500+odergarnichterschienenwaren

33 / 48

Page 34: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

RESULT-SETKandidatenliste2018A(Datenbis2017),6557Wortformen

REFERENCE-SETWort-undGrundformenlistedesNeologismenwörterbuchsausOWIDinkl.NeubedeutungenundMWEs

Stand01/2018

1043Wortformen,153Grundformen

=Stichwörter+Flektionsformen+Schreibvarianten+Wortbildungsprodukte+sinnverwandteAusdrücke

FORMALEEVALUATION

34 / 48

Page 35: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

TruePositives 91(54Grundformen)

Precision(Wortformen) 91/6557

Recall(Grundformen) 54/153 35%

PRECISIONUNDRECALL

35 / 48

Page 36: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

FILTER # GEFILTERTEALSGRUNDFORMEN

NOTINCORPUSORCLEANED

16 3-D-DruckerButtonlösungDoodlelisteEntscheidungslösungESMFreistoßsprayFukushima-EffektGapyearJahnbehördePflege-BahrPop-up-RestaurantQR-CodeRepaircaféSeniorazubiStadtgärtnernVERAH-Mobil

MINFREQ 6* CoworkingspaceentfolgenGuerillastrickenPushnachrichtStrickgraffitoVöner

QUANTFILTER 58* aufpoppenBestellbuttonBezahlschrankeBubble-TeaChiaClickworkerdampfenDampferDoodleEnergiearmutentfreundenFacebookpartyFemenaktivistinFingerwischFlexitarierFotobombeFrutarierGaragengoldGettofaustGlampingGooglebrilleHashtagHochfrequenzhandelHomestagingHugoHygieneampelInklusionsklasseKachelKampfradlerKeniakoalitionKillerroboterKinesiotapeKryptohandyLeoLikeLoopLoopschalmerkelnMerkelrauteMingleNetzparteiPaywallPinkifizierungPop-upSextingShapewearSpoilerSpotted-SeiteStreetfoodStrickguerillastromernTofutierTunnelUpcyclingVeggietagVERAHwhatsappenwischen

REGIONALISM 1* Memoriamgarten

NAME 18* AntänzerArabellionBFDBitcoinBlockupyBRICSBufdiCakepopCrowdworkingCybergroomingEmojiGroKoKryptopartyOccupybewegungSuperfoodVatileaksVeggiedayWhatsapp

FALSCH-NEGATIVEDurchwelchenFilterschrittwurdendieFalsch-Negativenentfernt?

36 / 48

Page 37: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

4.FAZITUNDAUSBLICK

37 / 48

Page 38: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

FortsetzungderKooperationmitProjektNeuerWortschatz

TuningdesquantitativenKriteriumsmitdenaktuellenKorpora

Experimentierumgebung

EinbeziehungvonCMC-Korpora/Webkorpora

ErmittlungvonMWEsundNeubedeutungen

ErmittlungvonKurzzeitwörtern

FAZITUNDAUSBLICK

38 / 48

Page 39: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

VIELENDANKFÜRIHREAUFMERKSAMKEIT!

39 / 48

Page 40: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

Falk,I.,Dernhard,D.&Gérard,C.(2014):FromNonWordtoNewWord:AutomaticallyidentifyingNeologismsinFrenchNewspapers.InProceedingsoftheInternationalConferenceonLanguageResourcesandEvaluation,LREC,The9theditionoftheLanguageResourcesandEvaluationConference,May2014,Reykjavik,Iceland.

Gries,StefanTh.(2008):Dispersionsandadjustedfrequenciesincorpora.InInternationalJournalofCorpusLinguistics,13(4),pp.403-437.

Herberg,D.,Kinne,M.&Steffens,D.(2004).NeuerWortschatz.Neologismender90erJahreimDeutschen.IncollaborationwithE.TellenbachandD.al-Wadi.Berlin/NewYork:deGruyter.

Keibel,H.,Hennig,S.&Perkuhn,R.(2010):EffizientehalbautomatischeDetektionvonNeologismuskandidaten.TechnicalReportIDS-KL-2010-01.Mannheim:InstitutfürDeutscheSprache.

Klosa-Kückelhaus,A.(2019):NeuerWortschatz.In:Eichinger,LudwigM./Plewnia,Albrecht(Hrsg.): .Empirisch–methodisch–theoretisch.JahrbuchdesInstitutsfürDeutscheSprache2018.(= 2018).Berlin/Boston:deGruyter,2019.S.355-357.

Kupietz,M.&Lüngen,H.&Kamocki,P.&Witt,A.(2018):TheGermanReferenceCorpusDeReKo:NewDevelopments–NewOpportunities.In:Calzolari,Nicolettaetal.(Hrsg.):ProceedingsoftheEleventhInternationalConferenceonLanguageResourcesandEvaluation(LREC2018).Miyazaki:EuropeanLanguageResourcesAssociation(ELRA),2018.S.4353-4360

Steffens,D.,al-Wadi,D.(2015):NeuerWortschatz.NeologismenimDeutschen2001-2010.Mannheim:InstitutfürDeutscheSprache.

NeuesvomheutigenDeutschJahrbuchdesInstitutsfürDeutscheSprache

LITERATUR

40 / 48

Page 41: KORPUSLINGUISTISCHE ERMITTLUNG VON … · 10/48 Harald Lüngen · Korpuslinguistische Ermittlung von Neologismuskandidaten in DeReKo · Workshop Neologismen: Korpuslinguistische Ermittlung

HaraldLüngen·KorpuslinguistischeErmittlungvonNeologismuskandidateninDeReKo·WorkshopNeologismen:KorpuslinguistischeErmittlungundlexikographischeBearbeitung,Leibniz-InstitutfürDeutscheSprache,3.-4.Juni2019

M-SCORE(Keibeletal.2010)

41 / 48