21
U NIVERSIT ¨ AT H EIDELBERG I NSTITUT F ¨ UR C OMPUTERLINGUISTIK E INF ¨ UHRUNG IN DIE KORPUSLINGUISTIK HAUSARBEIT Anglizismen und ihre deutschen Entsprechungen Eine korpusbasierte Analyse des Verdeutschungsprozesses anhand ausgew¨ ahlter Beispiele aus der Informatik Vor- & Zuname Victor Z IMMERMANN * Note 1.7 Studienfach Computerlinguistik, 2. Fachsemester, B.A. Betreuer Dipl.-Inform. Rainer P ERKUHN Dr. Marc KUPIETZ * [email protected] 2017-09-26 Sommer 2017

Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

UNIVERSITAT HEIDELBERGINSTITUT FUR COMPUTERLINGUISTIK

EINFUHRUNG IN DIE KORPUSLINGUISTIK

HAUSARBEIT

Anglizismen und ihre deutschen EntsprechungenEine korpusbasierte Analyse des Verdeutschungsprozesses anhand

ausgewahlter Beispiele aus der Informatik

Vor- & Zuname

Victor ZIMMERMANN∗

Note

1.7

Studienfach

Computerlinguistik,2. Fachsemester, B.A.

Betreuer

Dipl.-Inform. Rainer PERKUHN

Dr. Marc KUPIETZ

[email protected]

2017-09-26Sommer 2017

Page 2: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

Inhaltsverzeichnis

1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

2 Methodik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

2.1 Begriffspaare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

2.2 Korpus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

2.3 Varianten und Haufigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . 3

2.4 Zeitverlauf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2.5 Thematische Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

3 Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

3.1 Varianten und Haufigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . 5

3.1.1 Computer und Rechner . . . . . . . . . . . . . . . . . . . . . . . . 5

3.1.2 User und Benutzer . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

3.1.3 Interface und Benutzeroberflache . . . . . . . . . . . . . . . . . . . 6

3.2 Zeitverlauf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

3.2.1 Computer und Rechner . . . . . . . . . . . . . . . . . . . . . . . . 7

3.2.2 User und Benutzer . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

3.2.3 Interface und Benutzeroberflache . . . . . . . . . . . . . . . . . . . 9

3.3 Thematische Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

3.3.1 Computer und Rechner . . . . . . . . . . . . . . . . . . . . . . . . 10

3.3.2 User und Benutzer . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

3.3.3 Interface und Benutzeroberflache . . . . . . . . . . . . . . . . . . . 12

4 Auswertung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

4.1 Sinkende Haufigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

4.2 Verdeutschung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

4.2.1 Akzeptanz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

4.2.2 Relevanz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

5 Fazit und Reflexion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

5.1 Methodik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

5.2 Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

ii

Page 3: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

1 Einleitung

In der deutschen Sprache haben sich durch eine Reihe an englischen Vokabeln aus

der Informatik Quasi-Synonympaare mit deutschen Begriffen gebildet, die Untersu-

chungsgegenstand dieser Hausarbeit sein sollen. Die Informatik ist eine interessante

Datengrundlage, da durch die relativ kurzliche Addition des Vokabulars zum deutschen

Wortschatz noch immer eine Parallelverwendung der entlehnten englischen Begriffe und

deutschen Entsprechungen existiert.

Zu untersuchen gilt vor allem, ob es unter den ausgewahlten Paaren eine Tendenz

hin zum Anglizismus gibt, ob es einen allgemeinen An- oder Abstieg von informatischen

Begriffen im Sprachgebrauch1 gibt und ob und in welchem Ausmaß allgemeine Unter-

schiede zwischen der Nutzung von Anglizismen und ihren deutschen Entsprechungen

existieren.

Um dies zu erreichen, wird die Haufigkeit und Varietat ausgewahlter Beispiele (Com-puter, User und Interface) im heutigen Sprachgebrauch sowie historisch dargestellt und

die Begriffe thematisch aufgeschlusselt und verglichen. Zudem werden aus dieser Da-

tengrundlage allgemeine Entwicklungen und Ahnlichkeiten zwischen den Wortpaaren

hergeleitet.

Abschließend werden die Analyseergebnisse zusammengefasst, uber die Methodik reflek-

tiert und mogliche Ansatze fur eine tiefer- und weitergehende Analyse geboten.

2 Methodik

2.1 Begriffspaare

Als Untersuchungsgegenstand eignen sich vor allem Paare, die sowohl quasi-synonym 2

sind als auch nur eine geringe Ambiguitat aufweisen3.

Untersucht werden unter Rucksicht auf diese Gesichtspunkte die Begriffspaare:

• Computer und Rechner

• User und Benutzer

• Interface und Benutzeroberflache.

1Da DeReKo hauptsachlich aus Zeitungsquellen besteht, ist vielmehr das Ausmaß der Berichterstattunguber die ausgewahlten Begriffe Untersuchungsgegenstand als der allgemeine Sprachgebrauch.

2Vgl. Perkuhn et al. (2012, S. 136)3I.e. Web und Netz mogen vielleicht synonym genutzt werden, allerdings besitzt Netz ebenfalls eine

erweiterte Bedeutung.

KL | VERDEUTSCHUNG 1

Page 4: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

Zudem werden die Variationen PC, Benutzer und Benutzeroberflache nach Verteilung,

zeitlicher und regionaler Einordnung4 untersucht. Benutzeroberflache wird zum Vergleich

mit Benutzer untersucht, obwohl diese Schreibweise keine statistische Relevanz aufweist5.

Um moglichst eindeutige Synonyme mit moglichst wenig abweichenden Lexemen zu

gewahrleisten, wird Benutzer anstelle von Nutzer und Benutzeroberflache im Gegensatz

zu Oberflache betrachtet. Benutzeroberflache wird zum besseren Vergleich mit Benutzerebenfalls gegenuber Nutzeroberflache bevorzugt, obwohl bei letzterem Begriff nicht die

gleiche Ambiguitat wie bei Nutzer auftritt.

2.2 Korpus

Als Grundlage der Recherche dient ein nicht-technisches Korpus, welches mittels Cosmas

II aus dem Deutschen Referenzkorpus (DeReKo-2017-I)6 fur diese Hausarbeit zusammen-

gestellt wurde. Dieses nicht-technische Korpus umfasst das DeReKo-Gesamtkorpus mit

Ausnahme folgender Quellen:

• Wikipedia (2011)

• COMPUTER ZEITUNG (1993-1998)

• Gebrauchsanleitungen (1960-1974)

• Lufthansa Bordbuch (dt.) (1995-1997)

All diese Korpora weisen Abweichungen fur mindestens eines der zu betrachtenden

Worte auf. Dies fuhrt zu einer uberproportionalen Reprasentation der zu untersuchenden

Begriffe in weiten Teilen der Analyse. Bei der Betrachtung des Zeitverlaufs fuhrt die

nicht kontinuierliche Inklusion dieser Quellen im Gesamtkorpus7 zudem dazu, dass,

uber einen großeren Betrachtungsrahmen, deutliche Ausreißer und Extreme vorkom-

men. Ein Gesamtkorpus ohne diese vier Quellen fuhrt zu einer gleichmaßigeren und

naturlichsprachlicheren Datengrundlage.

Texte Worter Korpora

Nicht-technisches Korpus 24618645 6818551425 631

W-offentlich 27277392 7647570408 640

Tabelle 1: Nicht-technisches Korpus in Zahlen

4Nur fur Benutzer, siehe Abb. 25Siehe Tab. 46IDS. 2017b. Deutsches referenzkorpus / archiv der korpora geschriebener gegenwartssprache. Release

vom 08.03.20177Im Gesamtkorpus sind lediglich Quellen aus der deutschen Wikipedia fur das Jahr 2011 vorhanden.

KL | VERDEUTSCHUNG 2

Page 5: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

Das gewahlte nicht-technische Korpus umfasst somit insgesamt 10.2464% weniger Texte,

11.4615% weniger Worte und 1.41621% weniger Korpora als das Gesamtkorpus ’W-

offentlich’.

2.3 Varianten und Haufigkeiten

Die Varianten der zu untersuchenden Begriffe und deren Haufigkeiten werden mit-

tels des Cosmas II-Webdienstes8 des Instituts fur Deutsche Sprache ermittelt. Folgende

Einstellungen werden fur die Ermittlung der Varianten und Haufigkeiten verwendet:

• Groß-/Kleinschreibung beachten fur 1. Zeichen

Es sollen lediglich deutschsprachige Formulierungen evaluiert werden, daher wer-

den nur Treffer verwendet, in denen das gesuchte Wort kapitalisiert wird. Da es sich

bei samtlichen betrachteten Worten um Nomen handelt, wird hier die Großschrei-

bung dieser im Deutschen ausgenutzt. Durch diese Sortierung werden eventuelle

englischsprachige Zitate aus der Ergebnismenge gefiltert.

• Keine Begrenzung der Ergebnismenge

• Lemmatisierung: Flexionsformen

Bei zwei der zu untersuchenden Paare(Computer/Rechner, User/Benutzer) lasst sich

morphologisch keine Pluralform feststellen. Daher, um auch einen Vergleich zwi-

schen den Paaren zu ermoglichen, wird eine Lemmatisierung nach Flexionsformen

vorgenommen.

• Prozentuale Verteilung der Texte

• Prozentuale Verteilung der Worter

• Haufigkeitsmaß: Relative Haufigkeit in Prozent

Der Begriff Variante wurde bewusst an Stelle von Schreibweise gewahlt, da gezielt

verschiedene Worte verglichen werden sollen, welche das gleiche Lexem beschreiben,

was sowohl Abkurzungen (PC), Regionalismen (Benutzer) als auch Anglizismen umfassen

soll.

2.4 Zeitverlauf

Der Zeitverlauf der zu untersuchenden Begriffe wird ebenfalls mittels COSMAS II ermit-

telt. Die Suchanfrage nutzt dieselben Einstellungen wie zuvor bei der Haufigkeitsermittlung.

Fur diese Anfragen werden die Ergebnisse nach Jahren ausgegeben. Untersucht werden

8IDS. 2017a. Cosmas ii web. cosmas2.ids-mannheim.de/cosmas2-web

KL | VERDEUTSCHUNG 3

Page 6: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

die Begriffe zwischen den Jahren 1967 und 2016.

Das Korpus weist fur verschiedene Jahre eine stark variierende Große auf 9. Daher wird

relative Haufigkeit als Maßstab genutzt, um zwischen den Jahren vergleichende Angaben

machen zu konnen.

Abbildung 1: Wortumfang des Korpusarchivs des Instituts fur Deutsche Sprache inMannheim nach Jahr

Bis einschließlich 2013 umfasst das Korpus weniger als 7 Milliarden Worter (i.G.z.

uber 29 Milliarden Wortern 2017) (IDS, 2017c). Durch die Restriktion auf ein nicht-

technisches Korpus entfallen zudem große Teile der fur die Hausarbeit relevanten Daten

zu Gunsten einer ausgeglicheneren Datengrundlage. Dadurch konnen einzelne Ereignisse

starke Ausreißer im Zeitverlauf verursachen 10.

2.5 Thematische Verteilung

Die thematische Verteilung wird uber die Kookkurrenzdatenbank CCDB (Belica, 2001 ff),

unter Verwendung von Contrasting Near-Synonyms (CNS), ermittelt. Diese vergleicht

Quasi-Synonympaare auf Basis von sogenannten SOM-Karten11, welche zu einem unter-

suchten Wort ahnliche Begriffe12 thematisch clustern (Belica, 1995). Bei CNS werden

diese Ahnlichkeitskarten zweier Begriffe verglichen und die resultierende Karte entspre-

chend ihrer Ahnlichkeit zum jeweiligen Begriff visuell reprasentiert (rot-gelber gradueller

Farbverlauf).

9Siehe Abb. 110Siehe Abb. 511Self-Organizing Lexical Feature Maps12Die Ahnlichkeit wird anhand von Kookkurrenzprofilen errechnet.

KL | VERDEUTSCHUNG 4

Page 7: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

3 Ergebnisse

3.1 Varianten und Haufigkeiten

3.1.1 Computer und Rechner

Sowohl Computer als auch Rechner beschreiben laut Duden eine ’elektronische Rechenan-

lage’ (Dudenredaktion 2017a, Dudenredaktion 2017b), PC (Personal Computer) ist eine

Abkurzung und Konkretisierung von Computer, namlich ein solcher, welcher in einem

privaten Umfang verwendet wird. In der Umgangssprache wird letzterer Begriff aller-

dings synonym zu den zuvor Genannten genutzt, was ihn als Vergleichsobjekt interessant

macht.

Treffer rel. Hauf. Texte Korpora

Computer 287862 0.004222% 204694 597

Rechner 47201 0.000692% 34515 615

PC 72221 0.001061% 52678 557

Tabelle 2: Verteilung im Gesamtkorpus nach Variante: Computer, Rechner, PC

Computer ist, sowohl konkret als auch allgemein, haufiger im Korpus vorhanden als seine

deutsche Entsprechung Rechner, wobei Computer sowohl relativ als auch absolut etwa

vier mal haufiger vorkommt als PC und sechs mal haufiger als Rechner.Alle Varianten kommen in den meisten Korpora vor13. Rechner tritt in mehr Korpora

als die anderen Begriffe auf, obwohl es sich um die seltenste Variante handelt. Dies

konnte darauf zuruckzufuhren sein, dass es sich bei DeReKo hauptsachlich um einen

Zeitungskorpus handelt und Anglizismen von ausgewahlten Publikationen (evt. uber

einen gewissen Zeitraum) gemieden werden konnten. PC trat in Deutschland erst wirklich

in der Mitte der 1980er auf14, wodurch er in fruheren Korpora selbstverstandlich fehlt.

3.1.2 User und Benutzer

Sowohl User als auch Benutzer sind Personen, die etwas nutzen. Da User allerdings aus

dem Englischen mit einer eingeschrankten Bedeutung (Computernutzer, seltener Drogen-

nutzer) entlehnt wurde, handelt es sich bei User im Grunde um eine konkretere Variante

des Begriffes Benutzer. In der Kookkurrenzanalyse mit Contrasting Near-Synonyms15 zeigt

sich jedoch, dass Benutzer analog zu User fast ausschließlich in einem informatischen

Kontext gebraucht wird.

13Siehe Tab. 114Siehe Abb. 315Siehe Abb. 7

KL | VERDEUTSCHUNG 5

Page 8: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

Abbildung 2: Regionale Verteilung in Prozent nach Land und Variante: User, Benutzer,Benutzer

Der Begriff Benutzer ist ein Regionalismus16, welcher hauptsachlich in Osterreich und der

deutschsprachigen Schweiz benutzt wird. Dementsprechend kommt dieser Begriff auch

lediglich in 232 Korpora vor, gegenuber den uberregionalen Begriffen User und Benutzer.Zudem ist auffallig, dass Luxemburg und Osterreich User gegenuber Benutzer bevorzugen,

wahrend Benutzer in deutschen und schweizer Publikationen haufiger auftritt.

Treffer rel. Hauf. Texte Korpora

User 15391 0.000226% 11830 526

Benutzer 22321 0.000327% 18770 596

Benutzer 3709 0.000054% 3428 232

Tabelle 3: Verteilung im Gesamtkorpus nach Variante: User, Benutzer, Benutzer

Wie auch zwischen Computer und Rechner, wird der Anglizismus in weniger Korpora

verwendet als seine deutsche Entsprechung, was in diesem Fall allerdings auch auf das

geringere Vorkommen des Anglizismus im Gesamtkorpus zuruckgefuhrt werden konnte.

3.1.3 Interface und Benutzeroberflache

Interface und Benutzeroberflache beschreiben einen sichtbaren Teil einer Anwendung,

welche dem Endnutzer dient, Befehle an das Programm zu erteilen und Informationen

abzurufen.

Zum Vergleich mit dem Regionalismus Benutzer wurde zusatzlich Benutzeroberflacheuntersucht, hat allerdings nur 6 Ergebnisse geliefert. Dieses Fehlen an relevanten Kom-

posita weist darauf hin, dass Benutzer nicht im gleichen Kontext wie Benutzer, sondern

16Siehe Abb. 2

KL | VERDEUTSCHUNG 6

Page 9: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

vielmehr in nicht-informatischen Kontexten wie z.B. dem Straßenverkehr17 verwendet

wird und es sich beim Paar Benutzer/Benutzer nicht um echte Synonyme handelt.

Treffer rel. Hauf. Texte Korpora

Interface 1788 0.000026% 1498 368

Benutzeroberflache 2285 0.000034% 2014 408

Benutzeroberflache 6 0.000000% 6 6

Tabelle 4: Verteilung im Gesamtkorpus nach Variante: Interface, Benutzeroberflache,Benutzeroberflache

Interface und Benutzeroberflache kommen nur selten im Korpus vor, was im Vergleich

zu den anderen untersuchten Quasi-Synonympaaren auf die inhaltliche Tiefe dieser

Begriffe zuruckzufuhren ist. Sowohl Benutzer als auch Rechner sind konkrete Objekte,

wahrend eine Benutzeroberflache lediglich ein Element einer Softwareimplementierung

ist. Beide Begriffe kommen ahnlich haufig im Korpus vor, die Abweichung ist aufgrund

der geringen Stichprobengroße nicht sinnvoll zu bewerten.

3.2 Zeitverlauf

Trotz einer immer großer werdenden Prasenz von Computern in der Lebensrealitat der

deutschen Bevolkerung sinkt der Anteil der meisten zu untersuchenden Begriffe im

Korpus ab der Jahrtausendwende. Der Heimrechner verliert an Relevanz gegenuber

Enthullungen neuer Smartphones und Entwicklung abstrakterer Felder der Informatik

wie kunstlicher Intelligenz.

3.2.1 Computer und Rechner

Der Zeitverlauf fur Computer weist zwei großere Ausreißer 1979 und 1984 auf, welche

jeweils mit der Veroffentlichung des Atari 800-Computers 1979 und des Apple Macintoshs1984 zusammenfallen. Nach dem Jahr 2000 und dem ’Y2K Bug’ sinkt die mediale

Aufmerksamkeit am Computer.

17Eine Kookkurrenzanalyse mit der CCDBBelica (2001 ff) zeigt, dass Benutzer zwar vereinzelt im selbenKontext wie Benutzer, Benutzer aber nur sehr selten im informatischen Kontext genutzt wird.

KL | VERDEUTSCHUNG 7

Page 10: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

Abbildung 3: Relative Haufigkeit in Prozent nach Jahr: Computer, Rechner, PC

Der Graph fur Rechner weist ahnliche Hohen und Tiefen wie Computer auf, nur in klei-

nerer Auspragung. Nachdem er Mitte der 1980er zum ersten Mal vermehrt aufkommt,

wird PC 1991 als Begriff haufiger gebraucht als Rechner, worauf sich die beiden Graphen

bis 2015 wieder angleichen.

3.2.2 User und Benutzer

Obwohl Benutzer bereits zu Beginn des Untersuchungszeitraums im Sprachgebrauch zu

finden ist, findet sich der Regionalismus Benutzer erst ab 1990, bleibt zehn Jahre prasent

und fallt darauf auf ein niedrigeres Plateau zuruck.

Abbildung 4: Relative Haufigkeit in Prozent nach Jahr: User, Benutzer, Benutzer

KL | VERDEUTSCHUNG 8

Page 11: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

User tritt seit 1994 verstarkt auf, war allerdings auch zuvor vereinzelt im Korpus vor-

handen. Seit 2009 tritt User haufiger auf als die deutsche Entsprechung Benutzer. Der

Abwartstrend von Benutzer fangt, anders als bei Computer, schon vor dem Jahr 2000,

etwa um 1995, an und findet seinen Hochpunkt 1975, damals allerdings auch mit an-

deren Bedeutungen. Es ist davon auszugehen, dass die fallende Haufigkeit mit einer

Konkretisierung des Begriffs einhergeht.

User hingegen weist eine steigende Haufigkeit auf, nicht zuletzt durch einen Anstieg an

Berichterstattung uber soziale Medien, die ihre Benutzer vorzugsweise als User bezeich-

nen (i.e. ’Facebook User’).

3.2.3 Interface und Benutzeroberflache

Benutzeroberflache tritt zum ersten Mal 1989 im Korpus auf, hat 1995 einen Hochpunkt

und stabilisiert sich um die Jahrtausendwende. Interface fallt besonders durch seine drei

markanten Ausreißer 1973, 1990 und 2010 auf, welche auf ein Dreipersonenschach

namens Interface, die Hamburger Kunst- und Technologiemesse ’INTERFACE’ und eine

Kunstausstellung von Friedemann von Stockhausen zuruckzufuhren sind.

Abbildung 5: Relative Haufigkeit in Prozent nach Jahr: Interface, Benutzeroberflache

Durch die geringe Stichprobengroße18 fur Interface/Benutzeroberflache zeigt besonders

der Zeitverlauf, wie anfallig diese Datengrundlage fur Ausreißer ist und somit nur unter

Vorbehalt definitive Aussagen uber die Entwicklung des Quasi-Synonympaares getroffen

werden konnen.

18Siehe Tab. 4

KL | VERDEUTSCHUNG 9

Page 12: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

3.3 Thematische Verteilung

Es wurden bewusst Begriffspaare gewahlt, die kaum außerhalb der Informatik Verwen-

dung finden. Daraus entstehen CNS-Karten, die keine Felder außerhalb dieses Themen-

bereichs enthalten, obwohl vereinzelt durchaus solche Falle existieren19.

3.3.1 Computer und Rechner

Computer und Rechner sind von den untersuchten Quasi-Synonympaaren das ahnlichste.

Es fallen weder besonders gelbe (treten in einem analogen Kontext wie Computer auf,

weniger mit Rechner), noch besonders rote (treten in einem analogen Kontext wie Rechnerauf, weniger mit Computer) Felder auf.

Die deutlichste Unterscheidung lasst sich dadurch treffen, ob es sich um ahnliche20

oder relationierte21 Kookkurrenzpartner handelt. Im Allgemeinen gilt: Ahnliche Begriffe

tendieren zu einem analogen Kookkurrenzprofil zu Computer, relationierte Begriffe zu

einem analogen Profil zu Rechner.19Drogenabhangige werden selten auch User genannt.20Fernseher, Hersteller, Steckdose, etc.21Transistor, Treiber, Ubertragungsrate, etc.

KL | VERDEUTSCHUNG 10

Page 13: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

Abbildung 6: Contrasting Near-Synonyms: Computer, Rechner

Ebenfalls auffallig ist, dass es bei diesem Quasi-Synonympaar keine klare Aufteilung

zwischen englischen und deutschen Begriffen gibt. Der Anglizismus Cache22 ist ahnlicher

zu Rechner als zu Computer, wahrend Schreibmaschine23 ahnlicher zu Computer ist.

Komposita, in denen Computer bereits enthalten ist (i.e. Computerfirma, computergestutzt)weisen ein ahnliches Profil zu Computer auf.

3.3.2 User und Benutzer

Das Quasi-Synonympaar User/Benutzer weist eine Differenzierung zwischen Anglizismen

auf, welche tendenziell naher zu User stehen24, und deutschsprachigen Begriffen, die

22Abb. 6, rechts oben23Abb. 6, links unten24Siehe Abb. 7, rechts unten

KL | VERDEUTSCHUNG 11

Page 14: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

eher dem Kookkurrenzprofil von Benutzer entsprechen. Geschaftsbezogene Anglizismen

wie Professional sind User sehr ahnlich.

Abbildung 7: Contrasting Near-Synonyms: User, Benutzer

Peripheriegerate und andere physische Objekte stehen tendenziell eher im selben Kontext

wie Benutzer. Eine umgekehrte Aussage, also dass abstrakte Begriffe ahnlicher zu Usersind, lasst sich nicht treffen. Begriffe, die im Zusammenhang mit sozialen Netzwerken

stehen, also Network, Chatroom, etc., haben eine großere Ahnlichkeit zu User.

3.3.3 Interface und Benutzeroberflache

Interface und Benutzeroberflache weisen die großte Diskrepanz der Quasi-Synonympaare

auf. Die Trennung zwischen Anglizismen und deutschen Begriffen ist hier noch starker

als zwischen User und Benutzer.Fast alle gelben Felder in Abb. 8 bestehen aus Anglizismen, mit der Ausnahme von

Abkurzung und abgekurzt. Durch die vielen Abkurzungen, welche Interface als Bestandteil

KL | VERDEUTSCHUNG 12

Page 15: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

enthalten25, ist diese Korrelation zu erklaren. Auch Begriffe wie Hypertext (HDMI) sind

uber Abkurzungen mit Interface verbunden.

Abbildung 8: Contrasting Near-Synonyms: Interface, Benutzeroberflache

Ebenfalls auffallig ist, dass Begriffe, welche ein ahnliches Kookkurrenzprofil wie Be-nutzeroberflache aufweisen, durchschnittlich langer sind, als solche, die sehr ahnlich

zu Interface sind. Dies korreliert mit der Aufteilung in deutsche Begriffe und englische

Lehnworter.

25I.e. HDMI, API, GUI

KL | VERDEUTSCHUNG 13

Page 16: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

4 Auswertung

4.1 Sinkende Haufigkeit

Abgesehen von User weisen samtliche untersuchten Begriffe ein sinkende relative

Haufigkeit auf. Da es sich bei DeReKo hauptsachlich um einen Zeitungskorpus han-

delt, konnte man aus diesen Daten einen Abfall in medialer Aufmerksamkeit fur Rechner

und benachbarte Themen ableiten. Wahrend uber neue Smartphones und soziale Medien

weiterhin stark berichtet wird, sind medienwirksame Durchbruche und Nachrichten

uber Computer selbst seltener geworden. Als Ausnahme sind die groß inszenierten

Apple-Konferenzen zu nennen, allerdings vermarktet dieser Konzern seine Computer

als ’Mac’, wodurch auch solche Medienereignisse nur wenig Auswirkungen auf diese

Ergebnisse nehmen sollten. Es benotigt eine breitere Suche uber technische Begriffe, um

festzustellen, ob es sich bei diesem Gefalle um einen Trend im gesamten Feld oder nur

in einzelnen ausgewahlten Bereichen handelt. Dies wurde allerdings den Skopus dieser

Hausarbeit uberschreiten.

4.2 Verdeutschung

Aus der thematischen Einordnung geht hervor, dass sich die drei betrachteten Anglizis-

men in verschiedenen Stadien der Verdeutschung befinden, also der Einbinding eines

fremdsprachlichen Begriffes (in diesem Fall Anglizismen) in die deutsche Sprache. Dies

ist bei den gewahlten Beispielen vor allem durch die Aufteilung zwischen englischen und

deutschen Kookkurrenzmustern ersichtlich.

4.2.1 Akzeptanz

Computer, ein Wort das schon vor dem Untersuchungszeitraum in seiner momentanten

Bedeutung im Deutschen gebraucht wurde, ist weder ahnlicher zu englischen, noch

deutschen Begriffen. User/Benutzer hingegen sieht eine solche Verteilung, mit einem

haufigeren Auftreten von Anglizismen bei User und einem niedrigeren Auftreten bei

Benutzer. Bei Interface ist diese Aufteilung sogar noch starker, mit Anglizismen als stark

Interface zugehorig, einer kleineren Schnittmenge an Begriffen, die Ahnlichkeiten zu

beiden Begriffen zeigen und einer ebenfalls großen Menge an Begriffen deutschen Ur-

sprungs, die eine hohe Ahnlichkeit zu Benutzeroberflache zeigen.

Computer hat bereits fruh nach seinem Auftauchen in der deutschen Sprache den deut-

schen Begriff Rechner abgelost. Dies wird durch die Dominanz des Anglizismus uber den

KL | VERDEUTSCHUNG 14

Page 17: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

gesamten Untersuchungszeitraum26 bestatigt. User durchlauft einen ahnlichen Prozess,

hat in seiner Haufigkeit Benutzer aber erst 2010 uberholt27.

Interface und Benutzeroberflache sind zu selten im Korpus zu finden, um sichere Aussagen

uber deren Entwicklung zu treffen. Das Korpus ist durchzogen von Verwendungen von

Interface, die nicht direkt mit der Informatik in Verbindung stehen. Da noch immer eine

starke Korrelation zwischen dem Anglizismus und der Sprache analoger Kookkurrenzpro-

file besteht, bleibt offen, ob Interface denselben Prozess durchlaufen wird wie Computer.

Mit der thematischen Bindung eines Anglizismus an Kookkurrenzprofile anderer Fremdworter

als Maßstab fur Grade der Verdeutschung (mit Computer als Anglizismus mit hoher, Usermit maßiger und Interface mit niedriger Verdeutschung), lasst sich aus den Ergebnis-

sen der durchgefuhrten Korpussuche ableiten, dass der Grad der Verdeutschung davon

abhangt, wie lange der Begriff bereits im Wortschatz vorhanden ist. Eine Ausnahme bildet

Interface, welches etwa 10 Jahre vor User in den deutschen Wortschatz eingegangen

ist28, aber eine großere thematische Trennung zwischen englischen und deutschen Be-

griffen aufweist.29. Diese Ausnahme lasst vermuten, dass neben einem zeitlichen Aspekt

ebenfalls andere Faktoren den Prozess der Verdeutschung beschleunigen. Computer wird

bereits zu Beginn des Beobachtungszeitraumes gegenuber Rechner bevorzugt, User hat

Benutzer 2009 uberholt. Aus diesen beiden Beispielen lasst sich durchaus eine Tendenz

hin zum Anglizismus ableiten. Grund dafur konnte eine breitere Akzeptanz oder Kenntnis

englischer informatischer Begriffe sein.

Abbildung 9: Relative Haufigkeit in Prozent nach Jahr: Computer

Computer befindet sich seit 1964, mit vereinzelten Nennungen seit 1946 im Sprachge-

brauch30, User seit 199431. Es handelt sich also um 70 bzw. 22 Jahre, in denen diese26Siehe Abb. 327Nutzer wird haufiger als beide Begriffe genutzt, wurde aber in dieser Hausarbeit nicht naher untersucht.28Siehe Abb. 4 und 529Siehe Abb. 830Siehe Abb. 9, Suche basierend auf Google Books Ngram Viewer (Michel et al., 2010)31Siehe Abb. 4

KL | VERDEUTSCHUNG 15

Page 18: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

Begriffe in der deutschen Sprache genutzt werden. Dadurch wird deutlich, dass es sich

bei diesen Begriffen zumindest um Begriffe handelt, deren Bedeutung einem Großteil

der Bevolkerung bekannt ist oder zumindest eingegrenzt werden kann.

4.2.2 Relevanz

Durch einen Mangel an Relevanz fur den gewohnlichen Sprecher ist der geringe Grad an

Verdeutschung von Interface zu erklaren. Interface beschreibt ein Element einer oder die

gesamte graphische Oberflache eines Programms und ist damit deutlich weniger ’fassbar’

als die anderen untersuchten Begriffe.

Interface bleibt u.a. weiterhin in der deutschen Sprache erhalten, weil die deutsche

Entsprechung Benutzeroberflache

1. deutlich komplexer und langer als der Anglizismus und

2. junger als der Anglizismus ist.

Interface tritt seit 1972 im Korpus auf32, Benutzeroberflache allerdings erst seit 198933. Der

Begriff wird nur von einem eingeschrankten Publikum verstanden und genutzt, und ist

damit kaum außerhalb von Publikationen, die ohnehin weit mehr Fachsprache verwenden

als ubliche Medien, zu finden. Aus diesen Umstanden ergibt sich die Ahnlichkeit mit

anderen Anglizismen trotz der fruhen Einfuhrung.

Ein dem Englischen entlehnter Begriff wird nicht in seiner gesamten Bedeutungsfulle

ubernommen34. Vielmehr entspricht der Begriff zu Beginn lediglich einem Lexem in

der entlehnenden Sprache. Wenn dieses Lexem nicht relevant fur die Sprecher dieser

’Zielsprache’ ist, also nur von einer ausgewahlten Menge an Sprechern genutzt wird,

wird es als Fachbegriff in die Sprache eingehen. Der verdeutschte Anglizismus muss also

sowohl ein Konzept beschreiben, dass durch sein Auftreten als Anglizismus automatisch

restringiert ist, und dennoch ein fur den Sprecher einer Sprache so relevantes Konzept

beschreiben, dass es auch außerhalb von Fachliteratur Verwendung findet.

5 Fazit und Reflexion

Mit der praferierten Ursprungssprache der durch CNS-Karten festgestellten, zum unter-

suchten Wort ahnlichen Kookkurrenzprofile als Maßstab, ließ sich aus den gegebenen

Daten fur die Verdeutschung von Anglizismen eine Abhangigkeit von

32Allerdings auch haufig als von der Informatik unabhangiger Begriff33Siehe Abb. 534Z.B. beschreibt der Begriff ’Web’ im Englischen 23 (vgl. Online 2017), in seiner Form als Anglizismus

lediglich ein Lexem (vgl. Dudenredaktion).

KL | VERDEUTSCHUNG 16

Page 19: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

1. zeitlich restringierter Akzeptanz, und

2. thematisch restringierter Relevanz

herleiten. Je relevanter fur den gewohnlichen Sprecher ein Wort ist und je langer es sich

im Korpus befindet, desto wahrscheinlicher ist es, dass es auch in einem anderen Kontext

als andere Anglizismen verwendet wird. Im Umkehrschluss gilt daher, dass, je großer

der Grad der Verdeutschung ist, desto unahnlicher das Kookkurrenzprofil eines Begriffes

zu dem eines fremdsprachigen Begriffes ist.

Zudem zeigt sich unter den untersuchten Ergebnissen ein Abstieg in relativer Haufigkeit

der meisten Begriffe seit der Jahrtausendwende. Dies konnte allerdings auch auf die

kleine Stichprobengroße zuruckzufuhren sein, nicht zuletzt, da sich bereits unter den

untersuchten Begriffen Gegenbeispiele finden.

Auch festzustellen ist, dass sich der Anglizismus in der untersuchten Literatur durchsetzt.

Sowohl Computer als auch User weisen eine hohere relative Haufigkeit als ihre deutschen

Entsprechungen auf.

5.1 Methodik

Die Stichprobengroße war in vielen Fallen zu gering, um allgemeine Aussagen uber

Anglizismen in der Informatik treffen zu konnen. Die ausgewahlten Beispiele haben sich

gut geeignet, um Vergleiche zwischen der deutschen Entsprechung und dem Anglizismus

zu treffen, allerdings wurde, um moglichst bedeutungsgleiche Begriffe zu wahlen, nicht

immer der am haufigsten benutzte Begriff fur diese Bedeutung gewahlt. So ubertrifft

Nutzer sowohl User als auch Benutzer, wurde aber aufgrund der weiteren Bedeutung

nicht analysiert.

Begriffe wie Computer gehen auf das Ende des zweiten Weltkrieges zuruck, sind da-

mit allerdings in ihrem Ursprung nicht mehr im Korpus enthalten. Um dennoch einen

Vergleich zu ziehen, musste auf Google Books Ngram Viewer zuruckgegriffen werden,

dessen Ergebnisse deutlich weniger modular sind als solche, die durch Cosmas II erzielt

wurden.

Interface und Benutzeroberflache haben sich nicht als geeignete Untersuchungsgegenstande

herausgestellt. Benutzeroberflache weist ahnliche Problematiken wie Benutzer auf, hat zu-

dem ebenfalls die Schreibweise Oberflache, die auch andere Bedeutungen aufweist. Diese

Komplexitat wurde zu Beginn der Analyse nicht ausreichend eingeschatzt. Zudem sind

beide Begriffe nur selten im Korpus vertreten, weisen selbst mit dem eingeschrankten

Korpus noch viele Ausreißer auf und sind damit nur sehr vorsichtig zu klassifizieren.

Das nicht-technische Korpus hat sich geeignet, die meisten Ausreißer, vorausgesetzt

eine große Datengrundlage, aus der Suche auszuschließen. Allerdings wird durch den

KL | VERDEUTSCHUNG 17

Page 20: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

Ausschluss der großten informatischen Korpusquellen auch die untersuchte Datenmenge

stark eingeschrankt.

5.2 Ausblick

Weiterhin zu untersuchen gilt, ob die hier festgestellten Tendenzen auch uber ein weite-

res Feld an informatischen Begriffen oder Anglizismen gultig sind. Es ist vor allem die

Effektivitat der Ursprungssprache der Kookkurrenzpartner als Maßstab fur graduelle

Verdeutschung weiter zu erkunden.

Eine tiefere Kookkurrenzanalyse ware ebenfalls zu begrußen, um festzustellen, ob Ang-

lizismen nicht nur ahnlicher zu anderen Anglizismen sind, sondern auch haufiger mit

ihnen auftreten.

Ebenfalls wurde die Beziehung zwischen Benutzer, User und Nutzer nicht in ausrei-

chendem Maße untersucht. Nutzer wurde aufgrund seiner erweiterten Bedeutung nicht

betrachtet, ist allerdings fur die untersuchte Thematik relevant. In diesem Zusammen-

hang konnte ebenfalls Benutzer erneut untersucht werden.

KL | VERDEUTSCHUNG 18

Page 21: Anglizismen und ihre deutschen Entsprechungenzimmermann/download/zimmermann… · Rechner 47201 0.000692% 34515 615 PC 72221 0.001061% 52678 557 Tabelle 2: Verteilung im Gesamtkorpus

Literatur

Cyril Belica. 1995. Statistische kollokationsanalyse und -clustering.

Cyril Belica. 2001 ff. Kookkurrenzdatenbank ccdb. corpora.ids-mannheim.de/ccdb.

Dudenredaktion. ???? ”web” auf duden online.

http://www.duden.de/node/678917/revisions/1340744/view.

Dudenredaktion. 2017a. ”computer” auf duden online.

http://www.duden.de/node/695747/revisions/1376901/view.

Dudenredaktion. 2017b. ”rechner” auf duden online.

http://www.duden.de/node/656409/revisions/1294192/view.

IDS. 2017a. Cosmas ii web. cosmas2.ids-mannheim.de/cosmas2-web.

IDS. 2017b. Deutsches referenzkorpus / archiv der korpora geschriebener gegenwartss-

prache. Release vom 08.03.2017.

IDS. 2017c. Korpora der geschriebenen sprache / aktuelles korpusarchiv. www.ids-

mannheim.de/kl/projekte/korpora/archiv.

Jean-Baptiste Michel, Yuan Kui Shen, Aviva Presser Aiden, Adrian Veres, Matthew K.

Gray, William Brockman, The Google Books Team, Joseph P. Pickett, Dale Hoiberg, Dan

Clancy, Peter Norvig, Jon Orwant, Steven Pinker, Martin A. Nowak, and Erez Lieberman

Aiden. 2010. Quantitative analysis of culture using millions of digitized books. SciencePublished online ahead of print: 16. 12. 2010.

OED Online. 2017. ”web, n.”. www.oed.com/view/Entry/226695.

Rainer Perkuhn, Holger Keibel, and Marc Kupietz. 2012. Korpuslinguistik. UTB. Fink,

Paderborn.

KL | VERDEUTSCHUNG 19