22
Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University Language and Information Engineering (JULIE) Lab, Germany

Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

Embed Size (px)

Citation preview

Page 1: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

Computerlinguistik und Nachbarwissenschaften:

Sprache in unterschiedlichendisziplinären Kontexten

Proseminar im Sommersemester 2009

Udo Hahn

Jena University Language and Information Engineering (JULIE) Lab, Germany

Page 2: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

2

Allgemeine Hinweise

• Seminar: MO, 10-12h SR 103 (FG-27)

– Materialien im Netz– http://www.julielab.de/

„Students“

• Sprechstunde: MO, 14-15h R 004 (FG 30)

• Email: [email protected] • Fachliteratur (fast) nur in Englisch

Page 3: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

3

Bitte ...

• ... Handies ausschalten

• ... Kein Picknick

Page 4: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

4

Leistungsnachweis• Mündlicher Vortrag

– ca. 1 Stunde– Lektüre (ca. 50-150 Seiten)– Powerpoint-Präsentation– Handout

• Schriftliches Referat– Ca. 20 Seiten (+/- 2 Seiten)– Standardformat für Zeichengröße, Rand etc.– formale Standards beachten

• Deckblatt, Inhaltsverzeichnis, Gliederung, Bibliografie

– Startliteratur wird vorgegeben, eigene Recherchen– „Kontextualisierung“, Eigenleistungen erwünscht– Abgabe: spätestens eine Woche nach dem Ende der

letzten Lehrveranstaltung

Page 5: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

5

Ziele des Seminars

• Sprache im Kontext verschiedener Disziplinen

• Eingrenzung (nicht Abgrenzung!) durch unterschiedliche Perspektiven

• Verständnis für den Gegenstandsbereich der Computer-Linguistik

Page 6: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

6

Sprache in anderen Diszplinen• Geisteswissenschaften

– Philosophie– Literaturwissenschaft– Geschichte– Politik

• Sozialwissenschaften– Soziologie– Psychologie/Kognitionswissenschaft– Pädagogik

• Naturwissenschaften– Biologie– Medizin– Physik

• Metawissenschaften– Mathematik– Informatik– Informationswissenschaft

• Linguistik

Page 7: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

7

Philosophie

• Erkenntnistheorie (Sprachbindung?)• Begriffsbildung, Begriffswandel• Sprachphilosophie

– Objektebene vs. Metaebene: reden über (N)Sprache in einer (N)Sprache

• Wahrheitscharakter von Aussagen: formale Logik

• Rhetorik: persuasive Rede

Page 8: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

8

Literaturwissenschaft

• Alltagssprache – Literatursprache• Ästhetik vs. Profanität• Durchbrechung von (Sprach-)Normen

und Erwartungen– Ästhetisierung– Humor, Witz

• Textsorten (Textgenres)– Roman, Novelle, Lyrik– Zeitungstext, Fachtext– Brief, Email, SMS, Blog

Page 9: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

9

Geschichte

• Synchrone vs. diachrone Sprach-beschreibung

• Sprachwandel– lexikalisch– syntaktisch

• Sprachgeschichte und Sprach(en)politik

Page 10: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

10

Politik• Sprachpolitik

– Nationalsprachen– „Sprachregelungen“ für Feindbilder,

Systemabgrenzungen

• Ideologien und ihr Sprachrepertoire– lexikalisch, phrastisch (Slogans)– Bsp: Sprache des Dritten Reiches

• „Korrekte“ Sprache: definitionsgeleitete Kulturhoheit– Bsp: „Neger“, „Behinderter“, „Student“

• Hochemotionale Lexik– Bsp: „Faschist“, „Nazi“, „Jude“,

„Kommunist“, „Liberal“ [USA]

Page 11: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

11

Soziologie• Soziale Codes: (Unter/Ober)Schichtsprachen• Jargons

– Jugendsprache u.a. Partikularsprachen (Jäger,…,Betriebswirte)• Spracheninterferenz

– Latinismen, Anglismen („Denglisch“)• Mediensprache: Wirkung von Sprache auf

Einstellungen und Meinungen– Werbesprache (Bsp: „Geiz ist geil“)– Qualitätspresse (Zeit, FAZ, NYT) vs. Boulevard-Presse (Bild,

Sun) vs. Yellow Press• Sprachkontakt (sog. „Ausländer {D,E,F,…}“)• Hochsprache vs. Dialekt• Regionalsprachen

– Bsp: „Broiler“ vs. „Hähnchen“, „Metzger“ vs. „Fleischer“• Sprache und Gewalt, Beleidigungen• Sexistische, nationalistische/tribalistische, gruppen-

ausgrenzende (Fanclubs, Religionen usw.) Sprache– Bsp: „God‘s own country“, „Ungläubiger“/„Heide“

Page 12: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

12

Psychologie/Kognitionswissenschaft

• Sprachentwicklung– Kindersprache – Erwachsenensprache

• Sprachverarbeitung– Assoziationsexperimente

• mentales Lexikon

– Prozessierungsexperimente• Satzkomplexität• Ambiguität• Garden paths

– Gedächtnisformen• short/long term, Diskursgedächtnis

• Verständlichkeitsforschung (readability)

Page 13: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

13

Pädagogik

• Sprachen lernen: L2-Erwerb, DaF• Lernmodelle für den Spracherwerb von

Immigranten(kindern)– PISA

• Linguistik und Schulpraxis• Kerngrammatik / Kernlexikon• Sprachstörungen

– Legasthenie

Page 14: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

14

Medizin

• Sprachpathologien– Broca-Aphasie– Wernicke Aphasie– Logorrhoe (Vielgeschwätzigkeit –

Depression, Psychosen)

• Gehirnareale für Sprache• Sprache und Alterung

– Demenz

Page 15: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

15

Biologie

• Physiologische Basis des Sprechens– Artikulationsapparat

• Innateness-Hypothese: „Sprachgen“?• Tiersprachen vs. menschliche Sprache

– Bienentanz– Imponiergehabe bei Primaten

Page 16: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

16

Physik

• Sprachsignal als akustisches Phänomen– Quantisierung– Frequenzspektren– Akustische Eigenschaften– Normsprache

• vs. dialektale Sprache• vs. geschlechtsspezifische Sprache• Muttersprachler vs. Fremdsprachler

Page 17: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

17

Mathematik

• Sprachstatistik• Logik

– Aussagen- und Prädikatenlogik– Zeitlogik– Modallogik– Default-Logik– Probabilistische und Fuzzy Logik

• Algebra– Strings, Graphen

• Lernbarkeit von Sprachen– PAC learning, algorithmische Lerntheorie

Page 18: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

18

Informatik

• Natürliche vs. formale Sprachen• Typen formaler

Grammatiken/Sprachen/ Automaten• Berechnungskomplexität• NL und Programmiersprachen• Rechnerarchitektur

– Zahlensysteme (Chip-Design) vs. Sprachsysteme

• Datenbanken als Informationsspeicher

Page 19: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

19

Informationswissenschaft

• Begriffliche Ordnungssysteme– Thesauri, Klassifikationen– Ontologien

• Informationssuche (Information Retrieval)– in Dokumenten (à la Google)– in Datenbanken

• Sprache und …– … Medialität

• gesprochen vs. geschrieben• NL vs. Tabelle, Grafik, Bild, Film

– … Modalität• Gestik, Mimik, Haptik, …

Page 20: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

20

(wo bleibt die) Linguistik

• Strukturalismus• Subsysteme

– Laut/Buchstabe, Wort, Satz, Bedeutung, Pragmatik, Diskurs

• Sprachliche Universalien (für alle NLs)• Kompetenz vs. Performanz• Grammatikalität (Norm) vs. Akzeptabilität

(Verstehbarkeit)– Agrammatismus, Paragrammatismus

• Gesprochene vs. geschriebene Sprache– Lautinventar– Alphabete, Bildsprachen (Comics!)

• One World, one language:– Kunstsprachen und Plansprachen (Esperanto)– Latein, Englisch, …

Page 21: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

21

Grundlegende Literatur

• Textbooks on Natural Language Processing– D. Jurafsky & J.A. Martin (2000), Speech and

Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Prentice Hall.

– C.D. Manning & H. Schütze (1999), Foundations of Statistical Natural Language Processing. MIT Press.

• Textbooks– T

• Journal Articles– T

Page 22: Computerlinguistik und Nachbarwissenschaften: Sprache in unterschiedlichen disziplinären Kontexten Proseminar im Sommersemester 2009 Udo Hahn Jena University

22

Main NLP Publication Series

• Journals– Computational Linguistics– Natural Language Engineering– Language Resources and Evaluation