Linguistik mit Schwerpunkt Computerlinguistik ...· Nebenfach/Anwendungsfach Linguistik mit Schwerpunkt

  • View
    212

  • Download
    0

Embed Size (px)

Text of Linguistik mit Schwerpunkt Computerlinguistik ...· Nebenfach/Anwendungsfach Linguistik mit...

  • Nebenfach/Anwendungsfach

    Linguistik mit Schwerpunkt Computerlinguistik / Sprachtechnologie

    Prof. Dr. Udo Hahn

    Lehrstuhl für Computerlinguistik

    Institut für Germanistische Sprachwissenschaft

    Friedrich-Schiller-Universität Jena

  • 2

    „Informatiken“ • Kern-Informatik – Theoretische I.: Automaten-/Grammatiktheorie, Komplexitätstheorie, Codierungstheorie, …

    – Praktische I.: Programmiersprachen/Compilerbau, Betriebssysteme, Datenbanken, …

    • Angewandte Informatik: Bindestrich- Informatiken – Bioinformatik

    – Medizinische Informatik

    – Wirtschaftsinformatik

    – Computerlinguistik/Sprachtechnologie

  • 3

    „Sprachen“: Syntax & Semantik

    • Algebraisch/logisch – Formal, konstruiert

    • Bsp: Programmiersprache, PL1

    • Chemisch – Empirisch, naturgesetzlich

    • Benzol als chemische (Kekulé-)Strukturformel

    • Biologisch – Empirisch, naturgesetzlich + Evolution (+ Pathologien) • DNA-Struktur, Pathway-Diagramme

    • Natürliche Sprachen – Empirisch, sozial determiniert

    • Leitartikel aus der „Süddeutschen Zeitung“

    INFORMATION

  • 4

    Informationsstruktur aus Informatiksicht

  • 5

    Warum Sprachtechnologie ?

  • 6

    Textmengenwachstum in der Biomedizin

    MEDLINE

  • 7

    Informationsstruktur in natürlicher Sprache

  • 8

    Informationsstruktur in natürlicher Sprache

    UNSTRUKTURIERTE INFORMATION

  • 9

    Studium an der FSU Jena

    • Bachelor-Studiengänge – B.Sc. Informatik

    – B.Sc. Angewandte Informatik

    • Master-Studiengänge – M.Sc. Informatik

    – M.Sc. Computational Science

  • 10

    B.Sc. Informatik Nebenfach Linguistik++

    • Einführung in die Phonetik und Phonologie der deutschen Sprache (Laut) (5 LP)

    • Einführung in die Lexikologie (Wort) (5 LP) • Einführung in die Grammatiktheorie I (Satz I)

    (5 LP) • Einführung in die Textlinguistik (Text) (5 LP) • Einführung in die Computerlinguistik und Sprachtechnologie* (B-GSW-01 … -04) (10 LP)

    • Es müssen 24 (30) LP erworben werden • Bei Wahl dieses NFs werden 6 ASQ LP erworben

  • 11

    B.Sc. Angewandte Informatik Anwendungsfach Linguistik++ (P)

    • Einführung in die Phonetik und Phonologie der deutschen Sprache (Laut) (5 LP)

    • Einführung in die Lexikologie (Wort) (5 LP)

    • Einführung in die Grammatiktheorie I (Satz I) (5 LP)

    • Einführung in die Textlinguistik (Text) (5 LP)

    • Einführung in die Computerlinguistik und Sprachtechnologie* (B-GSW-01 … -04) (10 LP)

    • Es müssen 60 LP erworben werden

  • 12

    • Einführung in diachrone germanistische Sprachwissenschaft* (5 LP)

    • Sprachtheorie (5 LP) • Linguistische Stilistik (5 LP) • Theoretische und praktische Phonologie (5 LP) • Grammatiktheorie II (5 LP) • Angewandte Textlinguistik (*) (10 LP) • Norm und Varianz (10 LP) • Formen der Erweiterung des deutschen Wortschatzes (*) (10 LP)

    B.Sc. Angewandte Informatik Anwendungsfach Linguistik++ (WP)

  • 13

    M.Sc. Informatik/Computational Sci. Nebenfach Linguistik++

    • Computerlinguistik I:V+Ü+S (10 LP) • Computerlinguistik II/Sprachtechnologie V+Ü(+ S) (10 LP)

    • Es müssen 12 (20) LPs erworben werden • Bei Wahl dieses NFs werden 9 ASQ LP erworben, und es können 6 Projektarbeit-LP erworben werden (27 LP)

  • 14

    Bezüge zur Informatik • Theorie formaler Sprachen/Grammatiken und Automatentheorie (Syntax von NS)

    • Wahrscheinlichkeitstheorie (probabilistische Grammatiken/Automaten; statistische Semantik)

    • Graphentheorie • Informations- und Spieltheorie • Künstliche Intelligenz

    – Wissensrepräsentation: Logiken (Semantik von NS) – Maschinelles Lernen (Wahrscheinlichkeits- und Informations- theorie)

    • Informationssysteme – Datenbanken – Information Retrieval – Human Computer Interaction (HCI): Visualisierung

    • Software Engineering • Web-Technologien (RDF, XML, OWL, Ontologien)

  • 15

    Sprachtechnologie

    • Methoden … – Parsing, semantische Interpreter, OOP, …

    • Sprachtechnologische Anwendungen – Information Retrieval

    – Informationsextraktion / Text Mining

    – Frage-Antwort-Systeme

    – Textzusammenfassung

    – Maschinelle Übersetzung

    – … enge Bindung an biomedizinische Themen

    • Chancen auf dem Berufsmarkt sind positiv

  • 16

    Bemerkungen

    • Es gibt zwischen der Informatik und dem LS Computerlinguistik intensive Lehr-, Forschungs- und Prüfungsbeziehungen – Bioinformatik

    – Projekte: Forschungskern JenAge

    – Forschungsschwerpunkt „Komplexität“

    – Prof. König-Ries, Rossak, Küspert, Schukat-T. …

    • Der LS Computerlinguistik akquiriert in großem Maße Drittmittel – Projektarbeiten, Abschlussarbeiten

    – Studentische Hilfskräfte

    – http://www.julielab.de

  • Nebenfach/Anwendungsfach

    Linguistik mit Schwerpunkt Computerlinguistik / Sprachtechnologie

    Prof. Dr. Udo Hahn

    Lehrstuhl für Computerlinguistik

    Institut für Germanistische Sprachwissenschaft

    Friedrich-Schiller-Universität Jena