Entwicklung des sprachgesteuerten Schachcomputers Speech2Chess Bernhard Götz Matthias Brand

Preview:

Citation preview

Entwicklung des sprachgesteuerten Schachcomputers Speech2Chess

Bernhard GötzMatthias Brand

Übersicht

• Grundlagen der Spracherkennung– Sprachmodelle– Dekodierung

• Spracherkennung mit Sphinx• Grammatik für Speech2Chess• Das Schachprogramm• Die Anbindung

Video: Voice Control Tank

http://www.youtube.com/watch?v=f4LUBX6mwBk

Grundlagen der Spracherkennung

• Mensch-Maschine-KommunikationTaktil vs. Akustisch

• Vielfältige Anwendungsgebiete (Haushalt, Büro usw.)

• Ziel: Erkennen des Nachrichteninhalts(Spracherkennung, Sprachverstehen)

Grundlagen der Spracherkennung

Grundlagen der Spracherkennung

• Einflussfaktoren (Darbietungsform, Sprachumfang, Sprecherabhängigkeit)– Darbietungsform bestimmt durch Aufnahme– Sprachumfang von

Anwendung abhängig– Sprecheradaptive

Systeme

Grundlagen der Spracherkennung

• Schwierigkeiten bei der Spracherkennung– Kontinuität– Variabilität– Komplexität– Ambiguität

Modellierung des Sprachmodells

• Notwendige Informationen:– Wörterbuch (Wort Phoneme)– Akustisches Modell (Aufnahmen)– Wahrscheinlichkeit von Äußerungen

Dekodierung des Sprachmodells

Spracherkennung mit Sphinx

• HMM-basiert (Hidden Markov Model)• Erkennung durch Punkteverteilung (Score)• Repräsentation der möglichen Äußerungen

durch Graphen (folgende Folie)

Spracherkennung mit Sphinx

Spracherkennung mit Sphinx

Grammatik für Speech2Chess

• Befehle im Spiel:– Bauer von b7 nach b5– a1 nach c1– Dame h5 Schach!

• Kontrollbefehle:– Ja, Nein– Spiel beenden– usw.

Recommended