Transcript

14

Aktuell spracheingabe beim ipad iPadWelt 04/2012

iPad, zum Diktat!Nur dem aktuellen iPad hat Apple mit der Diktatfunktion einen Teil der

Siri-Spracherkennung verpasst. Wir zeigen, wie Sie weitere Siri-Funktionen

nachrüsten und Spracherkennung mit allen iPads nutzen

Fans der Serie und Spielfilme zu den Aben­teuern des Raumschiffs Enterprise kennen

die Filmszene aus „Star Trek IV: Zurück in die Gegenwart“ von 1986. Bei einer Zeitreise landet die Mannschaft im San Francisco des Jahres 1986. Dort versucht Lt. Commander Montgomery „Scotty“ Scott mithilfe eines Mac­intosh Plus, einen Werkstoff für eine Trans­portkiste für Buckelwale zu konstruieren. Der Mann aus dem 23. Jahrhundert hält die Maus an seinen Mund und sagt: „Hallo Computer.“ Natürlich ließ sich der Mac im Film so nicht zur Arbeit bewegen.

Was bei Erscheinen des Spielfilms als pure Science­Fiction abgetan werden konnte, ist längst Realität. Spracherkennung und Sprachsteuerung auf Computern gibt es seit

geraumer Zeit. Dank immer leistungsfähigerer Prozessoren in Smartphones und Tablet­PCs ist das auch bei mobilen Geräten keine Zu­kunftsmusik mehr. Mit dem iPhone 4S hat Apple im vergangenen Herbst Siri vorgestellt, seine Version eines intelligenten Sprachassi­stenten. Siri befindet sich noch immer in der Beta­/Ausbauphase, ist aber laut Apple­Chef Tim Cook eine der wichtigsten Kerntechnolo­gien – hier wird kräftig weiterentwickelt.

Siri light beim neuen iPad

Beim iPhone 4S versteht Siri nicht nur ein­fache Anweisungen, sondern stellt auch Zu­sammenhänge zwischen den Anweisungen her. Die meisten der von Apple mitgelieferten Apps lassen sich bereits per Siri am iPhone 4S

inhalt

Dragon Dictation: Diktat für alle 16

Voice Actions: Siri beim iPad 18

Voice Texter: Übersetzer und mehr 18

Voice Answer: Wissensdatenbank 19

Google-Suche: Suchen per Sprache 19

Sayhi: Mulitifunktionsübersetzer 20

© o

lly

15

iPadWelt 04/2012 spracheingabe beim ipad Aktuell

direkt ansprechen. Dabei gibt hierzulande al­lerdings einige Einschränkungen. An der Unter­stützung für Google Maps arbeitet Apple noch, und auch die Datenbank von Wolfram Alpha lässt sich noch nicht auf Deutsch befragen.

Im neuen iPad ist von der genannten Funktionalität zum Leidwesen vieler Anwen­der lediglich ein Teil implementiert. Apps, die Text eingabe per Displaytastatur erlauben, zei­gen eine zusätzliche Mikrofontaste. Das neue iPad bietet Anwendern eine Diktatfunktion. Die ist recht ausgereift, die Erkennungsquote ist hoch. Wie bei anderen Sprecherkennungs­lösungen kann das iPad allein die komplette Rechenleistung nicht bieten. Beim iPad wird der gesprochene Text aufbereitet und dann als Audiofile an Apples Server gesendet. Dort wird die Audiodatei interpretiert und der er­kannte Text zurück an das iPad beziehungs­weise die App geschickt. Dabei ist eine Inter­net­Verbindung Pflicht. Außerdem sollten sich Nutzer bewusst sein, dass Daten „in fremde Hände“ gelangen.

Nicht nur für Apples Implementation der Spracherkennung gilt, dass die Lösungen nur die Laute eines einzelnen „Auftraggebers“ ak­zeptieren. Wer etwa denkt, eine Spracherken­nung würde sich eigenen, um eine Konferenz mit mehrerem Personen mitzuschneiden, liegt falsch. Beim Versuch gelangen nur zusammen­hanglose Bruchstücke von Sätzen auf das Dis­play des iPad.

Des Weiteren hilft es, die Sprachbefehle für Interpunktion und Formatierung zu ken­nen. Ansonsten muss der erkannte Text später erheblich nachbearbeitet werden. Ab Seite 88 finden Sie ein Tipp­Special mit den wich­tigsten Befehlen. Die meisten Befehle gelten nicht nur für Apples Siri­basierte Lösungen, sondern zum Beispiel auch für die Spracher­kennungs­Apps für das iPad, die auf der Tech­nologie von Nuance basieren.

Siri-Funktionen nachrüsten

Wer neben der reinen Diktatfunktion auch mit Apps kommunizieren will, um eine Nachricht oder Mail zu versenden, muss zu Apps ande­rer Anbieter greifen. Diese erweitern nicht nur die Funktionalität des neuen iPad, in der Re­gel sind sie der einzige Weg, Spracherkennung und ­befehle auch auf die beiden älteren iPad­Modelle zu bekommen. So kann etwa Voice Actions (2,99 Euro), wie von Siri am iPhone 4S bekannt, eine Nachricht senden, eine Mail erzeugen und versenden, eine Erinnerung an­legen, den Wecker stellen und mehr.

Voice Answer (2,99 Euro) ermöglicht mit allen iPad­Modellen die Abfrage der Wis­sensdatenbank von Wolfram Alpha (www.wolframalpha.com) – allerdings in englischer Sprache. Brandneu und ebenfalls geeignet für

sämtliche iPad­Modelle ist Voice Texter (Ein­führungspreis 0,79 Euro). Die App verspricht unter anderem Spracherkennung in mehr als 20 Sprachen, den direkten Zugriff auf die App Nachrichten sowie die Suche über Google und andere Suchmaschinen.

Wer beim Ur­iPad oder dem Modell der 2. Generation lediglich eine sehr gute Diktier­funktion haben möchte, greift zur kostenlosen App Dragon Dictation. Die auf Nuance­Tech­nologie basierende Lösung bietet eine ähnlich gute Spracherkennungsleistung wie Siri, aber eben auch auf den von Siri nicht unterstützten älteren iPad­Modellen.

Nur zum Teil in die Rubrik passt eine neue App namens Sayhi (0,79 Euro). Der Universal­übersetzer akzeptiert Text­ oder Sprachein­gabe und bringt die Übersetzung aufs Display, dazu wird sie in der Sprache der Wahl auch akustisch ausgegeben. Die App ist einfach klasse, unterstützt haufenweise Sprachen, da­

runter sogar Japanisch und Russisch. Sayhi ist somit der ideale Reisebegleiter für den Urlaub und Businesstrips.

Spracherkennung nutzen

Wer die Diktierfunktion beim neuen iPad als nützlich erachtet, sollte sie auch häufiger ein­setzen, sie ist lernfähig und stellt sich auf Ihre Sprachgewohnheiten ein. Wie auch bei den anderen Lösungen sind die Ergebnisse gut, solange kein starker Dialekt gesprochen wird. Die meisten anderen Lösungen, die wir in die­sem Artikel ausführlich vorstellen, verfügen nicht über eine Lernfunktion. Sie zeigen aber, wo Apple noch nachbessern könnte. Kurz nach Erscheinen dieser Ausgabe wird Apple auf der Entwicklerkonferenz sicher zu kommenden Entwicklungen bei Siri Stellung beziehen. Be­sitzer eines älteren iPad werden aber weiter auf App­Lösungen setzen müssen, Siri wird nicht unterstützt. vr

beim neuen ipad (3. ge­neration) ist siri imple­mentiert, jedoch nur als diktierfunktion. diese wird aber in apps von apple und den meisten drittanbietern, die Texteingabe per display­tastatur erlauben, direkt unterstützt. Über die mikrofontaste starten sie die spracheingabe. siri ist lernfähig und bietet außerdem Text­korrektur.

beim iphone 4s bietet siri nicht nur eine diktierfunktion, sondern den direkten Zugriff auf einige apple­apps. man kann etwa das Wetter abfragen, Termine erstellen oder mails schreiben.

16

Aktuell spracheingabe beim ipad iPadWelt 04/2012

2. Text diktieren

Im Gegensatz zu Apples Siri erfolgt das Diktat in der App Dragon Dictation. Wie auch bei Apples Lösung und allen an­deren erreichen Sie eine bessere Spracherkennung bei Verwen­dung eines Headsets. Nachdem

der rote Aufnahmeknopf betätigt ist, beginnt die Aufnahme, ein weiteres Antippen des Displays beendet sie. Der Text lässt sich nach der Aufnahme per Tastatur bearbeiten. Die App sichert Auf­nahmen für die spätere Nutzung.

3. Text versenden oder kopieren

Liegt der Text in der gewünsch­ten Form vor, lässt er sich direkt in die App Mail übertragen oder auf Facebook beziehungsweise Twitter veröffentlichen. Dazu tippen Sie das Symbol oben rechts im App­Fenster an. Wollen Sie

den Text in einer anderen App – etwa einer Textverarbeitung – nutzen, wählen Sie die Option „Kopieren“, wechseln in die Ziel­App und wählen „Einsetzen“. Dragon Dictation benötigt wie Siri Internet­Verbindung.

Diktatfunktion für alte iPads1

1. dragon dictation – grundeinstellungen und datenschutz

Dragon Dictation (kostenlos) ist die Diktierlösung der Wahl für Besitzer eines iPad der ersten oder zweiten Generation. Die App basiert auf Dragon Naturally Speaking (Spracherkennung für

PCs). Neben den iPad­Modellen werden alle iPhones und der iPod Touch der dritten und vierten Generation unterstützt. Beim ers­ten Start erfragt die App Ihre Region (Bild 1). Nach der Auswahl

(Europa) wird gefragt, ob die App die Namen Ihrer Kontakte (und nur die) an den Server von Dragon übermitteln darf. Damit wird die Spracherkennung erleichtert, falls einer der Namen aus Ihren Kon­

takten stammt. Dragon verspricht, die Daten nicht weiterzuverwen­den. Wem das nicht geheuer ist, klickt hier „Nein“. Falsch erkannte Namen lassen sich nach der Auf­nahme manuell ändern.

Lesen Sie weiter auf Seite 18

auch wenn sie der Übermittlung ihrer Kontakte nicht zustimmen, funktioniert dragon dictation ohne probleme.2beim ersten start der app müssen sie ihre region

preisgeben, in unserem Fall „europa“.1

sie können den erfassten Text direkt an mail übergeben, bei Facebook oder Twitter posten oder kopieren.2der erfasste und erkannte Text lässt sich nacharbeiten,

die app legt Texte unter „notizen“ ab.1

18

Aktuell spracheingabe beim ipad iPadWelt 04/2012

Mit Voice Actions (2,99 Euro) hat Hersteller Pannous eine auf Nuance­Spracherkennung ba­sierte Lösung im Angebot, die bei allen iPad­Modellen sonst nur vom iPhone 4S zur Verfügung ge­stellte Siri­Funktionen bieten soll. So lässt sich per Spracheingabe eine E­Mail direkt erstellen, eine Google­Suche in Safari starten oder ein Termin beziehungsweise eine Erinnerung anlegen. Nach der Eingabe des Sprachbefehls öffnet Voice Actions die zustän­dige App und überträgt den „Auf­trag“. Während etwa die Google­Suche oder Mail­Erstellung gut klappte, haben wir Termine nicht eintragen können – obwohl die freundliche Stimme das erledigt haben wollte. Prima funktioniert hin gegen die Frage nach Orten, hier wird Karten geöffnet.

Siri beim iPad nachrüsten2

Voice actions – direkter Zugriff auf apps

Übersetzer und mehr3

Voice Texter – sprachtalent mit Zugriff auf viele apps

Ende Mai vorgestellt und zum Einführungspreis von 0,79 Euro angeboten wird die App Voice Texter, die sich in erster Linie als Dolmetscher versteht. Auch Voice Texter funktioniert auf allen

iPad­Modellen. Laut Hersteller versteht sich Voice Texter auf über 20 Sprachen. Der Benutzer wählt die Eingabesprache sowie die für die Ausgabe und spricht die zu übersetzenden Texte.

Klasse gelöst ist der Zugriff auf diverse Apps und Funktionen. Nach der Texterfassung legen Sie über „Aktion starten (Bild 1) fest, für welche App der Text ge­dacht ist. Neben diversen Stan­

dard­Apps unterstützt Voice Tex­ter auch Dienste wie Facebook, sucht in Ebay­Auktionen, Youtube und mehr. Voice Texter ist prima für alle iPad­Nutzer und basiert auch auf Nuance­Technologie.

Voice Texter öffnet einige apps in einem inline­Fenster, im bild die app nachrichten, und setzt den Text automatisch ein.2erfasste sprachnachrichten lassen sich einfach an

viele apps oder internet­dienste übergeben.1

Ähnlich wie bei siri am iphone 4s bekommt der benutzer Feedback per Text und stimme.2Über die einstellung ist unter anderem die

sprache für Voice actions festzulegen.1

19

iPadWelt 04/2012 spracheingabe beim ipad Aktuell

Wolfram Alpha (www.wolframalpha.com) ist eine auf der Soft­ware Mathematica basierende Wissensdatenbank zum Auffin­den und Darstellen von Infor­mationen von Wolfram Research. Wolfram Alpha ist eine seman­tische Suchmaschine. Die Ergeb­nisse reichen von einer simplen Summenbildung bis zu Eigen­werten, über Differenzialgleichun­gen bis zu Umlaufbahnen von Planeten. Nur Nutzer des iPhone 4S, die als Siri­Sprache Englisch eingestellt haben, können der­artige Fragen an die Datenbank stellen. In die Lücke springt die App Voice Answer (2,99 Euro). Wer der englischen Sprache mächtig ist, kann seine Fragen per Sprachbefehl stellen, be­kommt die Antwort angezeigt oder sogar ganz vorgelesen.

Wolfram Alpha nutzen4

Voice answer – Zugriff auf die Wissensdatenbank

Benutzer mit Google­Account sollten unbedingt die kostenlose App Google­Suche laden. An­ders als der Name zunächst ver­muten lässt, bietet die App vor allem einen direkten Zugriff auf die zahlreichen Google­Dienste – eine einmalige Anmeldung mit den Google­Account­Daten reicht aus. Anschließend haben Sie Zugriff auf Google Docs (Ta bellen & Texte), Googlemail, Kalender, Picasa­Fotos und mehr. Natürlich ist auch die Su­che in Googles Datenbanken über die App möglich. Hier und nur für die Suchfunktion hat Google ein kleines Mikrofon­Icon integriert, das die Suche über die Spracheingabe erlaubt. Die Spracherkennung funktio­niert gut, der Begriff wird an die Suche übergeben, die Resultate werden angezeigt (Bild 2).

Suchen per Sprachbefehl5

google­suche – apps und spracherkennung

… wie banale. das funktioniert auch bei Fragen zu lokalen Themen – allerdings in englisch.2Voice answer beantwortet dank Wolfram

alpha komplexe Fragen ebenso …1

die suche lässt sich per sprachbefehl starten, ergebnisse werden im google­Fenster angezeigt.2die kostenlose app bietet Zugriff auf ver­

schiedene google­apps und die suchfunktion.1

20

Aktuell spracheingabe beim ipad iPadWelt 04/2012

Mit der App Sayhi (Einführungs­preis 0,79 Euro) gibt es eine Übersetzungs­ und Dolmetsch­software für sämtliche iPad­ Modelle, die enorm Furore ge­macht hat. Sie bietet Sprach­erkennung für 24 Sprachen und Dialekte, darunter neben den wichtigen europäischen auch Man­darin, Kantonesisch, Russisch oder Koreanisch. Bei den genann­ten wird als Eingabe Sprache akzeptiert – alternativ Text per Tastatur. Die Übersetzung wird gesprochen und als Text ange­zeigt. Bei neun weiteren Sprachen beschränkt sich die Übersetzung auf die Sprachausgabe. Im ersten Schritt legen Sie nach dem Start der App die Sprachen für die Ein­ und Ausgabe per Klappmenü fest. Das Lautsprechersymbol zeigt an, falls nur die Sprachausgabe verfügbar ist.

Allround-Übersetzer6

1. sayhi – Übersetzer mit sprachein­ und ­ausgabe

Nach der Auswahl des Sprachen­paares können Sie loslegen. Tip­pen Sie unten links „Deutsch“ an, und sprechen Sie die Sätze, die es zu übersetzen gilt. Auch Sayhi nutzt einen Server des Anbieters, eine Internet­Verbindung muss bestehen. Alternativ zur Sprachein­gabe können Sie die Display­tastatur des iPad zu Hilfe nehmen (Bild 1). Sayhi stellt bei den 24 genannten Sprachen und Dialek­ten Ihre Spracheingabe samt Übersetzung als Text am Display dar und spricht außerdem die Übersetzung. Ihr Gegenüber kann den Button seiner Sprache eben­falls antippen und einen Text sprechen. Die Übersetzung wird farblich hinterlegt angezeigt (Bild 2). Wir konnten Englisch, Spanisch, Italienisch und Rus­sisch testen und sind begeistert.

2. dolmetscher in beide richtungen nutzen

neben der sprache wählen sie die stimme (männlich/weiblich) und sprechgeschwindigkeit.2Wählen sie zunächst über „settings“ die

eingabe­ und ausgabesprache.1

der Übersetzer funktioniert in beide richtungen, sprachausgabe und Text inklusive.2alternativ zur spracheingabe lässt sich der

zu übersetzende Text eintippen.1


Recommended