Wer mich kennt weiß, dass ich zu den Leuten gehöre, die nur sehr ungern bis gar nicht auf kleinen Tasten von mobilen Endgeräten ellenlange Texte tippen. Selbst eine Drei-Wörter-SMS gewählt sich eher aus meinen Fingern in das smarte Phone. Dabei ist es mir völlig egal, ob wir hier über die durchaus gut zu bedienende Tastatur von meinem geliebten HTC Touch Pro oder über das „high glossy capacitiv touch display“ in Fingerfettoptik sprechen. Ich mag es einfach nicht. Warum auch? Es ist umständlich, langsam, zu winzig! Richtig innovativ würde ich eine „direct mind control unit“ finden, aber da werden wir uns wohl noch etwas gedulden dürfen. Vor einigen Jahren gab es ja mal ein Versuch solch eine ähnliche Technik im Markt zu implementieren, was aber fehlschlug. Unter Anderem wohl auch deshalb, weil diese Art der Steuerung so präzise wie Puhbär als Mechaniker in einem Schweizer Uhrenwerk arbeitet. Aber ich schweife ab.
Vor einiger Zeit habe ich bei Caschy folgendes Video gesehen:
httpv://www.youtube.com/watch?v=gGbYVvU0Z5s
Nun ist Spracheingabe nicht wirklich innovativ. Stelle man sich nur mal eine U-Bahn in B-City mit über 900 Mio. Fahrgästen pro Jahr vor, und man selbst erwisch um 7 Uhr ausgerechnet den Wagon, wo 10 dieser Handyfreaks unbedingt ihren belanglosen Scheiß per Voice in ihre mobilen Endgeräte brabbeln. Und man muss ja bloß mal ein wenig weiterdenken: „Playing your favorit game per voice.“ Das wäre dann ja auch nicht mehr weit. Ich höre es schon: hoch, hoch, hoch, rechts, weiter, weiter, weiter, springen, weiter, weiter, weiter, runter, runter …. Ohhhhhhhh!!!
Wie dem auch sei. Zumindest einen Vorteil gegenüber der „normalen“, allgemein akzeptierten Eingabe hätte die Spracheingabe: Abgeschottet und allein im Büro wären die lästigen SMSen schnell diktiert und abgeschickt. Aber noch gibt es ja keine wirklich funktionierende Sprachsteuerung. Und für mich ist auch fraglich, inwiefern man bei dem obigen Video nicht auch getrickst hat. Man hat ja noch das Web Pad (jetzt We Pad) und diese großartige Präsentation in Flash vor Augen.
Als ich am Wochenende so durch den App-Store gestolpert bin, habe ich folgende, kostenlose App gefunden: Dragon Dictation. Diese App verspricht dem Benutzer den Text für SMS oder für diverse Soziale Netzwerke direkt per Diktat entgegenzunehmen und in Text umzuwandeln. Dabei beschränkt er sich nicht auf eine Sprache, sondern verspricht die Unterstützung für mehrere Sprachen mitzubringen.
Ich habe die Funktion dieses willigen Dieners ausprobiert und war überrascht. Aber nicht überrascht ob der tollen, tadellosen Funktion, sondern eher darüber, wieviel Spaß die Benutzung einer solchen Applikation mit sich bringen kann. Ich habe den ersten Absatz aus dem Editorial der aktuellen c’t genommen und folgendes hat das Programm verstanden:
„Computer das weiß jeder aus Erfahrung zerstöre Checkliste erst muss man herausfinden wie man ihnen die eigenen Wünsche nach Marketing kann im Glücksfall bekommt man tatsächlich das Ergebnis zurück dass man haben wollte nichts daran ist intuitiv zum Schreiben hackt man auf 105 Knöpfen herum um sich in deinem Spiel um zu gucken schickt man eine Faust große Robe über die Tischplatte“
Ein zweiter Versuch mit deutlicherem Vorlesen brachte folgenden Text in das iPhone:
„Computer das weiß ich aus Erfahrung sind sture Scheck ist der erst muss man herausfinden wie man ihnen die eigenen Wünsche nahe bringen kann im Glücksfall bekommt man tatsächlich das Ergebnis zurück dass man haben heute nichts daran ist intuitiv zum Schreiben hackt man auf 105 Köpfen herum um sich in einem Spiel um zu gucken schickt man einen Faust In Rubel über die Tischplatte“
Das Hühnchen hat ebenfalls einen Versuch gewagt:
„Das weiß jeder aus Erfahrung sind störrische Beef bei der erst muss man ja raus finden wie man mit ihnen die eigenen Münchener bringen kann es im Glücksfall bekommt man tatsächlich das Ergebnis so das man haben heute nicht sehr lange sind sie mit ihm zu wenig Schnee ist zum Schreiben hacken macht was er von den fünf Knöpfen herum an sich in einem Spiel um zu gucken steht man einen fast großen Bummel über die Tischplatte“
Wie man sieht, ist das Ergebnis zwar nahe am Original, aber noch weit davon entfernt, wirklich perfekt zu funktionieren. Eine Lernfunktion gibt es nicht, somit ist eine kontinuierliche Verbesserung der Software vom Benutzer her nicht möglich. Eigentlich schade. Aber vielleicht gibt es ja irgendwann mal eine bessere Version. Ich werde die App auf jeden Fall im Auge behalten.
Achtung Verschwörung: Wenn es demnächst funktioniert, dann wird der Text erst richtig angezeigt, dann aber verändert abgespeichert. Und auch nicht da wo man wollte, sondern wo das Phone wollte. Oder ist das vielleicht jetzt schon so, nur anders herum, hmmm?
Der Gute hatte es irgendwie mit den Roben und „Hobel“ kannte er gar nicht. Warum noch mal Hobel??
Egal. *hihi* Sollten nicht die gebräuchlichen Vokabeln vorhanden sein??
Der Typ im Video grinst mir zu däm… komisch.
Sprachsteuerung ist sicher ne feine Sache, aber wir sind noch Meilenweit davon entfernt, dass es auch wirklich so funktioniert wie in diesem Werbevideo.
@scheuch: Jepp! Mit hat es verwundert, dass er nicht mit: „Hi! I am an Android!“ begonnen hat. Das Video ist doch, meiner Meinung nach, ein wenig in Richtung Apple produziert. Aber das macht heute ja fast jeder.
Und ich denke, so schnell und undeutlich wie er spricht, hätte die Spracherkennung wahrscheinlich auch nur die Hälfte erkannt.