Tap to Play!

Text

One more thing: Siri

1983 veröffentlichte Apple die Lisa und somit erstmals eine grafische Benutzeroberfläche (außerhalb von Forschungsstätten). 1984 folgte der Macintosh-Computer, welcher die grafische Oberfläche der Allgemeinheit zugänglich machte, indem die Komplexität der Kommandozeile durch Grafiken und einen kleinen bewegten Zeiger verringert wurde. Danach geschah: Nichts.

Nach 24 Jahren Stillstand veröffentliche Apple im Jahr 2007 das iPhone (Youtube). Wieder hat Apple die Komplexität verringert: Anstelle mit einem zusätzlichen Gerät einen kleinen Zeiger auf dem Bildschirm zu bewegen, können die grafischen Bedienelemente mit dem Finger berührt werden. Zusätzlich verschwanden das Dateisystem und die parallele Verwendung von Programmen. Das Ergebnis ist ein Gerät, welches sich verblüffend natürlich anfühlt. Selbst die Frage nach gespeicherten Dokumenten oder der Dateispeicherung stellt sich nicht. Die ebenfalls von Apple gestartete Nische der Personal Digital Assistants kollabierte spontan.

2010 folgt das iPad (YouTube). Es verband die verringerte Komplexität des iPhones mit einem größeren Display und ermöglichte somit Applikationen, die bislang den “Maus-Rechnern” vorbehalten waren: Tabellenkalkulation, Textverarbeitung, Outlines, Mind Maps, Datenbanken, Bildbearbeitung, Videoschnitt, Audiosoftware.

Gerade mit den Touch-Geräten kann Apple bei Neueinsteigern immer noch mit einem großen Aha-Effekt und großen Augen punkten. Was Bedienung angeht, steht die Zeit seit vier Jahren allerdings abermals still und führt in vielen Bereichen den Stillstand der letzten 24 Jahre fort. Das iPad ist weitestgehend ein herkömmlicher Rechner, der der herkömmlichen Bedienungsphilosphie folgt: Ich hangle mich über Menüs und Buttons durch unterschiedliche sich selbst ersetzende Fensterschichten. Das klappt besser als am großen Rechner, da die Applikationen in der Regel für einen einfacheren Bedienungsworkflow optimiert sind, aber es fühlt sich eher nach Vergangenheit als nach Zukunft an.

Ein Beispiel: Wenn ich möchte, dass das iTunes auf meinem großen Rechner die letzten zehn Songs wiederholen soll, so muss ich folgendes verstehen:

  • Es gibt Playlisten, intelligente Playlisten, aus Metadaten generierte Ordner und einzelne Songs.
  • iTunes ist unterteilt in eine Sidebar für Playlisten, einen Browser für Metadaten und eine Liste für Songs.
  • Intelligente Playlisten können auf Kriterien von Songs reagieren, z.B. ihre letzte Spielzeit.
  • Ich kann eine intelligente Playlist der zuletzt gespielten Songs erstellen (iTunes wird mit einer ausgeliefert, aber um diese zu verstehen, muss ich alles obere verstanden haben).
  • Ich kann aus dieser die letzten zehn Songs in eine neue Playlist überführen.
  • Ich kann dann abspielen.

Für die simple Anforderung, die letzten Songs noch einmal zu spielen, ist das ziemlich viel Holz. Weshalb kann ich iTunes nicht einfach mitteilen: “Spiele die letzten zehn Songs noch einmal”?

Damit das möglich ist, muss der Rechner bzw. iTunes einiges können:

  1. Es muss meine Sprache, sei es getippt oder gesprochen, verstehen können.
  2. Es muss die Daten zur Verfügung haben (Liste zuletzt gespielter Songs).
  3. Es muss Zusammenhänge verstehen können: “Bitte die letzten zehn Songs noch einmal spielen”, “Bitte noch drei Songs dieser Band”

Eine intelligente Steuerung scheitert in der Regel an einem dieser drei Punkte. Alle drei sind allerdings erforderlich, damit wir effizenter mit Computern arbeiten können.

MacOS, Mac OS X und iOS kamen nahezu immer mit Möglichkeiten, den Computer Texte und Bedienelemente vorlesen zu lassen. Spracherkennung war aber immer nur auf das Erkennen bestimmter Befehle ausgelegt, was einen ersten Schritt und eine kleine Erleichterung darstellt, aber nicht bei der Bewältigung wirklicher Arbeitsabläufe hilft. Denn unabhängig davon, ob wir Befehle per Maus auswählen oder in den Computer hinein rufen, bieten Computer uns nur eine vorgefertigte Liste an Befehlen an, die wir einzeln, Schritt für Schritt, kombinieren müssen. Erst dann können wir mit der eigentlichen, intelligenten, analytischen Arbeiten beginnen, sofern diese dann noch erforderlich ist (viel Arbeit, die wir am Rechner erledigen, ist nur stumpfe Sucherei).

Umso überraschter war ich, als Apple vor einigen Tagen die neue Version von Siri vorstellte, welches Apple vor 1,5 Jahren einkaufte. Mittlerweile ist die Software vollständig in das iOS 5 integriert. Siri versteht die gesprochene Sprache, Siri hat dank der Daten des iPhones und zusätzlicher Dienste wie WolframAlpha Daten und analytische Funktionen zur Verfügung und es versteht Zusammenhänge. Alle drei oben genannten Anforderungen sind in einem gewissen Rahmen erfüllt.

Auch wenn Siri nicht innerhalb von Applikation steuert, sondern nur den Zugang zu diesen Applikationen, konnte Apple damit eine Punktlandung vollziehen: Das 24 Jahre alte Knowledge Navigator-Video (Video) präsentierte einen durch Sprache gesteuerten persönlichen Assistenten - im Jahre 2011. In wenigen Tagen werden Millionen von Menschen Siri verwenden können.

Der Einsatzbereich von Siri ist momentan noch begrenzt, aber ein erster Schritt zur Schaffung einer neuen Art der Bedienung von Computern, wie sie in Star Trek vorgelebt wurde: Computer als Werkzeug zur Recherche und Analyse, nicht aber als Intelligenzersatz. Diese soll weiterhin durch uns kommen und wird gefördert, indem uns der Computer lästige Arbeit abnimmt, anstelle sie uns - wie bislang - in Form unzähliger Menüpunkte vor die Füße zu werfen.

Dass Siri nicht über die Leistungsfähigkeit von Star Trek-Computern verfügt hat unterschiedliche Gründe. Einer der weniger offensichtlichen sind die Lücken im Informationszugriff. Nur wenige Daten liegen in strukturierter Form vor oder sind überhaupt öffentlich zugänglich. Für eine Star Trek-Computerwelt müssen strukturierte Informationen öffentlich verfügbar sein, weltweit, ohne staatliche oder privatwirtschaftliche Grenzen. Bis dahin ist es noch ein weiter Weg. Apple versucht dieses Problem momentan in Teilen durch die Verwendung von WolframAlpha zu umgehen. Ein weiterer offensichtlicherer Punkt liegt in der Eingeschränktheit des iOS: Applikationen wissen fast nichts voneinander.

Wenn Apple Siri nicht nur als Testballon ansieht, sondern als die Zukunft, dann muss Siri für Drittentwickler geöffnet werden, damit diese ihre Dienste für Siri anbieten können aber auch, damit Siri innerhalb von Applikationen Aufgaben steuern kann. Etwas ähnliches hat Apple schon einmal gemacht: Mac OS X bietet eine durch Drittanbieter erweiterbare, natürlichsprachliche Programmiersprache an. Diese Applikationen registrieren hierbei einen Wortschatz im Betriebssystem, der dann von beliebigen Applescripten und anderen Applikationen verwendet werden kann. Auch die aus Nextstep stammenden Services und der 2005 eingeführte Automator gehen in eine ähnliche Richtung.

In jedem Fall ist mit Siri ein “Living the Future”-Moment entstanden, der Science Fiction näher an die Realität holt.

Kommentare anzeigen
Gepostet am Freitag, Oktober 7 2011.
Getaggt mit: iOS 5SiriStar TrekSpracherkennungiPhone 4s
3
Anmerkungen
  1. von taptoplay gepostet

Tap to Play! Apple. Games. And more.
flattr ist eine nette Möglichkeit zur Geldverteilung an Netzinhalte, die man gerne liest, sieht, hört oder anderweitig nutzt und unterstützen möchte. Ihr könnt entweder ganz Tap to Play! mit diesem großen Button hier flattrn oder jeden einzelnen Artikel. Noch Fragen?
EmpfehlungenFeaturesiPadiPhoneKindleOliver wird wenigerArchivÜberKontaktImpressumTwitterRSS Ask me anything
Archiv Abonnieren
Vorige Seite Weiter