Blog

Stellen Sie sich eine Zukunft "mit freien Händen" vor

Veröffentlicht von  Claus Jepsen

Ingenieure entwickeln zurzeit Computer und Mobilgeräte für mehr Freisprechmöglichkeiten. Das heißt, Menschen werden häufiger bedeutungsvolle Gespräche mit Computern haben. An erster Stelle denken Ingenieure an die Stimme, wenn es um Kommunikation mit Geräten geht. Die Zukunft der freihändigen Mensch-Maschine-Kommunikation hängt davon ab, wie gut die Geräte die menschliche Sprache mit allen ihren Fehlern, Pausen und Akzenten verstehen.

Der Mensch wird vermutlich an vielen verschiedenen Stellen über die Stimme mit Computern kommunizieren können. Die Sprachen unterscheiden sich erheblich in den komplexen Merkmalen wie Lauten und Betonungen. Außerdem sprechen die Menschen sehr unterschiedlich, unterschiedlich laut und unterschiedlich hoch. Die Fehler der Echtzeit-Übersetzungssoftware von Skype zeigt, wie weit künstliche Intelligenz reichen muss, sogar in der Übersetzung zwischen zwei Varianten derselben Sprache.

Digitale Assistenten

Digitale Assistenten wie Alexa, Siri, Cortana, Google Assistant und andere geben den Blick in eine Zukunft frei, in der ein Bildschirm als Benutzeroberfläche überflüssig werden könnte. Die Stimme ersetzt immer mehr die Benutzeroberfläche. Allerdings versuchen die Geräte die Stimme durch Daten zu ergänzen. Zum Beispiel nutzt Cortana die E-Mails und Kalender ihrer Nutzer. Bald wird Cortana mit dem Microsoft Office 365 Cloud Service in der Lage sein, Dateien zu suchen und sachdienliche Dokumente zu finden. Der Bankenriese Wells Fargo and Visa arbeitet auch an eigenen Erkennungssystemen anhand von Stimme und biometrischen Daten. Dort wird dann beispielsweise die Stimme für Fonds-Transaktionen eingesetzt. Voice Control ermöglicht die Arbeit mit Computern, während das Geschäft ganz normal weitergeht.

Aber Voice Control birgt einige Sicherheitsrisiken. Selbst leise verbale Kommunikation kann abgefangen werden. Nachahmend können sich Anwender als die autorisierte Person ausgeben und Daten stehlen. Das bedeutet, dass Voice Control auf breiter Ebene Einzel- und Firmenrechte bezüglich Datenschutz und Vertraulichkeit bedrohen könnte. Voice Control bietet vermutlich einen neuen Grad an Funktionalität und viele Vorteile, ohne dass man ein Telefon vor sich haben muss. Wie Büros die Sicherheitsrisiken vermeiden und diese Vorteile in die Unternehmenswelt übertragen werden, bleibt abzuwarten.

Multi-Threading: Der Heilige Gral

Multi-Threading-Geräte, -Programme oder solche, die sich verschiedene Situationen merken können, könnten der Schlüssel zur verbesserten Kommunikation mit KI-Bots sein. Heute muss ein Anwender normalerweise einen Anwendungsfall beenden, bevor er einen neuen starten kann. Die meisten Leute wollen ein altes Gespräch nicht immer beenden, bevor sie mit einem neuen beginnen. Wenn ein Anwender gleichzeitig an mehreren Konversationen in verschiedenen Stadien mit einem KI-Bot beteiligt ist, können KI-Bots eventuell viel mehr erreichen. Ingenieure arbeiten zurzeit daran, Geräten die Flexibilität zu geben, Stimme und Text als Interface zu erkennen. Die Stimme kann in der Privatheit zu Hause oder in einem Auto funktionieren, insbesondere wenn mehrere Leute gleichzeitig an unterschiedlichen Orten arbeiten. In einem vollen Büro ist schriftliche Kommunikation wahrscheinlich die bessere Option.

Einbau von KI in verschiedene Systeme

Zudem arbeiten Ingenieure daran, KI in verschiedene Systeme und Bots zu integrieren. Dies ist eine herausfordernde Aufgabe. KI beschränkt sich zurzeit auf Sprachverarbeitung und einige Grundlagen in Zusammenhang mit festen Daten wie Wetter, Verkehr, Belanglosigkeiten und Fragen zur Firmeninventur.

Wenn Einzelpersonen mit Bots inhaltlich stärker kommunizieren möchten, müssen die Bots „schlauer“ sein - also häufiger proaktiv und intuitiv. Sie müssen Dinge über die Person, mit der sie kommunizieren, lernen. Der Bot sollte Vorlieben und Verhalten des Nutzers kennen und so potenzielle Bedürfnisse antizipieren und suggerieren. Ohne dieses „Lernen“ kann sich der Bot nicht in eine bedeutungsvolle Kommunikation einbringen. Auch, wenn eine Einzelperson zunächst sehr nachsichtig sein kann, wenn der Bot nicht alles sofort richtig versteht, erwarten Anwender von einem Bot, dass er sich verbessert und aus ihrem Verhalten lernt. 2017 werden sich Anwender nach Bots umsehen, die mehr erreichen wollen.

Claus Jepsen

Claus Jepsen

Claus Jepsen is a technology expert who has been fascinated by the micro-computer revolution ever since he received a Tandy TRS model 1 at the age of 14. Since then, Claus has spent the last few decades developing and architecting software solutions, most recently at Unit4, where he is the Chief Architect and Head of Innovation, leading the ERP vendor's focus on enabling the post-modern enterprise. 

At Unit4, Claus is building cloud-based, super-scalable solutions and bringing innovative technologies such as AI, chatbots, and predictive analytics to ERP. Claus is a strong believer that having access to vast amounts of data allows us to construct better, non-intrusive and pervasive solutions to improve our experiences, relieve us from tedious chores, and allow us focus on what we as individuals really love doing.

Folgen linkedin


Newsletter