AlexaGoogleKünstliche Intelligenz

Sprechen statt tippen – wie Sprache und Sprachassistenz unseren digitalen Alltag verändern

Sprechen statt tippen – wie Sprache und Sprachassistenz unseren digitalen Alltag verändern

Manchmal ganz schön nervig: Das Abhören von Sprachnachrichten kann mitunter ziemlich lange dauern und Menschen neigen dazu, einfach viel länger zu sprechen als eigentlich nötig. Zumindest sehen das 40% der Befragten einer Umfrage so1. Ebenso viele Deutsche verschicken jedoch auch mindestens einmal pro Woche eine Sprachnachricht. Dies ist das Ergebnis einer vom Bundesverband der Digitalwirtschaft beauftragten Studie zur Nutzung von Sprachnachrichten.

Voice-Nutzer wissen: Der Versand einer Sprachnachricht an einen Freund, die Spracheingabe der Zieladresse des nächsten Geschäftstermins via Google Maps, die Voice Search nach dem nächsten Restaurant, oder die mündliche Wetterabfrage ist auf einem Smartphone besonders schnell und bequem, sowie perfekt geeignet für Multitasker. So bleiben stets die Hände frei – zumindest neun Finger im Falle einer Sprachnachricht per WhatsApp.

WhatsApp Sprachnachricht versenden

Wer von der Zeitersparnis durch Sprechen statt Tippen noch nicht so ganz überzeugt ist, der werfe einen rund 45-sekündigen Blick in die diesjährige Google Keynote (ab min. 23:30) – samt euphorisierter Google Jünger.

Sprachassistenz nicht mehr ganz so neu

Die Grundlage für digitale Sprachassistenz, die Spracherkennung ging im letzten Jahrtausend los und wurde u.a. von IBM vorangetrieben. Kommerzielle Verbreitung erhielt eine Spracherkennungs-Software erstmals Ende der 1990er Jahre: die noch heute präsente Diktier-Software Dragon NaturallySpeaking. Im Smartphone-Zeitalter ließen sich erstmals unter dem Google Betriebssystem Android 2.2 im Jahr 2010 Voice Actions z.B. für den Versand von Textmitteilungen oder zur Navigation nutzen.

Schaut man sich hierzu das entsprechende YouTube Video an, wirkt die Technologie bereits, als entstamme sie dem digitalen Mittelalter:

Ende 2011 folgte Apples Markteinführung einer Sprachtechnologie mit Siri auf dem iPhone 4s. Erst ein Jahr zuvor hatte Apple das Unternehmen Siri übernommen.

Digitale Sprachassistenten – der Markt wächst rasant

Was mit Google und Apple begann, ist heute wesentlich breiter gefächert. Blickt man auf die Big Five auch GAFAM (Google, Amazon, Facebook, Apple und Microsoft), so bieten alle entweder eigene Soft- und/oder Hardware im Bereich der Sprachassistenz. Daneben mischen Unternehmen wie Samsung oder in China der Suchmaschinenanbieter Baidu und Xiaomi als Hardwarehersteller kräftig mit.

Die größten Anbieter von Sprachassistenzsystemen im Überblick

Anbieter Name Technologie Aktivierungs-kennwort Smart Speaker und kompatible Hardware Marktanteil Smart Speaker2
Amazon Alexa Alexa, Amazon, Echo, Computer Echo, Echo Dot, Echo Show, Echo Plus, Drittanbieter wie z.B. Bose, Sonos... 61%
Google Assistant Ok Google Jedes Android Smartphone, Google Home, Home Mini, Home Max, Drittanbieter wie z.B. Bose, Sonos... 24%
Apple Siri Hey Siri iPhone, Home Pod 5%
Microsoft Cortana Hey Cortana Teil von PCs und Laptops mit Windows 10 Betriebssystem, Xbox One k.A.
Samsung Bixby Hi Bixby Samsung Smartphones, Galaxy Home - geplante VÖ in 2019 k.A.

Einsatzzweck von digitalen Sprachassistenten

Für die Nutzer von Alexa, Siri & Co. spielt der Abruf von Informationen aus Suchmaschinen die größte Rolle im Einsatz der Technologie. Zudem werden Meldungen wie Wettervorhersagen oder Verkehrsnachrichten abgerufen. Das Erstellen und die Benachrichtigung von Kalendereinträgen, sowie die Bedienung von Musik und Radio fallen unter die typischen Anwendungen. Ein Teil der Nutzer bedient bereits Haushaltsgeräte, wie z.B. Thermostate via Sprachassistent. Noch eine eher untergeordnete Rolle spielt hingegen die Möglichkeit zur Bestellung von Waren (mehr dazu: Abschnitt Voice Commerce). Mehr Zahlen und interessante Fakten rund um die digitalen Sprachassistenten in unserer Infografik:

Infografik Digitale Sprachassistenten

Erfolgsfaktor Menschlichkeit?

Amazon’s System Echo hat den nord-amerikanischen und etwas zeitversetzt auch den deutschen Markt in kurzer Zeit erobert. Zwar rechnet man damit, dass in den nächsten 5-6 Jahren Google mit Amazon gleichauf liegt.2 Dennoch überzeugen Echo und Alexa durch Amazon-typisch günstige Preise für die eigene Hardware. Möglicherweise spielt auch eine weitere Besonderheit eine Rolle beim Erfolg von Alexa. So arbeitet Amazon daran, dass Alexas Stimme immer menschlichere Züge annimmt und z.B. flüstert, Pausen zur Betonung einlegt oder ihr Sprechtempo variiert.3 Offensichtlich weisen die Nutzer den Sprachrobotern also menschliche Eigenschaften zu und sind möglicherweise dann zufriedener mit ihrem Assistenzsystem, wenn dieses besonders sympathisch erscheint. Bestätigt wird diese emotionale Mensche-Maschine-Interaktion in einem Interview der Seite Home & Smart mit einem deutschen Alexa Manager: „…In der Realität äußern viele Nutzer ihre Gefühle jedoch direkt zu Alexa […] Wir hätten auch nicht erwartet, dass die Nutzer Alexa so häufig personifizieren“.4

Ob sich hier bereits mehr oder weniger echte „Beziehungen“ entwickeln, werden bald möglicherweise Soziologen untersuchen. Sind bizarre Liebesgeschichten wie die im Film „Her“ von 2013 bereits Realität?

Sprachsteuerung für das smarte Zuhause

Neben der bloßen Steuerung über Sprache nehmen auch Zahl und Diversität der zu steuernden Endgeräte zu. Unter das Schlagwort Smart Home fallen sämtliche vernetzte Geräte im und rund um den Haushalt. So lassen sich mittels Sprachsteuerung bereits Rasenmäher oder Kaffemaschinen starten. Auch mehrschrittige Vorgänge, wie z.B. das parallele Anschalten oder Dimmen des Lichts in Kombination mit dem Herunterlassen der Jalousien und der Regelung der Heizungstemperatur lassen sich als Sequenz selbst erstellen und einfach z.B. über Google Home bedienen. Egal ob Lampen und Lichtschalter, Saugroboter, Klimageräte, Türklingeln, Alarmanlagen, Überwachungskameras, W-LAN Steckdosen – die Liste kompatibler Geräte wird immer länger. Glück für alle, die im Urlaub mit der App ihrer Überwachungskamera überprüfen möchten, ob der Rasenmäher noch nicht ausgebüxt ist.

Kritik an Sprachassistenten

Zugleich gibt es auch reichlich Kritik an der Kommunikation mit Maschinen. So stellen einige Psychologen und Linguisten in Frage, ob die künstliche Intelligenz nicht negative Folgen für die Entwicklung der Sprache und soziale Intelligenz von Kindern haben muss.5 Auch ein aktuelles Bundestags-Gutachten sieht hier Risiken und noch mehr Aufklärungsbedarf durch die Hersteller, insbesondere bei der Nutzung der Dienste durch Kinder.6

Ebenfalls fraglich ist, welchen Einfluss Sprachassistenzsysteme auf die Kommunikation zwischen Menschen haben wird. Werden Unternehmen zukünftig noch menschliche Servicekräfte einsetzen oder lässt sich die große Welle an Anfragen digitalisiert erledigen? Werden meine Smart Speaker mir zukünftig die passende Werbung abspielen, nachdem sie ja bestens über meine Fragen und Lebensgewohnheiten Bescheid wissen?

Und nicht zuletzt seit der DSGVO im letzten Jahr ist das Thema Datenschutz für viele noch mehr in den Blickpunkt geraten. So sehen manche die Gefahr, dass z.B. Amazons Alexa gekapert werden kann und so der perfekte Trojaner eingeschleust wird. Insbesondere durch die zahlreichen externen Plug-ins, genannt Alexa Skills, sehen viele eine erhöhte Gefahr der Spionage. Amazon stellt hierzu fest, dass Skills keine direkten Sprachdaten der Nutzer erhalten, sondern nur die interpretierten Funktionsaufrufe.4 Ein unabhängiger Test ergab, dass Daten tatsächlich nur dann übermittelt wurden, wenn vorher das Aktivierungskennwort Alexa genannt und eine Anfrage ausgelöst wurde.7 Jedoch gibt es – das gesteht auch Amazon – immer wieder unbeabsichtigte Momente des Zuhörens, da Alexa durch ähnliche Begriffe oder Laute versehentlich gestartet wurde. So sind etliche Fälle bekannt, in denen Alexa unbeabsichtigt z.B. ein Puppenhaus bestellte. Natürlich sind auch Hacker-Zugriffe, z.B. zum Öffnen einer Haustüre vorstellbar und setzen entsprechende Schutzmaßnahmen voraus.

Grundsätzlich berichten Menschen von einem unbehaglichen Gefühl, da sie sich vorstellen, dass jemand/etwas sie permanent belauschen könnte.8

Voice Search und die Bedeutung für die Suchmaschine

Im Online-Marketing geistert unter SEOs (Menschen die Suchmaschinenoptimierung betreiben) seit ein paar Jahren das Voice Search Gespenst herum. Für einige ist es nach wie vor eines der absoluten Trendthemen. So kann Voice Search dazu führen, dass die Suchenden nur noch eine Antwort erhalten, in ähnlicher Weise, wie dies mit Rich Snippets (siehe auch unser Blogbeitrag zu Schema.org) bereits bei den lesbaren Suchergebnissen am Desktop erfolgt. Voice Search Experten raten deshalb dazu, sich sämtliche potenziellen Fragen der Nutzer entlang ihrer Customer Journey vor Augen zu führen und hierauf die passenden Antworten anzubieten. D.h. die Inhalte zu den eigenen Leistungen und Angeboten sollten möglichst dialogisch aufgebaut werden, so dass nach dem Frage-Antwort Prinzip auch kleine Informationshappen via Voice serviert werden können.

Als grundlegende Hausaufgabe sollten alle Unternehmen – insbesondere diejenigen mit lokaler Kundschaft – ihre Google My Business Einträge stets aktuell halten und ggf. Öffnungszeiten ihrer Filialen updaten, sowie die Rezensionen ausbauen und im Idealfall auf einen guten Durchschnittswert bringen.

Derzeit erreichen Google rund 20%-30%  aller Suchanfragen in Sprachpaketen. Noch sind sich die Experten einig, inwieweit das Thema Voice Search vielleicht auch doch einen etwas zu großen Hype erfährt.9

Sprache goes Shopping: Voice Commerce

„Schatz, ich bin kurz einkaufen! …fertig.“ 🛍️
Noch in den Kinderschuhen scheint das Thema Voice Commerce zu stecken. Wenn überhaupt, so werden derzeit von den Voice-affinen Käufern niedrigpreisige Artikel gekauft.8 Größtes Manko dürfte momentan das noch nicht stark ausgeprägte Vertrauen in die Sicherheit und Fehlerfreiheit des Bestellens per Spracheingabe sein. Doch wer bereits sein Online-Banking via Smartphone betreibt oder sein Abendessen über eine der typischen Lieferapps bestellt hat, der wird sich wohl diesem komfortablen Bestellprozess auf kurz oder lang wohl auch für höherpreisige Transaktionen nicht mehr verschließen. Wie hierbei mal eben 5-15 Minuten Zeitersparnis gewonnen werden, zeigt erneut ein Beispiel aus der Google Keynote 2019: Reservierung eines Mietwagens.

Fazit

Unsere Sprache hat uns Menschen zur weltbeherrschenden Spezies gemacht. Mit der Entwicklung künstlicher Intelligenz, schneller Datenverbindungen und immer leistungsfähigerer Hardware nehmen digitale Sprachassistenten, Voice Search und bald auch Voice Commerce rasant an Fahrt auf. Die Konzerne haben großes Interesse daran, ihre Technologien und Assistenten beim Verbraucher zu platzieren, stellen sie doch den idealen Zugang zu den Interessen, Wünschen und immer mehr auch Transaktionen dar. Zwar gibt es noch einige Hemmschuhe speziell im Aufbau von Vertrauen der Nutzer, wie die DSGVO, die vielen das Thema Datenschutz bewusster gemacht hat, oder den Cambridge Analytica Datenskandal, der möglicherweise nicht nur am Vertrauen in Facebook gerüttelt hat, oder auch die Tatsache, dass am Ende vielleicht doch ein Mensch meine Kommunikation mit dem heimischen Sprachroboter auswertet.10

Doch gleichzeitig zeigt sich: Kostenlose Services, die das Leben bequemer machen, vermeintlich mehr Zeit für andere Dinge und die Einfachheit der Steuerung und Erledigung diverser Aufgaben über den „Bedienkanal“, den wir alle von klein auf beherrschen, sind auf lange Sicht unschlagbare Argumente für den zukünftigen Erfolg der digitalen Sprachassistenten.

Quellen

1 BVDW- Studie zu Sprachnachrichten
2 Voicebot/Loup Ventures – Marktanteile von Smart Speakern
3 New SSML Features Give Alexa a Wider Range of Natural Expression
4 Home & Smart – Interview mit Dr. Philipp Berger von Amazon
5 Washington Post – How millions of kids are being shaped by know-it-all voice assistants
6 Handelsblatt – Bundestags-Gutachten kritisiert Sprachassistenten
7 ZDF Magazin WISO – Amazon gnadenlos erfolgreich
8 PWC – Prepare for the voice revolution
9 OMT – Online Marketing Trend Umfrage 2019
10 Spiegel online – Google analysiert Nutzergespräche mit seinem Sprachassistenten