Während viele in der Branche der Meinung sind, dass Blockchain, KI, die menschliche Arbeitskräfte ersetzt, oder Augmented Reality das "nächste große Ding" in der Technologie sind, gibt es eine entscheidende Technologie, die unterschätzt wird: die sprachgesteuerte Benutzeroberfläche.
Untersuchungen gehen davon aus, dass bis 2020 50 % der Suchanfragen über die Sprachsuche erfolgen werden. Was diese Studie jedoch unterschätzt, ist, dass kleine Verbesserungen in der sprachgesteuerten Benutzeroberfläche das Potenzial haben, das derzeitige Paradigma der Mensch-Computer-Interaktion komplett zu verändern. Dies geht weit über den Anwendungsfall der Suche hinaus und führt dazu, dass die sprachgesteuerte Benutzeroberfläche grafische Benutzeroberflächen und Anwendungen ersetzt oder tief in sie integriert.
Die sprachgesteuerte Benutzeroberfläche ermöglicht es Menschen, mit Geräten in natürlicher Sprache über intelligente Lautsprecher und andere Geräte zu kommunizieren, wie sie derzeit in Geräten wie Alexa oder Google Home zu finden sind. Sprechen ist grundlegend für die Art und Weise, wie wir Dinge mit anderen Menschen erledigen, und es wird grundlegend für die Art und Weise sein, wie wir in Zukunft Dinge mit Computern erledigen.
Dies ist jedoch derzeit nur eine Randmeinung.
Während die meisten Technikexperten der Meinung sind, dass die Sprache ihre derzeitige Nischenrolle im technologischen Ökosystem weiter ausbauen oder zumindest schrittweise wachsen wird, wenn sich die Technologie verbessert, ist meine Vorhersage, dass die Sprache an sich das Hauptereignis sein wird. Sie wird unsere Interaktionen mit Software und Geräten dominieren und sogar so wichtig werden wie die grafische Benutzeroberfläche.
Wie bereits erwähnt, handelt es sich hierbei nicht um eine Mainstream-Meinung. Viele Branchenexperten sind sich darüber im Klaren, dass die Sprachtechnologie immer noch ein Novum ist und noch nicht perfekt auf den Produktmarkt abgestimmt ist. Einige prominente VCs sind zum Beispiel der Meinung, dass die Sprachtechnologie immer eine Nische bleiben wird, bis eine allgemeine künstliche Intelligenz erreicht ist.
Aufgrund der vielen derzeitigen Einschränkungen von Sprachassistenten fällt es den Menschen schwer, sich die Sprache als die nächste Technologiewelle vorzustellen. Meiner Meinung nach ähnelt die heutige Sprachtechnologie der Einwahl ins Internet in den frühen 90er Jahren. Damals war das Online-Erlebnis so schlecht, dass man sich kaum vorstellen konnte, was möglich sein würde, wenn sich die Bandbreite verbessert. Führende Denker machten alle möglichen Vorhersagen für das Internet, die im Nachhinein absurd konservativ erscheinen - einige Experten sagten sogar voraus, dass es keinen größeren Einfluss auf die Wirtschaft haben würde als Faxgeräte.
Die Erwartungen der Menschen an die Sprachsteuerung sind heute ähnlich konservativ, was zum Teil daran liegt, dass die Sprachsteuerung noch immer nicht ausgereift ist. Man geht davon aus, dass Bots bis zur Erreichung einer allgemeinen künstlichen Intelligenz in Gesprächen schlecht abschneiden werden - und dass die Technologie erst dann großartig sein wird, wenn chatbots in der Lage ist, ein fast menschliches Gespräch mit dem Benutzer zu führen. Diese Annahme über die Notwendigkeit einer allgemeinen künstlichen Intelligenz ist jedoch fehlerhaft: Es gibt durchaus Möglichkeiten, chatbots mit der derzeitigen Technologie auf ein fast menschliches Niveau zu bringen.
Für allgemeine intelligente Sprachassistenten ist die Themenabdeckung so breit, dass sie fast vollständig selbstlernend sein müssen. Leider ist die derzeitige Technologie nicht gut genug, um automatisch selbstlernende Bots zu erstellen, die Gespräche mit Menschen über mehrere Runden hinweg führen können. Wenn es diese Technologie gäbe, könnten wir bei Google Folgefragen stellen. Aber intelligente Bots, die sich selbst entwickeln, sind so, als würde man versuchen, eine Smartphone-App ohne menschliches Zutun selbst zu entwickeln - das ist im Moment einfach nicht möglich.
Es gibt noch eine andere Möglichkeit, mit Bots eine Konversation auf fast menschlichem Niveau zu erreichen: die drastische Einschränkung ihres Anwendungsbereichs. Genau wie bei Apps können Entwickler ausgeklügelte Bots für bestimmte Aufgaben erstellen und sie manuell so programmieren, dass sie eine sinnvolle Konversation führen. Mit dieser Art von Bots wird der Durchbruch für die Sprachkommunikation kommen: Intelligente Lautsprecher, Telefone und andere Geräte werden diese Art von Bots beherbergen und denjenigen, die es richtig anstellen, große Chancen eröffnen.
Die Probleme der heutigen Voice Bots angehen
Um den Unterschied zwischen der Erfahrung mit aktuellen Voice Bots und dem, wie diese Technologie in Zukunft aussehen wird, intuitiv zu erfassen, müssen wir zunächst verstehen, warum ein Sprachgerät derzeit das Äquivalent zum Surfen im Internet mit einem Einwahlmodem ist.
Erstens sind die grundlegenden Interaktionen mit einem Sprachbot noch sehr dürftig. Man muss das Gerät gezielt mit einem heißen Wort ansprechen und dann abwarten, ob der Bot erfolgreich aktiviert wurde oder nicht. Wenn er aktiviert wurde, müssen Sie nach dem Piepton in einem langsamen, aber gleichmäßigen Tempo sprechen und Ihre Sätze so formulieren, dass sie alle erforderlichen Parameter enthalten - fast so, als würden Sie in einer SQL-Anweisung sprechen. Wenn Sie zu irgendeinem Zeitpunkt eine Denkpause einlegen, wird Ihre Interaktion fehlschlagen und Sie müssen zum Anfang zurückkehren.
Schauen wir uns ein Beispiel aus der Praxis an:
Sie sagen: "Hey, Google".
Es gibt eine Pause, in der Sie auf die Bestätigung warten, dass das Gerät aktiviert wurde.
Wenn sie aktiviert wurde, fahren Sie mit Ihrer Anfrage fort:
"Spielen Sie 'Dark Horse' von Katy Perry auf YouTube auf dem Fernseher im Wohnzimmer."
Es gibt eine weitere Verzögerung, während das Gerät verarbeitet, was Sie gesagt haben.
Wenn Ihre Anfrage erfolgreich war, beginnt auf Ihrem Fernseher etwas zu passieren und das Video wird abgespielt.
Wenn es nicht klappt, muss man wieder von vorne anfangen und es noch einmal versuchen, vielleicht mit einer anderen Satzstruktur, anderen Worten oder einfach nur, um deutlicher zu sprechen.
Diese Erfahrung ist voller Verzögerungen, möglicher Fehler und kann viele Neustarts erfordern, um Aufgaben zu erledigen. Außerdem ist der Sprachroboter noch nicht intelligent und reagiert nicht auf entsprechende Befehle oder Fragen zu dem, was Sie gerade tun.
Eine neue Art der Interaktion mit Sprachrobotern
Am einfachsten kann man sich die Interaktion mit den intelligenten Bots der Zukunft vorstellen, wenn man sich einen menschlichen Bediener vorstellt, der das Gerät steuert und ihm Anweisungen gibt, die sich speziell auf den Betrieb von YouTube beziehen (und auf nichts anderes).
Der erste Unterschied liegt in der Geschwindigkeit der Interaktion. Sie können mit dem "menschlichen" Bediener in normaler Geschwindigkeit sprechen, ohne Pausen oder Verzögerungen bei der Antwort, und ohne Probleme, wenn Sie während des Sprechens eine Pause machen. Sie können auch mitten im Satz auf den menschlichen Bediener verweisen, z. B. "Ich möchte fernsehen - weißt du was, Alexa, stell bitte etwas auf YouTube ein." Es kann sogar sein, dass Sie den Namen (das heiße Wort) gar nicht sagen müssen, damit er antwortet.
Dieser menschenähnliche Bot wäre auch flexibel in Bezug auf die Art und Weise, wie er mit Ihnen interagiert:
Sie: "Alexa, ich möchte YouTube sehen."
Alexa: "Klar, auf welchem Fernseher?"
Sie: "Auf dem Küchenfernseher - vielleicht etwas von Katy Perry."
Alexa: "Haben Sie einen bestimmten Song im Sinn?"
Sie: "Nein, was können Sie vorschlagen?"
Mensch: "'Roar', 'Dark Horse'? Ich habe weitere Vorschläge auf den Bildschirm gebracht."
Sie: "Toll, danke. Spielen Sie 'Hot and Cold'."
Dies ist die Zukunft der Bot-Interaktion: Nahtlos, reibungslos und einfach, um über die jeweilige Aufgabe oder das jeweilige Thema zu sprechen. Stellen Sie sich ein riesiges Universum dieser Bots mit einem ebenso riesigen Universum an billigen, handelsüblichen Sprachgeräten vor. Es wird so sein, als stünde in jedem Raum und neben jedem Gerät ein menschlicher Bediener. Es wird immer noch viele grafische Benutzeroberflächen geben, aber sie werden durch den Bot viel einfacher zu bedienen sein.
Schrittin die Zukunft der Sprache
Heutzutage ist es üblich, dass Mitarbeiter an Orten wie U-Bahnhöfen, Flughäfen und Supermärkten den Nutzern von Selbstbedienungs-Touchscreens behilflich sind - zum Beispiel die Person, die Ihnen am Flughafen an den Check-in-Automaten hilft, Ihre Bordkarte zu erhalten. Stellen Sie sich jedoch vor, diese Person könnte direkt mit der Check-in-Anwendung interagieren, d. h., Sie könnten dem Automaten auf halbem Weg zum Check-in mitteilen, dass Sie Ihren Sitzplatz ändern möchten, und die Anwendung würde Ihnen den entsprechenden Bildschirm anzeigen - und das alles ohne die Hilfe eines menschlichen Assistenten.
Das ist die Zukunft: Ein Sprachbot wird in jedes Gerät oder jeden Dienst, mit dem Sie arbeiten möchten, eingebettet sein oder darauf zugreifen können und sofort das tun, was Sie befehlen. Sie werden nicht mehr Ihr Telefon oder Ihren Laptop zücken müssen, um etwas zu erledigen - stattdessen brauchen Sie nur laut zu sagen, was Sie brauchen, und alles wird sich von selbst ergeben.
Bei der Umstellung auf die Sprachtechnologie geht es letztlich um etwas so Einfaches wie Bequemlichkeit. In unserer modernen Welt wollen die Menschen Dinge schnell und ohne großen Aufwand erledigen, und Geschwindigkeit ist wichtiger denn je. Auch wenn die meisten, die mit der Chatbot-Industrie zu tun haben, derzeit nicht damit rechnen, sehen diejenigen von uns, die die Technologie erforschen und entwickeln, massive Auswirkungen auf Geschäftsabläufe, Marketing, Vertrieb, Markenbildung, Produktvertrieb und vieles mehr voraus. Sprache ist die Zukunft der Technologie, und wir sind bereits auf halbem Weg dorthin.
Teilen Sie dies auf:
Erstellen Sie kostenlos Ihren eigenen personalisierten AI-Chatbot
Beginnen Sie mit der Erstellung eines personalisierten GPT-Bots mit unserer intuitiven Drag & Drop-Oberfläche.
Legen Sie los - es ist kostenlos! 🤖Keine Kreditkarte erforderlich
Bleiben Sie auf dem Laufenden über AI chatbots