Alors que de nombreux acteurs du secteur affirment que la blockchain, l'IA remplaçant les travailleurs humains ou la réalité augmentée sont les prochaines grandes nouveautés technologiques, une technologie cruciale est sous-estimée : l'interface utilisateur vocale.
Des études suggèrent que 50 % des requêtes de recherche seront effectuées par le biais de la recherche vocale d'ici 2020. Ce que ces études sous-estiment, cependant, c'est que de petites améliorations de l'interface vocale ont le potentiel de changer complètement le paradigme actuel de l'interaction homme-machine. Cela va bien au-delà du cas d'utilisation de la recherche, l'interface vocale remplaçant ou s'intégrant profondément aux interfaces utilisateur graphiques et aux applications.
L'interface vocale permet aux personnes de communiquer avec des appareils en langage parlé naturel par l'intermédiaire de haut-parleurs intelligents et d'autres appareils, que l'on trouve actuellement dans des appareils tels qu'Alexa ou Google Home. La parole est fondamentale dans la façon dont nous faisons les choses avec d'autres humains, et elle le sera dans la façon dont nous ferons les choses avec les ordinateurs à l'avenir.
Toutefois, il s'agit actuellement d'une opinion marginale.
La plupart des experts en technologie s'accordent à dire que la voix continuera à évoluer dans son rôle actuel de niche dans l'écosystème technologique, ou du moins qu'elle se développera progressivement au fur et à mesure que la technologie s'améliorera, mais je prédis que la voix sera l'événement principal en soi. Elle dominera nos interactions avec les logiciels et les appareils, et deviendra même aussi importante que l'interface utilisateur graphique.
Comme nous l'avons dit, cette opinion n'est pas partagée par tous. De nombreux experts du secteur reconnaissent que la technologie vocale est encore une nouveauté et qu'elle n'a pas encore atteint une adéquation parfaite entre le produit et le marché. D'éminents investisseurs en capital-risque, par exemple, estiment que tant que l'intelligence artificielle ne sera pas généralisée, la technologie vocale restera toujours très spécialisée.
En raison des nombreuses limitations actuelles des assistants vocaux, il est difficile pour les gens d'imaginer la voix comme la prochaine vague technologique. À mon avis, la voix est aujourd'hui comparable à l'Internet commuté du début des années 90. À l'époque, l'expérience en ligne était si mauvaise qu'il était difficile d'envisager ce qui serait possible une fois la bande passante améliorée. D'éminents penseurs ont fait toutes sortes de prédictions pour l'internet qui, avec le recul, semblent absurdement conservatrices - certains experts ont même prédit que l'internet n'aurait pas plus d'impact sur l'économie que les télécopieurs.
Les attentes des gens à l'égard de la voix sont tout aussi conservatrices aujourd'hui, en partie parce que l'expérience vocale est encore très rudimentaire. L'hypothèse est que tant que l'intelligence artificielle n'est pas généralisée, les bots seront peu performants dans les conversations - et la technologie ne sera jamais parfaite tant que les chatbots ne seront pas capables d'avoir une conversation presque humaine avec l'utilisateur. Toutefois, cette hypothèse concernant la nécessité d'une intelligence artificielle généralisée est erronée : Il existe certainement des moyens de faire en sorte que chatbots atteigne un niveau de performance proche de l'humain en utilisant la technologie actuelle.
Pour les assistants de haut-parleurs intelligents généraux, la couverture des sujets est si large qu'ils doivent être presque totalement auto-apprenants. Malheureusement, la technologie actuelle n'est pas assez performante pour créer automatiquement des robots auto-apprenants capables de gérer des conversations à plusieurs tours avec des humains. Si cette technologie existait, nous pourrions poser des questions complémentaires sur Google. Mais faire en sorte que les robots intelligents se construisent d'eux-mêmes, c'est comme essayer de faire en sorte qu'une application de smartphone se construise d'elle-même sans aucune intervention humaine - c'est tout simplement impossible pour l'instant.
Il existe un autre moyen d'obtenir une conversation de niveau presque humain avec les bots : réduire considérablement leur champ d'action. Comme pour les applications, les développeurs peuvent créer des bots sophistiqués pour des tâches spécifiques, en les programmant manuellement pour qu'ils s'engagent dans une conversation significative. C'est avec ce type de bots que se produira la percée de la voix : les haut-parleurs intelligents, les téléphones et d'autres appareils accueilleront ce type de bots, ce qui créera de grandes opportunités pour les premiers qui sauront tirer leur épingle du jeu.
Répondre aux problèmes des robots vocaux d'aujourd'hui
Pour saisir intuitivement la différence entre l'expérience des robots vocaux actuels et ce à quoi cette technologie ressemblera à l'avenir, nous devons commencer par comprendre pourquoi un dispositif vocal est actuellement l'équivalent de la navigation sur le web avec un modem à accès commuté.
Tout d'abord, les interactions de base avec un robot vocal sont encore très médiocres. Vous devez vous adresser spécifiquement à l'appareil avec un mot clé, après quoi vous devez attendre de voir si le robot a été activé avec succès ou non. S'il a été activé, vous devez parler après le signal sonore, à une vitesse lente mais constante, et formuler vos phrases de manière à inclure tous les paramètres nécessaires - un peu comme si vous parliez dans une instruction SQL. Si vous faites une pause pour réfléchir à tout moment, votre interaction échouera et vous devrez revenir au début.
Prenons un exemple concret :
Vous dites : "Hé, Google".
Il y a une pause pendant laquelle vous attendez la confirmation que le dispositif a été activé.
Si elle a été activée, vous poursuivez votre demande :
"Jouez 'Dark Horse' de Katy Perry sur YouTube, sur la télévision du salon.
Il y a un autre délai pendant que l'appareil traite ce que vous avez dit.
Si votre demande est acceptée, un événement se produira sur votre téléviseur et la vidéo sera diffusée.
En cas d'échec, il faut reprendre les choses depuis le début et réessayer, peut-être en changeant la structure de la phrase ou les mots, ou simplement en essayant de parler plus clairement.
Cette expérience est pleine de retards, d'erreurs potentielles et peut nécessiter de nombreux redémarrages pour accomplir des tâches. En outre, le robot vocal n'est pas encore intelligent et ne répondra pas aux commandes ou aux questions relatives à ce que vous êtes en train de faire.
Une nouvelle façon d'interagir avec les robots vocaux
La façon la plus simple d'imaginer les interactions avec les robots intelligents du futur est de se représenter un opérateur humain contrôlant l'appareil et lui donnant des instructions concernant spécifiquement l'utilisation de YouTube (et rien d'autre).
La première différence réside dans la vitesse d'interaction. Vous pouvez parler à l'opérateur "humain" à une vitesse normale, sans pause ni délai de réponse, et sans problème si vous faites une pause pendant que vous parlez. Vous pouvez également faire référence à l'opérateur humain au milieu d'une phrase - par exemple, "Je veux regarder la télévision - vous savez quoi, Alexa, mettez quelque chose sur YouTube". En fait, vous n'aurez peut-être pas besoin de prononcer son nom (le mot clé) pour qu'il réponde.
Ce robot à l'apparence humaine serait également flexible dans la manière dont il interagit avec vous :
Vous : "Alexa, je veux regarder YouTube".
Alexa : "Bien sûr, sur quelle télévision ?"
Vous : "Sur la télé de la cuisine - peut-être quelque chose de Katy Perry".
Alexa : "Avez-vous une chanson particulière en tête ?"
Vous : "Non, que pouvez-vous suggérer ?"
Humain : "'Roar', 'Dark Horse' ? J'ai mis plus de suggestions sur l'écran."
Vous : "Super, merci. Jouez 'Hot and Cold'".
C'est l'avenir des interactions avec les robots: Des interactions transparentes, fluides et faciles pour parler de la tâche ou du sujet en question. Imaginez un vaste univers de ces robots avec un univers tout aussi vaste d'appareils vocaux bon marché et banalisés. Ce sera comme si un opérateur humain se trouvait dans chaque pièce et à côté de chaque appareil. Il y aura encore beaucoup d'interfaces graphiques, mais elles seront beaucoup plus faciles à utiliser par l'intermédiaire du robot.
Steppinginto the future of voice (en anglais)
Aujourd'hui, il est courant de voir des employés dans des lieux tels que les stations de métro, les aéroports et les supermarchés fournir une assistance aux personnes utilisant des écrans tactiles en libre-service - par exemple, la personne qui vous aide à utiliser les machines d'enregistrement pour obtenir votre carte d'embarquement à l'aéroport. Imaginez, cependant, que cette personne puisse s'interfacer directement avec l'application d'enregistrement, c'est-à-dire qu'à mi-chemin du processus d'enregistrement, vous puissiez dire à la machine que vous voulez changer de siège par rapport à la position que vous avez choisie initialement, et l'application afficherait l'écran correspondant pour vous, le tout sans l'aide d'un assistant humain.
C'est l'avenir: un robot vocal sera intégré ou accessible à chaque appareil ou service avec lequel vous souhaitez vous engager, et fera instantanément ce que vous lui demandez. Vous n'aurez plus besoin de sortir votre téléphone ou votre ordinateur portable pour faire quelque chose. Au lieu de cela, il vous suffira de dire à haute voix ce dont vous avez besoin, et tout se mettra en place à partir de là.
En fin de compte, le passage à la téléphonie vocale se fera pour une raison aussi simple que la commodité. Dans notre monde moderne, les gens veulent faire les choses rapidement avec le moins de tracas possible, et la rapidité est plus importante que jamais. Bien que la majorité des acteurs du secteur des chatbots ne s'y attendent pas, ceux d'entre nous qui étudient et développent cette technologie prévoient des implications massives pour les opérations commerciales, le marketing, les ventes, l'image de marque, la distribution des produits et bien d'autres choses encore. La voix est l'avenir de la technologie, et nous sommes déjà à mi-chemin.
Partager ce message sur :
Créez gratuitement votre propre chatbot d'IA personnalisé
Commencez à créer un robot GPT personnalisé grâce à notre interface intuitive de type "glisser-déposer".
Commencez - c'est gratuit ! 🤖Aucune carte de crédit n'est requise
Restez au courant des dernières nouveautés en matière d'IA chatbots