- Les systèmes IVR modernes combinent la reconnaissance vocale et le NLP pour aller au-delà des menus encombrants, en traitant les demandes de base, en recueillant des informations et en acheminant les appels.
- Coûts inférieurs à ceux des agents vocaux entièrement autonomes.
- Le SVI suit des chemins définis et utilise des messages préenregistrés, ce qui facilite sa maintenance pour les cas d'utilisation simples.
- Pour éviter de frustrer les utilisateurs, les menus doivent être courts, les flux doivent être testés et affinés, et il faut toujours prévoir des chemins clairs vers des agents en direct lorsque les clients ont besoin d'une aide humaine.
"Si vous souhaitez parler à un humain, dites 'humain'.
"Humain".
Désolé, je n'ai pas trouvé d'option correspondant à "Cubain". Si vous souhaitez parler..."
Soupir.
La réputation des systèmes de réponse vocale interactive (RVI) a été traînée dans la boue.
Et, je veux dire, juste ; on peut certainement les appeler le vilain petit enfant de la famille des agents vocaux de l'IA.
Ils sont encombrants, dépassés et peu pratiques. À une époque où les applications les plus sophistiquées sont disponibles sur nos téléphones, avoir une conversation vocale avec un robot semble être l'utilisation la moins pratique de ces puissances de poche.
Pourquoi suis-je encore en train d'écrire cet article ?
Oh, oui. [s'éclaircit la gorge].
...mais en tant que connaisseur de la technologie vocale et adepte de la conception d'applications élégantes, j'ai quelques idées à proposer en faveur des flux téléphoniques automatisés.
Il s'agit de la barrière d'entrée la plus basse pour l'assistance à la clientèle, et les technologies de soutien - NLP (traitement du langage naturel) et ASR (reconnaissance automatique de la parole) - ont beaucoup progressé.
Avec une conception appropriée, les mots-clés mal compris et les menus interminables ne sont plus qu'un vestige du passé.
Je vous invite donc à découvrir les différentes parties du système, leur utilisation actuelle et les avantages uniques de cette technologie.
Car si vous avez certainement pensé à l'IVR, je parie que vous n'y avez jamais vraiment réfléchi.
Qu'est-ce que l'IVR ?
Le SVI (réponse vocale interactive) est un système téléphonique automatisé que les entreprises utilisent comme un menu pour guider les clients dans leurs appels d'assistance. Ces systèmes ont la capacité de répondre aux questions fréquemment posées, d'effectuer des tâches de base et de passer le relais à un agent en chair et en os.
Le SVI décharge l'agent en chair et en os des tâches de base que sont l'interrogation, l'envoi et la collecte d'informations, les premières parties de l'équation réservant les agents en chair et en os aux cas plus nuancés ou plus délicats.
Grâce à une bibliothèque de messages (généralement préenregistrés) et à la capacité de lire les données de l'utilisateur, ces agents numériques sont en mesure de se décharger d'une bonne partie du travail manuel de l'assistance à la clientèle.
Comment fonctionne l'IVR ?

1. Appel initial
Le flux IVR est lancé lorsqu'un client appelle une ligne téléphonique dédiée.
3. Entrée de l'utilisateur
L'utilisateur sélectionne une option. Le système peut lire l'entrée de l'utilisateur de différentes manières.
Multi-fréquence à deux tons (DTMF)
La DTMF est un classique. Il est simple et sans ambiguïté. Il est compréhensible qu'il soit moins apprécié - si vous passez un appel téléphonique, vous voulez parler.
D'autre part, c'est le moyen le moins exigeant en termes de ressources pour recueillir l'avis des utilisateurs.
Il est très utilisé par les services publics, c'est-à-dire les institutions qui n'ont pas encore mis en place un portail d'aide complet et qui s'attendent à ce que les demandes aboutissent de toute façon à l'intervention d'un agent en chair et en os.
Reconnaissance des commandes vocales
Il s'agit de demander à l'utilisateur de prononcer le mot associé à l'option choisie, par exemple "si vous souhaitez consulter le solde de votre compte, dites 'solde'".
Cette technologie a fait des progrès considérables au cours des dernières décennies, depuis qu'elle est apparue.
Vous êtes peut-être habitué à une reconnaissance frustrante et peu précise (comme dans l'exemple de l'introduction), mais cela est davantage lié à des systèmes SVI obsolètes qu'aux capacités de la reconnaissance des commandes vocales.
Reconnaissance automatique de la parole (ASR) et NLP
Les systèmes sophistiqués peuvent opter pour une reconnaissance vocale complète avec des systèmes NLP.
L'utilisateur exprime son choix en langage clair et des algorithmes basés sur des réseaux neuronaux profonds sont utilisés pour transcrire et classer les données de l'utilisateur, par exemple "Ouais, euh, je veux faire un dépôt".
Des systèmes disposant de relativement peu de ressources peuvent exécuter des modèles ASR et NLP assez rapides et précis, et les entreprises obtiennent des résultats positifs stupéfiants avec cette configuration.
4. Routage
En fonction de la structure du système et de la réponse du client, ce dernier sera dirigé vers l'étape suivante.
Ils peuvent être invités à saisir des informations personnelles, telles qu'un numéro de carte de crédit ou une date de naissance. Ils peuvent également être renvoyés à un menu ultérieur proposant des options plus spécifiques.
SVI et agents vocaux IA
Donc, si vous ajoutez une enveloppe vocale à un chatbot d'assistance à la clientèle, cela en fait-il un système IVR ?
Je suppose que, techniquement, c'est le cas.
Bien que les SVI soient utilisés pour désigner des systèmes avec un flux prédéfini et des messages préenregistrés.
Dans ce cas, l'agent utilise un message préenregistré pour inviter l'utilisateur à choisir l'une des options proposées et l'achemine en conséquence.
Dans le cas d'un agent d'IA vocal, l'utilisateur parle à l'agent et les réponses sont générées de manière dynamique. L'agent détermine de manière autonome quand évoquer quel outil, le cas échéant.
Un SVI utilise des messages préenregistrés et une entrée utilisateur rigide pour guider les utilisateurs à travers un flux. À chaque étape, l'utilisateur se voit proposer une série d'options qu'il doit sélectionner.
Un agent vocal IA, quant à lui, a accès à certains outils et a la capacité d'interpréter l'entrée de l'utilisateur pour déterminer lequel évoquer. Il génère également des réponses de manière dynamique, au lieu de diffuser des messages préenregistrés.

Quand utiliser le SVI plutôt qu'un agent vocal ?
L'éléphant dans la pièce : pourquoi s'embarrasser d'un système de commande vocale étape par étape alors que nous disposons d'agents conversationnels fluides et autonomes ?
Et si vous utilisez déjà l'IA pour catégoriser l'intention de l'utilisateur dans un SVI, pourquoi ne pas opter pour un système entièrement autonome ?
Je suis heureux que vous ayez posé la question.
Quand le budget est serré
Sans compter la reconnaissance vocale (qui serait présente dans les deux systèmes), l'utilisation de l'IA dans le SVI se résume à classer l'énoncé d'un utilisateur dans l'une des n catégories d'exemples (généralement >10).
Les agents autonomes, quant à eux, font appel à de multiples appels LLM (large language model) pour déterminer l'intention de l'utilisateur, composer une réponse et utiliser la synthèse vocale (TTS) pour générer le son associé, ce qui peut être coûteux et augmenter le temps de réponse.
Ce coût supplémentaire est souvent nécessaire. Par exemple, vous pouvez avoir une politique d'entreprise ou une page de FAQ très longue, et des centaines de demandes de renseignements de la part de vos clients.
Il serait impossible de les prédéfinir et, à Dieu ne plaise, d'obliger les clients à parcourir un menu enregistré pour trouver leur question. Dans ce cas, le choix d'un agent est évident.
Lorsque votre flux n'est pas entièrement défini
Les agents autonomes sont plus puissants, mais moins prévisibles.
N'oubliez pas qu'ils prennent des décisions seuls. Cela signifie qu'une série d'opérations est exécutée à chaque tour, ce qui rend les erreurs difficiles à déboguer.
Je le sais parce que j'ai passé des heures à les déboguer.
C'est une bonne chose. Cela fait partie du développement, mais il est préférable d'attendre d'avoir la certitude que les données, la structure du flux de travail et les besoins existent déjà.
Le SVI est un excellent moyen de réunir tous ces éléments.
Définir explicitement les étapes et guider les utilisateurs un par un est une façon beaucoup plus utile d'organiser vos données et de comprendre votre flux.
Je maintiens que le SVI a ses points forts et qu'il peut mieux répondre à des questions simples qu'un agent doté d'une IA complète.
Mais, à défaut d'autre chose, vous pouvez le considérer comme un tremplin vers l'automatisation complète.
Avantages de l'IVR
Ce n'est pas pour rien que les systèmes IVR sont si répandus.
Et même si nous vivons à une époque où les technologies d'assistance à la clientèle à commande vocale sont plus grandes et plus puissantes, je pense que le SVI vaut toujours la peine qu'on s'y intéresse.
Sécurité
Nous sommes tellement occupés à parler de ce que l'IA fait aussi bien que les humains que nous oublions souvent toutes les façons dont elle nous surpasse.
L'une d'entre elles est la reconnaissance vocale. Par exemple, "ay, c'est la voix de Tom" ou "ce n'est pas Tom".

Pour les questions sensibles, comme les finances ou les informations personnelles, un flux vocal automatisé donne aux entreprises la possibilité de vérifier la voix de l'interlocuteur par rapport à son identité, ce qui permet de détecter des fraudes qui pourraient autrement passer inaperçues.
Amélioration du CX
Lorsque vous ne disposez pas de la main-d'œuvre nécessaire pour répondre à tous les appels entrants, vous avez besoin de quelque chose pour prendre le relais.
Il vaut mieux être aidé que d'être mis en attente.
Les agents en chair et en os sont formidables. Mais des agents en direct qui ont été informés des besoins du client entrant, et qui sont répartis en fonction de leur expertise, c'est l'idéal.
Réduction des coûts
Celle-ci comporte deux volets.
Tout d'abord, le fait de décharger le service clientèle de tâches triviales permet toujours de réaliser des économies. Les clients qui posent des questions simples n'ont pas besoin d'un service particulièrement personnalisé, et le SVI peut effectuer des tâches simples ou offrir des réponses rapides.
Tout le monde y gagne
D'autre part, il s'agit d'une alternative moins coûteuse aux agents d'IA et aux chatbots.
Les entreprises sont impatientes de mettre en œuvre des agents d'IA complets pour automatiser leur support client sans envisager des automatisations moins coûteuses comme le SVI.
Le coût associé aux robots n'est pas seulement lié aux outils et à la technologie. Il s'agit également du temps que vous consacrez aux essais et aux erreurs de construction.
La conception d'un système peu coûteux avec un flux de travail explicite peut être un excellent moyen de recueillir des données sur les besoins des clients et d'apprendre comment automatiser au mieux vos flux, avant d'être prêt à appuyer sur la gâchette d'un système entièrement autonome.
Un routage plus efficace
L'utilisation d'étapes explicites du flux de travail (et idéalement d'un peu de magie de l'IA) peut grandement améliorer le dispatching. En d'autres termes, donner aux clients l'aide dont ils ont besoin.
L'IA est très douée pour trouver des modèles dans des données bruyantes.
L'IA ne fait pas partie intégrante du SVI, mais il est relativement simple d'ajouter un peu d'apprentissage automatique pour prédire les modèles de comportement des utilisateurs.
Avec l'IVR, vous pouvez recueillir des données sur le profil du client, son problème et l'aide apportée par certains agents en chair et en os.
Lors du routage, le SVI doit déterminer à quel agent en chair et en os il doit s'adresser.
Peut-être qu'un agent est plus compétent pour les questions de migration de base de données, et un autre pour les identifiants de connexion. Bien que l'agent 3 soit le mieux placé pour les problèmes d'identifiants pour les utilisateurs des plans d'entreprise.
Apprendre toutes les différentes combinaisons d'agents/préoccupations/profils serait la quête de toute une vie.
Mais pas pour l'IA - il s'agit simplement de données.
Assistance 24/7
Les agents en chair et en os ne sont peut-être pas disponibles 24 heures sur 24, mais vous pouvez recueillir les informations nécessaires à des heures indues, fixer une heure de rappel lorsqu'ils sont disponibles et répondre à des questions ponctuelles.
Cela réduira les frictions pour le client, rendra le temps actif des agents plus efficace et libérera éventuellement des ressources pour que vous puissiez employer des agents pendant les heures creuses.
Cas d'utilisation de l'IVR dans tous les secteurs d'activité
Les entreprises constatent des gains d'efficacité et de satisfaction dans tous les secteurs, en particulier lorsqu'elles associent le SVI à la PNL.
Banque
J'ai mentionné le secteur bancaire à plusieurs reprises dans cet article, car je pense qu'il s'agit d'une excellente utilisation de la RVI.
Quoi qu'il en soit, pour garantir une transaction sécurisée, il faut vérifier l'identité de l'utilisateur au moins plusieurs fois, puis spécifier les détails de la transaction.
La plupart de ces informations sont relativement simples mais sensibles : numéros de cartes de crédit, montants des dépôts. Tant que le SVI est fiable et sécurisé, il convient parfaitement aux services bancaires.
En fait, la mise en œuvre d'un SVI basé sur le langage naturel a aidé les banques à atteindre des niveaux élevés de confinement (pas besoin de passer à un agent en chair et en os) tout en améliorant la sécurité.
Soins de santé
Les problèmes de personnel rencontrés lors de la conférence COVID-19 ont montré l'importance d'une automatisation efficace dans le secteur des soins de santé.
GBANK Health, un réseau de pharmacies basé dans l'Iowa, a constaté une diminution de 24 % des transferts d'appels après la mise en place d'un SVI spécifique.
Cela nous rappelle que la médecine est un secteur à forts enjeux et à fortes contraintes. Et une automatisation efficace est synonyme d'amélioration du bien-être des personnes.
Soutien à la clientèle
La majorité des demandes d'assistance à la clientèle sont des questions récurrentes. La catégorisation et le filtrage des appels entrants permettent de gagner du temps et d'améliorer la satisfaction.
À cet égard, un détaillant américain a réussi à réduire de 30 % le nombre de transferts d'appels grâce à un SVI en langage naturel.
La mise en place d'un SVI met également la balle dans votre camp.
Le même détaillant a utilisé des algorithmes prédictifs pour recommander des services supplémentaires, avec un taux de réussite de plus de 70 %, réduisant ainsi le besoin d'appels de suivi.
Comment éviter les problèmes courants de l'IVR
Ce n'est pas toujours une partie de plaisir - il y a des problèmes qui peuvent survenir avec l'IVR. La bonne nouvelle, c'est qu'il existe des mesures à prendre pour y remédier.
Faire preuve de transparence
Le SVI n'est pas humain, et c'est normal.
Mais certains clients préfèrent parler à un agent en chair et en os.
Sans la capacité de lire les émotions d'un utilisateur ou d'y répondre, les clients mécontents peuvent se sentir dévalorisés.
La solution : Optimisez la clarté et soyez transparent dès que possible sur la façon dont l'utilisateur peut parler à un agent en direct.
Les menus automatisés sont en fin de compte moins personnels que les personnes. Et les utilisateurs le ressentiront différemment.
Vous ne pouvez pas contrôler l'attitude des clients à cet égard, mais vous pouvez toujours faire preuve de transparence quant aux options qui s'offrent à eux.
S'attaquer aux goulets d'étranglement
Même les systèmes automatisés ont des temps d'attente. D'une part, il y a des limites au nombre de clients que le système RVI peut servir en même temps. Les temps d'attente des agents en chair et en os varient également.
Solution : Identifier les goulets d'étranglement et essayer de les désamorcer.
Lors de l'élaboration d'un flux de travail IVR, il convient de prendre en compte les besoins à l'extérieur du système, tout autant qu'à l'intérieur.
Peut-être que certaines options du menu sont plus demandées que d'autres. Dans ce cas, envisagez de réorienter votre main-d'œuvre vers la résolution de ces problèmes.
Il est possible que les clients appellent pour des questions simples dont la réponse se trouve sur votre site web. Veillez à ce que ces informations soient claires et faciles à trouver.
Automatiser les appels téléphoniques grâce à l'IVR
Si vous n'êtes pas encore prêt à plonger dans les profondeurs de l'automatisation de l'IA, je ne vois pas de meilleure façon de vous y plonger que de mettre en place un SVI.
Le SVI est un excellent moyen d'exploiter la puissance de l'IA tout en gardant le contrôle. Vous pouvez recueillir des données et vous améliorer continuellement.
Tout ce dont vous avez besoin, c'est d'une plateforme de construction. Botpress dispose d'un créateur simple par glisser-déposer, d'un grand nombre de modèles à bas prix et d'une intégration téléphonique aisée. Il peut même collecter des données analytiques pour vous.
Commencez à construire dès aujourd'hui. C'est gratuit.
FAQ
Quelle est la précision du SVI moderne en matière de compréhension de la parole naturelle et des différents accents ?
Les systèmes IVR modernes atteignent une précision de 85 à 95 % pour un discours clair dans les langues prises en charge, grâce à la reconnaissance vocale avancée et au traitement du langage naturel. La précision diminue en cas d'accents forts, de dialectes ou de bruits de fond, ce qui rend les tests en situation réelle essentiels. De nombreuses plateformes proposent un réglage personnalisé du modèle afin d'améliorer la reconnaissance des accents spécifiques et du vocabulaire de l'industrie.
La mise en œuvre de la technologie IVR est-elle coûteuse pour une petite entreprise ?
Le coût de la technologie SVI n'est plus prohibitif pour les petites entreprises ; les solutions basées sur le cloud peuvent commencer à partir de 50 à 200 dollars par mois, en fonction du volume d'appels et des fonctionnalités. Les coûts augmentent si vous ajoutez la reconnaissance vocale ou les intégrations avec les systèmes de l'entreprise, et la dépense la plus importante est généralement le temps de conception et d'installation, plutôt que le logiciel.
Les systèmes IVR peuvent-ils s'intégrer aux systèmes de gestion de la relation client (CRM) pour personnaliser les réponses ?
Les systèmes SVI peuvent s'intégrer aux systèmes de gestion de la relation client (CRM) et aux outils d'arrière-plan, ce qui permet des expériences personnalisées, comme l'accueil des appelants par leur nom ou l'acheminement en fonction de l'historique des clients. Ces intégrations reposent sur des API ou des connexions directes aux bases de données, et nécessitent donc une certaine configuration technique, mais elles sont de plus en plus courantes dans les plateformes SVI modernes.
Les systèmes IVR peuvent-ils traiter en toute sécurité des informations sensibles telles que les numéros de carte de crédit ?
Les systèmes SVI peuvent traiter des informations sensibles en toute sécurité, à condition qu'ils soient conçus dans le respect de la norme PCI-DSS et des protocoles de cryptage. De nombreux fournisseurs de SVI modernes proposent des flux de "capture de paiement" sécurisés dans lesquels les données sensibles sont masquées aux agents humains et cryptées de bout en bout.
Combien de temps faut-il pour déployer un système IVR à partir de zéro ?
Une entreprise peut déployer un système SVI simple basé sur la technologie DTMF en quelques jours seulement si elle fait appel à un fournisseur de services en ligne proposant des modèles prédéfinis. Le lancement de systèmes SVI plus avancés, avec reconnaissance vocale et flux de travail complexes, peut prendre plusieurs semaines.
Comment les systèmes IVR lisent-ils les données des utilisateurs ?
Les systèmes traditionnels utilisent la technologie DTMF (Dual-Tone Multi-Frequency) pour lire les données saisies par l'utilisateur. C'est ainsi que les touches du clavier correspondent à des options.
(Et c'est pourquoi les différents chiffres du clavier produisent des sons différents).
Vous savez, "Pour l'anglais, appuyez sur le 1".
Certains l'utilisent encore. Mais, pour la plupart, les choses sont devenues considérablement plus épicées 🌶️.
Grâce aux progrès de la technologie vocale, ces systèmes peuvent intégrer des mécanismes beaucoup plus puissants pour reconnaître les mots-clés, ou même exécuter un traitement du langage naturel (NLP) pour extraire le sens et le sentiment du discours de l'utilisateur.