L'une des questions les plus fréquentes que nous posent nos clients et utilisateurs potentiels est : « Où sont vos classificateurs d'intention ? »
Nous n’en avons pas. Et oui, c’est voulu.
Botpress utilise des LLM pour identifier l’intention de l’utilisateur. Pourquoi ? Si vous créez un chatbot ou un agent IA, c’est bien plus efficace, aussi bien pour les concepteurs que pour les utilisateurs.
Nous sommes convaincus de cette approche, alors je voudrais prendre quelques minutes pour expliquer pourquoi nous n’utilisons pas de classificateurs d’intention.
En résumé : c’est plus simple à concevoir, plus précis et plus facile à maintenir.
L’époque d’avant les LLM
(Si vous savez déjà ce que sont les classificateurs d’intention et à quoi ils servent, vous pouvez passer cette section.)
Un classificateur d’intention est un outil qui catégorise les messages des utilisateurs selon des intentions prédéfinies, à partir de données d’entraînement.
Les développeurs doivent sélectionner et étiqueter d’innombrables exemples pour chaque intention possible, en espérant que le système saura faire le lien avec les messages des utilisateurs.
Par exemple, avec un chatbot e-commerce, les développeurs pourraient définir une intention comme « SuiviCommande ». Les exemples pourraient être : « Où est mon colis ? », « Suivre ma commande » ou « Peux-tu vérifier l’état de la livraison ? »
En gros, ils apprennent à l’agent IA à reconnaître l’intention de l’utilisateur en fournissant des exemples. Et oui, tout cela doit être saisi manuellement.
Heureusement, ce travail fastidieux de faire correspondre manuellement chaque phrase à une intention a quasiment disparu avec l’arrivée des LLM.
Mais de nombreuses plateformes de conversation IA continuent de les utiliser. Pourquoi ? On va y venir.
4 inconvénients des classificateurs d’intention
Ce n’est pas seulement que c’est plus long – les classificateurs d’intention posent problème pour de nombreuses raisons. En voici quelques-unes :
1. Dépendance aux données
Les classificateurs d’intention sont très gourmands en données. Ils ont besoin d’un énorme jeu d’exemples représentatifs pour chaque intention afin de fonctionner correctement. Sans cela, ils peinent à classer les messages.
Et constituer ces jeux de données est une corvée. Les développeurs passent des heures à collecter et étiqueter des exemples, ce qui n’est clairement pas la meilleure utilisation de leur temps.
2. Scalabilité limitée
Les classificateurs d’intention ne sont pas conçus pour évoluer facilement. Ajouter une nouvelle intention signifie collecter encore plus de données et réentraîner le modèle, ce qui devient vite un frein au développement. De plus, c’est un vrai casse-tête à maintenir, car la langue évolue constamment.
3. Compréhension limitée du langage
Les classificateurs d’intention ne comprennent pas vraiment le langage. Ils ont du mal avec les variations, comme :
- Les synonymes
- Les paraphrases
- Les formulations ambiguës
- Les fautes de frappe
- Les expressions familières inconnues
- Les messages fragmentés
Ils traitent aussi généralement chaque phrase isolément, ce qui les empêche de garder le fil d’une conversation.
4. Surapprentissage
Les classificateurs d’intention ont tendance à surapprendre, c’est-à-dire à mémoriser les exemples d’entraînement au lieu d’en tirer des règles générales.
Résultat : ils fonctionnent bien sur les phrases déjà vues, mais peinent dès que l’entrée varie. Cela les rend bien trop fragiles pour un usage professionnel.
6 raisons pour lesquelles les LLM sont meilleurs
Les LLM ont quasiment résolu tous ces problèmes. Ils comprennent le contexte et les nuances, et les développeurs n’ont pas besoin de les alimenter en données d’entraînement pour démarrer. Un agent basé sur un LLM peut commencer à discuter dès sa création.
1. Apprentissage zéro-shot
Les LLM n’ont pas besoin d’exemples pour apprendre. Leur pré-entraînement massif leur permet de comprendre le contexte, les nuances et l’intention sans que les développeurs aient à fournir des exemples précis.
2. La gestion des nuances
Les LLM excellent là où les classificateurs d’intention échouent. Ils interprètent facilement les expressions idiomatiques, le sarcasme ou le langage ambigu.
Leur entraînement sur des jeux de données variés leur permet de saisir les subtilités de la communication humaine que les classificateurs d’intention ratent souvent.
3. Meilleure gestion du contexte
Les LLM ne perdent pas le fil de la conversation. Ils se souviennent de ce qui a été dit, ce qui rend les échanges plus naturels et cohérents.
Ce contexte leur permet aussi de lever les ambiguïtés. Même si l’entrée est vague ou complexe, ils peuvent la comprendre en tenant compte de l’ensemble de la discussion.
4. Scalabilité
Les LLM sont bien plus adaptés à l’échelle. Ils n’ont pas besoin d’être réentraînés pour traiter de nouveaux sujets, grâce à leur compréhension globale du langage.
Ils sont donc prêts à gérer presque tous les cas d’usage dès le départ. Pour les systèmes multi-agents, il est évident qu’il vaut mieux utiliser un LLM qu’un classificateur d’intention.
5. Flexibilité
Les LLM ne reposent pas sur des modèles rigides. Leur flexibilité permet des réponses naturelles, variées et adaptées à chaque échange. L’expérience utilisateur est bien meilleure qu’avec des classificateurs d’intention fragiles.
6. Moins de données d’entraînement
Les LLM n’ont pas besoin de données annotées spécifiques à chaque tâche. Leur force vient de leur pré-entraînement sur des textes très variés, ils ne dépendent donc pas de jeux de données fastidieux à constituer.
Si besoin, les développeurs peuvent toujours personnaliser un LLM pour leur projet. Par exemple, les LLM peuvent être adaptés avec très peu de données, ce qui leur permet de répondre rapidement à des besoins ou secteurs spécifiques.
Pourquoi d'autres entreprises utilisent-elles des classificateurs d'intention ?
Bonne question. Si les LLM sont bien meilleurs pour classer les intentions, pourquoi tant d'entreprises continuent-elles d'utiliser des classificateurs d'intention ?
La réponse n’est pas très reluisante, ni très diplomatique : c’est un problème d’héritage technologique.
La plupart des entreprises ont tout intérêt à continuer d’utiliser les classificateurs d’intention. Leur base installée repose dessus. Elles n’ont aucune raison d’inciter leurs utilisateurs à changer de système.
Mais Botpress est LLM-first
Les LLM sont bien meilleurs pour identifier les intentions que les anciens classificateurs. C’est pour cela que nous avons tout réécrit en 2020 pour adopter une approche LLM-first.
Nous savions que la technologie avait évolué, et au lieu de rester sur l’ancien modèle, nous avons choisi d’aller de l’avant.
Allons-nous ajouter des classificateurs d'intention ?
Non. Nous tenons trop à l’expérience de nos concepteurs et de leurs utilisateurs.
L’avenir de la classification des intentions
Les classificateurs d’intention appartiennent au passé. C’est pour cela que nous misons tout sur les LLM.
À mesure que les LLM progressent, les agents IA créés sur Botpress seront de plus en plus performants. Nous sommes prêts et enthousiastes à l’idée de repousser les limites de l’IA conversationnelle.
Si vous souhaitez créer des agents IA flexibles grâce aux LLM, vous pouvez commencer à créer sur Botpress. C’est gratuit.





.webp)
