Définition complète
Un voicebot est un agent conversationnel capable d'interagir avec les utilisateurs par la voix. Il combine la reconnaissance vocale (STT) pour comprendre ce que dit l'utilisateur, le NLU/LLM pour traiter la demande, et la synthèse vocale (TTS) pour répondre oralement. Les voicebots incluent les assistants grand public (Alexa, Google Assistant) et les callbots téléphoniques en entreprise. Ils offrent une interaction naturelle, particulièrement adaptée aux contextes mains-libres ou pour les publics moins à l'aise avec le texte.
Questions fréquentes
Quelle différence entre voicebot et callbot ?
Le voicebot est le terme générique pour tout bot vocal (sur téléphone, enceinte connectée, application). Le callbot est un voicebot spécifiquement dédié au canal téléphonique. Le callbot gère les particularités de la téléphonie (DTMF, transfert d'appel, files d'attente) et s'intègre aux systèmes de centre de contact. Tous les callbots sont des voicebots, mais tous les voicebots ne sont pas des callbots.
Quels sont les défis spécifiques des voicebots ?
Les voicebots affrontent des défis que les chatbots texte n'ont pas : qualité audio variable (bruit, connexion), accents et prononciations diverses, impossibilité de "relire" (l'utilisateur ne peut pas scroller), latence visible (pause silencieuse gênante), gestion des interruptions (barge-in), et absence de visuel pour guider l'interaction. Une conception conversationnelle spécifique est nécessaire.
Comment mesurer la performance d'un voicebot ?
Les KPIs d'un voicebot incluent : taux de reconnaissance vocale (WER), taux de résolution sans escalade, durée moyenne de conversation, taux d'abandon, satisfaction utilisateur (enquête post-appel), et latence bout-en-bout. La latence est critique : au-delà de 1-2 secondes de silence, l'utilisateur perçoit un problème. Le taux de "je n'ai pas compris" révèle les faiblesses du STT ou du NLU.