Définition complète
Une utterance (énoncé) désigne un message ou une phrase produite par l'utilisateur dans une conversation avec un chatbot ou assistant vocal. C'est l'unité de base de l'interaction conversationnelle, sur laquelle s'appliquent la détection d'intention et l'extraction d'entités. Les variations d'utterances pour une même intention ("Quel temps fait-il ?", "Météo ?", "Il va pleuvoir ?") doivent être couvertes par les exemples d'entraînement pour que le NLU les reconnaisse correctement.
Questions fréquentes
Combien d'utterances faut-il par intention pour un chatbot ?
Le nombre d'utterances par intention dépend de la méthode. Pour les classifieurs NLU classiques : 20-100 exemples par intention, couvrant les variations linguistiques (formes affirmatives, interrogatives, négatives). Pour les LLM en few-shot : 3-10 exemples suffisent souvent. L'important est la diversité des formulations plutôt que le volume brut.
Comment générer des variations d'utterances ?
Les techniques de génération d'utterances incluent : paraphrase manuelle par des experts, crowdsourcing avec des utilisateurs réels, augmentation automatique (synonymes, réorganisation), utilisation de LLM pour générer des variations ("Donne 10 façons de dire 'annuler ma commande'"), et analyse des logs de conversation pour capturer les formulations réelles. Les variations réelles des utilisateurs sont les plus précieuses.
Comment gérer les utterances ambiguës ?
Les utterances ambiguës ("C'est pour le 15") nécessitent du contexte pour être comprises. Les stratégies : demander une clarification ("Le 15 de quel mois ?"), utiliser le contexte de conversation (si on parle de réservation, c'est une date), ou présenter plusieurs interprétations ("Voulez-vous dire X ou Y ?"). Les LLM gèrent mieux l'ambiguïté que les classifieurs simples grâce à leur compréhension contextuelle.