Définition complète
Le NER (Named Entity Recognition) ou reconnaissance d'entités nommées est une technique de NLP qui détecte et catégorise automatiquement les éléments d'information spécifiques dans un texte : noms de personnes, organisations, lieux, dates, montants, numéros de contrat. C'est une brique fondamentale pour l'extraction d'information structurée à partir de texte libre. Dans les chatbots, le NER extrait les données clés des messages utilisateurs pour alimenter les appels API ou personnaliser les réponses.
Questions fréquentes
Comment le NER est-il utilisé dans un chatbot ?
Dans un chatbot, le NER extrait les informations essentielles : "Je veux annuler ma réservation du 15 mars au nom de Dupont" → DATE: 15 mars, PERSON: Dupont. Ces entités alimentent ensuite les appels aux systèmes backend (rechercher la réservation par nom et date). Sans NER, le chatbot ne saurait pas quelles informations manipuler.
Quels sont les types d'entités les plus courants ?
Les entités standards sont : PERSON (noms de personnes), ORG (organisations), LOC/GPE (lieux), DATE (dates), TIME (heures), MONEY (montants), PERCENT (pourcentages), EMAIL, PHONE. En entreprise, nous ajoutons des entités métier : numéro de contrat, référence produit, code postal. Les modèles NER peuvent être entraînés pour détecter des entités personnalisées.
Quelle est la précision du NER en français ?
Les modèles NER modernes atteignent 90-95% de F1-score sur le français pour les entités classiques (personnes, lieux, organisations). Les performances diminuent sur les entités métier spécifiques sans fine-tuning. Les LLM modernes extraient les entités de façon zero-shot avec une bonne précision, mais les modèles NER spécialisés restent plus rapides et économiques à l'échelle.