Aller au contenu principal
Retour à Business
Agents I.A.

Copilot Studio : computer-use et voix temps réel passent en GA

Microsoft passe Copilot Studio en GA sur computer-use et voix temps réel. Ce qu'une DSI ou direction relation client française doit décider en 2026.

Louis-Clément Schiltz
CEO & Founder, Webotit.ai
8 min de lecture

Parler de ce sujet avec Webotit

En bref

Microsoft a passé en GA les computer-use agents Copilot Studio le 13 mai 2026 et les agents vocaux temps réel dans Dynamics 365 Contact Center le 26 mai. La voix reste limitée à l'Amérique du Nord. Pour une ETI française, c'est crédible sur le back-office, mais la relation client vocale en français reste à arbitrer.

Ce que Microsoft a vraiment annoncé en mai 2026

Deux annonces se sont enchaînées en treize jours. La première a peu fait parler en France, la seconde sera décisive pour les directions relation client.

Le 13 mai, Microsoft a fait passer en disponibilité générale les computer-use agents dans Copilot Studio, sur l'ensemble des géographies commerciales de Power Platform.1 Concrètement, un agent peut désormais ouvrir un navigateur, lire un écran, cliquer, remplir un formulaire et reprendre la main sur une application desktop, dans le périmètre que l'administrateur autorise.

Le 26 mai, dans le rattrapage officiel publié sur le blog Copilot Studio, Microsoft a confirmé trois choses : la GA du computer-use, la refonte de l'expérience workflows en early release, et le passage en GA des agents vocaux temps réel dans Dynamics 365 Contact Center, mais uniquement en Amérique du Nord pour l'instant.2

C'est l'enchaînement qui compte. Microsoft devient le premier hyperscaler à proposer en GA contractuelle à la fois un agent qui « voit » et « clique » à la place d'un opérateur, et un agent qui répond au téléphone en temps réel sur un parc Dynamics 365.3 Anthropic Claude Computer Use reste en bêta payante, Google Gemini Computer Use en preview publique.

Pour une DSI ou une direction relation client française, le sujet n'est plus « est-ce que la technologie existe ». Il est : qu'est-ce qu'on automatise avec qui, et sur quel périmètre.

Computer-use agents en GA : la couche RPA de Microsoft change de nature

Le computer-use est l'évolution logique de Power Automate Desktop. La différence : l'agent ne suit plus un script enregistré. Il regarde l'écran, comprend l'objectif, ajuste sa trajectoire.

La GA de mai 2026 ajoute trois briques opérationnelles importantes :

  • OpenAI CUA et Claude Sonnet 4.5 sont disponibles en production comme moteurs de l'agent.4 Le choix se fait au cas par cas selon la fiabilité demandée et le niveau de raisonnement nécessaire.
  • Azure Key Vault stocke les identifiants utilisés par l'agent, ce qui évite les credentials en clair dans les flows.
  • Microsoft Purview et Dataverse captent les logs d'exécution. Un RSSI peut rejouer une session pour reconstituer ce que l'agent a vu et fait à un instant T.4

La facturation suit le modèle Copilot Credits : 5 crédits par étape pour les modèles OpenAI CUA et Claude Sonnet 4.5, sur un pack tenant de 25 000 crédits à 200 dollars par mois.4 S'ajoute une consommation en « UI automation minutes » prélevée à la fois sur la licence Copilot Studio et sur la licence Windows 365 Cloud PC qui héberge l'exécution.

Pour une banque ou un assureur français, ça veut dire trois questions concrètes à poser à un projet pilote :

  1. Quels écrans précisément l'agent doit-il toucher, et lesquels sont sur Allowlist ?
  2. Combien d'étapes UI consomme un parcours typique (saisie de sinistre, mise à jour de fiche, contrôle KYC) ?
  3. Combien de minutes Windows 365 par mois pour atteindre le volume cible ?

À l'échelle d'un grand compte qui exécute 50 000 parcours par mois avec une moyenne de 8 étapes, le compteur de crédits atteint 2 millions par mois, soit 16 packs à 200 dollars, hors Windows 365. Une RSSI doit chiffrer le coût total avant de signer un déploiement.

L'avantage de Copilot Studio sur ce périmètre est réel : l'agent reste dans l'environnement Microsoft, les logs descendent automatiquement dans Purview, l'identité passe par Entra ID. Si l'ETI est déjà sous M365 E5 ou Power Platform, l'intégration ne crée pas de nouvelle dette opérationnelle.

Le risque est aussi réel : un agent computer-use est un opérateur silencieux qui touche des écrans de production. Sans procédure de validation humaine (human-in-the-loop) sur les actions à risque, une mise à jour fausse passe sans frottement. Microsoft a documenté le mécanisme, encore faut-il le configurer pour chaque parcours sensible avant la mise en production.5

Voix temps réel dans Dynamics 365 : verrouillée en Amérique du Nord

C'est là que le calendrier compte vraiment.

Microsoft a fait passer en GA les agents vocaux temps réel dans Dynamics 365 Contact Center, construits dans Copilot Studio et alimentés par le modèle GPT realtime d'OpenAI via Microsoft Foundry.6 Le pipeline historique (STT puis LLM puis TTS) cède la place à un modèle speech-to-speech : l'agent écoute, raisonne et répond dans le même flux, avec une latence basse, en gérant les interruptions et les changements de langue en cours de conversation.

L'escalade vers un conseiller humain transfère l'historique complet de la conversation, y compris l'intent et la progression du dossier, ce qui évite de faire répéter le client.6

Le verrou est géographique. Microsoft a écrit noir sur blanc : la GA est limitée aux clients Dynamics 365 Contact Center en Amérique du Nord.6 Aucun calendrier officiel de bascule EMEA, ni de mention de résidence de données européenne pour la couche voix.

Pour une direction relation client française qui regarde 2026, ça veut dire trois choses opérationnelles :

  • Un POC voix temps réel dans Dynamics 365 Contact Center n'est pas faisable depuis une entité française sans contourner la limitation régionale, ce qui pose une vraie question CNIL et de localisation des appels enregistrés.
  • L'arbitrage « j'attends Microsoft ou je signe un spécialiste » devient un choix CODIR, pas un choix d'équipe. Plus on attend, plus on prend du retard sur l'absorption des pics d'appels en français.
  • Le jour où Microsoft activera l'EMEA, le coût d'exécution dépendra de la consommation GPT realtime via Foundry, qui est facturé à la minute audio entrante et sortante. Pas du tout le même modèle que les forfaits français à coût fixe par appel.

Une mutuelle française qui voit 8 000 appels par mois sur ses gestionnaires d'adhérents ne peut pas se permettre d'attendre que la roadmap Microsoft daigne arriver à Paris. C'est précisément ce que disent les standards de mutuelle santé qui débordent à chaque campagne d'adhésion.

Ce que ça change pour une entreprise française

Cette double annonce force trois arbitrages en CODIR, et pas un seul.

Pour les ETI déjà sous Microsoft 365 E5 et Dynamics 365, Copilot Studio devient une plateforme d'agents IA à étudier sérieusement pour le back-office. Saisie de fiches assurés, contrôles KYC, mise à jour de stocks, traitement d'avenants : si le parcours est structuré et passe par des écrans Microsoft ou web, le computer-use agent réduit le besoin de scripts RPA fragiles. La gouvernance descend dans Purview, ce qui rassure la conformité.

Pour les directions relation client, l'annonce voix change le centre de gravité de la conversation interne. Beaucoup de DSI espéraient pouvoir mutualiser callbot et back-office sur une seule plateforme. Tant que Microsoft ne livre pas la voix en EMEA, ce n'est pas une option. Une banque top 20 qui doit absorber les pics d'appels sur la perte de carte, ou une compagnie d'assurance qui veut traiter les appels de débordement en relation assurés, doit travailler avec un spécialiste callbot français en parallèle.

Pour les pure players e-commerce français, la question est plus dure. Le SAV vocal en français est un coût qui monte à chaque pic logistique. Attendre Microsoft repousse de 12 à 18 mois un retour sur investissement déjà chiffrable.

Webotit.ai accompagne précisément ce type d'arbitrage : un dispositif de callbots et agents IA français qui répond en français de France sur le RTC et sur SIP, hébergé en Europe, avec une intégration aux briques Microsoft (Dataverse, Dynamics 365, Teams) quand elles sont déjà en place. L'objectif n'est pas de remplacer Copilot Studio, c'est de couvrir la couche que Microsoft ne livrera pas en GA française avant un certain temps.

Comment arbitrer entre Copilot Studio et un spécialiste callbot français

L'arbitrage n'est pas idéologique. Il suit la couche de la chaîne où chaque outil est le plus pertinent.

Copilot Studio est légitime quand :

  • les agents touchent des écrans Microsoft ou web déjà en place ;
  • le parcours est interne ou orienté collaborateur ;
  • la conformité descend déjà dans Purview ;
  • l'ETI a un FinOps Copilot Credits actif pour piloter le coût.

Un spécialiste callbot français reste critique quand :

  • la voix entrante est en français de France et tolère mal une latence supérieure à 800 ms ;
  • les pics d'appels saisonniers exigent une scalabilité immédiate (rentrée scolaire, campagne d'adhésion, pic météo en énergie) ;
  • les enregistrements doivent rester sur des serveurs hébergés en Europe pour la CNIL ;
  • la conversation doit s'intégrer à un CRM métier non Microsoft, fréquent en mutuelle ou en collectivité.

Pour un industriel du CAC 40 qui automatise la saisie de bons de commande dans son ERP, le bon choix est très probablement Copilot Studio plus une intégration computer-use. Pour le standard téléphonique du même industriel, qui reçoit 12 000 appels par mois en français de fournisseurs, sous-traitants et clients, le bon choix reste un callbot dédié, intégré au reste du SI.

Sur le chiffrage, estimer le retour sur investissement réel d'un callbot français pour 12 000 appels par mois donne un ordre de grandeur très différent du compteur Copilot Credits, ce qui aide à objectiver la décision en COMEX. La question utile n'est pas « Microsoft vs spécialiste », elle est « quel budget total pour quel taux d'automatisation, à 18 mois ».

Ce qu'il faut retenir

La plupart des directions relation client françaises ont passé 2025 à se demander s'il fallait attendre Microsoft pour leur callbot. La réponse au 31 mai 2026 est claire : pour le vocal en français, l'attente continue ; pour le back-office Windows et web, l'outillage existe.

Si vous voulez voir ce qu'un callbot français bien intégré apporte sur vos pics d'appels, découvrez notre approche des callbots et agents IA pour ETI et Grands Comptes français.

Questions frequentes

Quand les agents vocaux temps réel de Copilot Studio seront-ils disponibles en France ?

Microsoft n'a pas communiqué de calendrier officiel pour la bascule EMEA des agents vocaux temps réel dans Dynamics 365 Contact Center. La GA du 26 mai 2026 est limitée aux clients Amérique du Nord. Une DSI française doit raisonner sur un horizon de 12 à 18 mois minimum avant de pouvoir l'utiliser en production locale.

Quelle est la différence entre Copilot Studio computer-use et Power Automate Desktop ?

Power Automate Desktop suit un script enregistré pas à pas. Si l'écran change, le script casse. Un computer-use agent Copilot Studio regarde l'écran, comprend l'objectif et ajuste sa trajectoire en s'appuyant sur un modèle OpenAI CUA ou Claude Sonnet 4.5. L'agent gère mieux les variations d'interface mais reste piloté par les politiques Power Platform et logué dans Purview et Dataverse.

Combien coûte un agent computer-use dans Copilot Studio en 2026 ?

Microsoft facture les modèles OpenAI CUA et Claude Sonnet 4.5 cinq Copilot Credits par étape, sur un pack tenant de 25 000 crédits à 200 dollars par mois. S'ajoute la consommation en UI automation minutes prélevée sur la licence Copilot Studio et sur la licence Windows 365 Cloud PC qui héberge l'exécution. Un parcours type de huit étapes consomme 40 crédits, donc 0,32 dollar de modèle hors licence Windows 365.

Copilot Studio peut-il remplacer un callbot français spécialisé ?

Pas en 2026, et pas pour la relation client vocale en français. Tant que les agents vocaux temps réel Dynamics 365 Contact Center sont limités à l'Amérique du Nord, un callbot français spécialisé reste nécessaire pour traiter les appels en français avec une latence sous 800 ms, des enregistrements hébergés en Europe, et une intégration aux CRM métier non Microsoft fréquents en mutuelle, collectivité ou industrie.

Quels modèles d'IA sont disponibles dans Copilot Studio computer-use en GA ?

La GA de mai 2026 ouvre deux moteurs en production : OpenAI Computer-Use Assistant (CUA) et Anthropic Claude Sonnet 4.5. Le choix se fait au cas par cas selon la fiabilité demandée et la complexité du raisonnement. Pour les agents vocaux temps réel Dynamics 365 Contact Center, c'est le modèle GPT realtime d'OpenAI exposé via Microsoft Foundry qui pilote la conversation.

Sources et references

  1. [1]
  2. [2]
  3. [3]
  4. [4]
  5. [5]
  6. [6]
MicrosoftCopilot StudioDynamics 365 Contact Centercomputer-use agentscallbot