Claude Fable 5 : Mythos en production, tarif x2, fenêtre J-11

LLM

Claude Fable 5 : Mythos en production, tarif x2, fenêtre J-11

Anthropic ouvre Claude Fable 5 le 9 juin 2026 : 10/50 $ par M tokens, fallback Opus 4.8 sur cyber et bio, gratuit Pro/Max/Team/Enterprise jusqu'au 22 juin.

Louis-Clément Schiltz

CEO & Founder, Webotit.ai

11 juin 20268 min de lecture

Parler de ce sujet avec Webotit

En bref

Claude Fable 5, premier modèle Mythos d'Anthropic ouvert au public, est sorti le 9 juin 2026. Tarif API : 10 $ par million de tokens en entrée, 50 $ en sortie, soit 2x Opus 4.8. Un classifieur bascule la requête sur Opus 4.8 dès qu'elle touche cyber, biologie, chimie ou distillation. Accès gratuit Pro/Max/Team/Enterprise jusqu'au 22 juin 2026 : 11 jours pour arbitrer.

Anthropic a tenu Mythos enfermé dans Project Glasswing pendant deux mois. Le 9 juin 2026, le verrou saute. Claude Fable 5 reçoit la même architecture, avec un garde-fou de sécurité branché en série.¹

Pour une DSI française qui finançait déjà un POC sur Opus 4.8, la question n'est plus « est-ce qu'on teste Fable 5 ». C'est « combien de workloads bascule-t-on avant le 22 juin, date où l'accès gratuit s'arrête sur les forfaits Pro, Max, Team et Enterprise ».² 11 jours pour arbitrer.

Ce qu'Anthropic a vraiment ouvert le 9 juin 2026

Claude Fable 5 est exposé sur l'API Anthropic, sur Amazon Bedrock (régions US East N. Virginia et Europe Stockholm), sur Microsoft Foundry, sur GitHub Copilot et sur Databricks via Unity AI Gateway.³⁴ Le ticket d'entrée est immédiat pour toute équipe qui consomme déjà un de ces fournisseurs.

Trois chiffres techniques à connaître. Le contexte tient 1 million de tokens. La sortie est plafonnée à 128 000 tokens par réponse. Et le caching de prompt applique une remise de 90 % sur les tokens d'entrée mis en cache.⁵

Le caching est ce qui rend le modèle abordable sur des charges répétitives. Un agent qui lit chaque matin la même base documentaire de 200 000 tokens paie 2 $ d'entrée à froid, puis 0,20 $ par appel suivant tant que le cache tient. Sur un mailbot qui orchestre 1 000 qualifications par jour avec un contexte stable, l'écart se chiffre en milliers d'euros par mois.

Côté plans grand public, Anthropic fait un cadeau commercial très lisible : Fable 5 est inclus gratuitement sur Pro, Max, Team et Enterprise pendant la fenêtre du 9 juin au 22 juin 2026.² Passé cette date, l'usage retombe sur les politiques de crédit du plan, et la facture explose.

Pourquoi le tarif 10 $/50 $ change le calcul d'un agent en production

À 10 $ par million de tokens en entrée et 50 $ en sortie, Fable 5 vaut deux fois Opus 4.8 (5 $/25 $).⁶ Selon Cloudzero, un prompt qui coûtait 5 $ sur Opus 4.8 peut atteindre 13,50 $ sur Fable 5, le multiplicateur de 2x se combinant à une consommation de tokens jusqu'à 35 % supérieure pour un raisonnement plus long.⁷

Cette inflation n'est pas un détail comptable. Elle invalide un raisonnement budget que beaucoup d'ETI françaises ont signé en début d'année 2026.

Prenez une DSI qui a câblé son service de gestion de réclamations sur Opus 4.8 : 50 000 interactions par mois, 4 000 tokens d'entrée et 800 tokens de sortie en moyenne par interaction. Le coût mensuel actuel tient autour de 1 800 $. Sur Fable 5 sans optimisation, le même volume passe à environ 4 500 $.

À 2 700 $ de surcoût mensuel pour une seule charge, le retour sur investissement de la bascule doit se mesurer ailleurs : taux d'automatisation, qualité du retour, capacité à enchaîner des sous-tâches sans intervention humaine. Si Fable 5 n'apporte pas un gain mesurable de 30 % sur l'un de ces axes, la bascule perd son sens économique.

Le classifieur qui bascule sur Opus 4.8 est un mécanisme, pas un discours

Voici le point opérationnel le plus mal compris. Fable 5 et Mythos 5 sont le même modèle.¹ Ce qui les sépare est un classifieur de sécurité branché à l'entrée de l'API. Si la requête touche cybersécurité, biologie, chimie ou distillation, Fable 5 ne refuse pas. Il route silencieusement la demande vers Opus 4.8.

Anthropic publie une statistique précise : ce routage se déclenche dans moins de 5 % des sessions, et l'utilisateur est informé à chaque fois.⁸ Les 95 % restants traitent les requêtes avec la puissance brute de Mythos 5.

Pour une DSI, cela soulève une question concrète : qu'est-ce qu'un faux positif fait à une charge de production ?

Imaginez un agent IA qui lit des PDF d'audits SI dans une banque. Le PDF contient des termes techniques de cybersécurité défensive (pentest, hardening, CVE). Le classifieur bascule sur Opus 4.8. La réponse arrive avec 17 points de SWE-Bench Pro en moins (Opus 4.8 culmine à 69,2 % contre 80,3 % pour Fable 5).⁹ L'agent rate la détection que le client attendait.

Ce n'est pas un cas théorique. Toute charge de production qui traite des contenus de cyber défensive, des dossiers médicaux ou des contenus pharma va rencontrer ce routage. L'angle de gouvernance « Claude Compliance API branché à Purview, Okta, CrowdStrike » que nous avions traité dans la couche gouvernance de Claude Enterprise ne couvre pas ce routage modèle. C'est une couche séparée, qui doit être monitorée par votre observabilité applicative, pas par votre SIEM.

Arthur Mensch, CEO de Mistral AI, a qualifié cette architecture de « fear marketing ».¹⁰ Le terme est dur. Le mécanisme, lui, est réel et mesurable.

Stripe en un jour et 80,3 % sur SWE-Bench Pro : ce que ces chiffres disent à un CTO

Le chiffre marketing que tout le monde reprend est celui de Stripe : 50 millions de lignes de Ruby migrées en un jour, un travail qui aurait pris à une équipe humaine plus de deux mois.⁹ Le récit est vrai et instructif, mais il ne se transpose pas tel quel sur une base de code française moyenne.

Ce que dit ce chiffre, c'est que Fable 5 tient une cohérence sur des contextes très longs. Anthropic affirme que Fable 5 maintient sa concentration sur des millions de tokens et améliore son propre travail à partir de notes qu'il garde au fil de la session.¹ Lors d'un test interne avec le jeu Slay the Spire en mémoire persistante fichier, sa progression a été trois fois supérieure à celle d'Opus 4.8.⁹

Sur SWE-Bench Pro, le score officiel est de 80,3 %, devant Opus 4.8 à 69,2 %, GPT-5.5 à 58,6 % et Gemini 3.1 Pro à 54,2 %.⁹ Sur FrontierCode Diamond, un benchmark plus exigeant qui évalue le code agentique maintenable, Fable 5 atteint 29,3 % contre 13,4 % pour Opus 4.8 et 5,7 % pour GPT-5.5.⁹

Pour un CTO d'ETI française qui pèse l'arbitrage, la traduction concrète est la suivante. Sur une tâche unitaire (une fonction, une requête, un appel API), l'écart Fable 5 / Opus 4.8 ne justifie pas le surcoût. Sur une tâche longue (refactorisation multi-jours, audit code, migration de pipeline ETL), il devient mesurable. Sur une tâche multi-agents avec mémoire persistante, il devient décisif.

Ce que ça change pour une entreprise française

Trois cas concrets que nous voyons remonter cette semaine en cadrage chez des ETI françaises.

Une mutuelle de 1 200 salariés qui automatise la qualification de 8 000 emails sinistres par mois sur Opus 4.8. La direction du SAV pense que Fable 5 va débloquer les cas multi-pièces jointes complexes. La vraie question est en amont : 60 % des qualifications passent par un workflow simple, où Opus 4.8 fait déjà 92 % de précision. Ne basculer que les 40 % de cas complexes sur Fable 5, via un routeur côté mailbots de qualification, permet de chiffrer le gain avant de signer l'engagement.

Une banque privée régionale qui industrialise Claude Code pour la revue de PR. L'équipe data envisage Fable 5 pour les refactorings massifs (migration ORM, harmonisation des libs internes). C'est exactement la charge où le modèle excelle. Mais Fable 5 sort des forfaits Claude Code Agent SDK le 15 juin, comme nous l'avons documenté dans le choc tarif Agent SDK du 15 juin 2026. Le crédit Max 5x de 100 $ par développeur s'épuise en quelques heures sur Fable 5. La bascule oblige à activer l'overflow billing avec plafond mensuel, ou à isoler la charge sur un compte API dédié avec budget capé.

Un pure player e-commerce français qui sert 80 000 conversations SAV par mois via un chatbot relation client sur Sonnet 4.6. La direction e-commerce demande la bascule sur Fable 5 « pour rester au niveau de la concurrence ». L'analyse économique est sans appel : Sonnet 4.6 traite ces conversations à 0,012 $ par interaction, Fable 5 les traiterait à 0,18 $, soit 15 fois plus cher. La pertinence client gagnée se chiffre en pourcentage de NPS, et il faut un gain de 8 à 12 points pour que la bascule passe le test ROI. Avant toute décision, estimez le retour sur investissement réel intégrant cette couche variable.

Webotit, éditeur français d'IA conversationnelle, observe le même réflexe chez ses clients : Fable 5 est utile pour les charges agentiques longues et rares, pas pour les charges conversationnelles volumineuses et répétitives. Tasser cette nuance dans l'arbitrage CODIR évite une surfacturation de 5 à 10 fois sans gain métier.

Trois arbitrages à passer avant le 22 juin

L'horloge tourne. Voici les trois questions à fermer en réunion technique cette semaine.

1. Quelles charges agentiques pèsent plus de 10 minutes de raisonnement par tâche ? Ces charges sont les seules candidates rationnelles pour Fable 5. Pour tout le reste (conversation, qualification courte, extraction simple), Opus 4.8 ou Sonnet 4.6 restent plus efficaces sur le ratio prix/qualité.

2. Qui surveille le routage silencieux vers Opus 4.8 ? Si vos charges traitent du contenu cyber, médical, pharma ou chimie, vous avez statistiquement 5 % de routage automatique. Sans observabilité applicative qui logue ce flag, vous ne saurez pas pourquoi votre agent perd brutalement 11 points de précision sur certaines tâches.

3. Comment cadrer la fenêtre gratuite jusqu'au 22 juin ? Les 11 jours offerts à vos équipes Pro/Max/Team/Enterprise sont une occasion réelle de benchmarker en interne avec une charge représentative. Mais sans plan de test discipliné, les utilisateurs vont mélanger des prompts personnels et des prompts métier, et vous obtiendrez un retour qualitatif inutile pour décider en CODIR. Cadrez les tests sur 3 à 5 cas d'usage métier précis, mesurez précision, latence et coût équivalent en API directe.

Ce qu'il faut retenir

Conclusion

Fable 5 n'est pas un upgrade de routine. C'est le premier modèle Mythos en production avec un mécanisme de routage qui change la prédictibilité des sorties sur certaines charges. Pour une DSI française, la décision rationnelle n'est ni « on bascule tout » ni « on attend ». C'est « on isole les 3 charges agentiques longues où Fable 5 vaut deux fois plus, et on garde tout le reste sur Sonnet 4.6 ou Opus 4.8 ».

La fenêtre gratuite jusqu'au 22 juin n'est pas un cadeau commercial. C'est un benchmark interne à 11 jours.

Vous voulez cadrer ce benchmark avec quelqu'un qui voit la bascule en direct chez des ETI françaises ? Échangez avec les équipes Webotit sur l'orchestration d'agents IA gouvernée. Nous aidons les directions générales, DSI et lead dev à séparer les charges qui méritent un modèle Mythos des charges qui consomment inutilement le budget.

Questions frequentes

Quand exactement Claude Fable 5 est-il sorti et où est-il disponible ?

Claude Fable 5 est sorti le 9 juin 2026. Il est accessible via l'API Anthropic (modèle claude-fable-5), Amazon Bedrock (régions US East N. Virginia et Europe Stockholm), Microsoft Foundry, GitHub Copilot et Databricks via Unity AI Gateway. Aucune région française dédiée n'est annoncée pour l'instant ; les requêtes européennes passent par Stockholm.

Quel est le prix exact de Claude Fable 5 par rapport à Opus 4.8 ?

Fable 5 est facturé 10 $ par million de tokens en entrée et 50 $ en sortie, contre 5 $ et 25 $ pour Opus 4.8. Le facial est donc 2x. En pratique, Cloudzero observe que Fable 5 consomme jusqu'à 35 % de tokens en plus pour un raisonnement plus long, ce qui porte le surcoût réel à 2,5x ou 2,7x sur une tâche équivalente. Le caching de prompt applique 90 % de remise sur les tokens en cache.

Que fait Fable 5 quand la requête touche un sujet sensible comme la cybersécurité ?

Fable 5 ne refuse pas, il route silencieusement la requête vers Claude Opus 4.8. Anthropic indique que ce routage se déclenche dans moins de 5 % des sessions, et l'utilisateur est informé à chaque fois. Pour une charge de production qui traite des contenus cyber, médicaux ou pharma, cette bascule entraîne une perte mesurable de qualité, puisque Opus 4.8 score 69,2 % sur SWE-Bench Pro contre 80,3 % pour Fable 5.

Quels plans Claude bénéficient de l'accès gratuit à Fable 5 jusqu'au 22 juin 2026 ?

Les plans Pro, Max, Team et Enterprise incluent un accès gratuit à Fable 5 entre le 9 juin et le 22 juin 2026. Après cette date, l'usage retombe sur les règles de crédit du plan. Côté Claude Code et Agent SDK, la bascule se cumule avec le passage en crédit séparé prévu pour le 15 juin 2026, qui sort les charges agentiques automatisées des forfaits illimités.

Faut-il basculer une charge conversationnelle (chatbot, SAV) sur Fable 5 ?

Pas par défaut. Fable 5 est conçu pour des tâches agentiques longues avec mémoire persistante (refactoring massif, audit code, migrations multi-jours, recherche profonde). Sur une charge conversationnelle volumineuse (chatbot SAV, qualification email courte), Sonnet 4.6 ou Opus 4.8 restent plus efficaces sur le ratio prix/qualité. La bascule ne se justifie que si elle apporte un gain mesurable de 30 % minimum sur une métrique métier précise.

AnthropicClaude Fable 5Mythosagents IALLM entrepriseDSI

Articles associés

Agents I.A.

Claude Code 15 juin 2026 : cadrer le choc tarif Agent SDK Anthropic

Anthropic sort Agent SDK et claude -p des plans Pro/Max le 15 juin 2026. Crédit 20-200 $/mois, hausse 5-25×. Comment cadrer son budget IA en J-8.

Lire

Agents I.A.

Claude Compliance API : Anthropic branche Purview, Okta, CrowdStrike

Anthropic ouvre Claude à 28 outils sécurité (Purview, Okta, Wiz). Ce que la Compliance API change pour la gouvernance d'une DSI française.

Lire

Illustration éditoriale : Claude Managed Agents self-hosted sandbox et MCP tunnels pour DSI française

Agents I.A.

Claude self-hosted : sandbox et MCP tunnels, demi-pas DSI

Anthropic ouvre Claude Managed Agents au self-hosting et aux MCP tunnels. Ce qui change vraiment pour un DSI ou un RSSI français en 2026.

Lire