Kimi : évolution des modèles de 2023 à 2026

IA ConversationnelleArticle cluster

Kimi : évolution des modèles de 2023 à 2026

Lecture factuelle de la trajectoire Kimi: ce qui est public, ce qui ne l’est pas, et comment interpréter l’arrivée de K2, K2 Thinking et K2.5.

Gabriel Morel

Auteur spécialisé veille IA, LLM et agents IA

29 avril 20265 min de lecture

Parler de ce sujet avec Webotit

En bref

La trajectoire publique de Kimi est lisible à partir de 2024, pas de 2023: Mooncake sert de premier jalon clair, puis viennent Kimi k1.5, Kimi-VL, Kimi K2, Kimi K2 Thinking et Kimi K2.5. Pour une lecture entreprise, cela montre une montée rapide du long contexte vers des modèles plus agentiques et multimodaux.

Ce qu’on peut affirmer sur Kimi, et ce qu’on ne peut pas

Si vous cherchez une histoire “depuis 2023”, je préfère être exact plutôt que flatteur: je n’ai pas trouvé, dans les pages officielles publiques consultées le 25 mars 2026, de jalon Kimi daté de 2023 qui documente clairement la trajectoire produit. Le fil public visible commence en pratique en 2024, avec Mooncake daté du 26 juin 2024.¹

Cette précision compte, parce qu’en entreprise on confond souvent:

l’histoire interne d’un laboratoire,
l’histoire publique d’un produit,
et la maturité réellement exploitable en production.

Kimi ne doit pas être vendu comme une légende. Il doit être lu comme une courbe d’évolution très rapide entre 2024 et 2026.

La chronologie publique de Kimi

Voici la lecture la plus propre du trajet visible dans les sources officielles:

Date	Jalons officiels	Ce que cela raconte
26 juin 2024	Mooncake	architecture de serving long contexte et KV cache
20 janvier 2025	Kimi k1.5	montée en puissance du raisonnement et du RL
10 avril 2025	Kimi-VL	entrée plus nette dans le multimodal
26 avril 2025	Kimi-Audio	extension vers l’audio
17 juin 2025	Kimi-Dev	signal fort pour le code
20 juin 2025	Kimi-Researcher	agent de recherche
11 juillet 2025	Kimi K2	famille agentique de génération
5 septembre 2025	Kimi-K2-Instruct-0905	variante Instruct datée
6 novembre 2025	Kimi K2 Thinking	focus raisonnement + tools
27 janvier 2026	Kimi K2.5	multimodalité et agentic intelligence visuelle

Consultée le 25 mars 2026, la page d’accueil officielle de Kimi liste cette séquence dans l’ordre, et le changelog de la plateforme confirme les lancements clés, notamment Kimi K2 Thinking le 6 novembre 2025.¹²

Ce que cette évolution dit vraiment du produit

1. D’abord l’infra, ensuite l’agent

Le premier nom visible dans le parcours public est Mooncake, décrit comme une architecture de serving centrée sur le KVCache et le long contexte. C’est un signal de fondation, pas un coup marketing. Kimi s’est d’abord construit autour de la capacité à servir de grands contextes de manière efficace.¹

Pour une équipe produit, ça veut dire une chose simple: Kimi n’a pas commencé par “un joli chatbot”. Il a commencé par un problème d’infrastructure et de débit utile.

2. K1.5 puis K2: le bond vers le raisonnement agentique

Avec Kimi k1.5 le 20 janvier 2025, puis Kimi K2 le 11 juillet 2025, Moonshot affiche un changement de posture: on passe d’un système de contexte à un modèle davantage pensé pour le raisonnement, le code et les tâches outillées.

Les docs de K2 mettent en avant:

1T de paramètres totaux / 32B activés,
des capacités agentiques fortes,
ToolCalls,
JSON Mode,
Partial Mode,
recherche internet,
et une absence de vision sur K2.³

Autrement dit: K2 n’est pas “juste un gros modèle”. C’est un modèle conçu pour exécuter des tâches qui ressemblent déjà à des workflows métier.

3. K2 Thinking et K2.5: la spécialisation devient visible

Le 6 novembre 2025, Kimi K2 Thinking est lancé officiellement, avec un positionnement plus clair sur le raisonnement profond, la recherche et les séquences de tool use longues. La documentation publique parle de 200 à 300 appels d’outils séquentiels dans certains scénarios.⁴

Le 27 janvier 2026, Kimi K2.5 pousse encore l’idée plus loin: la page officielle le présente comme la version multimodale la plus versatile à date, avec visual input, thinking et non-thinking modes, dialogue et agent tasks.⁵

Dans un produit entreprise, cela se lit comme suit:

K2 = base agentique de génération,
K2 Thinking = raisonnement plus poussé,
K2.5 = multimodalité + agentic intelligence visuelle.

Pourquoi la date de départ publique compte pour les décideurs

Dans un benchmark, tout le monde veut l’effet “wow”. Dans une plateforme entreprise, ce qui compte est la trajectoire.

Si la trace publique commence en 2024, vous avez moins de recul historique visible qu’avec certains concurrents. Ce n’est pas un défaut en soi. Mais cela veut dire que le décideur doit être plus attentif à trois choses:

Stabilité des variantes
Documentation exploitable
Capacité de support commercial et technique

La page FAQ de Kimi indique d’ailleurs que le produit enterprise est bien disponible, avec contact sales et entitlements à demander par email.⁶

En clair: Kimi a une vitesse d’évolution très intéressante, mais vous ne l’évaluez pas comme un simple modèle de recherche. Vous l’évaluez comme un produit en changement rapide.

Le signal pour les projets Webotit

Pour un projet client, cette évolution ouvre trois usages nets:

assistant de recherche sur gros corpus,
copilote back-office qui appelle des outils,
interface multimodale qui comprend texte et visuels.

Mais elle impose aussi un cadre plus strict:

quel modèle exact est utilisé ?
quelle version ?
quels outils sont autorisés ?
quelle politique de cache et de coûts ?
quel fallback si le modèle change ?

Les pages de pricing et de limites montrent d’ailleurs un produit pensé autour du recharge-based access, de seuils de débit et d’une segmentation par tier. Le minimum de recharge pour démarrer est de 1 USD, avec un palier supplémentaire à 5 USD pour certains avantages, puis des tiers plus élevés jusqu’à des débits très supérieurs.⁷⁸

Cette logique a une conséquence directe: Kimi est intéressant pour des usages sérieux, mais il faut anticiper l’exploitation, pas seulement le prompt.

Ce que je retiens de la période 2024-2026

Le fil public Kimi raconte quatre choses:

une base infra solide autour du contexte et du serving,
un saut vers l’agentic reasoning,
une extension multimodale,
et une stratégie produit très rapide entre 2025 et 2026.

Pour une équipe entreprise, ce n’est pas “qui a gagné ?”. C’est plutôt: sur quelle version exacte puis-je m’appuyer, avec quel niveau de risque et de gouvernance ?

Si votre besoin est d’arbitrer maintenant, la suite logique est de comparer les modèles à suivre vraiment en 2026 et les cas d’usage où Kimi apporte un vrai gain business.

Ce que la trajectoire Kimi change pour un acheteur

Cette trajectoire a une implication très concrète : Moonshot n’est plus jugé uniquement sur son niveau de modèle, mais sur sa capacité à tenir un catalogue exploitable. Les pages de produit, les FAQs de plateforme, les pricing tables et les limites publiées au 25 mars 2026 montrent qu’il ne s’agit plus d’une simple démonstration technique. Il y a désormais assez de matière pour une vraie lecture produit.

Pour une équipe Webotit, cela veut dire qu’un benchmark Kimi ne doit pas se contenter d’un test “chat”. Il faut aussi regarder le comportement en outils, la stabilité des variantes preview, la place du multimodal et la cohérence entre coût public, limites et cas d’usage réels.

FAQ

Questions frequentes

Kimi a-t-il une histoire publique claire en 2023 ?

Pas dans les pages officielles que j’ai pu vérifier le 25 mars 2026. Le premier jalon public clair que j’ai trouvé est Mooncake, daté du 26 juin 2024.

K2, K2 Thinking et K2.5, c’est la même chose ?

Non. K2 est la base agentique de génération, K2 Thinking ajoute un focus raisonnement et tool use, et K2.5 ajoute une couche multimodale et visuelle plus nette.

Pourquoi l’évolution rapide de Kimi intéresse une entreprise ?

Parce qu’elle peut couvrir des cas de recherche, de support et de copilote métier, mais elle exige une bonne gouvernance de version, de coûts et d’intégration.

Sources et references

KimiMoonshot AILLMtimelinemodeles 2026agentic AI

Articles associés

IA Conversationnelle

Kimi 2026 : quels modèles suivre vraiment ?

Sélection pratique des variantes Kimi à suivre en 2026, avec un tri clair entre modèles à évaluer, modèles de compatibilité et bruit marketing.

Lire

IA Conversationnelle

Quand choisir Kimi : cas d’usage, coûts et limites

Guide entreprise pour savoir quand choisir Kimi, quels modèles prendre, combien cela coûte, et quelles limites garder en tête.

Lire

IA Conversationnelle

xAI : évolution des modèles de 2023 à 2026

Comprendre la trajectoire Grok chez xAI, avec les changements de gamme, d’outils, de contexte et de coûts utiles à l’entreprise.

Lire