Avec la disponibilité générale de la fenêtre à un million de jetons pour Claude Opus 4.6 et Sonnet 4,6, Anthropic franchit un seuil qui redistribue les cartes dans la course aux modèles de fondation. Prix, fiabilité et précision sur l’ensemble de la fenêtre : voilà les axes sur lesquels se jouera désormais la différenciation.

La généralisation de la fenêtre contextuelle à un million de jetons pour Claude Opus 4.6 et Claude Sonnet 4.6 marque une rupture dans la stratégie tarifaire d’Anthropic. Jusqu’ici réservée à des usages bêta ou soumise à des majorations, cette capacité est désormais facturée au tarif standard : 5 dollars par million de jetons en entrée et 25 dollars en sortie pour Opus 4.6, 3 dollars et 15 dollars pour Sonnet 4.6 — sans coefficient multiplicateur selon la longueur de la requête.

Plusieurs changements accompagnent cette disponibilité générale. Le plafond de médias par requête passe de 100 à 600 images ou pages PDF. Les limites de débit standard s’appliquent désormais sur l’ensemble de la fenêtre, sans restriction selon la longueur du contexte. L’en-tête bêta précédemment requis pour les requêtes dépassant 200 000 jetons devient obsolète : les appels existants qui l’incluent encore continuent de fonctionner sans modification du code. Sur Claude Code, les utilisateurs des plans Max, Team et Entreprise bénéficient automatiquement de la fenêtre complète pour Opus 4.6, réduisant les événements de compactage — la plateforme Coframe rapporte une baisse de 15 % de ces interruptions pour compacter les échanges et gagner en mémoire.

Un million de jetons : ce que cela représente concrètement pour les équipes IT

La portée pratique d’une fenêtre à un million de jetons dépasse la simple dimension quantitative. À titre de comparaison, un million de jetons correspond à l’intégralité d’une base de code de taille moyenne, à plusieurs milliers de pages de contrats, ou à la trace complète d’un agent opérant sur plusieurs heures — incluant les appels d’outils, les observations intermédiaires et les étapes de raisonnement. L’ingénierie de découpe contextuelle, les résumés avec perte d’information et la gestion manuelle du contexte que ces scénarios imposaient jusqu’ici deviennent superflus.

Pour les équipes de développement, l’impact concret est documenté par plusieurs utilisateurs précoces. Anton Biryukov, ingénieur logiciel chez Ramp, décrit comment les sessions Claude Code dépassant régulièrement 100 000 jetons lors d’interactions avec des outils de monitoring, des bases de données et du code source n’obligent plus à recommencer un raisonnement depuis le début après un compactage.

Un leadership de masse qui ne protège plus les flancs

La généralisation de la fenêtre à un million de jetons, conjuguée à l’effacement de la prime tarifaire sur les contextes longs, transforme une capacité jusqu’ici expérimentale en paramètre standard de conception des systèmes. C’est aussi une initiative stratégique, alors qu’OpenAI subit une lente érosion. Certes, les chiffres grand public d’OpenAI restent hors de portée de ses concurrents. Près de 900 millions d’utilisateurs hebdomadaires, 10 milliards de dollars de revenus annuels récurrents, une présence dans les flux quotidiens de centaines de millions de personnes. Mais cette domination masque deux glissements que les données sectorielles révèlent. Sur le marché applicatif mobile, la part de ChatGPT est passée de 69 % début 2025 à 45 % début 2026, selon Apptopia, pendant que Gemini progressait de 15 % à 25 % et que Grok montait à 15 % depuis une base quasi nulle. Sur le segment entreprise, celui qui conditionne les marges et la crédibilité réglementaire, Anthropic revendiquerait désormais un tiers du marché contre 25 % pour OpenAI, selon une étude Menlo Ventures dont il faut noter qu’elle émane d’un investisseur d’Anthropic.

Le lancement de GPT-5 était censé consolider la position d’OpenAI, mais il a produit l’inverse. Des graphiques de benchmark délibérément trompeurs — que Sam Altman a lui-même qualifié de « mega chart screw-up », ont alimenté une défiance durable dans la communauté des développeurs, précisément là où Anthropic a construit son avance sur les dix-huit derniers mois. GPT-5.2, lancé en décembre 2025 en réponse directe à la pression concurrentielle, a recentré le discours sur les développeurs et l’entreprise, reconnaissant implicitement que le terrain grand public n’était plus suffisant pour asseoir un leadership technique.

Ce que « un million de jetons » révèle du nouveau rapport de force

C’est dans ce contexte que la généralisation de la fenêtre à un million de jetons sans surcoût prend une dimension stratégique qui dépasse la simple annonce produit. GPT-5, dans sa version API, plafonne à 400 000 jetons — et les utilisateurs grand public disposent de fenêtres nettement plus restreintes selon leur abonnement. Anthropic supprime non seulement l’écart technique sur ce paramètre, mais le transforme en argument tarifaire explicite : même prix par jeton, quelle que soit la longueur de la requête, là où la tarification des contextes longs reste une variable d’ajustement chez la plupart des concurrents. Pour les DSI qui dimensionnent des architectures d’agents ou des pipelines documentaires, cette différence devient un critère de sélection important.

Le marché de l’IA de fondation n’est pas en train de basculer d’un monopole vers un autre. Il se fragmente en segments distincts — grand public, développeurs, entreprise, cas d’usage réglementés — où les positions dominantes ne se transfèrent pas automatiquement d’un terrain à l’autre. OpenAI conserve une avance de masse et une profondeur de trésorerie qu’aucun concurrent ne peut ignorer. Mais la capacité à imposer une norme tarifaire, à retenir les équipes techniques dans des sessions longues et à satisfaire les contraintes de gouvernance des grandes organisations s’est ouverte à une concurrence réelle. C’est un changement de nature, pas de degré.