Anthropic a publié une nouvelle version de son modèle Sonnet de taille moyenne, suivant le rythme du cycle de mise à jour de quatre mois de l’entreprise. Dans un article annonçant le nouveau modèle, Anthropic a souligné les améliorations apportées au codage, au suivi des instructions et à l’utilisation de l’ordinateur.
Sonnet 4.6 sera le modèle par défaut pour les utilisateurs des forfaits Free et Pro.
La version bêta de Sonnet 4.6 comprendra une fenêtre contextuelle de 1 million de jetons, soit deux fois la taille de la plus grande fenêtre précédemment disponible pour Sonnet. Anthropic a décrit la nouvelle fenêtre contextuelle comme « suffisante pour contenir des bases de code entières, de longs contrats ou des dizaines de documents de recherche dans une seule requête ».
La sortie intervient seulement deux semaines après le lancement de l’Opus 4.6, et un modèle Haiku mis à jour devrait suivre dans les semaines à venir.
Le lancement s’accompagne d’un nouvel ensemble de scores de référence records, notamment OS World pour l’utilisation informatique et SWE-Bench pour l’ingénierie logicielle. Mais le plus impressionnant est peut-être son score de 60,4 % à l’ARC-AGI-2, destiné à mesurer les compétences spécifiques à l’intelligence humaine. Le score place Sonnet 4.6 au-dessus de la plupart des modèles comparables, bien qu’il soit toujours à la traîne de modèles comme Opus 4.6, Gemini 3 Deep Think et une version raffinée de GPT 5.2.

