
Anthropic rend public son premier modèle de couche Mythos. Mardi, AI Labs a annoncé qu’il déploierait Fable 5 (la première version large de modèles d’IA d’une classe de modèles nettement plus puissantes) en tant que version générale et qu’il déploierait Claude Mythos 5 auprès de partenaires approuvés qui ont déjà accès à Claude Mythos Preview.
Il s’agit d’une étape importante pour le laboratoire, qui pensait initialement que les modèles de classe Mythos étaient trop risqués à publier en raison de leur capacité améliorée à découvrir les faiblesses de la cybersécurité. L’annonce intervient également un peu plus d’une semaine après que la société a secrètement déposé ses documents d’introduction en bourse.
Fortune a signalé pour la première fois l’existence du nouveau modèle plus puissant en mars après qu’une violation de données ait révélé son existence. En avril, Anthropic a officiellement annoncé Mythos, le qualifiant de « changement progressif » dans les fonctionnalités. L’entreprise a choisi de contrôler étroitement son déploiement à travers une initiative appelée Project Glasswing. Le projet visait à permettre aux professionnels de la cybersécurité d’accéder aux cyber-compétences des modèles pour renforcer leurs défenses contre les nouvelles menaces posées par des modèles d’IA de plus en plus sophistiqués.
Anthropic se dit désormais convaincu que les nouveaux garde-fous seront suffisants pour garder ces compétences dangereuses hors de mauvaises mains.
« La raison pour laquelle nous publions ‘Fable Five’ maintenant est que nous sommes plus sûrs d’avoir mis en place des garde-corps de sécurité », a déclaré Diane Penn, directrice de la gestion des produits, de la recherche et des laboratoires chez Anthropic, à Fortune.
La société a déclaré que les réponses dans certains domaines à haut risque, tels que la biologie et la cybersécurité, seront bloquées et principalement traitées par Claude Opus 4.8, le modèle le moins puissant d’Anthropic publié plus tôt cette année. La crainte est que donner aux utilisateurs un accès illimité aux renseignements de niveau Mythos pourrait permettre aux mauvais acteurs de mener plus facilement des cyberattaques plus sophistiquées ou de développer des armes biologiques. La société a également déclaré avoir regroupé en profondeur son classificateur (algorithme d’apprentissage automatique) pour tester sa robustesse face aux jailbreaks.
Anthropic a déclaré que les capacités du nouveau modèle « dépassent celles de tous les modèles précédemment disponibles » et ont démontré des performances supérieures dans des domaines tels que le codage, le travail de connaissances et la vision.
Penn a déclaré que Fable Five est particulièrement efficace dans ce qu’on appelle la « gestion de la mémoire à long terme », ou la capacité du modèle d’IA à suivre ce qu’il fait sur des tâches longues et complexes.
Les modèles précédents pouvaient « perdre le fil » au milieu de tâches longues et complexes, mais les nouveaux modèles se souviennent bien mieux de ce qu’ils font sur de longues périodes, a-t-elle déclaré. Penn a également déclaré que le laboratoire avait amélioré l’auto-vérification et l’instruction ultérieure. Les modèles vérifient désormais leur travail plus attentivement, testent leurs hypothèses et corrigent leur trajectoire avant de proposer une réponse finale. Elle a ajouté que ces changements signifient une amélioration de la qualité globale des tâches de codage et de non-codage.
« Nous pensons qu’il existe des cas d’utilisation alternatifs (pour le travail de connaissances), qu’il s’agisse de codage ou autre chose, mais nous pensons également que les cas d’utilisation sont en train de se développer », a déclaré Penn. « Des modèles comme Fable Five nous permettent d’exécuter des projets à très long terme, parfois du jour au lendemain. Cela peut inclure la possibilité de revoir et d’améliorer l’ensemble de la base de code. »
« Nous encourageons nos clients à confier leurs tâches les plus difficiles à Fable Five », a-t-elle ajouté.
Selon l’institut, les premières données montrent qu’au moins 95 % des sessions Fable s’exécutent uniquement sur les propres réponses de Fable, plutôt que d’être transmises à Opus. Cependant, Anthropic a été confronté dans le passé à des réactions négatives de la part de certains utilisateurs qui prétendaient que les filtres de sécurité de l’entreprise pouvaient parfois « sur-bloquer » des demandes inoffensives ou émettre de faux rejets.
Penn a reconnu que les garde-fous n’étaient peut-être pas parfaits dès le début.
« Nous reconnaissons qu’il peut y avoir des demandes bénignes qui sont initialement bloquées », a-t-elle déclaré.
« Alors que nous travaillons activement à améliorer les mesures de sécurité après le lancement, nous souhaitions rendre ce modèle accessible au public de manière sûre et dans les plus brefs délais. »
Fable 5 et Mythos 5 sont proposés à 10 $ par million de jetons d’entrée et à 50 $ par million de jetons de sortie. C’est le double du prix de la version standard du modèle suivant le plus avancé, l’Opus 4.8.

