Anthropic présente pour la première fois son modèle d’IA le plus puissant au grand public, mais il le fait avec des garde-fous.
Mardi, la société d’IA a lancé Claude Fable 5, la première version accessible au public de son modèle Mythos. Anthropic affirme que Fable 5 excelle dans l’ingénierie logicielle, le travail de connaissances et la vision, mais il est soumis à des limites de sécurité strictes. Dans les domaines à haut risque comme la cybersécurité, la biologie, la chimie et la distillation, le modèle bloque les réponses et revient à Claude Opus 4.8.
Lancé en avant-première en avril, Mythos était initialement limité à une poignée de partenaires en raison de problèmes de cybersécurité. La semaine dernière, Anthropic a élargi l’accès à des centaines d’organisations dans 15 pays, en se concentrant à nouveau sur les organisations qui gèrent des infrastructures critiques.
Désormais, une version de cette technologie est accessible à tous via l’API Claude d’Anthropic et les forfaits Entreprise basés sur la consommation. L’accès aux abonnements se déroulera par étapes : jusqu’au 22 juin, Fable 5 sera inclus dans les forfaits Pro, Max, Team et Enterprise par siège sans frais supplémentaires. Le 23 juin, Anthropic retirera Fable 5 de ces plans, nécessitant des crédits d’utilisation à l’avenir, avec l’intention de le restaurer en tant que fonctionnalité d’abonnement standard dès que possible.
Anthropic déploie également une nouvelle version de Mythos, appelée Mythos 5, auprès des organismes déjà approuvés pour accéder au modèle avancé.
Le lancement de Fable intervient alors qu’Anthropic se prépare à entrer sur les marchés publics, aux côtés d’OpenAI et de SpaceX d’Elon Musk. Cela fait également suite au plaidoyer de la société d’IA exhortant les grands laboratoires mondiaux d’IA à établir une pédale de frein coordonnée sur le développement de l’IA de pointe. Anthropic a averti que les systèmes progressent si rapidement qu’ils pourraient bientôt parvenir à une auto-amélioration récursive (RSI), s’améliorant de manière autonome sans intervention humaine.
Méfiant de ce qu’un modèle de classe Mythos pourrait faire entre de mauvaises mains, Anthropic affirme avoir testé ses classificateurs avec des tentatives de jailbreak avant de publier Fable 5.
« En interne, nous avons lancé un bug bounty externe qui n’a produit aucun jailbreak universel après plus de 1 000 heures de tests. Nous avons ensuite travaillé avec des organisations externes de red teaming qui n’ont pas non plus réussi à trouver de jailbreaks universels. »
Cela dit, de nouvelles attaques pourraient encore se produire. En conséquence, avec le lancement de Fable 5 et Mythos 5, Anthropic a déclaré qu’elle exigerait une rétention de 30 jours sur tout le trafic, même si les entreprises avaient auparavant des accords de rétention zéro. La société a déclaré qu’elle n’utiliserait pas les données à des fins de formation et qu’elle les utiliserait uniquement pour « se défendre contre des attaques complexes et nouvelles, y compris de nouveaux jailbreaks », et « identifier et réduire les faux positifs ». Cette politique pourrait créer un précédent dans l’industrie dans lequel l’accès à des modèles de plus en plus puissants s’accompagne de politiques obligatoires de conservation des données formulées comme une mesure de sécurité.
Pour ceux qui continuent à utiliser le modèle, toutes les questions n’obtiendront pas une réponse Fable 5. Anthropic affirme que les cas dans lesquels Fable doit s’en remettre à l’Opus 4.8 sont rares, les premières données montrant qu’au moins 95 % des sessions Fable s’exécutent entièrement sur les propres réponses du modèle.
Lors de tests effectués par des tiers, la société d’analyse Hex a déclaré dans un communiqué que Fable était la première à obtenir une note de 90 % sur son benchmark analytique de base pour les tâches analytiques complexes et de longue durée.
« Sur les questions les plus difficiles, il fait preuve d’un jugement rigoureux et d’une attention portée aux nuances », a déclaré Hex.
La plate-forme de codage Vibe Base44 a noté dans une déclaration que Fable est meilleur dans les « applications complètes uniques » et dispose d’un excellent appel d’outils. Genspark, plate-forme d’espace de travail et d’agent basée sur l’IA, a déclaré que Fable avait battu tous les autres modèles dans ses évaluations et avait obtenu de bien meilleurs résultats sur des tâches telles que la conception de l’interface utilisateur et le codage de jeux.
Le prix de Fable 5 et de Mythos 5 est de 10 $ par million de jetons d’entrée et de 50 $ par million de jetons de sortie, soit le double du prix de l’Opus 4.8. Ce prix à lui seul pourrait avoir un effet dissuasif sur une utilisation généralisée.
De nombreuses entreprises critiquent de plus en plus les coûts de l’IA après avoir vu les factures arriver ou après avoir dépensé plus tôt que prévu leurs budgets annuels d’IA. Les modèles avancés comme Opus 4.8 peuvent exacerber ces problèmes, avec des capacités de raisonnement avancées capables de diviser une seule requête en plusieurs tâches.
Anthropic a déclaré s’attendre à ce que la demande pour Fable 5 soit très élevée et difficile à prévoir. Et en effet, certains, comme la plateforme de récompenses d’achat Rakuten, pourraient penser que la hausse vaut le prix.
« Au plus haut effort, Fable réfléchit et valide son propre travail », a déclaré Rakuten dans un communiqué. « Pour nous, c’est ce qui rend possible des opérations hautement autonomes : un pays qui pense davantage pour lui-même. »
Lorsque vous achetez via des liens dans nos articles, nous pouvons gagner une petite commission. Cela n’affecte pas notre indépendance éditoriale.

