Close Menu
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
What's Hot

Les grèves d’Instructure concernent des pirates informatiques qui l’ont violé à deux reprises

mai 12, 2026

Le taux d’inflation a augmenté de 3,8% en avril en raison de la hausse des prix due à la guerre en Iran

mai 12, 2026

L’IA transforme les voitures connectées en machines à détecter les nids-de-poule

mai 12, 2026
Facebook X (Twitter) Instagram
Facebook X (Twitter) Instagram
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
221 France221 France
Home » Anthropic dit que les représentations « maléfiques » de l’IA étaient responsables des tentatives de chantage de Claude
Startups

Anthropic dit que les représentations « maléfiques » de l’IA étaient responsables des tentatives de chantage de Claude

JohnBy Johnmai 10, 2026Aucun commentaire2 Mins Read
Facebook Twitter Pinterest Reddit Telegram LinkedIn Tumblr VKontakte WhatsApp Email
Share
Facebook Twitter Reddit Pinterest Email


Les représentations fictives de l’intelligence artificielle peuvent avoir un réel effet sur les modèles d’IA, selon Anthropic.

L’année dernière, la société a déclaré que lors des tests préliminaires impliquant une société fictive, Claude Opus 4 tentait souvent de faire chanter les ingénieurs pour éviter d’être remplacé par un autre système. Anthropic a publié plus tard des recherches suggérant que les modèles d’autres sociétés présentaient des problèmes similaires de « désalignement agent ».

Apparemment, Anthropic a travaillé davantage sur ce comportement, affirmant dans un article sur X : « Nous pensons que la source originale de ce comportement était un texte Internet qui décrit l’IA comme diabolique et intéressée par l’auto-préservation. »

La société est entrée plus en détail dans un article de blog déclarant que depuis Claude Haiku 4.5, les modèles d’Anthropic « ne se livrent jamais à du chantage (lors des tests), là où les modèles précédents le faisaient parfois jusqu’à 96 % du temps ».

Qu’est-ce qui explique la différence ? La société a déclaré avoir constaté que la formation sur « des documents sur la constitution de Claude et des histoires fictives sur les IA en cours d’élaboration améliorait admirablement l’alignement ».

Dans le même ordre d’idées, Anthropic a déclaré qu’elle trouvait que la formation était plus efficace lorsqu’elle incluait « les principes qui sous-tendent un comportement aligné » et pas seulement « des démonstrations de comportements alignés uniquement ».

« Faire les deux ensemble semble être la stratégie la plus efficace », a déclaré l’entreprise.

Événement Techcrunch

San Francisco, Californie
|
13-15 octobre 2026



Source link

Share. Facebook Twitter Pinterest LinkedIn Reddit Email
Previous ArticleLe gourou du marché, Yardeni, prédit que l’indice S&P 500 atteindra 8 250 cette année alors que les bénéfices augmenteront
Next Article Le président Trump qualifie immédiatement la réponse de l’Iran à la proposition de cessez-le-feu américaine de « totalement inacceptable »
John
  • Website

Related Posts

Les grèves d’Instructure concernent des pirates informatiques qui l’ont violé à deux reprises

mai 12, 2026

L’IA transforme les voitures connectées en machines à détecter les nids-de-poule

mai 12, 2026

La startup vocale AI Vapi atteint une valorisation de 500 millions de dollars après avoir remporté Amazon Ring contre 40 concurrents

mai 12, 2026

Amazon lance la livraison en 30 minutes aux États-Unis

mai 12, 2026
Add A Comment
Leave A Reply Cancel Reply

Top Posts

Comment la fintech peut amener les talents numériques africains au monde

mai 12, 2026

Un pionnier de la Fintech lance un partenaire basé sur l’IA pour les professionnels en col blanc afin de lutter contre les perturbations de l’IA

mai 11, 2026

La société fintech britannique Wise fait ses débuts commerciaux aux États-Unis avec une double cotation

mai 11, 2026

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

Bienvenue sur 221 France, votre source d’informations de qualité sur les domaines de la technologie, des affaires, du lifestyle et des animaux de compagnie. Nous sommes passionnés par la création de contenus qui enrichissent votre quotidien et vous aident à naviguer dans un monde en constante évolution.

Facebook X (Twitter) Instagram Pinterest YouTube
Top Insights

Les grèves d’Instructure concernent des pirates informatiques qui l’ont violé à deux reprises

mai 12, 2026

Le taux d’inflation a augmenté de 3,8% en avril en raison de la hausse des prix due à la guerre en Iran

mai 12, 2026

L’IA transforme les voitures connectées en machines à détecter les nids-de-poule

mai 12, 2026
Get Informed

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

© 2026 221france. Designed by 221france.
  • Home
  • About us
  • Advertise us
  • Contact us
  • DMCA
  • Privacy policy
  • Terms & Condition

Type above and press Enter to search. Press Esc to cancel.