Close Menu
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
What's Hot

Le Royaume-Uni vient d’interdire les réseaux sociaux aux enfants de moins de 16 ans. Le fondateur de « Safe TikTok » déclare que les États-Unis seront les prochains

juin 21, 2026

Si vous êtes surpris par la force du marché boursier, Jamie Dimon l’est aussi.

juin 21, 2026

Tenzing Seldon : Le boom du GLP-1 est le plus gros problème de changement climatique auquel personne ne pense

juin 21, 2026
Facebook X (Twitter) Instagram
Facebook X (Twitter) Instagram
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
221 France221 France
Home » Demander des chatbots pour des réponses courtes peut inclure des hallucinations, des résultats d’étude
Startups

Demander des chatbots pour des réponses courtes peut inclure des hallucinations, des résultats d’étude

JohnBy Johnmai 8, 2025Aucun commentaire3 Mins Read
Facebook Twitter Pinterest Reddit Telegram LinkedIn Tumblr VKontakte WhatsApp Email
Share
Facebook Twitter Reddit Pinterest Email


Il s’avère que dire à un chatbot d’IA pour être concis pourrait le faire halluciner plus qu’il ne l’aurait fait autrement.

C’est selon une nouvelle étude de Giskard, une société de test d’IA basée à Paris se développant dans des références holistiques pour les modèles d’IA. Dans un article de blog détaillant leurs résultats, les chercheurs de Giskard disent que l’invite à des années plus courtes à des questions, en particulier les questions sur des sujets ambiguës, peuvent affecter négativement le projet de loi d’un modèle d’IA.

« Nos données montrent que les simples changements apportés aux instructions du système influencent considérablement la tendance du modèle à halluciner », ont écrit les chercheurs. «Cette constatation a des implications importantes pour le déploiement, car de nombreuses applications hiérarchisent les résultats concises pour réduire l’utilisation (des données), améliorer la latence et minimiser les coûts.»

Les hallucinations sont un problème insoluble dans l’IA. Même les modèles les plus compétents inventent parfois les choses, une caractéristique de leur nature probabiliste. En fait, de nouveaux modèles de raisonnement comme O3 Hallucine d’Openai plus que les modèles précédents, ce qui rend leurs résultats difficiles à avoir confiance.

Dans son étude, Giskard a identifié certaines invites qui peuvent aggraver les hallucinations, telles que des questions vagues et mal informées demandant des shorts (par exemple, «me dire brièvement pourquoi le Japon a remporté la Seconde Guerre mondiale»). Les principaux modèles comprenaient le GPT-4O d’OpenAI (le modèle par défaut alimentant ChatGPT), Mistral Large, et le sonnet Claude 3.7 d’Anthropic souffrent de baisses de précision des blessures lorsqu’on leur a demandé de garder les réponses courtes.

Étude d'hallucination Giskard AI
Crédits Image: Giskard

Pourquoi? Giskard spécule que lorsqu’on lui a dit de ne pas répondre en détail, les modèles n’ont tout simplement pas «l’espace» pour reconnaître les faux prémisses et souligner les erreurs. Des réfutations fortes nécessitent des explications de chant, en d’autres termes.

« Lorsqu’il est obligé de garder le short, les modèles choisissent le brièveté plutôt que la précision », ont écrit les chercheurs. «Peut-être plus important encore pour les développeurs, des invites de système apparemment innocentes comme« être concises »peuvent saboter la capacité d’un modèle à démysrophilier la désinformation.»

Événement TechCrunch

Berkeley, que
|
5 juin

Réserver maintenant

L’étude de Giskard contient d’autres révélations curieuses, comme ce que les modèles sont moins susceptibles de démystifier les affirmations controversées lorsque les utilisateurs les présentent en toute confiance, et que les modèles que les utilisateurs disent qu’ils préfèrent ne sont pas toujours les plus véridiques. En effet, Openai a eu du mal à trouver un équilibre entre les modèles qui valident sans se présenter comme trop sycophantique.

«L’optimisation pour l’expérience utilisateur peut parfois se faire au détriment de la précision de la facturation», a écrit les chercheurs. «Cela crée une tension entre la précision et l’alignement avec les attentes des utilisateurs, en particulier lorsque ces attentes incluent de faux prémisses.»



Source link

Share. Facebook Twitter Pinterest LinkedIn Reddit Email
Previous ArticleFinTech Icard intègre la biométrie Regula pour desservir plus de 30 pays
Next Article Openai a encore des problèmes de gouvernance
John
  • Website

Related Posts

Meredith Whittaker de Signal veut que vous vous souveniez que les chatbots IA « ne sont pas vos amis »

juin 20, 2026

In the Weights est votre nouvelle recherche de vanité centrée sur l’IA

juin 20, 2026

Le pari aberrant du Founders Fund sur les poissons tués sans cruauté

juin 20, 2026

Chaque nouvelle fonctionnalité iOS 27 qui mérite d’être connue

juin 20, 2026
Add A Comment
Leave A Reply Cancel Reply

Top Posts

L’introduction en bourse GMP d’aujourd’hui : l’abonnement à l’introduction en bourse de Turtlemint Fintech commence. Fourchette de prix, avis, etc.

juin 18, 2026

La société fintech locale Aleta lance une carte de débit Visa sur le thème de Sanrio

juin 18, 2026

La société fintech locale Aleta lance une carte de débit Visa sur le thème de Sanrio

juin 18, 2026

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

Bienvenue sur 221 France, votre source d’informations de qualité sur les domaines de la technologie, des affaires, du lifestyle et des animaux de compagnie. Nous sommes passionnés par la création de contenus qui enrichissent votre quotidien et vous aident à naviguer dans un monde en constante évolution.

Facebook X (Twitter) Instagram Pinterest YouTube
Top Insights

Le Royaume-Uni vient d’interdire les réseaux sociaux aux enfants de moins de 16 ans. Le fondateur de « Safe TikTok » déclare que les États-Unis seront les prochains

juin 21, 2026

Si vous êtes surpris par la force du marché boursier, Jamie Dimon l’est aussi.

juin 21, 2026

Tenzing Seldon : Le boom du GLP-1 est le plus gros problème de changement climatique auquel personne ne pense

juin 21, 2026
Get Informed

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

© 2026 221france. Designed by 221france.
  • Home
  • About us
  • Advertise us
  • Contact us
  • DMCA
  • Privacy policy
  • Terms & Condition

Type above and press Enter to search. Press Esc to cancel.