Close Menu
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
What's Hot

Les deux plus grands films du week-end ont tous deux été réalisés par des YouTubeurs

mai 30, 2026

L’armée américaine tire un missile sur la salle des machines d’un coureur de blocus après avoir ignoré plus de 20 avertissements

mai 30, 2026

Sridhar Ramaswamy, PDG de Snowflake, déclare que la tarification basée sur la consommation est là pour rester

mai 30, 2026
Facebook X (Twitter) Instagram
Facebook X (Twitter) Instagram
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
221 France221 France
Home » Les modèles d’IA ont toujours du mal à déboguer les logiciels, montre Microsoft Study
Startups

Les modèles d’IA ont toujours du mal à déboguer les logiciels, montre Microsoft Study

JohnBy Johnavril 10, 2025Aucun commentaire4 Mins Read
Facebook Twitter Pinterest Reddit Telegram LinkedIn Tumblr VKontakte WhatsApp Email
Share
Facebook Twitter Reddit Pinterest Email


Les modèles d’IA des laboratoires OpenAI, anthropiques et d’autres meilleurs laboratoires AI sont de plus en plus utilisés pour aider à la programmation des tâches. Le PDG de Google, Sundar Pichai, a déclaré que 25% octobre du nouveau code de la société était généré par l’IA, et que le PDG de Meta Mark Zuckerberg a des ambitions exprès de déployer largement les modèles de codage de l’IA avec le géant des médias sociaux.

Pourtant, même certains des meilleurs modèles ont aujourd’hui du mal à résoudre les bogues logiciels qui ne trébucheraient pas les développeurs expérimentés.

Une nouvelle étude de Microsoft Research, la division R&D de Microsoft, révèle que les modèles, comprenaient le Sonnet Claude 3.7 d’Anthropic et O3-MinI d’OpenAI, ne parviennent pas à déboguer de nombreux problèmes dans une référence de développement logiciel appelé Swe-Bench Lite. Les résultats sont un rappel qui donne à réfléchir que, malgré les déclarations audacieuses de la part des entreprises, l’IA ne correspond toujours pas aux experts humains dans des domaines tels que le codage.

Les co-auto-Autthors de l’étude ont testé neuf modèles différents comme l’épine dorsale d’un «agent invite unique» qui avait accès à un certain nombre d’outils de débogage, y compris un débogueur Python. Ils ont chargé cet agent de résoudre un ensemble organisé de 300 tâches de débogage de logiciels de Swe-Bench Lite.

Selon les co-auteurs, même lorsqu’ils sont équipés de modèles plus forts et plus récents, leur agent a rarement compliqué plus de la moitié des tâches de débogage avec succès. Claude 3.7 Sonnet avait le taux de réussite moyen le plus élevé (48,4%), suivi de l’O1 d’OpenAI (30,2%) et de l’O3-MinI (22,1%).

Microsoft AI Débogage de référence
Un tableau de l’étude. L’augmentation de «l’augmentation relative» fait référence aux modèles Boost que les modèles sont équipés d’un outillage de débogage.Crédits Image: Microsoft

Pourquoi la performance décevante? Certains modèles ont eu du mal à utiliser les outils de débogage à leur disposition et à comprendre comment différents outils pourraient aider avec différentes émetteurs. Le plus gros problème, cependant, était la pénurie de données, selon les co-auteurs. Ils spéculent qu’il n’y a pas suffisamment de données représentant des «processus de prise de décision séquentiels» – c’est-à-dire, le débogage humain des traces dans les données de formation des modèles actuels.

«Nous croyons fortement que la formation ou le réglage fin (modèles) peuvent en faire de meilleurs débogateurs interactifs», a écrit les co-auteurs de leur étude. «Cependant, cela nécessitera des données spécialisées pour réaliser une telle formation de modèle, par exemple, des données de trajectoire qui enregistrent des agents interagissant avec un débogueur pour collecter les informations nécessaires avant de suggérer une correction de bogue.»

Les résultats ne sont pas exactement choquants. De nombreuses études ont montré que l’IA générateur de code a tendance à introduire des vulnérabilité et des erreurs de sécurité, en raison de faiblesses dans des domaines comme la capacité de comprendre la logique de programmation. Une évaluation récente de Devin, un outil de codage d’IA populaire, a révélé qui ne pouvait effectuer que trois des 20 tests de programmation.

Mais le travail Microsoft est l’un des looks les plus détaillés à ce jour sur un problème de persiste pour les modèles. Il n’atténuera probablement pas l’enthousiasme des investisseurs pour les outils de codage d’assistance à la formulation de l’IA, mais avec un peu de chance, cela fera deux fois les développeurs et leurs high-ups pour permettre à l’IA d’exécuter le spectacle de codage.

Pour ce que cela vaut, un nombre croissant de chefs de technologie ont contesté l’idée qu’une IA automatisera les emplois de codage. Le co-fondateur de Microsoft, Bill Gates, a déclaré qu’il pensait que la programmation comme une profession était là pour rester. Il en va de même pour les plis de cette Amjad Masad, du PDG d’Okta Todd McKinnon et du PDG d’IBM Arvind Krishna.



Source link

Share. Facebook Twitter Pinterest LinkedIn Reddit Email
Previous ArticleBereal, qui dit qu’il a des utilisateurs de 40 m par mois, déploie des publicités aux États-Unis
Next Article What is Bluesky? Everything to know about the X competitor.
John
  • Website

Related Posts

Les deux plus grands films du week-end ont tous deux été réalisés par des YouTubeurs

mai 30, 2026

Les anciens de Snap dévoilent le fonds Ghost Angels

mai 30, 2026

« Quelle blague » : la nouvelle facturation basée sur des jetons de Github Copilot suscite la consternation parmi les développeurs

mai 30, 2026

Meta serait en train de développer une IA pendant

mai 30, 2026
Add A Comment
Leave A Reply Cancel Reply

Top Posts

La couche infrastructure sera le véritable champ de bataille du futur système financier

mai 30, 2026

Le co-fondateur de PB Fintech vend des actions d’une valeur de 665 £

mai 29, 2026

5 startups fintech indiennes qui ont retenu notre attention en mai

mai 29, 2026

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

Bienvenue sur 221 France, votre source d’informations de qualité sur les domaines de la technologie, des affaires, du lifestyle et des animaux de compagnie. Nous sommes passionnés par la création de contenus qui enrichissent votre quotidien et vous aident à naviguer dans un monde en constante évolution.

Facebook X (Twitter) Instagram Pinterest YouTube
Top Insights

Les deux plus grands films du week-end ont tous deux été réalisés par des YouTubeurs

mai 30, 2026

L’armée américaine tire un missile sur la salle des machines d’un coureur de blocus après avoir ignoré plus de 20 avertissements

mai 30, 2026

Sridhar Ramaswamy, PDG de Snowflake, déclare que la tarification basée sur la consommation est là pour rester

mai 30, 2026
Get Informed

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

© 2026 221france. Designed by 221france.
  • Home
  • About us
  • Advertise us
  • Contact us
  • DMCA
  • Privacy policy
  • Terms & Condition

Type above and press Enter to search. Press Esc to cancel.