Le MIT a testé l'IA sur des milliers de tâches sur le lieu de travail. Dans la plupart des cas, ce n’était qu’à la dernière minute.

Un pourcentage croissant de travailleurs américains expérimentent l’intelligence artificielle dans leur travail quotidien, mais ils ont probablement des doutes quant à la sécurité de leur emploi à long terme.

Cependant, des données récentes publiées par le Massachusetts Institute of Technology (MIT) montrent que malgré les progrès de l’IA au cours des dernières années, la technologie ne fonctionne toujours que de manière médiocre pour certaines tâches sur le lieu de travail. Même ainsi, vous pourriez quand même commettre une grave erreur.

Les travailleurs qui craignent d’être bientôt remplacés par l’IA pourraient être rassurés par une nouvelle étude publiée par le MIT. L’étude présente l’histoire d’une reprise d’emploi basée sur l’IA plus comme un document de réflexion à combustion lente que comme un film d’action au rythme rapide.

Les résultats préliminaires publiés jeudi montrent que l’IA améliore progressivement sa capacité à effectuer diverses tâches dans de nombreux métiers. Mais dans la plupart des cas, les performances des modèles actuellement disponibles ressemblent à celles d’un stagiaire désillusionné, atteignant des critères minimaux mais luttant globalement pour produire un travail de qualité sans intervention humaine pour affiner le résultat.

barre claire

Les chercheurs du MIT ont utilisé 41 LLM différents, y compris les versions de Claude, Gemini et ChatGPT, pour analyser les performances de plus de 11 000 tâches principalement basées sur du texte pour une variété d’emplois répertoriés par le ministère du Travail. Les résultats ont ensuite été notés par des humains possédant une réelle expérience pratique dans le domaine. L’objectif était de voir à quelle fréquence un remplaçant de travailleur IA pouvait produire un résultat que les gestionnaires trouveraient acceptable sans édition humaine, et d’évaluer sa qualité.

Les chercheurs ont découvert que même si l’IA est devenue plus fiable dans de nombreux types de tâches au fil des années, elle continue de ne pas être à la hauteur à mesure que les enjeux et les normes augmentent. L’étude du MIT a utilisé une échelle de score de 1 à 9 pour évaluer les performances de l’IA, 7 étant « légèrement adéquat », ce qui signifie que le travail est utile tel quel et ne nécessite pas de modification. Fin 2025, le modèle d’IA obtenait une note de 7 sur environ 65 % des tâches.

Plus important encore, pour les entreprises qui envisagent de remplacer les correctifs des employés par l’IA, les données du MIT suggèrent que l’IA a du mal à effectuer des tâches plus complexes. Quel que soit le temps nécessaire au modèle d’IA pour accomplir une tâche, la probabilité de succès lorsqu’elle est évaluée sur la base d’un score de qualité de 9 ou « excellent » n’a jamais été supérieure à 50 %. En d’autres termes, si un travail nécessite plusieurs étapes, de la créativité et de la précision, les remplacements par l’IA sont plus susceptibles d’échouer que de réussir.

Cette étude est cohérente avec plusieurs aspects de l’histoire actuelle de l’adoption de l’IA dans les entreprises américaines. Alors que les entreprises qui utilisent l’IA sont plus susceptibles d’automatiser les tâches et les rôles de routine après les postes de débutant, certaines compétences techniques avancées, notamment les compétences numériques, sont en réalité associées à une prime salariale.

Cela se reflète également dans les données du MIT, qui ont révélé que même si les rôles qualifiés dans les emplois juridiques et informatiques avaient un taux de réussite moyen plus faible, les tâches textuelles liées aux métiers de la construction et de la maintenance étaient généralement plus faciles à réaliser pour les modèles d’IA.

Les entreprises qui ont expérimenté l’automatisation complète de certaines parties de leurs charges de travail ont été confrontées à des difficultés initiales. L’année dernière, Deloitte a produit deux rapports pour des clients gouvernementaux en Australie et au Canada, qui se sont tous deux révélés truffés de mensonges. Des médias comme CNET et Sports Illustrated ont également été surpris en train d’utiliser l’IA pour créer des articles inexacts basés sur des signatures fabriquées. Les avocats utilisent également l’IA pour rédiger des mémoires, et un cabinet d’avocats a présenté des excuses publiques l’année dernière après avoir découvert qu’une fausse citation générée par l’IA dans une affaire avait contribué à son dépôt de bilan.

Des preuves anecdotiques et des données du MIT suggèrent que l’IA a encore besoin d’une touche humaine pour maximiser ses avantages, mais la technologie continue de progresser rapidement. Les chercheurs du MIT estiment que l’amélioration des capacités des modèles a augmenté les taux de réussite de l’IA dans les tâches analysées jusqu’à 11 points de pourcentage chaque année.

Les auteurs estiment que d’ici 2029, la plupart des modèles d’IA seront capables d’effectuer 80 à 95 % des tâches basées sur du texte avec au moins des références adéquates.

Il reste à voir si l’IA peut évoluer vers des performances bonnes ou parfaites.

« L’adoption généralisée de l’automatisation, en particulier dans les domaines où la tolérance à l’erreur est faible, est peut-être encore loin », écrivent les chercheurs.

L’IA est peut-être capable de gérer des tâches de base telles que la rédaction, l’envoi de courriers électroniques et l’analyse de chiffres, mais elle n’est toujours pas au niveau où les humains peuvent exceller.

Source link

What's Hot

Anthropic est en pleine expansion sur les marchés privés ; SpaceX pourrait gâcher la fête

Le gourou du voyage, Rick Steves, serait heureux de payer plus d’impôts

Les astronautes lunaires Artemis II capturent la beauté de la Terre alors qu’ils voyagent à plus de 110 000 milles de chez eux

Le MIT a testé l’IA sur des milliers de tâches sur le lieu de travail. Dans la plupart des cas, ce n’était qu’à la dernière minute.

Le gourou du voyage, Rick Steves, serait heureux de payer plus d’impôts

Les astronautes lunaires Artemis II capturent la beauté de la Terre alors qu’ils voyagent à plus de 110 000 milles de chez eux

Les coûts du carburéacteur augmentent de près de 100 % en raison de la guerre en Iran, rendant les bagages enregistrés sur United Airlines 10 $ plus chers

Qu’est-ce que NMN : tout ce que vous devez savoir des experts

Comment les fondateurs de fintech peuvent-ils stimuler la croissance ?

Comment les fondateurs de fintech peuvent-ils stimuler la croissance ?

OPay nommé sponsor principal du BusinessDay Fintech Summit 2026

Top Insights

Anthropic est en pleine expansion sur les marchés privés ; SpaceX pourrait gâcher la fête

Le gourou du voyage, Rick Steves, serait heureux de payer plus d’impôts

Les astronautes lunaires Artemis II capturent la beauté de la Terre alors qu’ils voyagent à plus de 110 000 milles de chez eux

What's Hot

Le MIT a testé l’IA sur des milliers de tâches sur le lieu de travail. Dans la plupart des cas, ce n’était qu’à la dernière minute.

barre claire

Related Posts

Subscribe to Updates