
Un pourcentage croissant de travailleurs américains expérimentent l’intelligence artificielle dans leur travail quotidien, mais ils ont probablement des doutes quant à la sécurité de leur emploi à long terme.
Cependant, des données récentes publiées par le Massachusetts Institute of Technology (MIT) montrent que malgré les progrès de l’IA au cours des dernières années, la technologie ne fonctionne toujours que de manière médiocre pour certaines tâches sur le lieu de travail. Même ainsi, vous pourriez quand même commettre une grave erreur.
Les travailleurs qui craignent d’être bientôt remplacés par l’IA pourraient être rassurés par une nouvelle étude publiée par le MIT. L’étude présente l’histoire d’une reprise d’emploi basée sur l’IA plus comme un document de réflexion à combustion lente que comme un film d’action au rythme rapide.
Les résultats préliminaires publiés jeudi montrent que l’IA améliore progressivement sa capacité à effectuer diverses tâches dans de nombreux métiers. Mais dans la plupart des cas, les performances des modèles actuellement disponibles ressemblent à celles d’un stagiaire désillusionné, atteignant des critères minimaux mais luttant globalement pour produire un travail de qualité sans intervention humaine pour affiner le résultat.
barre claire
Les chercheurs du MIT ont utilisé 41 LLM différents, y compris les versions de Claude, Gemini et ChatGPT, pour analyser les performances de plus de 11 000 tâches principalement basées sur du texte pour une variété d’emplois répertoriés par le ministère du Travail. Les résultats ont ensuite été notés par des humains possédant une réelle expérience pratique dans le domaine. L’objectif était de voir à quelle fréquence un remplaçant de travailleur IA pouvait produire un résultat que les gestionnaires trouveraient acceptable sans édition humaine, et d’évaluer sa qualité.
Les chercheurs ont découvert que même si l’IA est devenue plus fiable dans de nombreux types de tâches au fil des années, elle continue de ne pas être à la hauteur à mesure que les enjeux et les normes augmentent. L’étude du MIT a utilisé une échelle de score de 1 à 9 pour évaluer les performances de l’IA, 7 étant « légèrement adéquat », ce qui signifie que le travail est utile tel quel et ne nécessite pas de modification. Fin 2025, le modèle d’IA obtenait une note de 7 sur environ 65 % des tâches.
Plus important encore, pour les entreprises qui envisagent de remplacer les correctifs des employés par l’IA, les données du MIT suggèrent que l’IA a du mal à effectuer des tâches plus complexes. Quel que soit le temps nécessaire au modèle d’IA pour accomplir une tâche, la probabilité de succès lorsqu’elle est évaluée sur la base d’un score de qualité de 9 ou « excellent » n’a jamais été supérieure à 50 %. En d’autres termes, si un travail nécessite plusieurs étapes, de la créativité et de la précision, les remplacements par l’IA sont plus susceptibles d’échouer que de réussir.
Cette étude est cohérente avec plusieurs aspects de l’histoire actuelle de l’adoption de l’IA dans les entreprises américaines. Alors que les entreprises qui utilisent l’IA sont plus susceptibles d’automatiser les tâches et les rôles de routine après les postes de débutant, certaines compétences techniques avancées, notamment les compétences numériques, sont en réalité associées à une prime salariale.
Cela se reflète également dans les données du MIT, qui ont révélé que même si les rôles qualifiés dans les emplois juridiques et informatiques avaient un taux de réussite moyen plus faible, les tâches textuelles liées aux métiers de la construction et de la maintenance étaient généralement plus faciles à réaliser pour les modèles d’IA.
Les entreprises qui ont expérimenté l’automatisation complète de certaines parties de leurs charges de travail ont été confrontées à des difficultés initiales. L’année dernière, Deloitte a produit deux rapports pour des clients gouvernementaux en Australie et au Canada, qui se sont tous deux révélés truffés de mensonges. Des médias comme CNET et Sports Illustrated ont également été surpris en train d’utiliser l’IA pour créer des articles inexacts basés sur des signatures fabriquées. Les avocats utilisent également l’IA pour rédiger des mémoires, et un cabinet d’avocats a présenté des excuses publiques l’année dernière après avoir découvert qu’une fausse citation générée par l’IA dans une affaire avait contribué à son dépôt de bilan.
Des preuves anecdotiques et des données du MIT suggèrent que l’IA a encore besoin d’une touche humaine pour maximiser ses avantages, mais la technologie continue de progresser rapidement. Les chercheurs du MIT estiment que l’amélioration des capacités des modèles a augmenté les taux de réussite de l’IA dans les tâches analysées jusqu’à 11 points de pourcentage chaque année.
Les auteurs estiment que d’ici 2029, la plupart des modèles d’IA seront capables d’effectuer 80 à 95 % des tâches basées sur du texte avec au moins des références adéquates.
Il reste à voir si l’IA peut évoluer vers des performances bonnes ou parfaites.
« L’adoption généralisée de l’automatisation, en particulier dans les domaines où la tolérance à l’erreur est faible, est peut-être encore loin », écrivent les chercheurs.
L’IA est peut-être capable de gérer des tâches de base telles que la rédaction, l’envoi de courriers électroniques et l’analyse de chiffres, mais elle n’est toujours pas au niveau où les humains peuvent exceller.

