Les modèles d’IA sont lancés à un rythme vertigineux, par tous, des grandes entreprises technologiques comme Google, des startups comme Openai et Anthropic. Garder une trace des dernières personnes peut être écrasante.
L’ajout à la confusion est que les modèles d’IA sont souvent promus en fonction des repères de l’industrie. Mais ces mesures techniques révèlent souvent peu sur la façon dont les vraies personnes et les entreprises les utilisent nouvellement.
Pour couper le bruit, TechCrunch a compilé un aperçu des modèles d’IA les plus avancés publiés depuis 2024, avec des détails sur la façon de les utiliser et à quoi ils sont les meilleurs. Nous tiendrons également cette liste avec les derniers lancements.
Il existe littéralement plus d’un million de modèles d’IA: le visage étreint, par exemple, accueille plus de 1,4 million. Cette liste pourrait donc manquer des modèles qui fonctionnent mieux, d’une manière ou d’une autre.
Modèles d’IA sortis en 2025
Openai GPT 4.5 ‘Orion’
Openai appelle Orion leur grand modèle à ce jour, vantant sa forte «connaissance du monde» et «l’intelligence émotionnelle». Cependant, il sous-performe sur certains repères par rapport aux nouveaux modèles de raisonnement. Orion est disponible pour les sous-centres du plan de 200 $ par mois d’OpenAI.
Claude Sonnet 3.7
Anthropic dit que c’est le premier modèle de raisonnement «hybride» de l’industrie, car il peut à la fois tirer des réponses rapides et vraiment réfléchir aux choses en cas de besoin. Il donne également aux utilisateurs le contrôle de la durée du modèle pour le modèle par anthropique. Sonnet 3.7 est disponible pour tous les utilisateurs de Claude, mais les utilisateurs plus lourds auront besoin d’un plan Pro de 20 $ au mois.
Xai’s Grok 3
Grok 3 est le dernier modèle phare de la start-up fondée sur Elon Musk XAI. Il devrait surpasser d’autres modèles de premier plan sur les mathématiques, les sciences et le codage. Le modèle nécessite X Premium (qui est de 50 $ par mois.) Après qu’une étude ait trouvé Grok 2 penché à gauche, Musk s’est engagé à déplacer Grok plus « politiquement neutre » mais il n’est pas encore clair si cela a été réalisé.
Openai O3-MinI
Il s’agit du dernier modèle de raisonnement d’Openai et est optimisé pour les tâches liées aux STEM comme le codage, les mathématiques et les sciences. Ce n’est pas le modèle le plus puissant d’Openai, mais à l’approche qu’il est plus petit, la société dit que c’est un coût moindre significatif. Il est disponible pour l’objectif gratuit nécessite une subcription pour les utilisateurs lourds.
Openai Deep Research
La recherche approfondie d’Openai est conçue pour effectuer des recherches approfondies sur le sujet avec des citations claires. Ce service n’est disponible qu’avec un abonnement Pro de 200 $ par mois par mois. OpenAI le recommande pour tout, de la science à la recherche sur le shopping, mais méfiez-vous que les hallucinations restent un problème pour l’IA.
Mistral le chat
Mistral a lancé App APP versions de The Cat, un assistant personnel multimodal AI. Mistral affirme que le chat répond rapidement que tout autre chatbot. Il a également une version payante avec un journalisme à jour de l’AFP. Les tests du monde ont trouvé les performances impressionnantes du chat, bien qu’elle ait fait plus d’erreurs que Chatgpt.
Opérateur Openai
L’opérateur d’Openai est censé être un stagiaire personnel qui peut le faire indépendamment, comme vous aider à acheter des produits d’épicerie. Il nécessite un abonnement Chatgpt Pro de 200 $ à mois. Les agents de l’IA sont très prometteurs, mais ils sont toujours expérimentaux: une revue du Washington Post indique que l’opérateur a décidé de commander une douzaine d’œufs pour 31 $, payé avec le créditeur de l’examinateur.
Google Gemini 2.0 Pro expérimental
Le modèle phare très attendu de Google Gemini dit qu’il excelle dans le codage et la compréhension des connaissances générales. Il a également une fenêtre super longue de 2 millions de jetons, aidant les utilisateurs qui ont besoin de procéder rapidement des morceaux de texte. Le service nécessite (au minimum) un abonnement Google One AI Premium de 19,99 $ en mois.
Modèles d’IA sortis en 2024
Deepseek R1
Ce modèle d’IA chinois a pris d’assaut la Silicon Valley. Le R1 de Deepseek fonctionne bien sur le codage et les mathématiques, tandis que sa nature open source signifie que n’importe qui peut l’exécuter localement. Plus, c’est gratuit. Cependant, R1 intégrats la censure du gouvernement chinois et fait face à des interdictions croissantes pour avoir renvoyé les données des utilisateurs à la Chine.
Recherche profonde des Gémeaux
La recherche profonde résume les résultats de recherche de Google dans un document simple et bien cité. Le service est utile pour les étudiants et toute autre personne qui a besoin d’un résumé de recherche rapide. Cependant, sa qualité n’est pas aussi bonne qu’un véritable article évalué par les pairs. La recherche approfondie nécessite à 19,99 $ Google One AI Premium abonnement.
Meta Llama 3.3 70b
Il s’agit de la version la plus récente et la plus avancée des modèles Open Source Llama AI de Meta. Meta a toute cette version en tant que la moins chère et la plus efficace à ce jour, en particulier pour les mathématiques, les connaissances générales et l’instruction. Il est gratuit et open source.
Openai Sora
Sora est un modèle qui crée des vidéos réalistes basées sur le texte. Bien qu’il puisse générer des scènes entières plutôt que de simples clips, Openai admet qu’elle génère souvent une «physique irréaliste». Il n’est actuellement disponible que sur les versions payantes de Chatgpt, à commencer par Plus, qui est de 20 $ en mois.
Alibaba Qwen QWQ-32B-Preview
Ce modèle est l’un des rares à rivaliser avec l’O1 d’Openai sur certains repères de l’industrie, à l’exceller en mathématiques et en codage. Ironalement pour un «modèle de raisonnement», il a «place à l’amélioration du raisonnement de bon sens», dit Alibaba. Il incorpore également la censure du gouvernement chinois, montrent les tests TechCrunch. C’est gratuit et open source.
Utilisation de l’ordinateur d’Anthropic
L’utilisation de l’ordinateur de Claude est destinée à prendre le contrôle de votre ordinateur pour effectuer des tâches comme le codage ou la réservation d’un billet d’avion, ce qui en fait un prédécesseur de l’opérateur d’Openai. L’utilisation de l’ordinateur reste cependant en version bêta. Le prix est via l’API: 0,80 $ par million de jetons d’entrée et 4 $ par million de jetons de production.
X.ai’s Grok 2
La société AI d’Elon Musk, X.AI, a lancé une version améliorée de son chatter phare Grok 2 qu’il prétend être «trois fois plus rapide». Les utilisateurs gratuits sont limités à 10 questions toutes les deux heures sur Grok, tandis que les abonnés à X’s Premium et Premium + bénéficient de limites de plans plus élevés. X.AI a également lancé un générateur d’images, Aurora, qui produit des images hautement photoréalistes, comprenait du contenu graphique ou violent.
Openai O1
La famille O1 d’Openai est censée produire de meilleures réponses en «pensant» à travers les réponses grâce à une fonction de raisonnement caché. Le modèle excelle dans le codage, les mathématiques et la sécurité, affirme Openai, mais a également de décembre les humains. L’utilisation d’O1 nécessite une abonnement à ChatGpt Plus, qui est de 20 $ en mois.
Claude Sonnet 3.5 d’Anthropic
Claude Sonnet 3.5 est un modèle de revendications anthropiques comme étant les meilleures de classe. Il est devenu connu pour ses capacités de codage et est considéré comme un chatbot de choix d’un initié technologique. Le modèle peut être accessible gratuitement sur Claude, bien que les utilisateurs lourds auront besoin d’un abonnement pro mensuel de 20 $. Bien qu’il puisse comprendre les images, il ne peut pas les générer.
Openai GPT 4O-MINI
Openai a Tourd GPT 4O-MINI comme modèle le plus abordable et le plus rapide à ce jour grâce à sa petite taille. Il est destiné à permettre une large gamme de tâches comme alimenter les chatbots de service client. Le modèle est disponible sur le niveau gratuit de Chatgpt. Il est mieux adapté aux tâches simples à volume élevé par rapport à des tâches plus complexes.
Commande cohere r +
Le modèle R + de la commande de Cohere excelle dans des applications de génération (ou RAG) complexes de récupération (ou RAG) pour les entreprises. Cela signifie qu’il peut très bien trouver et citer des informations spécifiques. (L’inventeur de Rag fonctionne en réalité à Cohere.) Pourtant, Rag des ne résout pas complètement le problème d’hallucination de A.