Nous tuons, Google a dévoilé Gemini 2.5, une nouvelle famille de modèles de raisonnement en IA qui s’arrête pour «penser» avant une question.
Pour lancer la nouvelle famille de modèles, Google lance Gemini 2.5 Pro Experimental, un modèle multimodal et de raisonnement d’IA qui, selon la société, est son modèle le plus intelligent à ce jour. Ce modèle sera disponible sur You est tué dans la plate-forme de développeur de l’entreprise, Google AI Studio, ainsi que dans l’application Gemini pour les abonnés au plan d’IA de 20 $ par mois de la société, Gemini Advanced.
À l’avenir, Google dit que tous ses nouveaux modèles d’IA auront la capacité de raisonnement.
Sale Openai a lancé le premier modèle de raisonnement d’IA en septembre 2024, O1, l’industrie technologique a couru pour égaler ou dépasser les capacités de ce modèle avec les leurs. Aujourd’hui, Anthropic, Deepseek, Google et Xai ont tous des modèles de raisonnement en IA, qui utilisent une puissance de calcul supplémentaire et du temps pour vérifier les faits et raisonner par des problèmes avant de fournir une réponse.
Les techniques de raisonnement ont aidé les modèles d’IA à atteindre de nouveaux sommets en mathématiques et en codage des tâches. Beaucoup dans le monde de la technologie croient que les modèles de raisonnement seront un élément clé des agents de l’IA, des systèmes autonomes qui peuvent effectuer des tâches en grande partie sans intervention humaine. Cependant, ces modèles sont également existés.
Google a déjà vécu avec les modèles de raisonnement d’IA, publiant auparavant une version «pensée» de Gemini en décembre. Mais Gemini 2.5 représente la série de modèles «O» d’Openai de l’entreprise.
Google affirme que Gemini 2.5 Pro surpasse ses modèles d’IA frontaliers précédents et certains des principaux modèles d’IA compétentes, sur plusieurs repères. Plus précisément, Google dit qu’il a conçu Gemini 2.5 pour exceller dans la création d’applications Web et d’applications de codage agentiques vives.
Lors d’une évaluation mesurant l’édition de code, appelé Help Polyglot, Google dit que Gemini 2.5 Pro scores 68,6%, surperformant les modèles TOP IA à partir de profondeur d’Openai, anthropique et de laboratoire AI chinois.
Au début, sur un autre test de mesurer les abilitités du logiciel, Swe-Bench vérifié, Gemini 2.5 Pro marque 63,8%, surperformant O3-Mini et de Deepseek de Deepseek, mais sous-performant le Sonnet Claude 3.7 d’Anthropic, qui a marqué 70,3%.
Lors du dernier examen de l’humanité, un test multimodal composé de milliers de crowdsourcés par rapport aux mathématiques, aux sciences humaines et aux sciences naturelles, Google dit que Gemini 2.5 Pro scores 18,8%, fonctionnant mieux que la plupart des modèles phares rivaux.
Pour commencer, Google dit que Gemini 2.5 Pro est expédié avec une fenêtre de contexte de jeton de 1 million, ce qui signifie que le modèle d’IA peut prendre 750 000 mots à un seul coup. C’est long que la série de livres «Lord of the Rings» entière. Et bientôt, Gemini 2.5 Pro soutiendra la longueur d’entrée (2 millions de jetons).
Google n’a pas publié le prix de l’API pour Gemini 2.5 Pro. La société affirme qu’elle partagera plus dans les semaines à venir.