Le nouveau petit modèle d'IA d'AI2 surpasse les modèles de taille similaire de Google, Meta

C’est la semaine pour les petits modèles d’IA, semble-t-il.

Jeudi, AI2, l’Institut de recherche AI à but non lucratif, a publié Olmo 2 1B, un modèle de paramètre de 1 milliard de milliards de dollars qui prétend battre des modèles de taille similaire de Google, Meta et Alibaba sur plusieurs benchmarks. Les paramètres, parfois rétractés aux poids, sont les composants internes d’un modèle qui guident son comportement.

OLMO 2 1B est disponible sous une licence Apache 2.0 permissive sur la face de la plate-forme AI Dev. Contrairement à la plupart des modèles, Olmo 2 1b peut être reproduit à partir de zéro; AI2 a pris le code et les ensembles de données (OLMO-MIX-1124, Dolmino-MIX-1124) utilisés pour le développer.

Les petits modèles peuvent ne pas être aussi capables que leurs homologues de géant, mais surtout, ils ont besoin de matériel costaud pour fonctionner. Cela les rend beaucoup plus accessibles pour les développeurs et les amateurs d’enfant avec les limites des machines bas de gamme et de consommation.

Il y a eu une série de petits lancements de modèles au cours des derniers jours, de la famille de raisonnement Phi 4 de Microsoft à 2,5 Omni 3B de Qwen. La plupart d’entre eux – et Olmo 2 1b – peuvent facilement fonctionner sur un ordinateur portable moderne ou même un appareil mobile.

AI2 dit qu’Olmo 2 1b a été formé sur un ensemble de données de 4 billions de jetons provenant de sources publiques, générées par AI-AI et créées manuellement. Les jetons sont les bits bruts des modèles de données ingèrent et génèrent – 1 million de jetons équivaut à environ 750 000 mots.

Nous avons des références mesurant le raisonnement arithmétique, GSM8K, OLMO 2 1B scores mieux que Google’s Gemma 3 1b, Meta’s Llama 3.2 1B et Alibaba’s Qwen 2.5 1.5b. Olmo 2 1b éclipse également les performances de trois modèles sur véritableqa, un test pour évaluer la précision de facturation.

Événement TechCrunch

Berkeley, que
|
5 juin

Réserver maintenant

Ce modèle a été prétraité sur des jetons 4T de données de haute qualité, suite à la même pré-entraînement standard dans un recuit à haute qualité de nos modèles 7, 13 et 32b. Nous téléchargeons des points de contrôle intermédiaires de toutes les 1000 étapes de la formation.

Accédez au modèle de base: https://t.co/xofywjmo85 pic.twitter.com/7USJ6SYMDL

– AI2 (@allen_ai) 1er mai 2025

AI2 prévient que l’Olmo 2 1b comporte des risques, comme si. Comme tous les modèles d’IA, il peut produire des «sorties à problèmes» comprenait un contenu nocif et «sensible», selon l’organisation, ainsi que des déclarations inactives. Pour ces raisons, AI2 recommande de ne pas déployer OLMO 2 1B en milieu commercial.

Source link

What's Hot

Aurora lance son service de camionnage commercial sans conducteur et a surpris le soumissionnaire rejoint le cas de faillite de Canuno

Les forces britanniques ont empêché le drone de survoler les têtes des soldats

Donald Trump demande 163 milliards de dollars de réductions de dépenses fédérales « Wake » et « gaspillement »

Le nouveau petit modèle d’IA d’AI2 surpasse les modèles de taille similaire de Google, Meta

Aurora lance son service de camionnage commercial sans conducteur et a surpris le soumissionnaire rejoint le cas de faillite de Canuno

L’un des récents modèles GEMINI AI de Google scores pire sur la sécurité

Le dernier partenaire de véhicule autonome d’Uber? Moment de démarrage chinois

Startups hebdomadaires: Drama Gold Game-Chainger? Vous décidez

Platnova célèbre son 2e anniversaire avec une expansion mondiale, innovation fintech | Guardian Nigeria News

Opportunités de démarrage de l’Inde FinTech en Inde

Irish Fintech PiPit Global acquis par Qenta

Top Insights

Aurora lance son service de camionnage commercial sans conducteur et a surpris le soumissionnaire rejoint le cas de faillite de Canuno

Les forces britanniques ont empêché le drone de survoler les têtes des soldats

Donald Trump demande 163 milliards de dollars de réductions de dépenses fédérales « Wake » et « gaspillement »

What's Hot

Le nouveau petit modèle d’IA d’AI2 surpasse les modèles de taille similaire de Google, Meta

Related Posts

Subscribe to Updates