L'ancien chef de l'IA de Databricks pense pouvoir réduire la facture d'électricité de l'IA de 1 000 fois

La volonté de découvrir la prochaine grande nouveauté de l’IA a financé des projets assez ambitieux, mais une entreprise en profite pour reconstruire l’architecture informatique à partir de zéro.

Dirigé par Naveen Rao, ancien responsable de l’IA chez Databricks, Unconventional AI promet de rendre le traitement d’inférence beaucoup plus économe en énergie. L’arme secrète : un nouveau type d’architecture informatique basée sur des oscillateurs.

Jeudi, la société a publié son premier modèle d’IA, appelé Un-0, un outil système de génération d’images qui montre pour la première fois comment la technologie de l’entreprise peut reproduire les systèmes d’IA conventionnels. Dans un nouvel article d’accompagnement, l’équipe de recherche de la société détaille comment elle a construit un modèle de génération d’images entièrement fonctionnel à l’aide d’une simulation logicielle de la nouvelle architecture – un modèle qui fonctionne aussi bien que les modèles de diffusion de pointe.

« C’est le ‘bonjour le monde’ d’un nouveau type d’ordinateur », a déclaré Rao à TechCrunch. « Au cours de la prochaine année, vous allez commencer à voir des nouvelles assez intéressantes à ce sujet. »

Le résultat du nouveau modèle Un-0 est similaire à celui des modèles de génération d’images tels que Stable Diffusion ou GPT Image 1 d’OpenAI. Ce qui est impressionnant, c’est la manière dont il parvient à ces performances. Le modèle repose sur une architecture basée sur un oscillateur qui est complètement différente des puces qui alimentent l’informatique conventionnelle et les LLM traditionnels. Les avantages du calcul basé sur un oscillateur sont complexes, mais Rao estime qu’il permettra à terme de réduire la consommation d’énergie jusqu’à 1 000 fois.

Une grande partie des infrastructures nécessaires pour y parvenir est encore en construction. La version actuelle d’Un-0 fonctionne sur une simulation logicielle des puces d’oscillateur d’Unconventional, mais la société prévoit de publier prochainement les schémas d’une puce réelle. À partir de là, le plan est de créer une pile d’inférence complète à partir de zéro, l’IA non conventionnelle fournissant à terme une capacité de calcul comme n’importe quel autre fournisseur.

« Nous allons construire un nouveau type de système composé de nos puces », déclare Rao. « Nous y exécuterons des modèles d’IA et nous disposerons d’un câble réseau où les invites entrent et les inférences sortent, mais cela se fera à 1/1000 de puissance. »

C’est un objectif incroyablement ambitieux, surtout pour une entreprise qui compte encore moins de 50 salariés. Mais compte tenu de l’ampleur du développement de l’IA et du coût anticipé pour répondre à la demande croissante d’inférence, il s’agit peut-être de l’un des rares efforts visant à répondre à l’ampleur du problème. Selon Rao, l’approvisionnement en énergie disponible constituera l’une des limites strictes de l’IA dans les années à venir – et Unconventional est l’un des rares projets capables d’y répondre.

« La mise à l’échelle de l’IA est difficile à cause de l’énergie. Ce sera la limite fondamentale dans les prochaines années. Vous ne pouvez tout simplement pas la dépasser. Ce sera un problème limité en énergie, en fin de compte », dit-il.

Lorsque vous achetez via des liens dans nos articles, nous pouvons gagner une petite commission. Cela n’affecte pas notre indépendance éditoriale.

Source link

What's Hot

Nous sommes tous d’accord pour dire que vous détestez l’IA, mais seul Mark Cuban comprend pourquoi la Silicon Valley ne peut pas y remédier.

Les dons américains atteindront 617 milliards de dollars en 2025 – et l’effet Paul Allen révèle qui en est réellement le moteur

La Maison Blanche demande à OpenAI de ralentir la sortie de son nouveau modèle pour des raisons de sécurité

L’ancien chef de l’IA de Databricks pense pouvoir réduire la facture d’électricité de l’IA de 1 000 fois

La Maison Blanche demande à OpenAI de ralentir la sortie de son nouveau modèle pour des raisons de sécurité

Les YouTube Shorts deviennent encore plus courts avec une mise à jour qui vous permet de doubler la vitesse de lecture

Patronus AI décroche 50 millions de dollars pour construire des « mondes numériques » qui mettent à l’épreuve les agents d’IA

Polymarket affirme que des pirates ont volé les fonds des utilisateurs

The AI Race In Fintech Comes Down To One Thing: Trust

The AI Race In Fintech Comes Down To One Thing: Trust

Pourquoi la prochaine licorne fintech pourrait naître d’une idée « ennuyeuse »

Top Insights

Nous sommes tous d’accord pour dire que vous détestez l’IA, mais seul Mark Cuban comprend pourquoi la Silicon Valley ne peut pas y remédier.

Les dons américains atteindront 617 milliards de dollars en 2025 – et l’effet Paul Allen révèle qui en est réellement le moteur

La Maison Blanche demande à OpenAI de ralentir la sortie de son nouveau modèle pour des raisons de sécurité

What's Hot

L’ancien chef de l’IA de Databricks pense pouvoir réduire la facture d’électricité de l’IA de 1 000 fois

Related Posts

Subscribe to Updates