La volonté de découvrir la prochaine grande nouveauté de l’IA a financé des projets assez ambitieux, mais une entreprise en profite pour reconstruire l’architecture informatique à partir de zéro.
Dirigé par Naveen Rao, ancien responsable de l’IA chez Databricks, Unconventional AI promet de rendre le traitement d’inférence beaucoup plus économe en énergie. L’arme secrète : un nouveau type d’architecture informatique basée sur des oscillateurs.
Jeudi, la société a publié son premier modèle d’IA, appelé Un-0, un outil système de génération d’images qui montre pour la première fois comment la technologie de l’entreprise peut reproduire les systèmes d’IA conventionnels. Dans un nouvel article d’accompagnement, l’équipe de recherche de la société détaille comment elle a construit un modèle de génération d’images entièrement fonctionnel à l’aide d’une simulation logicielle de la nouvelle architecture – un modèle qui fonctionne aussi bien que les modèles de diffusion de pointe.
« C’est le ‘bonjour le monde’ d’un nouveau type d’ordinateur », a déclaré Rao à TechCrunch. « Au cours de la prochaine année, vous allez commencer à voir des nouvelles assez intéressantes à ce sujet. »
Le résultat du nouveau modèle Un-0 est similaire à celui des modèles de génération d’images tels que Stable Diffusion ou GPT Image 1 d’OpenAI. Ce qui est impressionnant, c’est la manière dont il parvient à ces performances. Le modèle repose sur une architecture basée sur un oscillateur qui est complètement différente des puces qui alimentent l’informatique conventionnelle et les LLM traditionnels. Les avantages du calcul basé sur un oscillateur sont complexes, mais Rao estime qu’il permettra à terme de réduire la consommation d’énergie jusqu’à 1 000 fois.
Une grande partie des infrastructures nécessaires pour y parvenir est encore en construction. La version actuelle d’Un-0 fonctionne sur une simulation logicielle des puces d’oscillateur d’Unconventional, mais la société prévoit de publier prochainement les schémas d’une puce réelle. À partir de là, le plan est de créer une pile d’inférence complète à partir de zéro, l’IA non conventionnelle fournissant à terme une capacité de calcul comme n’importe quel autre fournisseur.
« Nous allons construire un nouveau type de système composé de nos puces », déclare Rao. « Nous y exécuterons des modèles d’IA et nous disposerons d’un câble réseau où les invites entrent et les inférences sortent, mais cela se fera à 1/1000 de puissance. »
C’est un objectif incroyablement ambitieux, surtout pour une entreprise qui compte encore moins de 50 salariés. Mais compte tenu de l’ampleur du développement de l’IA et du coût anticipé pour répondre à la demande croissante d’inférence, il s’agit peut-être de l’un des rares efforts visant à répondre à l’ampleur du problème. Selon Rao, l’approvisionnement en énergie disponible constituera l’une des limites strictes de l’IA dans les années à venir – et Unconventional est l’un des rares projets capables d’y répondre.
« La mise à l’échelle de l’IA est difficile à cause de l’énergie. Ce sera la limite fondamentale dans les prochaines années. Vous ne pouvez tout simplement pas la dépasser. Ce sera un problème limité en énergie, en fin de compte », dit-il.
Lorsque vous achetez via des liens dans nos articles, nous pouvons gagner une petite commission. Cela n’affecte pas notre indépendance éditoriale.

