Shawn Shen estime que l’IA devra se souvenir de ce qu’elle voit pour réussir dans le monde physique. La société Memories.ai de Shen utilise les outils d’IA de Nvidia pour construire l’infrastructure des appareils portables et de la robotique afin de pouvoir mémoriser et rappeler des souvenirs visuels.
Memories.ai a annoncé lundi une collaboration avec le géant des semi-conducteurs Nvidia lors de sa conférence GTC. Grâce à ce partenariat, Memories.ai utilise Cosmos Reason 2 de Nvidia, un modèle de langage de vision raisonnée, et Nvidia Metropolis, une application de recherche et de synthèse vidéo, pour continuer à développer sa technologie de mémoire visuelle.
Shen (photo ci-dessus à gauche) a déclaré à TechCrunch que lui et son co-fondateur et CTO Ben Zhou (photo ci-dessus à droite) ont eu l’idée de l’entreprise en construisant le système d’IA derrière les lunettes RayBan de Meta. La construction des lunettes IA les a amenés à réfléchir à la manière dont les gens utiliseraient réellement la technologie dans la vie réelle si les utilisateurs ne pouvaient pas se souvenir des données vidéo qu’ils enregistraient.
Ils ont regardé autour de eux pour voir s’ils pouvaient trouver quelqu’un qui construisait déjà ce type de solution de mémoire visuelle pour l’IA. Comme ils n’y parvenaient pas, ils ont décidé de se séparer de Meta et de le construire eux-mêmes.
« L’IA se porte déjà très bien dans le monde numérique, qu’en est-il du monde physique ? » dit Shen. « Les appareils portables IA, la robotique ont également besoin de mémoires. … En fin de compte, vous avez besoin de l’IA pour avoir des mémoires visuelles. Nous croyons en cet avenir. »
La capacité de mémorisation des systèmes d’IA, en général, est relativement nouvelle. OpenAI a mis à jour ChatGPT pour commencer à mémoriser les discussions passées en 2024 et a affiné cette fonctionnalité en 2025. xAI d’Elon Musk et Google Gemini ont également lancé leurs propres outils de mémoire au cours des deux dernières années.
Mais ces progrès se sont largement concentrés sur la mémoire textuelle, a déclaré Shen. La mémoire textuelle est beaucoup plus structurée et plus facile à indexer, mais n’est pas aussi utile pour les applications physiques d’IA qui interagissent largement avec le monde par le biais de la vue et des visuels.
Événement Techcrunch
San Francisco, Californie
|
13-15 octobre 2026
Memories.ai a été lancé en 2024 et a levé jusqu’à présent 16 millions de dollars, grâce à un tour de table de 8 millions de dollars en juillet 2025 et une extension de 8 millions de dollars. Le cycle a été dirigé par Susa Ventures et comprenait, entre autres, Seedcamp, Fusion Fund et Crane Venture Partners.
Shen a déclaré que la construction réussie de cette couche de mémoire visuelle nécessitait deux choses : construire l’infrastructure nécessaire pour intégrer et indexer les vidéos dans un format de données pouvant être stocké et rappelé, et capturer les données nécessaires pour entraîner le modèle à faire exactement cela.
La société a lancé son grand modèle de mémoire visuelle (LVMM) en juillet 2025. Shen a déclaré qu’il pourrait être comparé à une version plus petite de Gemini Embedding 2, un modèle d’indexation et de récupération multimodal, publié plus tôt ce mois-ci.
Pour la collecte de données, l’entreprise a créé LUCI, un périphérique matériel porté par les « collecteurs de données » de l’entreprise et qui enregistre des vidéos et est utilisé pour entraîner le modèle. Shen a déclaré qu’ils n’avaient pas l’intention de devenir une entreprise de matériel informatique, ni de vendre ces appareils, mais qu’ils avaient plutôt construit les leurs parce qu’ils n’étaient pas satisfaits des enregistreurs vidéo du commerce axés sur les formats vidéo haute définition et gourmands en batterie.
La société a lancé la deuxième génération de ce LVMM et a signé un partenariat avec Qualcomm pour fonctionner sur les processeurs Qualcomm à partir de la fin de cette année.
Memories.ai travaille également déjà avec certaines des grandes entreprises de vêtements, a déclaré Shen, mais a refusé de divulguer lesquelles. Malgré une certaine demande actuelle, Shen voit des opportunités encore plus grandes à venir dans les domaines des appareils portables et de la robotique.
« En termes de commercialisation, nous nous concentrons davantage sur le modèle et l’infrastructure, car nous pensons qu’à terme, le marché des appareils portables et de la robotique viendra, mais ce n’est probablement pas maintenant », a déclaré Shen.

