ComfyUI, une startup qui aide les créateurs à contrôler les sorties image, vidéo et audio des modèles de diffusion avec un flux de travail basé sur des nœuds, a levé un financement de 30 millions de dollars pour une valorisation de 500 millions de dollars.
Le cycle a été mené par Craft Ventures, avec la participation d’autres investisseurs, notamment Pace Capital, Chemistry et TruArrow.
ComfyUI a été lancé en tant que projet open source en 2023, peu de temps après l’introduction des modèles de diffusion. À cette époque, des modèles comme Midjourney et DALL-E d’OpenAI étaient à peine fonctionnels et commettaient fréquemment des erreurs majeures, comme l’ajout de doigts supplémentaires aux mains.
Pour remédier à ces limitations, les fondateurs du projet ont développé un cadre modulaire qui donne aux créateurs un contrôle granulaire sur chaque étape du processus de génération.
Leur outil a acquis une telle popularité auprès des professionnels de la création qu’il a finalement évolué pour devenir une startup formelle. Fin 2024, ComfyUI a levé 19 millions de dollars en financement de série A auprès d’investisseurs dont Chemistry Ventures, Cursor Capital et Guillermo Rauch, fondateur de Vercel.
Bien que les derniers modèles de diffusion aient parcouru un long chemin depuis l’ajout d’un sixième chiffre aux mains, le besoin de précision granulaire offerte par ComfyUI n’a fait que croître.
« Si vous pensez à votre solution typique basée sur des invites, comme Midjourney ou ChatGPT, vous demandez quelque chose, cela (n’obtient que) 60 à 80 % », a déclaré Yoland Yan, co-fondateur et PDG de ComfyUI, à TechCrunch. « Mais pour changer ces 20% restants, il faut essayer cette machine à sous. »
Yan a comparé le processus à celui de jouer dans un casino, car inciter le modèle à apporter un petit changement peut entraîner un résultat complètement différent, notamment l’écrasement des parties qui étaient déjà parfaites.
L’interface basée sur les nœuds de ComfyUI permet aux créateurs de relier des composants spécifiques du processus de génération, leur donnant ainsi un contrôle total sur la qualité de leur sortie finale.
« Vous ne pouvez pas facilement transmettre ce message dans la boîte de dialogue (d’un modèle fondamental) », a déclaré Yan.
Les créateurs semblent être d’accord, puisque ComfyUI prétend compter plus de 4 millions d’utilisateurs.
L’outil est utilisé par les professionnels de la création pour les effets visuels, l’animation, la publicité et même le design industriel.
La startup affirme que son offre est devenue un outil tellement nécessaire pour les artistes techniques et autres créatifs qu’il n’est pas rare de voir « artiste ou ingénieur ComfyUI » répertorié comme titre de poste sur les sites d’emploi des studios.
Bien que les modèles fondamentaux de vidéo et d’image continuent de s’améliorer, Yan affirme qu’ils sont loin d’être parfaits et qu’un outil comme ComfyUI continuera d’être très demandé.
« Dans un monde où les déchets de l’IA seront omniprésents, la version Comfy de l’approche humaine dans la boucle finira par gagner la plupart des regards », a-t-il déclaré.
Les concurrents de ComfyUI incluent Weavy, une startup rachetée par Figma l’année dernière.
Lorsque vous achetez via des liens dans nos articles, nous pouvons gagner une petite commission. Cela n’affecte pas notre indépendance éditoriale.

