Les géants de la technologie aiment se vanter d’environ un milliard de modèles d’IA paramètres qui nécessitent des grappes GPU massives et excitées. Mais Fastito adopte une approche différente.
La startup basée à Palo Alto dit qu’elle a inventé un nouveau type d’architecture de modèle d’IA qui est intentionnellement petit et l’espace de tâche. Les modèles sont si petits qu’ils se sont entraînés avec des GPU de jeu bas de gamme d’une valeur de moins de 100 000 $ au total, explique Fastéo.
La méthode est une attention attrayante. Facito a obtenu 17,5 millions de dollars de financement de démarrage dirigé par Khosla Ventures, le premier investisseur de capital-risque d’Openai, Fastito Testls TechCrunch.
Cela porte le financement total de la startup à près de 25 millions de dollars. Il a levé 7 millions de dollars en novembre dernier dans une ronde pré-Seed menée par VC ARM M12 et Insight Partners de Microsoft.
«Nos modèles sont rapides, plus précis et coûtent une fraction pour s’entraîner tout en surpassant les modèles phares sur des tâches spécifiques», explique Ash Lewis, PDG et co-fondateur de Fastino.
Fastito a construit les petits modèles suivants qu’il suce aux clients d’entreprise. Chaque modèle se concentre sur une tâche spécifique dont une entreprise peut avoir besoin, comme la réduction des données sensibles ou le résumé des documents d’entreprise.
Facito ne divulgue pas encore les métriques ou les utilisateurs précoces, mais disent que ses performances époustouflent les premiers utilisateurs. Par exemple, parce qu’ils sont si petits, ses modèles peuvent fournir une réponse entière dans un seul jeton, a déclaré à Lewis à TechCrunch, montrant la technologie donnant une réponse détaillée en même temps en millisecondes.
Événement TechCrunch
Berkeley, que
|
5 juin
Réserver maintenant
Il est encore un peu tôt pour dire que l’approche d’Ifstéto se reproduira. L’espace de l’IA de l’entreprise est bondé, des sociétés comme Cohere et Databricks vantant également l’IA qui excelle dans certaines tâches. Et les fabricants de modèles SATA axés sur l’entreprise, notamment anthropiques et Mistral, ont également proposé de petits modèles. Ce n’est pas un secret non plus que l’avenir de l’IA génératif pour l’entreprise est probablement dans des modèles de langage plus petits et plus ciblés.
Le temps peut dire, mais un vote précoce de la confiance de Khosla ne fait certainement pas de mal. Pour l’instant, Fastito dit qu’il est axé sur la construction d’une équipe de pointe de l’IA. Il cible les chercheurs dans les meilleurs laboratoires AI qui ne sont pas obsolètes par la construction du plus grand modèle ou le battement des repères.
«Notre stratégie d’embauche est très axée sur les chercheurs qui ont peut-être un processus de réflexion contre la façon dont les modèles linguistiques se construisent correctement», explique Lewis.