Les données tabulaires sont un terme large qui serre les données structurelles qui s’inscrivent généralement dans une ligne et une colonne spécifiques. Il peut s’agir d’une base de données SQL, d’une feuille de sprié, d’un fichier .csv, etc.
Bien qu’il y ait eu d’énormes progrès sur l’intelligence artificielle appliquée à des données de non-structure et de séquentiels, ces modèles de grande langue sont flous par conception. Ils sont conçus pour manipuler les jetons d’entrée pour générer une sortie cohérente sans nécessaire sur le fait après une structure fixe. Les meilleurs LLM sont également coûteux à accéder via une API ou coûteux à exécuter sur votre propre infrastructure cloud.
Et pourtant, de nombreuses entreprises ont déjà une stratégie de données avec un entrepôt de données ou un lac de données pour centraliser toutes les données importantes et certains scientifiques des données qui peuvent tirer parti de ces données pour améliorer la stratégie de l’entreprise.
La startup française Neuralk-AI est une société d’intelligence artificielle qui travaille sur des modèles AA axés sur les données tabulaires. La société a annoncé cette semaine 4 millions de dollars de financement.
«Les données avec une valeur réelle pour les entreprises sont des données qui ont été identifiées il y a longtemps, structurées sous la forme d’une table, et utilisée par les scientifiques des données de ces entreprises pour créer tous leurs algorithmes d’apprentissage automatique», co-fondateur de Nueralk -II et Le scientifique en chef Alexandre Pasquiou a déclaré à TechCrunch.
Neuralk-ai pense qu’il y a une opportunité de revisiter le développement du modèle d’IA, mais avec un accent spécifique sur les données structurées. Au début, il prévoit d’offrir son modèle en tant qu’API aux scientifiques des données travaillant pour les sociétés parce que les entreprises aiment les données – pensez aux catalogues de produits, aux bases de données des clients, aux tendances des paniers d’achat, etc.
«Aujourd’hui, les LLM sont idéales pour la recherche, l’interaction naturelle des utilisateurs et la réponse aux questions basées sur des documents non protégés. Mais il a certaines limites au moment où nous retournons à l’apprentissage automatique classique, qui est vraiment basé sur des données tabulaires classiques », a déclaré Pasquiou.
Avec Neuelk-AI, les détaillants peuvent automatiser des workflows de données complexes avec une déduplication et un enrichissement intelligentes. Mais ils utilisent également les modèles de l’entreprise pour détecter la fraude, optimiser les recommandations de produits et générer des prévisions de vente qui pourraient être utilisées pour la gestion des stocks et les prix des produits.
Fly Ventures a mené le tour de 4 millions de dollars de l’entreprise avec Steamai également participation. Plusieurs Business Angels ont également investi dans la startup, comme Thomas Wolf de Hugging Face, Charles Gorinttin d’Alan et Philippe Corrot et Nagi Letaifa de Mirakl.
L’équipe travaille toujours activement sur ses modèles. Il prévoit de tester avec un groupe de principaux détaillants français et de startups commerciales, comme E.Leclerc, Auchan, Mirakl et Lucky Cart.
« Dans les trois ou quatre mois, nous publierons la première version de notre modèle et la référence publique sur laquelle nous serons en mesure de classer notre modèle par rapport à l’état de l’art dans cet espace », a déclaré Pasquiou. «Et en septembre, l’idée est d’être le meilleur modèle de fondation tabulaire dans le domaine de l’apprentissage de la représentation.»