De grands modèles linguistiques formés sur de vastes ensembles de données pourraient accélérer la recherche en génomique, rationaliser la documentation clinique, améliorer les diagnostics en temps réel, soutenir la prise de décision clinique, accélérer la découverte de médicaments et même générer des données synthétiques pour faire progresser les expériences.
Mais leur promesse de transformer la recherche biomédicale se heurte souvent à un goulot d’étranglement : au-delà des données structurées sur les soins de santé, ces modèles peinent dans des cas extrêmes comme les maladies rares et les conditions inhabituelles, où les données fiables et représentatives sont rares.
Mantis Biotech, basée à New York, affirme développer une solution pour combler cette lacune en matière de disponibilité des données. La plate-forme de l’entreprise intègre des sources de données disparates pour créer des ensembles de données synthétiques pouvant être utilisés pour créer ce que l’on appelle des « jumeaux numériques » du corps humain : des modèles prédictifs basés sur la physique de l’anatomie, de la physiologie et du comportement.
L’entreprise propose ces jumeaux numériques pour une utilisation dans l’agrégation et l’analyse de données. Ces jumeaux numériques pourraient être utilisés pour étudier et tester de nouvelles procédures médicales, former des robots chirurgicaux et simuler et prédire des problèmes médicaux ou même des modèles de comportement. Par exemple, une équipe sportive pourrait prédire la probabilité qu’un joueur spécifique de la NFL développe une blessure au talon d’Achille en fonction de ses performances récentes, de sa charge d’entraînement, de son régime alimentaire et de la durée de son activité, a expliqué la fondatrice et PDG de Mantis, Georgia Witchel, à TechCrunch dans une récente interview.
Pour construire ces jumeaux, la plateforme de Mantis récupère d’abord des données provenant de diverses sources telles que des manuels scolaires, des caméras de capture de mouvement, des capteurs biométriques, des journaux d’entraînement et de l’imagerie médicale. Ensuite, il utilise un système basé sur LLM pour acheminer, valider et synthétiser les différents flux de données, et exécute toutes ces informations via un moteur physique pour créer des rendus haute fidélité de cet ensemble de données, qui peuvent ensuite être utilisés pour former des modèles prédictifs.
« Nous sommes capables de prendre toutes ces sources de données disparates et de les transformer en modèles prédictifs sur les performances des gens. Ainsi, chaque fois que vous souhaitez prédire les performances d’un être humain, c’est un très bon cas d’utilisation de notre technologie », a déclaré Witchel.
La couche du moteur physique est essentielle ici, a déclaré Witchel à TechCrunch, car elle aide la plate-forme à améliorer les informations disponibles en ancré les données synthétiques générées et en modélisant de manière réaliste la physique de l’anatomie.
Événement Techcrunch
San Francisco, Californie
|
13-15 octobre 2026
« Si je vous demandais d’estimer la pose de la main d’une personne à qui il manque un doigt, ce serait vraiment très difficile, car il n’existe pas d’ensembles de données accessibles au public sur les positions des mains étiquetées d’une personne à qui il manque un doigt. Nous pourrions générer cet ensemble de données très, très facilement, car nous prenons simplement notre modèle physique et nous disons, supprimez le doigt X, régénérez le modèle », a-t-elle déclaré.
Étant donné que la plate-forme Mantis comble les lacunes des sources de données, Witchel pense qu’elle pourrait être largement utilisée dans l’industrie biomédicale, où les informations sur les procédures ou les patients peuvent être difficiles d’accès, sont non structurées ou cloisonnées dans diverses sources. Elle a souligné les cas extrêmes ou les maladies rares, pour lesquels les données sont difficiles à obtenir car il existe souvent des contraintes éthiques et réglementaires concernant l’inclusion des données des patients dans des ensembles de données publics ou leur utilisation pour former des modèles d’IA.
« Vous savez, quand vous voyez un enfant de trois ans courir partout, qu’il a une Barbie, qu’il la tient par une jambe et l’écrase contre une table ? Je veux que les gens aient cet état d’esprit avec nos jumeaux numériques », a-t-elle déclaré. « Je pense que cela va ouvrir les gens à l’idée selon laquelle les humains peuvent être testés lorsque vous utilisez des humains virtuels. Je pense qu’actuellement, les gens fonctionnent avec un état d’esprit exactement opposé, ce qui est tout à fait logique, car la vie privée des gens doit être respectée. En fait, je ne pense pas vraiment que les données des gens devraient être exploitées du tout, surtout quand il y a ces jumeaux numériques. «
Pour l’instant, Mantis a connu du succès dans le sport professionnel, probablement parce qu’il est nécessaire de modéliser des athlètes de haut niveau. Witchel a déclaré que l’un des principaux clients de la startup était une équipe de la NBA.
« Nous créons ces représentations numériques des athlètes, qui montrent essentiellement comment cet athlète a sauté, pas seulement aujourd’hui, mais chaque jour de l’année écoulée, et voici comment leurs sauts changent au fil du temps par rapport à la durée de leur sommeil, ou par rapport au nombre de fois qu’ils lèvent les bras au-dessus de leur tête », a-t-elle expliqué.
La startup a récemment levé 7,4 millions de dollars en financement de démarrage dirigé par Decibel VC, avec la participation de Y Combinator, de quelques investisseurs providentiels et de Liquid 2. Le financement sera utilisé pour les fonctions de recrutement, de publicité, de marketing et de mise sur le marché.
La prochaine étape pour Mantis, a déclaré Witchel, consiste à continuer à développer la technologie et, éventuellement, à rendre la plate-forme accessible au grand public, en ciblant les soins de santé préventifs. La société s’efforce également de répondre aux besoins des laboratoires pharmaceutiques et des chercheurs travaillant sur des essais de la FDA, dans le but de fournir des informations sur la manière dont les patients réagissent aux traitements.

