Thinking Machines Lab, la startup d’IA fondée l’année dernière par l’ancienne CTO d’OpenAI Mira Murati, a annoncé lundi quelque chose appelé modèles d’interaction, qui, dans son essence, ressemble à une IA qui peut vous interrompre.
À l’heure actuelle, tous les modèles d’IA que vous avez utilisés fonctionnent de la même manière. Vous parlez, il écoute. Il répond, vous écoutez. Thinking Machines essaie de changer cela en créant un modèle qui traite votre entrée et génère une réponse en même temps, cela ressemble donc plus à un appel téléphonique qu’à une chaîne de texte.
Le terme technique pour cela est « full duplex », et la société affirme que son modèle, TML-Interaction-Small, répond en 0,40 seconde, ce qui correspond à peu près à la vitesse d’une conversation humaine naturelle et nettement plus rapide que les modèles comparables d’OpenAI et de Google.
Il s’agit néanmoins d’un aperçu de la recherche et non d’un produit. La société ne le rend pas encore public. Un « aperçu de recherche limité » arrivera dans les prochains mois, indique-t-il, avec une publication plus large prévue plus tard cette année.
Alors qu’en penser ? Nous n’en sommes pas sûrs. Les benchmarks sont impressionnants et l’idée sous-jacente – que l’interactivité doit être native d’un modèle, et non boulonnée – est vraiment intéressante. Nous ne saurons pas si l’expérience du monde réel est à la hauteur des affirmations techniques tant que les gens ne pourront pas réellement l’utiliser.

