Au fur et à mesure que les systèmes IA deviennent plus capables, la parole devient rapidement la façon par défaut de communiquer avec les machines. La startup de l’IA française Mistral a sauté dans la course audio avec son premier modèle ouvert, visant à remettre en question la domination des systèmes d’entreprise fortifiés avec des alternatives ouvertes.
Nous Kill, Mistral a annoncé la sortie de Voxral, sa première famille de modèles audio destinés aux entreprises.
La société lance Voxtral comme le premier modèle ouvert capable de déployer «une intelligence vocale vraiment utilisable en production».
En d’autres termes, les développeurs ne devront plus choisir entre un système ouvert et bon marché que les transcriptions Fumale et ne comprennent pas vraiment ce qui se dit, et une qui fonctionne bien, mais est fermée, laissant les développeurs avec une facture plus élevée et moins de contrôle sur le déploiement.
Pour les entreprises, cela signifie que Voxtral offre une alternative abordable qui, selon l’entreprise, est «moins de la moitié du prix» des solutions comparables.

Mistral dit que Voxtral peut transcrire jusqu’à 30 minutes audio. En raison de son épine dorsale LLM, Mistral Small 3.1, il peut comprendre jusqu’à 40 minutes, permettant aux utilisateurs de poser des questions sur le contenu audio, de générer des résumés ou de transformer les commandes vocales en actions en temps réel comme appeler des API ou des fonctions d’exécution. Voxtral est également multilingue, avec la capacité de transcrire et de comprendre les langues comprenant l’anglais, l’espagnol, le français, le portue, l’hindi, l’allemand, le néerlandais et l’italien.
La société propose deux variantes de ses «modèles de compréhension de la parole». Le premier, Voxtral Small, a 24 milliards de paramètres pour les déploiements à l’échelle de la production et est compétitif avec Elevenlabs Scribe, GPT-4-Mini et Gemini 2.5 Flash.
Événement TechCrunch
San Francisco
|
27-29 octobre 2025
Le second, Voxtral Mini, a 3 milliards de paramètres pour les déploiements locaux et Edge. Il existe également une version API ultra-cochée, dépouillée et rapide du modèle de 3 milliards appelé Voxtral Mini Transcibe qui est optimisé pour les cases d’utilisation uniquement en transcription et promet de surpasser Openai Whisper pour moins de la moitié du prix.
Les utilisateurs peuvent essayer Voxtral gratuitement en téléchargeant l’API sur la face de l’étreinte ou en testant les modèles dans le chatbot de Mistral le chat. L’intégration de l’API dans les applications Démarrer à 0,001 $ par minute, selon la société.
Le lancement survient un mois après que Mistral a annoncé le magistral, sa première famille de modèles de raisonnement qui résolvent les problèmes étape par étape pour une amélioration de la fiabilité.
Mistral, l’une des meilleures entreprises d’IA en Europe, est bien connue pour son plaidoyer poussant les modèles d’IA open source. Plus tôt ce mois-ci, TechCrunch a indiqué que l’entreprise était en pourparlers pour lever jusqu’à 1 milliard de dollars de capitaux propres d’investisseurs comme le fonds MGX d’Abu Dhabi.