OpenAI améliore ses modèles de transcription et de génération de voix

OpenAI apporte de nouvelles modèles d’IA de transcription et de génération de voix à son API qui, selon la société, améliore ses versions précédentes.

Pour OpenAI, les modèles s’inscrivent dans sa vision plus large «agentique»: la construction de systèmes automatisés qui peuvent accomplir indépendamment des tâches au nom des utilisateurs. La définition de «l’agent» pourrait être en litige, mais le responsable du produit Openai Olivier Godment a décrit une interprétation comme un chatbot qui peut parler avec les clients d’une entreprise.

« Nous allons voir de plus en plus d’agents pop -up dans les prochains mois », a déclaré à TechCrunch lors d’un briefing. «Et donc le thème général est d’aider les clients et les agents de développement utiles, disponibles et précis.»

OpenAI affirme que son nouveau modèle de texte vocale, «GPT-4O-MINI-TTS», offre non seulement une parole plus nuancée et réaliste, mais est également plus «orientable» que ses modèles de synthèse de la parole précédente. Les développeurs peuvent instruire GPT-4O-MININI-TS sur la façon de dire des choses dans un langage naturel pour l’exemple, «Parlez comme un scientifique fou» ou «Utilisez une voix sereine, comme un professeur de pleine conscience».

Voici la «vraie voix», la voix altérée:

Résultats de la transcription OpenAI — Les résultats de la transcription OpenAI d’analyse comparative.Crédits d’image: Openai

Source link

What's Hot

Une chronologie du marché américain des semi-conducteurs en 2025

La Banque d’Angleterre détient des taux d’intérêt à 4,25% au milieu de l’incertitude au Moyen-Orient

Empire de Nvidia: un regard sur ses meilleurs investissements en démarrage

OpenAI améliore ses modèles de transcription et de génération de voix

Une chronologie du marché américain des semi-conducteurs en 2025

Empire de Nvidia: un regard sur ses meilleurs investissements en démarrage

Le plomb de la croissance de la forme de Stripe aide la diaspora africaine à investir dans les startups, l’immobilier

Non, Andreessen Horowitz n’a pas posté cette arnaque crypto tweet

Trust + mise à niveau avec des plafonds d’intérêt plus élevés et de nouveaux avantages

FM Sitharaman a déclaré que le marché fintech devrait augmenter de 30% par an.

FinTech et la croissance mondiale en tant que centre national russe organiseront des séances clés à Spief 2025

Top Insights

Une chronologie du marché américain des semi-conducteurs en 2025

La Banque d’Angleterre détient des taux d’intérêt à 4,25% au milieu de l’incertitude au Moyen-Orient

Empire de Nvidia: un regard sur ses meilleurs investissements en démarrage

What's Hot

OpenAI améliore ses modèles de transcription et de génération de voix

Related Posts

Subscribe to Updates