Close Menu
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
What's Hot

L’ancien ingénieur de Google Larry Page, Sergey Brin et Sundar Pichai disent partager la même qualité « folle »

juin 28, 2026

La bataille d’Anthropic avec Alibaba soulève des questions sur l’introduction en bourse de 1 000 milliards de dollars : dans quelle mesure l’IA de pointe est-elle défendable ?

juin 28, 2026

Anthony Scaramucci sur America 250 : Joe DiMaggio, où est-il passé ?

juin 28, 2026
Facebook X (Twitter) Instagram
Facebook X (Twitter) Instagram
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
221 France221 France
Home » Deux étudiants de premier cycle ont construit un modèle de discours d’IA pour rivaliser
Startups

Deux étudiants de premier cycle ont construit un modèle de discours d’IA pour rivaliser

JohnBy Johnavril 22, 2025Aucun commentaire3 Mins Read
Facebook Twitter Pinterest Reddit Telegram LinkedIn Tumblr VKontakte WhatsApp Email
Share
Facebook Twitter Reddit Pinterest Email


Une paire d’étudiants de premier cycle, ni avec une vaste expertise en IA, disent que cela a créé un modèle d’IA ouvertement avaiable qui peut générer des clips de style podcast similaires à NotebookLM de Google.

Le marché des outils vocaux synthétiques est vaste et en croissance. ElevenLabs est l’un des grands joueurs, mais il n’y a pas de pénurie de challengers (voir Playai, sésame, etc.). Les investisseurs pensent que ces outils ont un énorme potentiel. Selon PitchBook, les startups développant la voix de la voix AI ont recueilli plus de 398 millions de dollars de financement en capital-risque l’année dernière.

Toby Kim, l’un des cofondateurs de Corée de Nari Labs, le groupe derrière le modèle nouvellement sorti, a déclaré que lui et son collègue co-fondateur avaient commencé à découvrir l’IA de discours il y a trois mois. Inspiré par Notebooklm, ils voulaient créer un modèle qui offrait plus de contrôle sur les voix générées et la «liberté dans le script».

Kim dit qu’ils ont utilisé le programme de cloud TPU Research de Google, qui fournit des chercheurs ayant un accès gratuit aux puces AI TPU de l’entreprise, pour former le modèle de Nari, Dia. Pondération dans 1,6 milliard de paramètres, le DIA peut générer un dialogue à partir d’un script, permettant aux utilisateurs de personnaliser les tons des haut-parleurs et d’insérer des disfluences, des toux, des rires et d’autres indices non verbaux.

Les paramètres sont les modèles de variables internes utilisés pour faire des prédictions. Généralement, les modèles avec plus de paramètres fonctionnent mieux.

Disponible à partir de la plate-forme AI Dev Huging Face et Github, DIA peut fonctionner sur la plupart des PC modernes avec au moins 10 Go de Trum. Il génère une voix aléatoire à moins d’inviter avec une description d’un style prévu, mais il peut également cloner la voix d’une personne.

Dans les brefs tests de TechCrunch de la DIA via la démo Web de Nari, le DIA a très bien fonctionné, sans se plaindre de générer des chats bidirectionnels sur n’importe quel sujet. La qualité des voix semble compétitive avec d’autres outils, et la fonction de clonage vocale fait partie de l’EASST que ce journaliste a essayé.

Voici un échantillon:

Cependant, comme de nombreux générateurs de voix, DIA offre peu de garanties. Il serait trivialement facile de créer une désinformation ou un enregistrement arcmautique. Sur les pages du projet de DIA, Nari décourage l’abus du modèle à des impergents, tromper ou embauche autrement dans la campagne illicite, mais le groupe dit qu’il n’est pas responsable de la mauvaise utilisation.

Nari a également révélé quelles données il a gratté pour entraîner le dia. Il est possible que le dia a été développé en utilisant du contenu protégé par le droit d’auteur – pour commenter les actualités de hacker note qu’un échantillon ressemble au podcast «Planet Money» de NPR. Les modèles de formation sur le contenu protégé par le droit d’auteur sont une pratique répandue mais légalement douteuse. Certaines sociétés d’IA affirment que l’utilisation équitable les protège de la liababilité, tandis que les titulaires de droits nettent que l’utilisation équitable n’est pas pour la formation.

En tout état de cause, Kim dit que le plan de Nari est de créer une plate-forme vocale synthétique avec un «aspect social» en plus de la dia et des modèles plus grands et futurs. Nari a également l’intention de publier un rapport technique pour la DIA et d’étendre le support du modèle aux langues au-delà de l’anglais.



Source link

Share. Facebook Twitter Pinterest LinkedIn Reddit Email
Previous ArticleLe fonds spéculatif Elliot augmente la chaleur avec BP, qui a une demande de flux de trésorerie plus élevée
Next Article La startup EV de l’Inde, Ather, coupe la taille de l’introduction en bourse à 308 millions de dollars, à la recherche de 1,4 milliard de dollars d’évaluation post-monnaie
John
  • Website

Related Posts

Le chef indien des paiements pense que l’IA sera fortement impliquée dans la prochaine ère de croissance des paiements numériques

juin 28, 2026

Instagram teste d’autres façons de personnaliser « Votre algorithme »

juin 27, 2026

Le PDG de SoftBank n’est pas le seul à se poser des questions sur le battage médiatique des centres de données orbitaux d’Elon Musk

juin 27, 2026

Le fondateur le plus en forme de la salle a eu un cancer. Voici comment il a utilisé l’IA pour riposter.

juin 27, 2026
Add A Comment
Leave A Reply Cancel Reply

Top Posts

GMP d’introduction en bourse d’aujourd’hui : l’introduction en bourse de Turtlemint Fintech Solutions envisage une cotation faible alors que la prime du marché gris diminue pendant deux jours

juin 28, 2026

Quelles actions fintech sont les meilleures à acheter en 2026 ?

juin 26, 2026

Quelles actions fintech sont les meilleures à acheter en 2026 ?

juin 26, 2026

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

Bienvenue sur 221 France, votre source d’informations de qualité sur les domaines de la technologie, des affaires, du lifestyle et des animaux de compagnie. Nous sommes passionnés par la création de contenus qui enrichissent votre quotidien et vous aident à naviguer dans un monde en constante évolution.

Facebook X (Twitter) Instagram Pinterest YouTube
Top Insights

L’ancien ingénieur de Google Larry Page, Sergey Brin et Sundar Pichai disent partager la même qualité « folle »

juin 28, 2026

La bataille d’Anthropic avec Alibaba soulève des questions sur l’introduction en bourse de 1 000 milliards de dollars : dans quelle mesure l’IA de pointe est-elle défendable ?

juin 28, 2026

Anthony Scaramucci sur America 250 : Joe DiMaggio, où est-il passé ?

juin 28, 2026
Get Informed

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

© 2026 221france. Designed by 221france.
  • Home
  • About us
  • Advertise us
  • Contact us
  • DMCA
  • Privacy policy
  • Terms & Condition

Type above and press Enter to search. Press Esc to cancel.