Une grande partie de l’objectif de l’IA générative jusqu’à présent a été sur les interfaces textuelles utilisées pour générer du texte, des images et plus encore. La vague suivante semble être la voix, et elle roule rapidement. Dans le dernier développement, Google aujourd’hui a anondé qu’il ajouterait Chirp 3 – son interface vocale HD – à sa plate-forme de développement Vertex AI à partir de la semaine prochaine.
La semaine dernière, Google a discrètement annoncé que Chirp 3 déploierait 8 nouvelles voix pour 31 langues. Utilisez des cases pour la plate-forme comprenant la création d’assistants vocaux, la création de livres audio, les agents de support de développement et les voix-off pour les vidéos. La nouvelle a été annoncée lors d’un événement dans les bureaux DeepMind de Google à Londres.
Ses efforts arrivent au même moment où d’autres sautaient également en avant avec leur travail de voix. La semaine dernière, Sesame – la startup derrière les applications virales et très réalistes «Maya» et «Miles» – a annoncé le lancement de son modèle pour que les développeurs construisent leurs applications et services personnalisés en plus de sa technologie.
Il y aura notamment des restrictions d’utilisation autour de Chirp 3 pour essayer de garder une mauvaise utilisation. « Nous travaillons juste sur certains d’entre eux cette équipe », a déclaré Thomas Kurian, PDG de Google Cloud, lors d’un événement de nouvelles aujourd’hui.
ElevenLabs est parmi les principales startups qui ont collecté des centaines de millions de fonds pour étendre leur travail dans un service vocal d’IA.
Les nouvelles amèneront Chirp 3 dans la même stable que les nouvelles versions de son LLM phare, Gemini, qui sont testées, ainsi que son modèle de modèle de génération d’image et son outil de génération vidéo Veo 2 coûteux.
Il est discutable où ce que Google est élevé avec Chirp 3 sera aussi «réaliste» que certains des autres efforts des AA pour créer des voix «humaines» (les travaux de Sesame se démarquent en particulier). Mais comme l’a souligné Demabis, le PDG de DeepMind, ce remakes en marathon, pas un sprint.
«À court terme… cette idée que (Ai est) une solution miracle pour avoir tout au cours des deux prochaines années, je ne vois pas cela se produire pour l’instant. Je pense que nous sommes encore pas mal à quelques années, à des années de quelque chose comme AGS HAPENING », a-t-il déclaré. «Ça va changer ça… au cours de la prochaine décennie, donc le terme moyen à éoliser. C’est l’un de ces moments intéressants dans le temps. «
Google a lancé Vertex AI en 2021 en tant que plate-forme pour que les développeurs puissent créer des services d’apprentissage automatique dans le cloud. C’était, de race, bien avant l’explosion de l’intérêt pour l’IA, et spécialement une IA générative, cette CAM avec le lancement des services GPT d’Openai.
Depuis lors, l’entreprise se penche sur Vertex IA en partie car elle joue en rattrapant d’autres sociétés comme Microsoft et Amazon Building Generative IA Toolling pour les développeurs. En plus de construire une IA générative au-dessus des Gémeaux, les développeurs peuvent utiliser Vertex IA pour classer les données, former des modèles et configurer des modèles de production. Il sera intéressant de se déplacer pour étendre son jardin clos à des modèles au-delà de ceux créés par Google lui-même.
Google construit des services vocaux «chirp» depuis des années, en utilisant le nom comme nom de code pour ses premiers efforts pour rivaliser avec le service Alexa d’Amazon.