AI Startup Stability AI a publié un modèle AI audio stable, un modèle d’IA générant de l’audio «stéréo» qui, selon la société, est le jeûne sur le marché et efficace pour fonctionner sur les smartphones.
Stable Audio Open Small est le fruit d’une collaboration entre la stabilité AI et ARM, le fabricant de puces qui produit de nombreux processeurs à l’intérieur de tablettes, téléphones et autres appareils mobiles. Bien qu’un certain nombre d’applications AI-Powred peuvent générer de l’audio, comme Suno et Udio, la plupart s’appuient sur le traitement des nuages, ce qui signifie qu’ils ne peuvent pas être utilisés hors ligne.
La stabilité affirme également que l’ensemble de formation de Stable Audio Open Small est composé de chansons de l’archive de musique libre de bibliothèques audio et de freeSound libre de droits. C’est par opposition aux ensembles de formation des Suno et Udio suspendus, qui contiennent du contenu protégé par le droit d’auteur, posant un risque IP.
Stable Audio Open Small est de 341 millions de paramètres de taille et optimisé pour fonctionner sur des processeurs ARM. (Les paramètres, somnolents redressés aux poids, sont les composants internes d’un modèle qui guident son comportement.) Conçu pour générer rapidement des échantillons audio courts et des effets sonores (par exemple, des riffs de tambour et d’instruments), un audio stable ouvert peut produire jusqu’à 11 secondes d’audio sur un smartphone secondes, affirme les affirmations d’IA de stabilité.
Voici un échantillon généré par STABLE Audio Open Small:
Et en voici un autre:
Le modèle n’est pas sans ses limites. STABLE Audio Open Small Invite uniquement écrit en anglais, et des notes de stabilité dans sa documentation selon laquelle le modèle ne peut pas générer des voix réalistes ou des chansons à haute qualité. Le modèle ne fonctionne pas non plus bien entre les styles musicaux, la stabilité avertit une conséquence de ses données de formation biaisées occidentales.
Dans une autre ride potentielle pour les développeurs, un small audio stable Small a des termes d’utilisation quelque peu restrictifs. Il est gratuit pour les chercheurs, les amateurs et les entreprises avec moins d’un million de dollars de revenus annuels, les développeurs d’objectifs et l’organisation qui gagnent plus d’un million de dollars de revenus doivent payer pour la licence d’entreprise de stabilité.
La stabilité, l’entreprise assiégée derrière la diffusion stable du modèle de génération d’images populaire, a collecté de nouveaux espèces l’année dernière en tant qu’investisseurs, y compris Eric Schmidt et le fondateur de Napster, Sean Parker, ont cherché à changer l’entreprise. Emad Mostaque, co-fondateur et ex-PDG de Stabilité, aurait mal géré la stabilité dans la ruine financière, ce qui a conduit le personnel à démissionner, un partenariat avec Canva à passer et des investisseurs à se soucier des perspectives de l’entreprise.
Au cours des derniers mois, la stabilité a embauché un nouveau PDG, a soutenu le directeur de Titanic James Cameron à son conseil d’administration et a publié plusieurs nouveaux modèles de génération d’images.