Openai mercredi, brutsez la technologie derrière sa nouvelle fonctionnalité de génération d’images améliorée dans Chatgpt à son API, permettant aux développeurs de l’intégrer dans leurs applications et services.
Le nouveau générateur d’images d’OpenAI, qui a été lancé pour la plupart des utilisateurs de Chatgpt fin mars, est devenu viral pour sa capacité à créer des photos de style Ghibli-réaliste et des «figures d’action AI». Cela a été une blessure mixte pour OpenAI, ce qui a conduit à des millions de nouvelles inscriptions pour Chatgpt tout en allant considérablement la capacité de l’entreprise. Selon la société.
Dans l’API d’OpenAI, la capacité de génération d’image est alimentée par un modèle d’IA appelé «GPT-IMAGE-1». Un modèle nativement multimodal, GPT-IMAGE-1 peut créer des images sur différents styles, suivre les directives personnalisées, les connaissances mondiales du monde et rendre le texte.
Les développeurs peuvent générer plusieurs images à la fois en utilisant GPT-IMAGE-1 et contrôler la qualité de génération et donc la vitesse.
Selon OpenAI, GPT-IMAGE-1 utilise les mêmes garde-corps de sécurité que la génération d’images dans Chatgpt, y compris des garanties qui empêchent le modèle de générer du contenu qui exécute les politiques de l’entreprise. Les développeurs peuvent contrôler la sensibilité à la modération, qui peut être définie sur «Auto» pour le filtrage standard ou «faible» pour le filtrage moins restrictif. Un faible filtrage limite moins de catégories de contenu potentiellement inapproprié, par documentation OpenAI fournie à TechCrunch.
OpenAI dit également que toutes les images créées avec GPT-IMAGE-1 sont filigranées avec des métadonnées C2PA afin qu’elles puissent être identifiées comme générées par l’AI par des plates-formes et des applications prises en charge.
Le prix est de 5 $ par million de jetons d’entrée pour le texte et de 10 $ par million de jetons d’entrée pour les images, et 40 $ par million de jetons de sortie pour les images. (Les jetons sont les bits bruts de données qui modélisent les processus.) Cela se traduit par pulvériser 2 cents, 7 cents et 19 cents par image générée pour les images carrées de faible, moyenne et de haute qualité, respectivement, selon OpenAI.
Openai dit que les entreprises, notamment Adobe, Airtable, Wix, Instacart, GoDaddy, Canvad et Figma, utilisent ou expérimentent déjà GPT-IMAGE-1. La plate-forme de conception Figma de Figma, par exemple, permet désormais aux utilisateurs de générer et de modifier des images via GPT-IMAGE-1, tandis que Instacact teste le modèle pour les recettes et les listes de courses.