Dans le but de rivaliser plus agressivement avec des sociétés rivales d’IA comme Google, OpenAI lance Flex Processing, une option API que les prestataires réduisent les prix d’utilisation du modèle d’IA en échange d’une responsabilité lente et «l’inconvénient des ressources occasales.
Flex Processing, qui est disponible en bêta pour les modèles de raisonnement O3 et O4-MINI publiés par refus, est l’amour à faible professionnalité et les tâches de « non-production » telles que les modèles, l’enrichissement des données et les charges de travail asynchrones, dit Openai.
Il réduit exactement les coûts d’API. Pour l’O3, le traitement Flex est de 5 $ / m de jetons d’entrée (~ 750 000 mots) et de jetons de sortie de 20 $ / m par rapport aux jetons d’entrée standard de 10 $ / m et à des jetons de sortie de 40 $ / m. Pour O4-Minini, Flex baisse le prix à 0,55 $ / m de jetons d’entrée et les jetons de sortie de 2,20 $ / m à partir de jetons d’entrée de 1,10 $ / m et les jetons de sortie de 4,40 $ / m.
Le lancement du traitement Flex survient alors que le prix de l’IA frontalière continue de grimper, et que les rivaux publient des modèles moins chers et plus efficaces sur le budget. Jeudi, Google a déployé Gemini 2.5 Flash, un modèle de raisonnement qui correspond ou Bests Deepseek de R1 de Deepseek en termes de performances à un coût de jeton à faible entrée.
Dans un e-mail aux clients annonçant le lancement de Flex Pricing, OpenAI a également indiqué que les développeurs en tiers 1-3 de sa hiérarchie US Use Thirds devront terminer le processus de vérification d’identification nouvellement introduit pour accéder à l’O3. (Les tiers sont déterminés par le montant d’argent dépensé pour les services OpenAI.) Les O3 – et les autres modèles – Résumé et le support API de streaming sont également déclenchés derrière la vérification.
Openai a précédemment déclaré que la vérification d’identification était investie pour empêcher les mauvais acteurs de violer ses politiques d’utilisation.