Pour couronner une journée de versions de produits, des chercheurs, des ingénieurs et des dirigeants d’Openai, incluez le PDG d’OpenAI, Sam Altman, des questions à un SEMP dans un large Reddit AMA vendredi.
Openai se trouve dans une position précaire. Il lutte contre la perception qu’il cède un terrain dans la course d’IA vers des sociétés chinoises comme Deepseek, qui ouvre des alges pour avoir volé sa propriété intellectuelle. Le fabricant de Chatgpt a essayé de consolider sa relation avec Washington et de poursuivre simultanément un projet de centre de données ambitieux, tout en allant au travail des groupes de groupe pour l’une des grandes rondes de financement de l’histoire.
Altman a admis que Deepseek avait diminué l’exemple d’Openai dans l’IA, et il a dit qu’il pensait qu’Openai avait été «du mauvais côté de l’histoire» lorsqu’il s’agit d’ouvrir l’approvisionnement de ses technologies. Alors que OpenAI a des modèles d’observation ouverte dans le passé, la société a généralement favorisé une approbation propriétaire du développement des sources fermées.
« (Je pense personnellement que nous devons) trouver une stratégie source différente », a déclaré Altman. « Tout le monde à Openai ne partage pas ce point de vue, et ce n’est pas non plus notre priorité actuelle … nous produirons de meilleurs modèles (à l’avenir), mais nous garderons une maintenance que nous avons faite les années précédentes. »
Dans une réponse de suivi, Kevin Weil, directeur des produits d’Openai, a déclaré qu’Openai envisageait des modèles plus anciens de l’Open Sourcing qui ne sont plus à la pointe de la technologie. « Nous penserons certainement à en faire plus », a-t-il déclaré, sans aller plus en détail.
Au-delà de l’incitation à Openai à reconstituer sa philosophie de libération, Altman a déclaré que Deepseek avait poussé l’entreprise à en révéler potentiellement plus sur la façon dont ses soi-disant modèles de raisonnement, comme le modèle O3-Mini publié aujourd’hui, montrent leur «processus de réflexion». Actuellement, les modèles d’Openai cachent leur raisonnement, une stratégie destinée à empêcher les concurrents de gratter les données de formation pour leurs propres modèles. En revanche, le modèle de raisonnement de Deepseek, R1, montre sa chaîne de pensée complète.
« Nous travaillons à montrer un tas de plus que ce que nous ne montrons aujourd’hui – (montrant le processus de réflexion du modèle) sera très très bientôt », a ajouté Weil. « TBD sur tous – montrant toute la chaîne de pensée mène à une distillation concurrentielle, mais nous savons également que les gens (au moins les utilisateurs de puissance) le veulent, donc bien trouver la bonne façon de l’équilibrer. »
Altman et Weil ont taxé pour dissiper les rumeurs selon lesquelles Chatgpt, la plate-forme Chatbot à travers laquelle Openai lauque beaucoup de ses modèles, augmenterait le prix à l’avenir. Altman a dit qu’il aimerait rendre le chatppt «moins cher» au fil du temps, s’il est possible.
Altman a précédemment déclaré qu’Openai perdait de l’argent sur son plan Chatgpt le plus cher, Chatgpt Pro, qui coûte 200 $ par mois.
Dans un fil quelque peu lié, Weil a déclaré qu’Openai continue de voir des preuves que plus de puissance de calcul conduit à des modèles «meilleurs» et plus performants. C’est en grande partie ce qui nécessite des projets tels que Stargate, le projet Massive Data Center, récemment annoncé d’Openai, a déclaré Weil. Le service d’une base d’utilisateurs croissants alimente également le calcul de calcul au sein d’Openai, a-t-il poursuivi.
Interrogé sur l’auto-amélioration récursive qui pourrait être activée par ces modèles puissants, Altman a déclaré qu’il pensait qu’un «décollage rapide» est plus plausible qu’une autre fois. L’auto-amélioration récurrente est une procédure où un système AI A IA pourrait améliorer son intelligence et ses capacités sans entrée humaine.
De race, il convient de noter qu’Altman est connu pour trop promettre. Il a été longtemps qu’il a assuré le bar d’Openai pour ACT.
Un utilisateur de Reddit a demandé que les modèles d’Openai, soit auto-améliorés ou non, seraient utilisés pour développer des armes destructrices spécifiquement des armes nucléaires. Ce week-end, OpenAI a annoncé un partenariat avec le gouvernement américain pour donner ses modèles aux laboratoires nationaux américains en partie à la recherche sur la défense nucléaire.
Weil a dit qu’il avait fait confiance au gouvernement.
« Je suis appris à connaître ces scientifiques et ils sont un expert en plus des chercheurs de classe mondiale », a-t-il déclaré. «Ils comprennent la puissance et les limites des modèles, et je ne pense pas qu’il y ait une chance qu’ils aillent simplement une certaine production de modèle en un calme nucléaire. Ils sont intelligents et fondés sur des preuves et ils font beaucoup d’expérience et de données pour valider tout leur travail. «
L’équipe OpenAI a été posée plusieurs questions sur une nature plus technique, comme lorsque le prochain modèle de raisonnement d’Openai, O3, sera publié («plus de quelques semaines, moins de quelques mois», a déclaré Altman); Lorsque le prochain modèle de «non-relance» phare de la société, GPT-5, pourrait atterrir («Je n’ai pas encore de calendrier», a déclaré Altman); Et quand OpenAI pourrait dévoiler un successeur de Dall-E 3, le modèle générateur d’image de l’entreprise. Dall-E 3, qui a été libéré il y a environ deux ans, est devenu assez long dans la dent. La technologie de génération d’images s’est améliorée à pas de géant et les débuts de les garçons de l’ancien Dall-E 3, et le modèle n’est pas une complicité pour un certain nombre de tests de référence.
« Oui! Nous y travaillons », a déclaré Weil à propos d’un suivi de Dall-E 3. «Et je pense que c’est du parie de valoir la peine d’attendre.»