Il y a une nouvelle tendance quelque peu à l’avance: les gens utilisent le chatppt pour déterminer la location illustrée sur les images.
Ce week-end, OpenAI a publié ses modèles de nouvelles AI, O3 et O4-MinI, qui peuvent tous deux «raisonner» uniquement à travers des images téléchargées. Dans la pratique, les modèles peuvent recadrer, tourner et zoomer sur les photos – même floues et déformées – pour analyser soigneusement les analyser.
Ces capacités d’analyse d’image, associées à la capacité des modèles à rechercher le Web, constituent un puissant outil de recherche de localisation. Les utilisateurs de X ont rapidement découvert que l’O3, en particulier, est que bon pour déduire les villes, les points de repère et même les restaurants et bars à partir d’indices visuels subtils.
Wow, le cloué et pas même un arbre en signe. pic.twitter.com/bvcoe1fq0z
– Swax (@Swax) 17 avril 2025
Dans de nombreux cas, les modèles ne semblent pas s’appuyer sur les «souvenirs» des conversations de chatppt passées, ou les données exif – les métadonnées atteintes sur des photos qui révèlent des détails tels que l’endroit où la photo a été prise.
X est une fille avec des exemples d’utilisateurs qui donnent des menus de restaurant Chatgpt, des clichés de quartier, des façades et des autoportraits, et de demander à O3 d’imaginer qu’il joue « GeoGuessr », un jeu en ligne qui met les joueurs au défi de deviner les locations de Google Street View Images.
Ceci est une fonctionnalité Fun Chatgpt O3. GeoGuessr! pic.twitter.com/hrcmixs8yd
– Jason Barnes (@vyrotek) 17 avril 2025
C’est un potentiel évident de. Il n’y a rien à empêcher un mauvais acteur de capturer l’écran, disons, l’histoire Instagram d’une personne et l’utilisation de Chatgpt pour essayer de les doxx.
O3 est fou
J’ai demandé à un de mes amis de me donner une photo aléatoire
Ils m’ont donné une photo aléatoire qu’ils ont prise dans une bibliothèque
O3 le sait dans 20 secondes et c’est le bon pic.twitter.com/0k8dxifkoy– Yumi (@izyuuumi) 17 avril 2025
De race, cela pourrait être fait avant même le lancement de O3 et O4-MinI. TechCrunch a dirigé un certain nombre de photos via O3 et un modèle plus ancien sans les capacités de transfert d’images, GPT-4O, pour comparer les compétences locales des modèles. Étonnamment, GPT-4O arrive à la même réponse correcte que O3 le plus souvent et a pris moins de temps.
Il y avait au moins un cas lors de nos brefs tests lorsque O3 a trouvé une place que GPT-4O ne pouvait pas. Étant donné une photo d’une tête de rhinocéros violet et montée dans une barre faiblement éclairée, O3 a correctement répondu qu’il provenait d’un Speakeasy de Williamsburg, comme GPT-4O l’a deviné, un pub britannique.
Cela ne suggère pas que O3 soit impeccable dans ce look. Plusieurs de nos tests ont échoué – O3 est resté coincé dans une boucle, incapable d’arriver à un an un an qui était raisonnablement confiant ou a porté une mauvaise location. Les utilisateurs de X Noteud, également, que O3 peut être prêt dans ses déductions de location.
Mais la tendance illustre certains des risques émergents présentés par des modèles d’IA de raisonnement plus compétents et plus capables. Il a appelé à être des garanties en place pour retirer cela de la «recherche de location de dons» dans Chatgpt, et Openai, la société derrière Chatgpt, ne traite pas du résultat dans son report de sécurité pour O3 et O4-MinI.
Nous avons contacté Openai pour commenter. Nous mettrons à jour notre article s’ils réagissent.