Operai reveló dos nuevos modelos de razonamiento para su herramienta CHATGPT a principios de esta semana, alegando que pueden «pensar con imágenes». Los modelos O3 y O4-Mini pueden interpretar y manipular imágenes, obteniendo información para mejorar la salida.
Los modelos han provocado una tendencia viral entre los usuarios expertos, que han descubierto que pueden geolocar fotos con entradas adicionales limitadas. El modelo O3en particular, parece competente para identificar ubicaciones en imágenes, incluso con obstrucciones.
Puede editar imágenes recortando o zoom para extraer información, respondiendo con coordenadas geográficas precisas y el nombre del lugar. Esta habilidad funciona con imágenes tanto al aire libre como en interiores.
Los expertos, incluido el profesor asociado de Wharton, Ethan Mollick, tienen confirmado que el modelo no simplemente extrae información de GeoTagged de las fotos, sino que usa su propio razonamiento. Sin embargo, como cualquier modelo de IA, es propenso a respuestas incorrectas, especialmente con señales limitadas.
La capacidad de geolocalización del modelo ha generado preocupaciones sobre el mal uso potencial, ya que hace que el proceso sea fácil para cualquier persona con acceso. Sin barreras para evitar el uso no autorizado, determinar la ubicación de alguien podría convertirse en un riesgo de privacidad significativo.
Algunos ejemplos de las capacidades del modelo se han compartido en las redes sociales, con los usuarios que demuestran su capacidad para identificar ubicaciones. Como el usuario x Jason Barnes compartido«Bien. Decir que estaba en AZ podría haber sido una pista demasiado grande.
Si bien Geolocating ha sido una actividad de nicho entre los expertos, la última actualización de ChatGPT lo hace accesible para una audiencia más amplia, lo que plantea preocupaciones sobre el uso responsable.