DeepMind tiene introducido Genie 2, un modelo avanzado de IA capaz de generar mundos interactivos en 3D a partir de simples descripciones de texto e imágenes. Anunciado el 4 de diciembre de 2024, el sucesor de Genie 1 crea diversos entornos virtuales, lo que permite a los usuarios interactuar dinámicamente a través de controles de teclado y mouse, simulando acciones como saltar y nadar. Está entrenado en varios videos y puede modelar interacciones, física y comportamiento de NPC.
DeepMind lanza Genie 2, una IA revolucionaria para mundos 3D
Genie 2 tiene la capacidad de visualizar una amplia gama de escenas 3D, ofreciendo funcionalidades similares a los videojuegos AAA. Al procesar indicaciones, el modelo puede producir entornos consistentes, incluidas perspectivas isométricas y en primera persona que duran entre 10 y 20 segundos, y algunas se extienden hasta un minuto. Las afirmaciones de DeepMind afirman que el modelo recuerda partes de una escena más allá de la vista inmediata, representándolas con precisión cuando reaparecen. Esto contrasta con modelos existentes como el simulador de Minecraft de Decart, que a menudo tienen problemas con la coherencia y la resolución.
Estas GPU Intel Battlemage filtradas son bestias de juego
El elemento fundamental de Genie 2 implica el procesamiento de una imagen de referencia combinada con un mensaje de texto, lo que agiliza la generación de entornos altamente interactivos. Por ejemplo, un mensaje como «Un lindo robot humanoide en el bosque» permite al modelo crear la escena correspondiente. La inclusión de interacciones complejas, como permitir a los jugadores hacer estallar globos o navegar por entornos, muestra su sólido motor de física. A pesar de tales capacidades, surgen preocupaciones con respecto a la interpretación de la entrada del modelo, particularmente si replica inadvertidamente elementos del juego protegidos por derechos de autor debido a la falta de detalles con respecto a las fuentes de datos de entrenamiento.
Las implicaciones de propiedad intelectual derivadas de los datos de entrenamiento de Genie 2 plantean preguntas importantes. DeepMind se beneficia del amplio acceso de Google a YouTube, posiblemente utilizando contenido de vídeo para la formación de modelos. Este acceso da lugar a especulaciones sobre la generación de reproducciones sin licencia de juegos observados, lo que puede convertirse en un tema de examen legal. A medida que el modelo de IA desdibuja las líneas de originalidad, la preocupación por la replicación no autorizada cobra gran importancia.
Hallazgos de un CABLEADO La investigación destacó que las principales empresas, incluida Activision Blizzard, están empleando tecnologías de inteligencia artificial para optimizar los procesos, lo que podría provocar pérdidas de empleos. La introducción de Genie 2 puede complicar aún más el panorama, donde las herramientas de inteligencia artificial aceleran el desarrollo al tiempo que desafían los roles laborales tradicionales.
DeepMind enfatiza el papel de Genie 2 en el desarrollo de diversas tareas de evaluación para agentes de IA. Si bien los requisitos informáticos del modelo y las perspectivas de comercialización siguen sin revelarse, los avances en curso apuntan a una relación en evolución entre la IA y el diseño de juegos. Varios informes indican una afluencia de inversiones en tecnologías de modelos mundiales, lo que significa un cambio fundamental tanto en la investigación de la IA como en las experiencias de juegos interactivos. Esta tendencia resuena con una creciente fascinación por el potencial de la IA para remodelar las industrias creativas.
Los esfuerzos de contratación enfocados de DeepMind resaltan el compromiso con desarrollos pioneros. Su reclutamiento estratégico de talentos de otras empresas líderes en IA refuerza su intención de permanecer a la vanguardia de las tecnologías de IA generativa.
Créditos de imagen y vídeo destacados: Google DeepMind