Operai ha anunciado el lanzamiento de Sora 2, su modelo insignia y modelo de generación de audio. El nuevo modelo, que presenta una mayor precisión física, un mayor control del usuario y la capacidad de insertar elementos del mundo real en escenas generadas, se está implementando a través de una nueva aplicación social para iOS llamada «SORA». Este lanzamiento marca un paso adelante significativo del modelo SORA original lanzado en febrero de 2024. OpenAi describe este avance como un potencial «momento GPT-3.5 para el video», lo que indica un salto sustancial en capacidad y rendimiento.
Mejoras clave en Sora 2
Sora 2 presenta varios avances importantes sobre su predecesor, acercándose al objetivo de crear un simulador mundial funcional.
- Precisión física mejorada: Los modelos de video anteriores a menudo eran «excesivos», sin tener en cuenta la física realista para cumplir con el aviso de un usuario. Sora 2 demuestra una simulación más fundamentada de las leyes físicas, modelando con precisión los resultados como un disparo de baloncesto perdido que se rebotó en el tablero en lugar de teletransportarse al aro.
- Controlabilidad avanzada del usuario: El modelo puede seguir instrucciones intrincadas y de múltiples disparos mientras mantiene el estado del mundo generado en diferentes escenas y ángulos de cámara, lo que permite narraciones de video más complejas y coherentes. También muestra competencia en varios estilos estéticos, incluidos realistas, cinematográficos y anime.
- Integración de elementos del mundo real: Los usuarios ahora pueden inyectar elementos del mundo real en entornos generados. Al grabar un video de una persona, animal u objeto, el modelo puede colocar ese elemento en cualquier escena generada por Sora, retratando con precisión su apariencia y voz.
La aplicación Sora Social Apl y Cameos
Operai está implementando el nuevo modelo a través de una aplicación Social iOS diseñada para crear y compartir contenido de video. La característica central de la aplicación es «cameos», que operacionaliza la capacidad del modelo para insertar elementos del mundo real. Para crear un cameo, un usuario registra un breve video y un clip de audio dentro de la aplicación, que captura su semejanza y voz para su uso en generaciones. Los usuarios tienen control completo sobre su semejanza personal y pueden decidir quién se le permite usar su cameo. También pueden revocar el acceso o eliminar cualquier video que incluya su cameo en cualquier momento.
Centrarse en el bienestar y la seguridad del usuario
Al lanzar la aplicación, OpenAI ha esbozado medidas para abordar preocupaciones como la adicción digital y el aislamiento social.
- Filosofía de alimentación: El algoritmo de alimentación de la aplicación está diseñado para «maximizar la creación, no el consumo», priorizar el contenido de las personas que sigue y el contenido que probablemente inspire su propio trabajo creativo. Openai afirma que «no está optimizando el tiempo que pasa en la alimentación».
- Seguridad para adolescentes: Las salvaguardas específicas para los usuarios adolescentes incluyen límites diarios predeterminados en la cantidad de generaciones que pueden ver y permisos más estrictos con respecto al uso de sus cameos. Operai también está lanzando controles parentales a través de ChatGPT para administrar la configuración para las cuentas de los adolescentes.
- Moderación: Además de los sistemas de seguridad automatizados, la compañía está ampliando a sus equipos de moderadores humanos para revisar los posibles casos de acoso escolar.
Disponibilidad y acceso
La aplicación Sora iOS ahora está disponible para descargar en los Estados Unidos y Canadá, con planes de expandirse a otros países. El acceso se está implementando en un sistema basado en invitaciones para alentar a los usuarios a unirse a sus amigos.
- Precios: Inicialmente, el servicio será gratuito, con «límites generosos para comenzar». OpenAI ha declarado que su único plan de monetización actual es eventualmente permitir a los usuarios pagar por generaciones adicionales si la demanda excede los recursos informáticos disponibles.
- Sora 2 Pro: Los suscriptores de ChatGPT Pro tendrán acceso a una versión experimental de mayor calidad del modelo llamada Sora 2 Pro, que estará disponible en el sitio web de Sora.com.
- Acceso de API: Operai planea lanzar Sora 2 a través de su API para desarrolladores. El modelo anterior, Sora 1 Turbo, permanecerá disponible.
Operai ve la rápida mejora de los modelos de video como un paso crucial hacia el desarrollo de simuladores mundiales de uso general y agentes robóticos, presentando a Sora 2 como «progreso significativo hacia ese objetivo».





