OpenAI tiene lanzado capacidades de video en tiempo real en ChatGPT, mejorando su modo de voz avanzado con comprensión visual. Esta función, que comenzó a implementarse el 12 de diciembre, permite a los usuarios interactuar con la IA a través de su cámara para recibir asistencia contextual. La integración significa un avance notable en las capacidades de conversación de la IA, especialmente para quienes se suscriben a ChatGPT Plus, Team o Pro.
OpenAI mejora ChatGPT con capacidades de video en tiempo real
El modo de voz avanzado ahora incluye análisis de video en tiempo real y funcionalidades para compartir pantalla. Los usuarios pueden apuntar sus teléfonos a objetos para obtener respuestas inmediatas o compartir sus pantallas para obtener explicaciones detalladas de configuraciones o problemas. Esta incorporación se basa en capacidades anteriores, lo que permite una experiencia de usuario más interactiva. OpenAI demostró la función durante una transmisión en vivo, mostrando su capacidad para participar en conversaciones informales y brindar información basada en información visual.
En cuanto a disponibilidad, el lanzamiento comenzó el 12 de diciembre y se extenderá a lo largo de la semana siguiente. Sin embargo, los usuarios europeos junto con los suscriptores de ChatGPT Enterprise y Edu pueden enfrentar retrasos; Estos usuarios recibirán acceso a principios del próximo año. Esta expansión indica el enfoque de OpenAI en mejorar la interacción del usuario con la IA, alineándose con su objetivo general de proporcionar capacidades avanzadas dentro de su conjunto de productos.
Integraciones con iOS 18.2
En un desarrollo paralelo, Apple recientemente introducido iOS 18.2, que incorpora varias funciones de ChatGPT en Siri, herramientas de escritura y Visual Intelligence. La integración con Siri permite al asistente de voz reconocer consultas que quedan fuera de su alcance y redirigirlas a ChatGPT. Los usuarios serán notificados y deberán aprobar esta acción antes de que continúe.
Para los usuarios con dispositivos iPhone 16, Visual Intelligence les permite apuntar su cámara a objetos o situaciones para recuperar información a través de ChatGPT o Google. Además, la función Herramientas de escritura ahora incluye una nueva herramienta «Redactar», que permite la creación de contenido desde cero utilizando las capacidades de ChatGPT. Estas funciones, que enfatizan la utilidad y el control del usuario, se han estructurado para alinearse con los límites de uso de ChatGPT, lo que garantiza una experiencia organizada.
Actualizaciones de los ’12 días de OpenAI’
OpenAI ha organizado una campaña denominada «12 días de OpenAI», que comienza el 5 de diciembre y que incluye sesiones diarias de transmisión en vivo que revelan nuevas características o productos. El director ejecutivo Sam Altman describió la campaña como una combinación de actualizaciones importantes y mejoras menores. Entre los anuncios notables estuvo la introducción de una nueva voz de Santa para el Modo de Voz Avanzado, que los usuarios pueden activar mediante un ícono de copo de nieve.
Además, la campaña desvelado Sora, el nuevo modelo de vídeo de OpenAI, ya disponible para ChatGPT Pro y usuarios Plus. Este modelo puede generar contenido de texto a video y de video a video, ampliando significativamente las vías creativas disponibles para los usuarios. Otras actualizaciones notables incluyeron la anuncio de Canvas para todos los usuarios web, anteriormente una función beta, que permite una experiencia de gestión de proyectos más integrada.
De cara al futuro, OpenAI tiene planes de ampliar su oferta, incluida una versión completa de su modelo de lenguaje o1, destinada a mejorar aún más las capacidades de razonamiento. La compañía tiene como objetivo hacer que el ajuste de refuerzo esté más ampliamente disponible, y actualmente se buscan aplicaciones en institutos de investigación y universidades para ajustar modelos de IA para tareas específicas.
Crédito de la imagen destacada: AbiertoAI