Es posible que OpenAI pronto lance una herramienta de inteligencia artificial capaz de tomar el control de las PC de los usuarios y realizar acciones en su nombre, conocida como herramienta Operador. El ingeniero de software Tibor Blaho, conocido por filtrar con precisión los próximos productos de IA, reclamos haber encontrado pruebas que respalden esta evolución.
OpenAI planea el lanzamiento en enero para el operador de herramientas de inteligencia artificial
Se informa que OpenAI apunta a un Lanzamiento en enero de Operador. Los descubrimientos recientes de Blaho incluyen opciones ocultas en el cliente ChatGPT de OpenAI para macOS que permiten a los usuarios definir accesos directos para «Alternar operador» y «Forzar salida del operador». Además, Blaho señala que OpenAI ha agregado referencias al Operador en su sitio web, aunque estas referencias aún no son visibles públicamente.
OpenAI lanzará un operador de agente de IA autónomo en enero
Según Blaho, el sitio web también contiene tablas inéditas que comparan el desempeño del Operador con otros sistemas de IA que utilizan computadoras. Si los números son exactos, indican que el Operador no es del todo confiable, dependiendo de la tarea. Por ejemplo, en una prueba comparativa en OSWorld, que simula un entorno informático real, el “OpenAI Computer Use Agent (CUA)” obtuvo una puntuación del 38,1%, mejor que el modelo de Anthropic pero significativamente por debajo de la puntuación del 72,4% alcanzada por los humanos. OpenAI CUA supera a los agentes humanos en la prueba WebVoyager, que evalúa las habilidades de navegación web de una IA, pero tiene un rendimiento inferior en otro punto de referencia, WebArena.
El operador parece tener dificultades con tareas que normalmente son fáciles para los humanos. En las pruebas que requerían que el Operador se registrara en un proveedor de nube y lanzara una máquina virtual, tuvo éxito el 60% de las veces. Mientras tanto, logró crear una billetera Bitcoin solo el 10% de las veces, según la información filtrada. puntos de referencia.
OpenAI está ingresando al espacio de los agentes de IA en un momento en que competidores como Anthropic y Google también están avanzando en esta área. La firma de análisis Markets and Markets proyecta que el mercado de agentes de IA podría alcanzar los 47.100 millones de dólares para 2030. Si bien los agentes de IA permanecen en una etapa primitiva de desarrollo, algunos expertos expresan preocupación por su seguridad, especialmente si la tecnología mejora rápidamente.
Un gráfico filtrado indica que el Operador se desempeña bien en ciertas evaluaciones de seguridad, particularmente en resistir intentos de participar en actividades ilícitas y buscar datos personales confidenciales. Según se informa, las pruebas de seguridad han contribuido al largo ciclo de desarrollo de Operador. Wojciech Zaremba, cofundador de OpenAI criticado La reciente liberación del agente de Anthropic por falta de medidas de seguridad, indica una posible reacción negativa si OpenAI acelerara una liberación similar.
Investigadores de IA y ex empleados han dirigido críticas a OpenAI por supuestamente priorizar la rápida producción de tecnología sobre las medidas de seguridad.
Crédito de la imagen: Tibor Blaho.