La última empresa de Google, cuyo nombre en código es “Proyecto Jarvis”, está diseñada para aprovechar la IA para automatizar tareas basadas en la web dentro del navegador Chrome.
De acuerdo a La informacióneste proyecto impulsado por IA, que se espera que debute en los primeros avances en diciembre, está impulsado por Géminis 2.0 de Google modelo y representa una herramienta orientada al consumidor destinada a simplificar las interacciones en línea. Siguiendo el modelo del asistente ficticio JARVIS de Marvel, Jarvis realizará tareas digitales de varios pasos de forma autónoma, abarcando todo, desde compras en línea hasta reservas de viajes.
Gemini 2.0 impulsa el Proyecto Jarvis
Gemini 2.0, la última versión del modelo avanzado de IA de Google, sirve como base para el Proyecto Jarvis. Revelado en Google I/O 2024Gemini está diseñado con mejoras en el razonamiento, la planificación y la memoria, todo ello destinado a ayudar a los usuarios a completar tareas complejas de varios pasos de forma autónoma.
Como explicó el CEO de Google, Sundar Pichai, durante I/O, el objetivo es crear “sistemas inteligentes que muestren razonamiento, planificación y memoria, [and are] capaz de pensar en varios pasos por delante” mientras permanece totalmente supervisado por el usuario. Con estas capacidades, Gemini pretende proporcionar un “ejemplo emblemático”de cómo los futuros agentes de IA pueden mejorar la productividad y reducir las aportaciones de los usuarios.

Lo que distingue a Jarvis es su capacidad para operar dentro del Cromo navegador, capturando capturas de pantalla para guiar sus interacciones con formularios y botones en línea. Según The Information, Jarvis toma capturas de pantalla frecuentes de la ventana de Chrome de un usuario para interpretar cada interfaz, lo que le permite «hacer clic» en botones, escribir en campos o incluso comparar elementos entre sitios web.
El método basado en capturas de pantalla también permite a Jarvis comprender formas complejas y diseños que varían ampliamente entre diferentes sitios. Sin embargo, esta característica significa que Jarvis opera relativamente lento y se toma unos segundos para analizar cada captura de pantalla antes de continuar con el siguiente paso. Si bien aún no está optimizada para la velocidad, esta tecnología muestra la estrategia de Google de utilizar recursos basados en la nube para respaldar tareas complejas de IA que de otro modo requerirían potencia de procesamiento en el dispositivo.
¿Qué tal las aplicaciones?
El Proyecto Jarvis promete cambiar la forma en que los usuarios interactúan con las plataformas digitales, con énfasis en la automatización de tareas rutinarias basadas en la web, como comprar productos, reservar vuelos o recopilar investigaciones.
Esta capacidad podría atraer a una amplia audiencia, desde profesionales ocupados hasta usuarios cotidianos que buscan optimizar las tareas. El informe de Information destaca que Jarvis permitirá a los usuarios completar extensos procesos basados en la web con una mínima aportaciónlo que les permite delegar actividades que requieren mucho tiempo a la IA. Al hacerlo, Google pretende posicionar a Jarvis como una herramienta orientada al consumidor y centrada en la productividad, muy similar a La visión del copiloto de Microsoft o de Apple Inteligencia de Apple.
¿Cuándo pueden los usuarios acceder a Google Jarvis?
Los informes sugieren que una vista previa temprana del Proyecto Jarvis puede debutar este diciembreaunque los detalles podrían cambiar. Es probable que la empresa lance inicialmente la herramienta a una audiencia limitada para identificar y solucionar cualquier error o limitación antes de una implementación más amplia.
Google ha utilizado un enfoque similar para lanzamientos de productos anteriores, como su Bardo IAbrindando a los primeros usuarios la oportunidad de ofrecer comentarios y contribuir a mejoras antes de una disponibilidad más amplia. Esta fase de prueba podría dar forma a cómo Google optimiza Jarvis para lograr un rendimiento más rápido y fluido, al tiempo que garantiza que los protocolos de seguridad cumplan con las expectativas de los usuarios.

Ahí vienen las preocupaciones
Como asistente de IA con un control significativo sobre la experiencia web del usuario, Jarvis plantea nuevas preocupaciones sobre privacidad y seguridad. Dado que Jarvis depende de la interpretación de capturas de pantalla de información potencialmente confidencial, serán esenciales medidas de seguridad sólidas para garantizar que los datos del usuario permanezcan protegidos. El plan de Google incluye pruebas exhaustivas de estas salvaguardas antes de que Jarvis vea un lanzamiento más amplio, pero los riesgos potenciales asociados con un nivel tan alto de acceso al sistema están provocando un debate entre los defensores de la privacidad y los desarrolladores.
Al otorgar a herramientas de inteligencia artificial como Jarvis control directo sobre los dispositivos de los usuarios, Google debe implementar salvaguardas para evitar vulnerabilidades y accesos no autorizados. Si bien el Proyecto Jarvis aún está en desarrollo, promete cambiar las reglas del juego en la productividad impulsada por la IA al permitir a los usuarios delegar tareas complejas de varios pasos dentro del navegador Chrome. Al combinar el poder de Gemini 2.0 con las capacidades web de Chrome, Google está creando una IA que podría redefinir cómo abordamos las tareas digitales, desde las compras hasta la investigación.
A medida que Google ultima Jarvis para uso del consumidor, su éxito podría allanar el camino para experiencias de IA más avanzadas y autónomas, cambiando la forma en que interactuamos con los navegadores y, potencialmente, con la tecnología en general.
Créditos de imagen: Emre Çıtak/Ideograma IA