Google tiene lanzado Una nueva característica en su API de Géminis llamada «almacenamiento en caché implícito», que la compañía afirma puede reducir los costos en un 75% para los desarrolladores de terceros que utilizan sus últimos modelos de IA, Gemini 2.5 Pro y 2.5 Flash.
La función permite automáticamente ahorros de costos cuando una solicitud de API de Gemini a un modelo golpea un caché, eliminando la necesidad de configuración manual requerida por el método de almacenamiento explícito anterior. Según Google, el almacenamiento en caché implícito se activa cuando una solicitud comparte un prefijo común con una solicitud anterior, y el recuento mínimo de token inmediato requerido es 1,024 para 2.5 flash y 2,048 para 2.5 Pro.
Logan Kilpatrick, miembro del equipo de Géminis, anunciado El lanzamiento el 8 de mayo de 2025, indicando que la característica puede ofrecer un ahorro significativo de costos para los desarrolladores. Google recomienda que los desarrolladores coloquen un contexto repetitivo al comienzo de las solicitudes y agregue el contexto de cambio al final para aumentar las posibilidades de golpes de caché implícitos.
El almacenamiento en caché es una práctica ampliamente adoptada en la industria de la IA que reutiliza los datos con frecuencia o precomputados con frecuencia para reducir los requisitos y costos informáticos. El método de almacenamiento de almacenamiento explícito anterior de Google requirió que los desarrolladores definieran de alta frecuencia de manera manual, lo que a menudo resultó en un trabajo adicional y, a veces, facturas API sorprendentemente grandes para algunos usuarios.
Algunos desarrolladores habían expresado insatisfacción con la implementación explícita de almacenamiento en caché para Gemini 2.5 Pro, lo que llevó al equipo de Gemini a disculparse y comprometerse a hacer cambios. La nueva característica de almacenamiento en caché implícito aborda estas preocupaciones al automatizar el proceso de almacenamiento en caché y transmitir los ahorros de costos a los desarrolladores cuando se produce un golpe de caché.
Si bien Google afirma que el almacenamiento en caché implícito puede ofrecer un ahorro de costos del 75%, la compañía no proporcionó una verificación de terceros de la efectividad de la característica. Como tal, los ahorros de costos reales pueden variar según cómo los desarrolladores usan la función.