Dataconomy ES
Social icon element need JNews Essential plugin to be activated.
Subscribe
No Result
View All Result
Dataconomy ES
Social icon element need JNews Essential plugin to be activated.
Subscribe
No Result
View All Result
Dataconomy ES
No Result
View All Result

El almacenamiento en caché implícito tiene como objetivo reducir los costos de la API de Géminis en un 75%

byKerem Gülen
9 mayo 2025
in Artificial Intelligence, News
Home Artificial Intelligence

Google tiene lanzado Una nueva característica en su API de Géminis llamada «almacenamiento en caché implícito», que la compañía afirma puede reducir los costos en un 75% para los desarrolladores de terceros que utilizan sus últimos modelos de IA, Gemini 2.5 Pro y 2.5 Flash.

La función permite automáticamente ahorros de costos cuando una solicitud de API de Gemini a un modelo golpea un caché, eliminando la necesidad de configuración manual requerida por el método de almacenamiento explícito anterior. Según Google, el almacenamiento en caché implícito se activa cuando una solicitud comparte un prefijo común con una solicitud anterior, y el recuento mínimo de token inmediato requerido es 1,024 para 2.5 flash y 2,048 para 2.5 Pro.

Logan Kilpatrick, miembro del equipo de Géminis, anunciado El lanzamiento el 8 de mayo de 2025, indicando que la característica puede ofrecer un ahorro significativo de costos para los desarrolladores. Google recomienda que los desarrolladores coloquen un contexto repetitivo al comienzo de las solicitudes y agregue el contexto de cambio al final para aumentar las posibilidades de golpes de caché implícitos.

El almacenamiento en caché es una práctica ampliamente adoptada en la industria de la IA que reutiliza los datos con frecuencia o precomputados con frecuencia para reducir los requisitos y costos informáticos. El método de almacenamiento de almacenamiento explícito anterior de Google requirió que los desarrolladores definieran de alta frecuencia de manera manual, lo que a menudo resultó en un trabajo adicional y, a veces, facturas API sorprendentemente grandes para algunos usuarios.

Algunos desarrolladores habían expresado insatisfacción con la implementación explícita de almacenamiento en caché para Gemini 2.5 Pro, lo que llevó al equipo de Gemini a disculparse y comprometerse a hacer cambios. La nueva característica de almacenamiento en caché implícito aborda estas preocupaciones al automatizar el proceso de almacenamiento en caché y transmitir los ahorros de costos a los desarrolladores cuando se produce un golpe de caché.

Si bien Google afirma que el almacenamiento en caché implícito puede ofrecer un ahorro de costos del 75%, la compañía no proporcionó una verificación de terceros de la efectividad de la característica. Como tal, los ahorros de costos reales pueden variar según cómo los desarrolladores usan la función.


Crédito de imagen destacado

Tags: APIGéminisGoogle

Recent Posts

  • Brad Smith testifica la aplicación Microsoft bloqueada de Deepseek para los empleados
  • Chrome implementa la IA local para detectar nuevas estafas web emergentes
  • Aprendizaje automático basado en modelos (MBML)
  • Rastreo de rendimiento de ML
  • Apple desarrolla nuevas chips para gafas inteligentes de IA y Macs

Recent Comments

No hay comentarios que mostrar.
Dataconomy ES

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Follow Us

Social icon element need JNews Essential plugin to be activated.
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.