Red de entrega de contenido de Cloudflare experimentado una interrupción importante el martes 19 de noviembre de 2025 debido a una consulta mal configurada en su sistema de gestión de bots, lo que afectó a varios servicios de Internet a nivel mundial. El cofundador y director ejecutivo de Cloudflare, Matthew Prince, detalló la causa en un publicación de blogidentificando un problema dentro del sistema Bot Management, que gestiona los rastreadores automatizados. Este problema específico resultó en la «peor interrupción de Cloudflare desde 2019». Aproximadamente 20 por ciento del tráfico web a través de la red de Cloudflare, así como reportado por la empresa el año pasado. La interrupción desconectó numerosos servicios, incluidos X, ChatGPT y Downdetector, durante varias horas. Este incidente se parece a interrupciones anteriores que involucraron a Microsoft Azure y Servicios web de Amazon. Los controles de bots de Cloudflare abordan desafíos como el de los rastreadores que extraen datos para el entrenamiento de IA generativa. La compañía presentó recientemente el «Laberinto de IA», un método de mitigación que utiliza contenido generado por IA para impedir que los rastreadores y bots de IA no cumplan. Sin embargo, la interrupción se debió a modificaciones en el sistema de permisos de una base de datos, no a tecnología de inteligencia artificial generativa, DNS o actividades maliciosas como un «ataque DDoS a hiperescala», que Cloudflare consideró inicialmente. Prince explicó que el Gestión de robots El modelo de aprendizaje automático del sistema, que genera puntuaciones de bot para solicitudes de red, utiliza un archivo de configuración actualizado con frecuencia para identificar solicitudes automatizadas. Un «cambio en nuestro comportamiento de consulta subyacente de ClickHouse que genera este archivo provocó que tuviera una gran cantidad de filas de ‘funciones’ duplicadas». Esta alteración de la consulta llevó a que la base de datos de ClickHouse produjera información duplicada. El archivo de configuración superó rápidamente los límites de memoria preestablecidos, provocando la falla del «sistema proxy central que maneja el procesamiento del tráfico para nuestros clientes, para cualquier tráfico que dependiera del módulo de bots». En consecuencia, las empresas que utilizan las reglas de Cloudflare para bloquear bots cortaron incorrectamente el tráfico legítimo, mientras que los clientes que no emplearon la puntuación de bot generada en sus reglas permanecieron en línea. Cloudflare ha descrito cuatro planes específicos Para evitar incidentes similares:
- Ingestión de endurecimiento: Reforzar la ingesta de archivos de configuración generados por Cloudflare al mismo estándar que la entrada generada por el usuario.
- Habilitación de interruptores de apagado más globales: Implementar opciones adicionales de desactivación general para funciones.
- Eliminación de volcados de memoria: Evitar que los volcados de memoria u otros informes de errores abrumen los recursos del sistema.
- Revisión de modos de falla: Examinar los modos de falla de las condiciones de error en todos los módulos de proxy principales.





