oráculo tiene anunciado su OCI Zettascale10, un software basado en la nube supercomputadora de inteligencia artificial Afirma que ofrece 16 zettaFLOPS de máximo rendimiento. El sistema, que utiliza 800.000 GPU de Nvidia, está diseñado para soportar cargas de trabajo de IA a gran escala desarrolladas por socios como OpenAI. La compañía afirma que el sistema puede alcanzar un rendimiento máximo de 16 zettaFLOPS distribuidos en sus 800.000 GPU Nvidia. Este nivel de producción, cuando se calcula por GPU, equivale aproximadamente a 20 petaflops por cada unidad. Esta métrica de rendimiento individual es comparable a la salida del chip Grace-Blackwell GB300 Ultra, un componente utilizado en sistemas de escritorio de alta gama diseñados específicamente para tareas de inteligencia artificial. La cifra total posiciona a Zettascale10 como una entrada importante en la infraestructura computacional a gran escala. Oracle ha identificado la plataforma como la infraestructura fundamental para el clúster Stargate de OpenAI, que se encuentra en Abilene, Texas. Esta instalación se está construyendo para gestionar algunas de las cargas de trabajo de IA más exigentes que actualmente surgen tanto de iniciativas de investigación como de aplicaciones comerciales. Peter Hoeschele, vicepresidente de Infraestructura y Computación Industrial de OpenAI, afirmó: «El diseño RoCE personalizado altamente escalable maximiza el rendimiento de todo el tejido a escala de gigavatios mientras mantiene la mayor parte de la energía enfocada en la computación». Un elemento central del sistema Zettascale10 es la arquitectura de red Oracle Acceleron RoCE, que ha sido diseñada para mejorar la escalabilidad y confiabilidad para operaciones de IA con gran cantidad de datos. Este diseño emplea tarjetas de interfaz de red que funcionan como conmutadores en miniatura, creando enlaces directos entre GPU en varios planos de red aislados. Esta configuración tiene como objetivo reducir la latencia en la comunicación entre GPU. También proporciona redundancia, lo que permite que los trabajos computacionales continúen procesándose sin interrupción incluso si una de las rutas de la red experimenta una falla. Ian Buck, vicepresidente de Hiperescala de la empresa, destacó el papel de Nvidia en el sistema. «Con la infraestructura de IA de pila completa de Nvidia, OCI Zettascale10 proporciona el tejido informático necesario para avanzar en la investigación de IA de última generación y ayudar a las organizaciones de todo el mundo a pasar de la experimentación a la IA industrializada», dijo Buck. Oracle también afirma que su estructura de red puede reducir los costos al simplificar los niveles dentro de la estructura de la red y al mismo tiempo ofrecer un rendimiento consistente en todos los nodos. El sistema introduce tecnologías de óptica receptora y enchufable lineal, destinadas a reducir el consumo de energía y los requisitos de refrigeración sin sacrificar el ancho de banda. La afirmación de rendimiento de 16 zettaFLOPS de Oracle no ha sido verificada de forma independiente. Las métricas de rendimiento para los sistemas en la nube pueden diferir según la metodología utilizada para el cálculo, y la cifra de la empresa podría basarse en el rendimiento máximo teórico en lugar de tasas operativas sostenidas. Dado que la producción total anunciada del sistema equivale a la suma de sus 800.000 GPU funcionando a su máximo potencial, su eficiencia en el mundo real dependerá significativamente de factores como el diseño de la red y la optimización del software. Se espera que los analistas esperen para ver si la configuración ofrece un rendimiento comparable al de los clústeres de IA establecidos de otros proveedores importantes de la nube. El sistema Zettascale10 está diseñado para permitir a los clientes entrenar e implementar grandes modelos de IA en el entorno de nube distribuida de Oracle, que incluye medidas de soberanía de datos. Mahesh Thiagarajan, vicepresidente ejecutivo de Oracle Cloud Infrastructure, comentó: «Con OCI Zettascale10, estamos fusionando la arquitectura de red Oracle Acceleron RoCE de OCI con la infraestructura de IA de Nvidia de próxima generación para ofrecer una capacidad de IA de varios gigavatios a una escala inigualable». Añadió que los clientes pueden construir y entrenar modelos usando menos energía y operar con «datos sólidos y soberanía de IA». El sistema también ofrece flexibilidad operativa a través del mantenimiento independiente a nivel de avión, lo que permite actualizaciones con un tiempo de inactividad reducido. Los observadores han observado que otros proveedores importantes de la nube están construyendo simultáneamente sus propios clústeres de GPU a gran escala y desarrollando sistemas avanzados de almacenamiento en la nube, lo que podría reducir cualquier ventaja competitiva de Oracle. El lanzamiento del sistema Zettascale10 está previsto para el próximo año. Su capacidad para satisfacer la creciente demanda de computación de IA escalable, eficiente y confiable se evaluará después de su implementación.





