microsoft anunciado el chip Maia 200 el lunes para escalar la inferencia de IA, con más de 100 mil millones de transistores para velocidades más rápidas y mayor eficiencia que el Maia 100 de 2023. El Maia 200 ofrece más de 10 petaflops con precisión de 4 bits y aproximadamente 5 petaflops con rendimiento de 8 bits. Microsoft lo llama un caballo de batalla de silicio diseñado específicamente para tareas de inferencia de IA. Este proceso implica ejecutar modelos de IA entrenados para generar resultados, distintos de la fase de entrenamiento que construye esos modelos. A medida que se expanden las operaciones de IA, la inferencia ahora representa una proporción cada vez mayor de los gastos informáticos totales, lo que impulsa los esfuerzos para simplificarla. La empresa posiciona el Maia 200 para reducir las interrupciones operativas y el consumo de energía en las implementaciones de IA. Un solo nodo equipado con el chip maneja los modelos de IA actuales más grandes, dejando capacidad para otros sustancialmente más grandes en el futuro. Microsoft declaró: «En términos prácticos, un nodo Maia 200 puede ejecutar sin esfuerzo los modelos más grandes de hoy, con mucho espacio para modelos aún más grandes en el futuro». Este lanzamiento se alinea con un patrón entre las principales empresas de tecnología que desarrollan procesadores personalizados para disminuir la dependencia de las unidades de procesamiento de gráficos de Nvidia, que dominan las cargas de trabajo de IA. Las GPU de Nvidia se han vuelto fundamentales para el éxito de la IA, lo que ha generado alternativas para gestionar los gastos de hardware. Google ofrece unidades de procesamiento tensorial, o TPU, no como chips independientes sino como recursos informáticos basados en la nube. Amazon proporciona chips aceleradores Trainium AI, y el Trainium 3 de tercera generación se lanzó en diciembre. Estas opciones permiten a las empresas desviar algunas cargas de trabajo del hardware de Nvidia, reduciendo los costos generales. Microsoft afirma que Maia 200 supera a sus competidores en métricas clave. Alcanza tres veces el rendimiento FP4 de los chips Trainium de tercera generación de Amazon. Su rendimiento en el FP8 supera al de las TPU de séptima generación de Google, como se detalla en el comunicado de prensa de la compañía el lunes. El chip ya respalda los esfuerzos internos de IA. Impulsa los modelos desarrollados por el equipo de Superinteligencia de Microsoft. Las operaciones del chatbot Copilot también dependen del hardware Maia 200. A partir del lunes, Microsoft extendió invitaciones a usuarios externos. Los desarrolladores, académicos y laboratorios de inteligencia artificial de vanguardia ahora pueden acceder al kit de desarrollo de software Maia 200 para integrarlo en sus cargas de trabajo.





