A pesar de su reputación de retrasarse en el desarrollo de la IA, Apple ha creado la mejor computadora para la investigación de IA. El Mac Studio con el M3 Ultra Chip admite una asignación de memoria unificada sin precedentes, hasta 512 GB, lo que lo convierte en la forma más fácil y asequible de realizar investigaciones de IA avanzadas con grandes modelos en hardware personal.
El último modelo Deepseek V3 demuestra esto con su rendimiento, que se ejecuta completamente en una sola Mac. Los investigadores instalados de Apple revelaron la funcionalidad del modelo el lunes.
Esta capacidad es posible gracias a la potencia de procesamiento de la Mac, que está centralizada bajo una arquitectura unificada. Deepseek V3 logra los niveles de rendimiento competitivos con los líderes de la industria como ChatGPT. Este software se ejecuta de manera eficiente no solo en las granjas de servidores más volantes, sino también cómodamente en la computadora de escritorio de Apple.
El nuevo modelo es similar a los precios usados del automóvil. Con un precio de $ 9,499, es igual a alrededor del costo de un automóvil de segunda mano, pero confesamente no requiere el espacio o los costos de un centro de datos.
Esto no fue planeado. La arquitectura fue diseñada para maximizar los componentes individuales en un chip, creando incidentalmente un potencial masivo para la memoria unificada, beneficiando sustancialmente las tareas de IA.
El impulso de desarrollo para el silicio de Apple tenía la intención de mejorar las computadoras portátiles, como la duración de la batería de MacBook Air. A lo largo de la década de 2010, Apple había estado desarrollando procesadores de silicio secuenciales. Este proyecto comenzó con el lanzamiento del chip A4 en 2010. Macs integrados con Apple Silicon apareció a mitad de la década.
Los modelos de IA son alimentados por GPU, pero la memoria es vital. Una costosa GPU NVIDIA 4090, que tiene un tamaño grande y está destinado al modelado 3D y la representación de video, contiene 24 GB de memoria. Modelos de lenguaje potentes como Deepseek R1 requerir memoria al menos 64 veces esa capacidad.
Las ventajas de ejecutar modelos superan localmente los servicios basados en la nube. Eliminar la necesidad de usar servidores internacionales con latencia de red y limitaciones de uso, y costos financieros, es un beneficio exclusivo del procesamiento local. Además, las preocupaciones de privacidad y seguridad se mitigan ejecutando hardware e infraestructura local.
La arquitectura única de Apple para su silicio también difiere de muchos PC personalizados. Apple Silicon integra CPU, GPU y motores neuronales en un solo chip, en lugar de utilizar memoria discreta para cada componente. El arreglo especializado hace que el hardware de Apple sea el más rentable para una capacidad de memoria local sustancial.
Apple Marketing Materials elogió la arquitectura de memoria unificada cuando lanzaron el chip M1. Hacen hincapié en cómo varios componentes del sistema que utiliza el acceso a la memoria compartida aumenta la capacidad de procesamiento de su computadora, pero mejora principalmente la duración de la batería de MacBook Air.
El lunes, el investigador de Aprendizaje de Apple Machine, Awni Hannun, reveló que ejecuta un modelo de lenguaje grande en un estudio de Mac. Él compartido Especificaciones de rendimiento en sus redes sociales, destacando los centros utilizando 512 GB de memoria unificada.
La gran actuación que ofrece Mac Studio M3 Ultra de Apple en la investigación de IA no es accidente, pero un subproducto de su diseño de chip se centró en la duración de la batería; Un impresionante, aunque no planificado, beneficia que los competidores ahora están jugando para emular.
La ventaja del mundo real aquí es obvia: sin retrasos en la red latente, enormes costos de terceros o riesgos de seguridad en la nube debido a la transferencia de datos, los investigadores finalmente pueden utilizar grandes modelos de IA en hardware local. Las ventajas inmediatas para la eficiencia y la seguridad son innegables. Noticias subparentes para granjas de servidores.
No había necesidad de que Apple diseñara una máquina desde el salto específicamente para la IA. Su decisión de crear chips eficientes para productos de consumo ha convocado involuntariamente a una bestia con un apetito insaciable para aplastar problemas en el aprendizaje automático. Apple debería agradecer a los equipos que exigieron más de sus portátiles.