Deepseek, una prominente compañía de IA china, enfrentó demoras inesperadas en la liberación de su modelo R2 debido a las persistentes dificultades técnicas encontradas con las chips Ascend de Huawei. Las autoridades chinas habían alentado a Deepseek a utilizar procesadores nacionales sobre los sistemas H20 de NVIDIA.
A pesar de la asistencia en el sitio de los ingenieros de Huawei, Deepseek no pudo completar una carrera de capacitación exitosa utilizando chips Ascend. En consecuencia, la compañía dependía del hardware de NVIDIA para los procesos de capacitación mientras implementaba chips Ascend para tareas de inferencia. Este enfoque de doble hardware subraya los desafíos en la transición por completo a la infraestructura interna de IA para operaciones complejas.
El lanzamiento del modelo R2, inicialmente programado para mayo de 2025, se pospuso. Este retraso se deriva de los obstáculos técnicos no resueltos asociados con los chips Ascend y los requisitos de etiquetado de datos extendidos para el conjunto de datos de capacitación actualizado. Según los informes, el fundador de Deepseek, Liang Wenfeng, articuló la insatisfacción con el progreso del desarrollo del modelo, lo que indica la necesidad de un tiempo adicional para garantizar que el modelo pueda mantener la posición competitiva de Deepseek.
Los competidores han aprovechado los contratiempos de desarrollo de Deepseek. El QWEN3 de Alibaba, por ejemplo, ha integrado algoritmos de entrenamiento central similares a los de Deepseek, al tiempo que mejora la eficiencia y la flexibilidad en sus propios sistemas. Este desarrollo destaca la rápida evolución dentro de los ecosistemas de IA y el potencial para que los rivales capitalicen las dificultades encontradas por las nuevas empresas individuales.
La iniciativa estratégica más amplia de Beijing para la autosuficiencia de IA ha intensificado la presión sobre las empresas nacionales para que adopten hardware producido localmente. Este impulso tiene como objetivo reducir la dependencia de la tecnología extranjera, particularmente de compañías como Nvidia. Sin embargo, la implementación de esta estrategia ha revelado las disparidades existentes en la estabilidad, la conectividad entre chip y la madurez del software al comparar los chips de Huawei con los productos establecidos de NVIDIA.
Nvidia ha enfatizado la importancia estratégica de mantener el acceso para los desarrolladores chinos, señalando que las restricciones a la adopción de la tecnología podrían afectar negativamente los intereses de seguridad económica y nacional. Las compañías de IA chinas están navegando por un paisaje complejo, equilibrando las directivas gubernamentales para usar hardware nacional con las realidades prácticas de desarrollar y desplegar modelos de idiomas grandes, que a menudo requieren capacidades de procesamiento avanzadas y confiables.
A pesar de estos desafíos, el modelo R2 de Deepseek aún puede ver un lanzamiento en las próximas semanas. El rendimiento eventual del modelo probablemente sufrirá escrutinio, particularmente cuando se evalúa contra rivales que han sido entrenados utilizando hardware más maduro y establecido. Esta situación ejemplifica la tensión continua entre los objetivos políticos nacionales, las capacidades técnicas disponibles y las demandas prácticas del despliegue de IA del mundo real.





