El unicornio chino de IA DeepSeek mantiene a la industria adivinando sobre el lanzamiento de sus modelos de próxima generación. V4 y R2. A pesar de la intensa especulación sobre un posible lanzamiento durante el próximo Año Nuevo Lunar, la compañía se ha negado a comentar sobre fechas específicas.
En cambio, la empresa está dejando que su investigación hable por sí sola. En las últimas semanas, DeepSeek ha publicado varios artículos técnicos que describen métodos novedosos para superar las limitaciones actuales del hardware. Con las sanciones estadounidenses que restringen el acceso de China a las GPU avanzadas de Nvidia, La última investigación de DeepSeek se centra en la eficiencia algorítmica.
El martes, la empresa presentó «Engrama,«una técnica de memoria condicional diseñada para resolver la escasez de memoria de gran ancho de banda de la GPU, un cuello de botella crítico en el escalamiento de la IA. Esto sigue a un artículo del que es coautor el CEO Liang Wenfeng sobre «hiperconexiones restringidas por múltiples» (mHC), un marco destinado a entrenar sistemas masivos de manera más rentable.
Los analistas creen que estas innovaciones son movimientos estratégicos para mantener el impulso a pesar de los vientos geopolíticos en contra. «DeepSeek sólo quiere demostrar que la innovación en la infraestructura de IA impulsaría la eficiencia,» dijo Zhang Ruiwang, Arquitecto de sistemas de información con sede en Beijing.
Si bien la fecha de lanzamiento de los sucesores de los modelos V3 y R1 sigue siendo un misterio, La compañía confirmó que su equipo central permanece intacto. Un artículo actualizado sobre el modelo R1 señaló que los 18 científicos principales originales todavía están en la empresa. desafiando las altas tasas de rotación de la industria china.





