Deepseek acelerará el lanzamiento de su nuevo modelo de IA, R2, luego del éxito de su modelo anterior, R1, que recientemente provocó una venta de $ 1 billón en los mercados de acciones globales debido a su desempeño competitivo contra las contrapartes occidentales.
Deepseek acelera el lanzamiento del modelo R2 AI después del éxito R1
La startup con sede en Hangzhou originalmente tenía como objetivo lanzar R2 a principios de mayo, pero ahora está presionando por un despliegue acelerado, según tres fuentes familiarizadas con la compañía. Se espera que el nuevo modelo mejore las capacidades de codificación y admita el razonamiento en múltiples idiomas más allá del inglés. Deepseek no ha comentado sobre estos desarrollos.
R1, desarrollado utilizando chips Nvidia menos potentes, sigue siendo competitivo con los modelos creados por las principales empresas tecnológicas estadounidenses que han invertido cientos de miles de millones en tecnologías de IA. Vijayasimha Alilughatta, director de operaciones de Zensar, declaró que la liberación de R2 podría afectar significativamente la industria de la IA, desafiando el dominio de los líderes del mercado existentes.
Fundador y ethos operativos
Liang Wenfeng, fundador de Deepseek y multimillonario de su cuantitativo Fondo de cobertura High-Flyer, ha mantenido un perfil bajo desde julio de 2024. Los ex empleados describen a Deepseek como operando más como un laboratorio de investigación que un negocio convencional, caracterizado por un estilo de gestión plana que contrasta con la estructura jerárquica común en el sector tecnológico de China.
Liang, quien comenzó su carrera en imágenes inteligentes y luego administró un equipo de investigación, fue elogiado por contratar a los mejores ingenieros de algoritmos y fomentar un entorno colaborativo. Los empleados notaron que muchos trabajaron en ocho horas, sintiéndose capacitados para contribuir a proyectos clave. Liang enfatiza la calidad en el desarrollo extenso de aplicaciones, después de haber comentado sobre evitar un gasto pesado a favor de refinar modelos de IA.
Según los informes, la compensación en Deepseek y High-Flyer es generosa; Los científicos de datos senior en High-Flyer pueden ganar hasta 1.5 millones de yuanes anualmente, significativamente más altos que los competidores. High-Flyer en sí es reconocido como uno de los principales fondos cuantitativos de China, gestionando decenas de miles de millones de yuanes a pesar de las presiones regulatorias sobre el sector.
Deepseek sacudió el mercado una vez y aquí está por qué podría volver a suceder
La ventaja competitiva de Deepseek proviene de las importantes inversiones de High-Flyer en investigación y energía informática. La firma asignó el 70% de sus ingresos para la investigación de IA, construyendo dos grupos de AI de supercomputación, incluidos uno que consta de 10,000 chips A100 NVIDIA durante 2020 y 2021. El gobierno chino inicialmente planteó preocupaciones sobre la adquisición masiva de chips, pero finalmente permitió que las operaciones procedieran, lo que luego benefició a Deep Speeek cuando el US Banned A100 Chip Exports a China en 2022.
Con una competencia limitada por tales recursos, Deepseek ha atraído a los principales investigadores. La aplicación de técnicas rentables, como la mezcla de expertos (MOE) y la atención latente de múltiples cabezas (MLA), ha permitido a la compañía reducir los costos informáticos mientras sigue siendo competitivo. Según los analistas de Bernstein, se estima que los precios de Deepseek son de 20 a 40 veces más baratos que los modelos similares de OpenAI.
Desde la introducción de R1, los gigantes tecnológicos occidentales han ajustado sus estrategias, reflejadas en los recortes de precios de OpenAI y la introducción de niveles de acceso con descuento por Google. Las pruebas de referencia de UST señalaron que R1 a menudo requería tres veces los tokens para razonamiento en comparación con los modelos reducidos de Openi.
Apoyo gubernamental
Deepseek ha ganado el favor del gobierno chino, como lo demuestra Liang asistiendo a una reunión de alto perfil con el primer ministro Li Qiang como representante del sector de la IA. Los gobiernos locales y varias empresas estatales han comenzado a integrar los modelos de Deepseek, lo que indica un fuerte respaldo del liderazgo chino, cuyo objetivo es demostrar superioridad sobre la tecnología estadounidense.
Este aumento se produce en un momento en que los modelos de Deepseek enfrentan la eliminación de las tiendas de aplicaciones en algunos países, incluidos Corea del Sur e Italia, debido a problemas de privacidad. Los expertos advierten que si Deepseek se convierte en el modelo de IA preferido para las entidades estatales chinas, los reguladores occidentales pueden responder con mayores restricciones a las exportaciones y colaboraciones de tecnología de IA.
Liang ha reconocido los desafíos planteados por el embargo en los chips de IA avanzados, enfatizar la financiación no ha sido el problema principal para Deepseek.
Crédito de imagen destacado: Matheus bertelli/pexels