Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
No Result
View All Result

Deepseek R2 viene rápido: ¿puede el oeste mantenerse al día?

byKerem Gülen
27 febrero 2025
in Inteligencia Artificial, Noticias
Home Noticias Inteligencia Artificial
Share on FacebookShare on Twitter
Google Preferred Source

Deepseek acelerará el lanzamiento de su nuevo modelo de IA, R2, luego del éxito de su modelo anterior, R1, que recientemente provocó una venta de $ 1 billón en los mercados de acciones globales debido a su desempeño competitivo contra las contrapartes occidentales.

Deepseek acelera el lanzamiento del modelo R2 AI después del éxito R1

La startup con sede en Hangzhou originalmente tenía como objetivo lanzar R2 a principios de mayo, pero ahora está presionando por un despliegue acelerado, según tres fuentes familiarizadas con la compañía. Se espera que el nuevo modelo mejore las capacidades de codificación y admita el razonamiento en múltiples idiomas más allá del inglés. Deepseek no ha comentado sobre estos desarrollos.

R1, desarrollado utilizando chips Nvidia menos potentes, sigue siendo competitivo con los modelos creados por las principales empresas tecnológicas estadounidenses que han invertido cientos de miles de millones en tecnologías de IA. Vijayasimha Alilughatta, director de operaciones de Zensar, declaró que la liberación de R2 podría afectar significativamente la industria de la IA, desafiando el dominio de los líderes del mercado existentes.

Fundador y ethos operativos

Liang Wenfeng, fundador de Deepseek y multimillonario de su cuantitativo Fondo de cobertura High-Flyer, ha mantenido un perfil bajo desde julio de 2024. Los ex empleados describen a Deepseek como operando más como un laboratorio de investigación que un negocio convencional, caracterizado por un estilo de gestión plana que contrasta con la estructura jerárquica común en el sector tecnológico de China.

Liang, quien comenzó su carrera en imágenes inteligentes y luego administró un equipo de investigación, fue elogiado por contratar a los mejores ingenieros de algoritmos y fomentar un entorno colaborativo. Los empleados notaron que muchos trabajaron en ocho horas, sintiéndose capacitados para contribuir a proyectos clave. Liang enfatiza la calidad en el desarrollo extenso de aplicaciones, después de haber comentado sobre evitar un gasto pesado a favor de refinar modelos de IA.

Según los informes, la compensación en Deepseek y High-Flyer es generosa; Los científicos de datos senior en High-Flyer pueden ganar hasta 1.5 millones de yuanes anualmente, significativamente más altos que los competidores. High-Flyer en sí es reconocido como uno de los principales fondos cuantitativos de China, gestionando decenas de miles de millones de yuanes a pesar de las presiones regulatorias sobre el sector.


Deepseek sacudió el mercado una vez y aquí está por qué podría volver a suceder


La ventaja competitiva de Deepseek proviene de las importantes inversiones de High-Flyer en investigación y energía informática. La firma asignó el 70% de sus ingresos para la investigación de IA, construyendo dos grupos de AI de supercomputación, incluidos uno que consta de 10,000 chips A100 NVIDIA durante 2020 y 2021. El gobierno chino inicialmente planteó preocupaciones sobre la adquisición masiva de chips, pero finalmente permitió que las operaciones procedieran, lo que luego benefició a Deep Speeek cuando el US Banned A100 Chip Exports a China en 2022.

Con una competencia limitada por tales recursos, Deepseek ha atraído a los principales investigadores. La aplicación de técnicas rentables, como la mezcla de expertos (MOE) y la atención latente de múltiples cabezas (MLA), ha permitido a la compañía reducir los costos informáticos mientras sigue siendo competitivo. Según los analistas de Bernstein, se estima que los precios de Deepseek son de 20 a 40 veces más baratos que los modelos similares de OpenAI.

Desde la introducción de R1, los gigantes tecnológicos occidentales han ajustado sus estrategias, reflejadas en los recortes de precios de OpenAI y la introducción de niveles de acceso con descuento por Google. Las pruebas de referencia de UST señalaron que R1 a menudo requería tres veces los tokens para razonamiento en comparación con los modelos reducidos de Openi.

Apoyo gubernamental

Deepseek ha ganado el favor del gobierno chino, como lo demuestra Liang asistiendo a una reunión de alto perfil con el primer ministro Li Qiang como representante del sector de la IA. Los gobiernos locales y varias empresas estatales han comenzado a integrar los modelos de Deepseek, lo que indica un fuerte respaldo del liderazgo chino, cuyo objetivo es demostrar superioridad sobre la tecnología estadounidense.

Este aumento se produce en un momento en que los modelos de Deepseek enfrentan la eliminación de las tiendas de aplicaciones en algunos países, incluidos Corea del Sur e Italia, debido a problemas de privacidad. Los expertos advierten que si Deepseek se convierte en el modelo de IA preferido para las entidades estatales chinas, los reguladores occidentales pueden responder con mayores restricciones a las exportaciones y colaboraciones de tecnología de IA.

Liang ha reconocido los desafíos planteados por el embargo en los chips de IA avanzados, enfatizar la financiación no ha sido el problema principal para Deepseek.


Crédito de imagen destacado: Matheus bertelli/pexels

Tags: Presentadoveterano

Related Posts

Sony revela God of War: Laufey para PS5

Sony revela God of War: Laufey para PS5

3 junio 2026
Microsoft presenta Surface RTX Spark Dev Box para cargas de trabajo de IA

Microsoft presenta Surface RTX Spark Dev Box para cargas de trabajo de IA

3 junio 2026
Anthropic invita a 150 organizaciones más al Proyecto Glasswing

Anthropic invita a 150 organizaciones más al Proyecto Glasswing

3 junio 2026
June Android Drop trae herramientas de seguridad y funciones de búsqueda más inteligentes

June Android Drop trae herramientas de seguridad y funciones de búsqueda más inteligentes

3 junio 2026
Microsoft presenta el Proyecto Solara para un futuro en el que el agente será el primero

Microsoft presenta el Proyecto Solara para un futuro en el que el agente será el primero

3 junio 2026
X lanza respuestas en video estilo TikTok para publicaciones

X lanza respuestas en video estilo TikTok para publicaciones

3 junio 2026

Recent Posts

  • Las reglas de exclusión voluntaria de la búsqueda de IA de Google provocan el lanzamiento del navegador Enviromates
  • Sony revela God of War: Laufey para PS5
  • Los investigadores desbloquean una mejora 20 veces mayor en experimentos con láser ultrarrápidos
  • Microsoft presenta Surface RTX Spark Dev Box para cargas de trabajo de IA
  • Según los informes, los nuevos chips Core Ultra de Intel son escasos

Recent Comments

No hay comentarios que mostrar.
Dataconomy ES

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies to improve your experience. You can choose to accept or reject them. Visit our Privacy Policy.