Deepseek, un laboratorio de IA chino, ha actualizado su modelo de IA Tirador de pruebasdiseñado para resolver pruebas y teoremas relacionados con las matemáticas, con el lanzamiento de la versión V2 en la plataforma de desarrollo de IA abrazando Face el miércoles.
La última versión parece estar construida sobre el modelo V3 de Deepseek, que cuenta con 671 mil millones de parámetros y utiliza una arquitectura de mezcla de expertos (MOE). Esta arquitectura permite que el modelo descomponga tareas complejas en subtareas y las delegue a componentes «expertos» especializados.
En el contexto de los modelos de IA, los parámetros son una medida aproximada de las capacidades de resolución de problemas de un modelo. Veterano Última actualización de Prover en agosto, describiéndolo como un modelo personalizado para la prueba de teorema formal y razonamiento matemático.
La actualización se produce cuando Deepseek continúa expandiendo sus ofertas de IA. En febrero, Reuters informó que la compañía estaba considerando recaudar fondos externos por primera vez. Recientemente, Deepseek lanzó una versión mejorada de su modelo V3 de uso general y se espera que actualice su modelo de «razonamiento» R1 pronto.