El Laboratorio de Investigación y Desarrollo de AI de Google, DeepMind, ha presentado Alphaevolve, un sistema de IA diseñado para abordar problemas complejos en matemáticas y ciencias con soluciones «con graduados en máquina». El sistema aprovecha los modelos «de vanguardia», específicamente modelos de Géminis, para generar, criticar y evaluar las posibles respuestas a un problema dado.
Alphaevolve presenta un mecanismo para reducir las alucinaciones en los modelos de IA mediante el uso de un sistema de evaluación automática. Este sistema obtiene las respuestas generadas para su precisión, lo que le permite funcionar de manera efectiva en problemas que pueden ser autoevaluados, particularmente en campos como la informática y la optimización del sistema.

Para utilizar AlphaevoleLos usuarios deben proporcionar una declaración del problema junto con detalles opcionales, como instrucciones, ecuaciones y literatura relevante. También deben suministrar un mecanismo para evaluar automáticamente las respuestas del sistema, típicamente en forma de una fórmula. La capacidad del sistema se limita a describir soluciones como algoritmos, lo que lo hace menos adecuado para problemas no numéricos.
En las pruebas de evaluación comparativa, Alphaevolve se presentó con alrededor de 50 problemas matemáticos en varias ramas, incluida la geometría y la combinatoria. El sistema «redescubrió» con éxito las respuestas más conocidas el 75% del tiempo y descubrió soluciones mejoradas en el 20% de los casos. DeepMind también aplicó Alphaevolve a problemas prácticos, como optimizar la eficiencia del centro de datos de Google y acelerar las ejecuciones de entrenamiento modelo.
Video: Google DeepMind
De acuerdo a ProfundoAlphaevolve generó un algoritmo que recuperó el 0.7% de los recursos de cómputo mundiales de Google en promedio y sugirió una optimización que redujo el tiempo general para entrenar modelos Géminis en un 1%. Si bien Alphaevolve no está haciendo descubrimientos innovadores, se afirma que ahorra tiempo y libera a los expertos para centrarse en tareas más críticas.
DeepMind planea construir una interfaz de usuario para Alphaevolve y lanzar un programa de acceso temprano para académicos seleccionados antes de considerar un despliegue más amplio. El laboratorio afirma que las capacidades de Alphaevolve lo convierten en una herramienta valiosa para los expertos en dominios.