Una nueva investigación indica que el aprendizaje por transferencia puede acelerar significativamente la búsqueda de nueva física, reduciendo la necesidad de costosas simulaciones. Sin embargo, la dependencia de patrones establecidos puede hacer que la IA pase por alto fenómenos genuinamente nuevos, según un estudio publicado en el Journal of Cosmology and Astroparticle Physics (JCAP).
El modelo estándar de cosmología, conocido como ΛCDM, explica muchas características del universo pero no es exhaustivo. Nuevas observaciones han planteado preguntas sobre conceptos como neutrinos masivos, gravedad modificada y energía oscura en evolución. Investigarlos requiere extensas simulaciones por computadora, que son costosas desde el punto de vista computacional y requieren mucho tiempo.
El equipo de investigación se propuso determinar si el aprendizaje por transferencia podría mejorar la eficiencia de la simulación. El aprendizaje por transferencia permite a una IA aplicar conocimientos desde tareas más simples a otras más complejas, reduciendo así los costos. Inicialmente, la IA se entrenó en simulaciones básicas de ΛCDM antes de pasar a modelos más complejos que incorporaban nuevas físicas potenciales.
Adrian Bayer, coautor del Instituto Flatiron y la Universidad de Princeton, describió este método como un atajo al entrenamiento tradicional de IA. «Por lo general, la gente entrena la IA directamente en las simulaciones computacionalmente más costosas. Lo que hacemos en cambio es utilizar primero simulaciones ΛCDM más simples y menos costosas para darle a la IA una idea de lo que está sucediendo», dijo Bayer.
Esta estrategia de preentrenamiento ayudó a la IA a gestionar la complejidad sin sentirse abrumada. El estudio encontró que el aprendizaje por transferencia redujo la cantidad de simulaciones costosas necesarias en más de diez veces en algunos casos.
Los investigadores también identificaron un desafío conocido como transferencia negativa, que ocurre cuando la IA malinterpreta nueva información basándose en su conocimiento preexistente. La IA a menudo tenía dificultades para discernir nuevos efectos cuando se parecían a patrones alineados con los parámetros ΛCDM existentes. Esto fue evidente en simulaciones con neutrinos masivos, donde la IA enfrentó dificultades para diferenciar nuevas firmas de aquellas que ya había asociado con parámetros conocidos.
Veena Krishnaraj, autora principal del estudio, explicó que la transferencia negativa resulta de degeneraciones físicas subyacentes en los modelos. «Diferentes procesos físicos pueden producir firmas observables muy similares», señaló, indicando la necesidad de actuar con cautela al interpretar los hallazgos de la IA.
El estudio enfatiza tanto los beneficios potenciales como las limitaciones del aprendizaje por transferencia en el dominio de la física. Si bien el entrenamiento previo puede acelerar el análisis de datos, puede obstaculizar la capacidad de la IA para reconocer descubrimientos innovadores. La siguiente fase consistirá en aplicar la técnica de aprendizaje por transferencia a observaciones astronómicas reales.
Los investigadores anticipan que el aprendizaje por transferencia será fundamental para los próximos estudios cosmológicos que recopilarán datos de alta precisión. El artículo titulado «Transferir el aprendizaje más allá del modelo estándar», escrito por Veena Krishnaraj y sus colegas, ahora se publica en JSTAT.





