Thinking Machines Lab, respaldado por $ 2 mil millones en fondos iniciales y personal de ex investigadores de Operai, ha compartido sus primeros conocimientos de investigación detallados. El laboratorio publicó una publicación de blog el miércoles que examina cómo crear modelos de IA que produzcan respuestas más consistentes y reproducibles, abordando un desafío fundamental en el desarrollo de inteligencia artificial.
La investigación de consistencia del modelo de IA se dirige al no determinismo en modelos de idiomas grandes
La publicación de blog, titulada «Derrotar el no determinismo en la inferencia de LLM«Investiga por qué los modelos de IA a menudo generan respuestas variadas a preguntas idénticas. Si bien esta variabilidad se ha aceptado como una característica inherente de los modelos de lenguaje grande, el laboratorio de las máquinas de pensamiento ve este no determinismo como un problema solucionable en lugar de una limitación inevitable.
La orquestación del núcleo de GPU causa aleatoriedad de respuesta
El investigador Horace fue autor de la publicación, argumentando que la aleatoriedad en los modelos de IA se deriva de cómo se orquestan los núcleos GPU durante el procesamiento de inferencia. El procesamiento de inferencia se refiere a los pasos computacionales que ocurren después de que los usuarios envíen consultas, como presionar ENTRAR en ChatGPT. Los núcleos de GPU son programas especializados que se ejecutan en chips de computadora NVIDIA. Él cree que un manejo cuidadoso de esta capa de orquestación puede permitir que los modelos de IA generen resultados más predecibles y consistentes.
Las respuestas consistentes mejoran la capacitación de aprendizaje de refuerzo
Más allá de mejorar la confiabilidad para las aplicaciones empresariales y científicas, sugiere que las respuestas reproducibles pueden optimizar la capacitación de aprendizaje de refuerzo (RL). El aprendizaje de refuerzo recompensa los modelos de IA para respuestas correctas, pero las respuestas inconsistentes introducen el ruido en los datos de entrenamiento. Las respuestas más consistentes podrían mejorar el proceso RL, que se alinea con los informes anteriores de la información de que el laboratorio de Machines de pensamiento planea usar RL para adaptar a los modelos de IA a necesidades comerciales específicas.
Primer lanzamiento de productos planeado para los próximos meses
La ex directora de tecnología de Openai, Mira Murati, anunció en julio que Thinking Machines Lab lanzará su primer producto pronto. Indicó que el producto será «útil para investigadores y nuevas empresas que desarrollen modelos personalizados», aunque los detalles específicos y si incorpora las técnicas de reproducibilidad siguen siendo no reveladas.
El compromiso de investigación abierto refleja el enfoque temprano de OpenAI
Laboratorio de máquinas de pensamiento Anunció planes para publicar regularmente publicaciones de blog, código y resultados de investigación para «beneficiar al público, pero también mejorar nuestra propia cultura de investigación». La publicación reciente lanza una nueva serie llamada «Connectismo», lo que refleja este compromiso de transparencia. Este enfoque refleja la promesa de investigación abierta temprana de Openai, aunque OpenAi se volvió menos transparente a medida que crecía. El blog de investigación proporciona una visión rara de las operaciones de Thinking Machines Lab e indica que la compañía está abordando importantes desafíos de investigación de inteligencia artificial mientras trabaja hacia productos que justifican su valoración de $ 12 mil millones.