Thinking Machines Lab revela investigación sobre la eliminación de la aleatoriedad en las respuestas del modelo de IA

Thinking Machines Lab, respaldado por $ 2 mil millones en fondos iniciales y personal de ex investigadores de Operai, ha compartido sus primeros conocimientos de investigación detallados. El laboratorio publicó una publicación de blog el miércoles que examina cómo crear modelos de IA que produzcan respuestas más consistentes y reproducibles, abordando un desafío fundamental en el desarrollo de inteligencia artificial.

La investigación de consistencia del modelo de IA se dirige al no determinismo en modelos de idiomas grandes

La publicación de blog, titulada «Derrotar el no determinismo en la inferencia de LLM«Investiga por qué los modelos de IA a menudo generan respuestas variadas a preguntas idénticas. Si bien esta variabilidad se ha aceptado como una característica inherente de los modelos de lenguaje grande, el laboratorio de las máquinas de pensamiento ve este no determinismo como un problema solucionable en lugar de una limitación inevitable.

La orquestación del núcleo de GPU causa aleatoriedad de respuesta

El investigador Horace fue autor de la publicación, argumentando que la aleatoriedad en los modelos de IA se deriva de cómo se orquestan los núcleos GPU durante el procesamiento de inferencia. El procesamiento de inferencia se refiere a los pasos computacionales que ocurren después de que los usuarios envíen consultas, como presionar ENTRAR en ChatGPT. Los núcleos de GPU son programas especializados que se ejecutan en chips de computadora NVIDIA. Él cree que un manejo cuidadoso de esta capa de orquestación puede permitir que los modelos de IA generen resultados más predecibles y consistentes.

Las respuestas consistentes mejoran la capacitación de aprendizaje de refuerzo

Más allá de mejorar la confiabilidad para las aplicaciones empresariales y científicas, sugiere que las respuestas reproducibles pueden optimizar la capacitación de aprendizaje de refuerzo (RL). El aprendizaje de refuerzo recompensa los modelos de IA para respuestas correctas, pero las respuestas inconsistentes introducen el ruido en los datos de entrenamiento. Las respuestas más consistentes podrían mejorar el proceso RL, que se alinea con los informes anteriores de la información de que el laboratorio de Machines de pensamiento planea usar RL para adaptar a los modelos de IA a necesidades comerciales específicas.

Primer lanzamiento de productos planeado para los próximos meses

La ex directora de tecnología de Openai, Mira Murati, anunció en julio que Thinking Machines Lab lanzará su primer producto pronto. Indicó que el producto será «útil para investigadores y nuevas empresas que desarrollen modelos personalizados», aunque los detalles específicos y si incorpora las técnicas de reproducibilidad siguen siendo no reveladas.

El compromiso de investigación abierto refleja el enfoque temprano de OpenAI

Laboratorio de máquinas de pensamiento Anunció planes para publicar regularmente publicaciones de blog, código y resultados de investigación para «beneficiar al público, pero también mejorar nuestra propia cultura de investigación». La publicación reciente lanza una nueva serie llamada «Connectismo», lo que refleja este compromiso de transparencia. Este enfoque refleja la promesa de investigación abierta temprana de Openai, aunque OpenAi se volvió menos transparente a medida que crecía. El blog de investigación proporciona una visión rara de las operaciones de Thinking Machines Lab e indica que la compañía está abordando importantes desafíos de investigación de inteligencia artificial mientras trabaja hacia productos que justifican su valoración de $ 12 mil millones.

Thinking Machines Lab revela investigación sobre la eliminación de la aleatoriedad en las respuestas del modelo de IA

Related Posts

El nuevo modelo K2 de EAU cree el modelo AI Jailbreak Horas después del lanzamiento a través de registros de razonamiento transparente

La startup de Barcelona, Altan, recauda $ 2.5 millones para democratizar el desarrollo de software con agentes de IA

MIT Sloan: el 80% de los ataques de ransomware usan AI

Cuspai recauda $ 100 millones para la plataforma de descubrimiento de materiales de IA

Google Gemini ahora transcribe archivos de audio

Lista de verificación de ética AGI propone diez elementos clave

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Thinking Machines Lab revela investigación sobre la eliminación de la aleatoriedad en las respuestas del modelo de IA

La investigación de consistencia del modelo de IA se dirige al no determinismo en modelos de idiomas grandes

La orquestación del núcleo de GPU causa aleatoriedad de respuesta

Las respuestas consistentes mejoran la capacitación de aprendizaje de refuerzo

Primer lanzamiento de productos planeado para los próximos meses

El compromiso de investigación abierto refleja el enfoque temprano de OpenAI

Related Posts

El nuevo modelo K2 de EAU cree el modelo AI Jailbreak Horas después del lanzamiento a través de registros de razonamiento transparente

La startup de Barcelona, ​​Altan, recauda $ 2.5 millones para democratizar el desarrollo de software con agentes de IA

MIT Sloan: el 80% de los ataques de ransomware usan AI

Cuspai recauda $ 100 millones para la plataforma de descubrimiento de materiales de IA

Google Gemini ahora transcribe archivos de audio

Lista de verificación de ética AGI propone diez elementos clave

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Follow Us

La startup de Barcelona, Altan, recauda $ 2.5 millones para democratizar el desarrollo de software con agentes de IA