Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
No Result
View All Result

Thinking Machines Lab revela investigación sobre la eliminación de la aleatoriedad en las respuestas del modelo de IA

byKerem Gülen
11 septiembre 2025
in Artificial Intelligence
Home Artificial Intelligence

Thinking Machines Lab, respaldado por $ 2 mil millones en fondos iniciales y personal de ex investigadores de Operai, ha compartido sus primeros conocimientos de investigación detallados. El laboratorio publicó una publicación de blog el miércoles que examina cómo crear modelos de IA que produzcan respuestas más consistentes y reproducibles, abordando un desafío fundamental en el desarrollo de inteligencia artificial.

La investigación de consistencia del modelo de IA se dirige al no determinismo en modelos de idiomas grandes

La publicación de blog, titulada «Derrotar el no determinismo en la inferencia de LLM«Investiga por qué los modelos de IA a menudo generan respuestas variadas a preguntas idénticas. Si bien esta variabilidad se ha aceptado como una característica inherente de los modelos de lenguaje grande, el laboratorio de las máquinas de pensamiento ve este no determinismo como un problema solucionable en lugar de una limitación inevitable.

La orquestación del núcleo de GPU causa aleatoriedad de respuesta

El investigador Horace fue autor de la publicación, argumentando que la aleatoriedad en los modelos de IA se deriva de cómo se orquestan los núcleos GPU durante el procesamiento de inferencia. El procesamiento de inferencia se refiere a los pasos computacionales que ocurren después de que los usuarios envíen consultas, como presionar ENTRAR en ChatGPT. Los núcleos de GPU son programas especializados que se ejecutan en chips de computadora NVIDIA. Él cree que un manejo cuidadoso de esta capa de orquestación puede permitir que los modelos de IA generen resultados más predecibles y consistentes.

Las respuestas consistentes mejoran la capacitación de aprendizaje de refuerzo

Más allá de mejorar la confiabilidad para las aplicaciones empresariales y científicas, sugiere que las respuestas reproducibles pueden optimizar la capacitación de aprendizaje de refuerzo (RL). El aprendizaje de refuerzo recompensa los modelos de IA para respuestas correctas, pero las respuestas inconsistentes introducen el ruido en los datos de entrenamiento. Las respuestas más consistentes podrían mejorar el proceso RL, que se alinea con los informes anteriores de la información de que el laboratorio de Machines de pensamiento planea usar RL para adaptar a los modelos de IA a necesidades comerciales específicas.

Primer lanzamiento de productos planeado para los próximos meses

La ex directora de tecnología de Openai, Mira Murati, anunció en julio que Thinking Machines Lab lanzará su primer producto pronto. Indicó que el producto será «útil para investigadores y nuevas empresas que desarrollen modelos personalizados», aunque los detalles específicos y si incorpora las técnicas de reproducibilidad siguen siendo no reveladas.

El compromiso de investigación abierto refleja el enfoque temprano de OpenAI

Laboratorio de máquinas de pensamiento Anunció planes para publicar regularmente publicaciones de blog, código y resultados de investigación para «beneficiar al público, pero también mejorar nuestra propia cultura de investigación». La publicación reciente lanza una nueva serie llamada «Connectismo», lo que refleja este compromiso de transparencia. Este enfoque refleja la promesa de investigación abierta temprana de Openai, aunque OpenAi se volvió menos transparente a medida que crecía. El blog de investigación proporciona una visión rara de las operaciones de Thinking Machines Lab e indica que la compañía está abordando importantes desafíos de investigación de inteligencia artificial mientras trabaja hacia productos que justifican su valoración de $ 12 mil millones.

Tags: inteligencia artificialLaboratorio de máquinas de pensamientoPresentado

Related Posts

El nuevo modelo K2 de EAU cree el modelo AI Jailbreak Horas después del lanzamiento a través de registros de razonamiento transparente

El nuevo modelo K2 de EAU cree el modelo AI Jailbreak Horas después del lanzamiento a través de registros de razonamiento transparente

12 septiembre 2025
La startup de Barcelona, ​​Altan, recauda $ 2.5 millones para democratizar el desarrollo de software con agentes de IA

La startup de Barcelona, ​​Altan, recauda $ 2.5 millones para democratizar el desarrollo de software con agentes de IA

12 septiembre 2025
MIT Sloan: el 80% de los ataques de ransomware usan AI

MIT Sloan: el 80% de los ataques de ransomware usan AI

11 septiembre 2025
Cuspai recauda $ 100 millones para la plataforma de descubrimiento de materiales de IA

Cuspai recauda $ 100 millones para la plataforma de descubrimiento de materiales de IA

11 septiembre 2025
Google Gemini ahora transcribe archivos de audio

Google Gemini ahora transcribe archivos de audio

11 septiembre 2025
Lista de verificación de ética AGI propone diez elementos clave

Lista de verificación de ética AGI propone diez elementos clave

11 septiembre 2025

Recent Posts

  • Tencent contrata a Yao Shunyu de Openai para AI en Shenzhen
  • El nuevo modelo K2 de EAU cree el modelo AI Jailbreak Horas después del lanzamiento a través de registros de razonamiento transparente
  • El kit de herramientas de cibercrimen de spamgpt permite campañas de phishing automatizadas a gran escala en 2025
  • El DOJ le pide a la corte que obligue a Apple a producir más documentos antimonopolio
  • Administrador de ransomware ucraniano Volodymyr TyMoshchuk acusado de ataques cibernéticos globales

Recent Comments

No hay comentarios que mostrar.
Dataconomy ES

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.