Los investigadores del MIT desarrollaron un nuevo sistema de conversión de voz a realidad que combina IA generativa 3D con ensamblaje robótico para fabricar objetos a pedido. El sistema creó elementos como muebles en tan solo cinco minutos. Este flujo de trabajo impulsado por IA permite a los usuarios proporcionar información hablada a un brazo robótico, «haciendo que los objetos existan mediante la palabra». La tecnología aprovecha el procesamiento del lenguaje natural, la IA generativa 3D y el ensamblaje robótico para agilizar el proceso de fabricación. Alexander Htet Kyaw, estudiante de posgrado del MIT y miembro de la Academia de Diseño Morningside (MAD), afirmó: «Estamos conectando el procesamiento del lenguaje natural, la IA generativa 3D y el ensamblaje robótico». Añadió que estas áreas de investigación que avanzan rápidamente no se habían combinado previamente para crear objetos físicos a partir de una simple indicación del habla. El sistema recibe comandos de voz, como «Quiero un taburete sencillo», y luego construye objetos a partir de componentes modulares. Hasta ahora, los investigadores han utilizado el sistema para construir taburetes, estantes, sillas, una mesa pequeña y formas decorativas, incluida una estatua de un perro. El sistema de conversión de voz a realidad procesa las solicitudes de los usuarios a través de varias etapas:
- Reconocimiento de voz: Un modelo de lenguaje grande procesa la entrada hablada del usuario.
- IA generativa 3D: El sistema crea una representación de malla digital del objeto deseado.
- Algoritmo de voxelización: La malla 3D se divide en componentes de ensamblaje específicos.
- Procesamiento geométrico: El ensamblaje generado por IA se modifica para tener en cuenta las limitaciones de fabricación del mundo real, como el número de componentes, los voladizos y la conectividad geométrica.
- Secuencia de montaje y planificación de rutas: El sistema crea una secuencia de montaje factible y una planificación de ruta automatizada para el brazo robótico.
A diferencia de la impresión 3D, que suele tardar horas o días, este sistema completa la construcción de objetos en cuestión de minutos. También hace que el diseño y la fabricación sean más accesibles para personas sin experiencia en modelado 3D o programación robótica. Kyaw desarrolló el sistema inicial mientras tomaba el curso del profesor Neil Gershenfeld, «Cómo hacer casi cualquier cosa». Continuó el proyecto en el Centro de Bits y Átomos (CBA) del MIT, colaborando con los estudiantes de posgrado Se Hwan Jeon del Departamento de Ingeniería Mecánica y Miana Smith de CBA. El equipo planea mejorar la capacidad de carga de los muebles implementando conexiones más robustas entre cubos modulares, yendo más allá de las conexiones magnéticas actuales. Smith señaló: «También hemos desarrollado procesos para convertir estructuras de vóxeles en secuencias de ensamblaje factibles para robots móviles pequeños y distribuidos, lo que podría ayudar a traducir este trabajo a estructuras de cualquier tamaño». El uso de componentes modulares tiene como objetivo reducir los residuos de fabricación al permitir el desmontaje y montaje en nuevos objetos. Kyaw también está trabajando para integrar el reconocimiento de gestos y la realidad aumentada en el sistema, combinando el control del habla y los gestos para mejorar la interacción. El equipo presentó su artículo, «Discurso a la realidad: producción bajo demanda utilizando lenguaje natural, IA generativa 3D y ensamblaje robótico discreto», en el Simposio sobre fabricación computacional (SCF ’25) de la Association for Computing Machinery (ACM) en el MIT el 21 de noviembre. https://www.youtube.com/watch?v=GJQD86H9Nok





