Research El nuevo marco de prueba de estrés revela defectos en el razonamiento avanzado de IA 29 julio 2025