Antrópico tiene lanzado Claude 3.7, el primer modelo de IA del mundo capaz de producir salida estándar o una cantidad controlable de «razonamiento» para abordar problemas complejos. Este modelo híbrido está diseñado para mejorar la interacción de los usuarios y el desarrollador al permitir un equilibrio entre las respuestas instintivas y el razonamiento metódico.
Antropía revela Claude 3.7: El primer modelo de IA de razonamiento híbrido

Michael Gerstenhaber, líder de productos en Anthrope, declaró: «El [user] Tiene mucho control sobre el comportamiento, cuánto tiempo piensa, y puede intercambiar razonamiento e inteligencia con el tiempo y el presupuesto «. Claude 3.7 presenta una característica de «scratchpad» que muestra el proceso de razonamiento del modelo, inspirándose en el popular modelo de IA chino Veterano. Esta funcionalidad ayuda a los usuarios a comprender el enfoque del modelo para resolver problemas, facilitando los ajustes rápidos.
Dianne Penn, protagonista de investigaciones en antrópico, enfatizó la efectividad del scratchpad en conjunto con la capacidad de razonamiento ajustable. Los usuarios pueden instruir al modelo que asigne más tiempo para la resolución de problemas si los intentos iniciales no producen el desglose deseado.

La estructura híbrida de Claude 3.7 lo distingue de los competidores. Mientras que Openai lanzó un modelo de razonamiento llamado O1 en septiembre de 2024, y luego una versión más robusta llamada O3, ambos requieren que los usuarios cambien entre modelos para acceder a las funciones de razonamiento. Claude 3.7 de Anthrope permite un alternativo sin problemas entre las respuestas convencionales y el razonamiento extendido, una ventaja significativa.
El modelo híbrido se alinea con los marcos de razonamiento descritos por el economista ganador del premio Nobel Daniel Kahneman en su libro «Pensamiento, rápido y lento», ofrece procesos cognitivos instintivos y deliberados. Los modelos estándar, como los modelos de lenguaje grande (LLM), generalmente generan respuestas instantáneas, pero pueden vacilar en tareas que requieren un razonamiento exhaustivo, como los cálculos aritméticos.
Para mejorar las capacidades de Claude 3.7, Anthrope empleó el aprendizaje de refuerzo para capacitar al modelo con datos adicionales centrados en aplicaciones comerciales como la codificación y las consultas legales. Penn señaló que «las cosas en las que hicimos mejoras son […] sujetos técnicos o sujetos que requieren un largo razonamiento «. El modelo ha superado a OpenAI’s O1 en marcos específicos como SWE-Bench al abordar desafíos de codificación complejos.
Claude Ai ahora puede reflejar tu estilo de escritura perfectamente
Código Claude
La compañía ha introducido Claude Code, una nueva herramienta diseñada para ayudar con las tareas de codificación impulsadas por la IA, que funciona bien en escenarios complejos. «El modelo ya es bueno para codificar», agregó Penn. «[But] El pensamiento adicional sería bueno para los casos que podrían requerir una planificación muy compleja, digamos que está viendo una base de código extremadamente grande para una empresa «.

Claude 3.7 Sonnet está disponible en todos los planes de Claude, libres, profesionales, equipos y empresas, así como a través de la API antrópica, el rock de Amazon y la IA de vértices de Google Cloud. El modelo mantiene la misma estructura de precios que sus predecesores: $ 3 por millón de tokens de entrada y $ 15 por millón de tokens de salida, lo que incluye tokens de pensamiento.
Anthrope ha desarrollado el soneto Claude 3.7 con una filosofía que integra el razonamiento como un componente central del modelo. Funciona tanto como un LLM ordinario actualizado como un modelo de razonamiento, lo que permite a los usuarios elegir cuando desean respuestas directas o respuestas más largas y reflexivas. En el modo de pensamiento extendido, Claude 3.7 refina sus respuestas, mejorando el rendimiento en las tareas en matemáticas, física, seguimiento de instrucciones y codificación.
Usando el soneto Claude 3.7 a través de la API, los usuarios pueden controlar su presupuesto de «pensamiento» especificando un número máximo de tokens. Esta flexibilidad permite a los usuarios priorizar la velocidad versus la calidad del resultado.
Las evaluaciones recientes de Claude indican liderazgo en las capacidades de codificación en múltiples plataformas. Cursor reconoció a Claude como el mejor de su clase para las tareas de codificación del mundo real, con avances en la administración de bases de código intrincadas. Cognition informó un rendimiento superior en las alteraciones del código de planificación, mientras que Vercel no señaló su precisión en la navegación de flujos de trabajo de agentes complejos. La presentación de replicación ha empleado efectivamente a Claude para el desarrollo de aplicaciones web sofisticadas, y las pruebas realizadas por Canva revelaron que Claude ofrece un código listo para la producción con calidad de diseño mejorada y significativamente menos errores.
Claude Code, actualmente en una vista previa de investigación limitada, funciona como una herramienta de colaboración que puede leer, editar código, ejecutar pruebas e interactuar con GitHub, optimizar el proceso de codificación. Las primeras pruebas han demostrado que el código Claude puede realizar tareas en una sola sesión que generalmente requieren un esfuerzo manual extenso. Las mejoras futuras se centrarán en la confiabilidad de las herramientas, el soporte de comandos largos y el rendimiento mejorado.
Anthrope ha enfatizado su compromiso de desarrollar el soneto Claude 3.7 con un enfoque en la seguridad, la seguridad y la confiabilidad. Claude 3.7 ha hecho distinciones discernibles entre las solicitudes benignas y dañinas, logrando una reducción del 45% en rechazos innecesarios en comparación con su predecesor. La tarjeta del sistema que acompaña detalla las evaluaciones de seguridad que podrían beneficiar a otras iniciativas de investigación de IA y aborda los riesgos emergentes, incluidos los ataques de inyección inmediatos.
Claude 3.7 Sonnet y Claude Code representan avances significativos hacia los sistemas de IA que pueden apoyar efectivamente las capacidades humanas mediante la integración del razonamiento profundo y la colaboración autónoma.
Crédito de la imagen destacada: antrópico