Liberaciones antrópicas Claude Sonnet 4.5 con codificación avanzada y capacidades de agente

La compañía de IA Anthrope ha lanzado Claude Sonnet 4.5, un nuevo modelo insignia que la compañía posiciona como el más capaz de codificar, construir agentes de IA complejos y usar sistemas informáticos, con ganancias significativas en razonamiento y matemáticas. El nuevo modelo está disponible ahora y está acompañado por un nuevo conjunto de herramientas de desarrollador y actualizaciones importantes en la línea de productos Claude.

Sonnet 4.5 características que se destacan

Según Anthrope’s blogel modelo logra el rendimiento de última generación en la evaluación verificada de SWE-Bench, un punto de referencia que mide las habilidades de codificación de software del mundo real. También muestra un rendimiento mejorado en el punto de referencia OSWorld, que prueba la capacidad de un modelo de IA para realizar tareas del mundo real en una computadora, como navegar en sitios web y llenar hojas de cálculo. La compañía también informa que los expertos en finanzas, derecho, medicina y STEM encontraron que el soneto 4.5 tiene un conocimiento y razonamiento específicos de dominio dramáticamente mejores en comparación con los modelos anteriores.

Nuevas herramientas para desarrolladores: el agente de Claude SDK

Junto con el nuevo modelo, Anthrope ha lanzado el Agente de Claude SDK. Este kit de desarrollo de software proporciona a los desarrolladores la misma infraestructura que la compañía utiliza para alimentar su producto de código Claude, lo que les permite construir sus propios agentes de IA personalizados. El SDK está diseñado para resolver desafíos comunes en el desarrollo de agentes, como administrar la memoria para tareas de larga duración, manejar sistemas de permisos y coordinar subagentes que trabajan hacia un objetivo compartido. https://www.youtube.com/watch?v=OXFVKBB7MCG

Actualizaciones de productos en todo el ecosistema de Claude

El lanzamiento de Sonnet 4.5 incluye varias actualizaciones significativas a los productos Claude existentes.

Código Claude: Introduce puntos de control que permiten a los usuarios guardar el progreso y volver a un estado anterior, una interfaz terminal renovada y una extensión de código nativo vs.
API de Claude: Agrega una nueva función de edición de contexto y una herramienta de memoria para ayudar a los agentes a ejecutar más tiempo y manejar tareas más complejas.
Aplicaciones de Claude: Los usuarios de los planes pagos ahora pueden ejecutar código y crear archivos, como hojas de cálculo, diapositivas y documentos, directamente dentro de sus conversaciones.
Claude para la extensión de Chrome: Ahora disponible para los usuarios de Max que previamente se unieron a la lista de espera.

Centrarse en la seguridad y la alineación

Anthrope afirma que Claude Sonnet 4.5 es su modelo más alineado hasta la fecha, con mejoras en la reducción de comportamientos indeseables como el engaño y la sycofancia. El modelo se libera bajo el marco de nivel de seguridad de IA de la compañía (ASL-3), que incluye salvaguardas como clasificadores diseñados para detectar entradas y resultados potencialmente peligrosos, particularmente aquellos relacionados con armas químicas, biológicas, radiológicas y nucleares (CBRN).

Imagina con Claude

Por un tiempo limitado, Anthrope ofrece una vista previa de investigación llamada «Imagine with Claude» para sus suscriptores Max. En esta demostración, el modelo genera software en tiempo real en respuesta a las solicitudes de los usuarios, sin código preescritado. Esta vista previa está diseñada para mostrar las capacidades de SON-NET 4.5 cuando se combina con la infraestructura correcta.

Disponibilidad y precios

Claude Sonnet 4.5 está disponible ahora a través de la API de Claude. El precio es el mismo que el modelo anterior de Claude Sonnet 4, a $ 3 por millón de tokens de entrada y $ 15 por millón de tokens de salida. Anthrope recomienda actualizar a Sonnet 4.5 para todos los usos, ya que proporciona un rendimiento mejorado para el mismo costo. https://www.youtube.com/watch?v=oz-alrj0ovg

Claude sonnet 4.5 vs chatgpt-5: ¿cuál debería usar para su próximo proyecto?

El lanzamiento de Claude Sonnet 4.5 ha intensificado la competencia a la vanguardia de la inteligencia artificial, desafiante directamente GPT-5. Si bien ambos modelos representan un desarrollo avanzado de IA, muestran fortalezas distintas, particularmente en los ámbitos de la codificación, las capacidades de agente y el rendimiento general.

De un vistazo: diferencias clave

Característica	Claude soneto 4.5	GPT-5
Resistencia principal	Codificación de agente, uso de la computadora y tareas autónomas de larga duración.	Inteligencia unificada, razonamiento avanzado y capacidades multimodales.
Swe-Bench Verificado	77.2% (estándar), 82% (alto computo).	72.8%.
Punto de referencia de Osworld	61.4%.	No especificado, pero el soneto 4.5 lidera el gráfico.
Herramientas para desarrolladores	Claude Agent SDK, extensión de código nativo vs, código Claude con puntos de control.	Accedido a través de API e integrado en productos como ChatGPT y Microsoft Copilot.
Características únicas	Puede operar de forma autónoma durante más de 30 horas. Características mejoradas de seguridad y alineación.	Sistema unificado que combina múltiples modelos de IA. Ajusta dinámicamente su enfoque de razonamiento basado en la complejidad de la tarea.

Codificación y enfoque de desarrollador

Claude Sonnet 4.5 se ha posicionado como el «mejor modelo de codificación del mundo». Este reclamo está justificado por su desempeño líder en varios puntos de referencia clave. En SWE-Bench verificado, que mide la capacidad de un modelo para resolver problemas de GitHub en el mundo real, el soneto 4.5 obtiene un impresionante 77.2%, superando el 72.8%de GPT-5. Con potencia informática adicional, la puntuación de Sonnet 4.5 salta al 82%. Además, en el banco terminal, una prueba de la capacidad de una IA para usar una interfaz de línea de comandos, el soneto 4.5 alcanzó una tasa de éxito del 50%, significativamente antes del 43.8% de GPT-5. Esto sugiere que para los desarrolladores y usuarios técnicos que necesitan una IA para realizar tareas complejas de varios pasos en un entorno terminal, Sonnet 4.5 tiene una ventaja clara. En contraste, GPT-5 se presenta como un poderoso modelo de codificación de uso general. Si bien establece nuevos puntos de referencia de última generación en el momento de su lanzamiento, el enfoque especializado de Sonnet 4.5 parece darle una ventaja en las tareas centradas en el desarrollador.

Capacidades de agente y uso de la computadora

Una característica destacada de Claude Sonnet 4.5 es su capacidad para funcionar como un agente autónomo de larga duración. Los informes indican que el modelo puede mantener el enfoque y el rendimiento en tareas complejas durante más de 30 horas, un aumento significativo de los modelos anteriores. Esta resistencia es crucial para las tareas que requieren un esfuerzo sostenido, como la refactorización de código a gran escala o el análisis de datos en profundidad. En el punto de referencia de OSWorld, que evalúa la capacidad de una IA para realizar tareas del mundo real en una computadora, Sonnet 4.5 ha tomado el primer lugar con una tasa de éxito del 61.4%. Esta competencia se demuestra aún más en sus capacidades de uso de herramientas, donde obtuvo un notable 98.0% en el dominio de telecomunicaciones de las evaluaciones de banquillo τ, casi duplicando el rendimiento de su predecesor y superando el GPT-5. GPT-5, por otro lado, está diseñado como un sistema unificado que puede cambiar de manera inteligente entre diferentes enfoques de razonamiento en función de la complejidad de la tarea. Esto le permite manejar una amplia variedad de tareas de manera eficiente, pero no enfatiza la misma autonomía de larga duración que el soneto 4.5.

Razonamiento, matemáticas y rendimiento general

En áreas de razonamiento general y matemáticas, la competencia está mucho más cerca. En la competencia de matemáticas de la escuela secundaria AIME 2025, Sonnet 4.5 logró un puntaje perfecto del 100% al usar Python, superando ligeramente el 99.6% de GPT-5. Para el razonamiento a nivel de posgrado, medido por el punto de referencia de diamantes GPQA, los modelos son altamente competitivos, con GPT-5 con una ligera ventaja. Los primeros informes de los usuarios y las pruebas prácticas sugieren que Sonnet 4.5 es notablemente más rápido …

Crédito de imagen destacado

Liberaciones antrópicas Claude Sonnet 4.5 con codificación avanzada y capacidades de agente

Related Posts

Qwen Code v0.5.0 de Alibaba transforma la terminal en un ecosistema de desarrollo completo

ChatGPT evoluciona hacia una suite ofimática con nuevos bloques de formato

Google NotebookLM presenta "Modo conferencia" para aprendizaje de IA de 30 minutos

Amazon agrega Angi, Expedia, Square y Yelp a Alexa+

Los robotaxis Waymo pueden tener el asistente de automóvil Gemini AI

Por qué NVIDIA se salta Intel 18A para sus chips AI de próxima generación

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Liberaciones antrópicas Claude Sonnet 4.5 con codificación avanzada y capacidades de agente

Sonnet 4.5 características que se destacan

Nuevas herramientas para desarrolladores: el agente de Claude SDK

Actualizaciones de productos en todo el ecosistema de Claude

Centrarse en la seguridad y la alineación

Imagina con Claude

Disponibilidad y precios

Claude sonnet 4.5 vs chatgpt-5: ¿cuál debería usar para su próximo proyecto?

De un vistazo: diferencias clave

Codificación y enfoque de desarrollador

Capacidades de agente y uso de la computadora

Razonamiento, matemáticas y rendimiento general

Related Posts

Qwen Code v0.5.0 de Alibaba transforma la terminal en un ecosistema de desarrollo completo

ChatGPT evoluciona hacia una suite ofimática con nuevos bloques de formato

Google NotebookLM presenta "Modo conferencia" para aprendizaje de IA de 30 minutos

Amazon agrega Angi, Expedia, Square y Yelp a Alexa+

Los robotaxis Waymo pueden tener el asistente de automóvil Gemini AI

Por qué NVIDIA se salta Intel 18A para sus chips AI de próxima generación

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Follow Us