El nuevo modelo Haiku 4.5 de Anthropic rivaliza con el Sonnet 4 a un tercio del precio

antrópico tiene liberado Claude Haiku 4.5, un pequeño modelo de IA con latencia optimizada. Iguala el rendimiento de codificación de Claude Sonnet 4 a más del doble de velocidad y un tercio del costo, y está disponible a través de API y socios en la nube. El modelo se dirige a aplicaciones con presupuestos de latencia ajustados y demandas de alto rendimiento, incluidos asistentes en tiempo real, automatización de atención al cliente y programación en pares. Anthropic posiciona a Haiku 4.5 como un reemplazo directo para Haiku 3.5 y Sonnet 4 en cargas de trabajo interactivas y sensibles a los costos. Según se informa, supera a Sonnet 4 en tareas de “uso de computadora”, que implican manipulación de GUI y navegador para productos como Claude para Chrome. El modelo también se describe como una mejora material de la capacidad de respuesta en Claude Code para proyectos de múltiples agentes y creación rápida de prototipos. En la jerarquía de modelos de Anthropic, Haiku 4.5 proporciona capacidades cercanas a la frontera con mayor rentabilidad. La empresa afirmó que su modelo Sonnet 4.5 sigue siendo la oferta de vanguardia y «el mejor modelo de codificación del mundo». Anthropic sugiere un patrón de orquestación en el que Sonnet 4.5 maneja una planificación compleja de varios pasos y un grupo de trabajadores de Haiku 4.5 ejecuta las subtareas en paralelo. Se recomienda este enfoque para equilibrar el razonamiento de alto nivel con una ejecución rentable y de alta velocidad para proyectos grandes o complejos. Los desarrolladores pueden acceder al modelo inmediatamente a través de la API de Anthropic con el identificador `claude-haiku-4-5`. También está disponible en Amazon Bedrock y Google Cloud Vertex AI, aunque Anthropic señala que la cobertura regional y los ID de modelo dentro de estas plataformas en la nube pueden actualizarse con el tiempo. El precio de la API es de 1 dólar por millón de tokens de entrada y 5 dólares por millón de tokens de salida. Para los flujos de trabajo que utilizan almacenamiento en caché de avisos, las tarifas se enumeran en $1,25 por millón de tokens de escritura y $0,10 por millón de tokens de lectura, lo que ofrece mayores reducciones de costos para consultas repetidas. https://www.youtube.com/watch?v=ccQSHQ3VGIc Anthropic publicó resultados de referencia con detalles de metodología, indicando que los datos muestran paridad de codificación con Sonnet 4 y un rendimiento superior en tareas de uso de computadora bajo sus estructuras de prueba. Los resultados incluyen:

SWE-bench verificado: 73,3 % de éxito en 50 pruebas, utilizando un andamiaje simple con dos herramientas (bash, ediciones de archivos), un presupuesto de pensamiento de 128 000, muestreo predeterminado y sin cálculo en el momento de la prueba.
Terminal-Banco: Un promedio de más de 11 ejecuciones con el agente Terminus-2, donde seis ejecuciones no tuvieron presupuesto de pensamiento y cinco tuvieron un presupuesto de pensamiento de 32K.
OSWorld-Verificado: Un promedio de cuatro ejecuciones con un máximo de 100 pasos, un presupuesto total de pensamiento de 128 000 y una configuración de 2 000 por paso.
OBJETIVO / MMMLU: Promedios de múltiples ejecuciones utilizando muestreo predeterminado y presupuestos de pensamiento de 128K.

La compañía aconseja que los usuarios repliquen las pruebas utilizando su propia orquestación, conjuntos de herramientas y presupuestos de pensamiento específicos antes de generalizar los resultados de rendimiento a sus propias aplicaciones. Claude Haiku 4.5 se publica bajo la licencia ASL-2. Según las pruebas internas de Anthropic, el modelo tiene una tasa de desalineación medida más baja que Sonnet 4.5 y Opus 4.1, lo que indica un perfil de seguridad diferente dentro del marco de evaluación de la empresa.

Crédito de imagen destacada