Anthropic ha anunciado el lanzamiento de dos nuevos modelos de IA: un Claude 3.5 Sonnet actualizado y un nuevo Claude 3.5 Haiku. El Claude 3.5 Sonnet actualizado ofrece mejoras generales, con mejoras significativas en las capacidades de codificación. El nuevo Claude 3.5 Haiku ofrece funciones avanzadas de IA a un precio asequible, igualando el rendimiento del modelo insignia anterior de Anthropic, Claude 3 Opus, manteniendo al mismo tiempo una velocidad y un costo similares a los de su predecesor.
Soneto de Claude 3.5
El Claude 3.5 Sonnet actualizado se basa en el éxito de su predecesor con un rendimiento mejorado en diversas tareas, especialmente en codificación. Anthropic ha destacado que Claude 3.5 Sonnet lidera las tareas de ingeniería de software, mostrando marcadas mejoras en benchmarks como SWE-bench Verificadodonde mejoró del 33,4% al 49,0%, superando a otros modelos del mercado.
El modelo también funcionó bien en el uso de herramientas agentes, mejorando las puntuaciones en el banco TAU del 62,6% al 69,2% en el ámbito minorista y del 36,0% al 46,0% en el ámbito de las aerolíneas. Según los primeros evaluadores como GitLab y Cognition, estas actualizaciones representan un avance sustancial para la codificación y automatización impulsadas por IA, con mejores capacidades de razonamiento y una latencia adicional mínima.
![Claude de Anthropic ahora puede usar una computadora 1 Claude de Anthropic ahora puede usar una computadora](https://dataconomy.com/wp-content/uploads/2024/10/claude-3-5-sonnet-haiku-computer-use_02.jpg)
Claude 3.5 Haiku
Claude 3.5 Haiku está diseñado para ofrecer un rendimiento de última generación manteniendo los costos bajos. El modelo obtiene una puntuación alta en puntos de referencia como SWE-bench Verified, logrando un 40,6%, lo que supera a muchos agentes que utilizan otros modelos de vanguardia, incluidos el Claude 3.5 Sonnet y el GPT-4o originales. El modelo tiene como objetivo servir aplicaciones que necesitan una IA rápida y confiable, como productos orientados al usuario y tareas que requieren experiencias personalizadas.
Anthropic lanzará Claude 3.5 Haiku a finales de este mes, inicialmente disponible como un modelo de solo texto con planes para admitir entrada de imágenes en el futuro. Estará disponible a través de la API de Anthropic, Amazon Bedrock y Vertex AI de Google Cloud.
Claude AI de Anthropic ahora está en tu iPad
El uso de la computadora está disponible como una versión beta pública experimental
Antrópico también tiene introducido una nueva característica experimental llamada “uso de computadora”, disponible en versión beta pública. Los desarrolladores pueden ordenar a Claude 3.5 Sonnet que use computadoras como un humano: mirando pantallas, moviendo cursores y escribiendo. Esta capacidad aún es experimental, con algunas limitaciones, pero desarrolladores como Replit y The Browser Company ya han comenzado a explorar cómo podría automatizar procesos complejos que involucran muchos pasos.
Esta característica tiene como objetivo enseñar a la IA habilidades informáticas generales, haciéndola más versátil para completar tareas que antes requerían herramientas personalizadas. Los desarrolladores pueden acceder a esta versión beta a través de la API de Anthropic y otras plataformas en la nube importantes. Si bien los primeros resultados son prometedores, Anthropic reconoce que la tecnología aún se está desarrollando, con desafíos para realizar algunas tareas informáticas comunes como desplazarse y arrastrar.
Empresas como Asana, Canva, Cognition y DoorDash están experimentando con las nuevas funciones, explorando el potencial de la IA para automatizar procesos que tradicionalmente requerían la participación humana. Las primeras pruebas realizadas por el Instituto de Seguridad de IA de EE. UU. y el Instituto de Seguridad del Reino Unido descubrieron que el Claude 3.5 Sonnet actualizado cumple con los estándares de seguridad de Anthropic y es adecuado para uso público.
Anthropic también aborda los riesgos potenciales asociados con la capacidad de la IA para interactuar con las computadoras. Para garantizar un despliegue responsable, la empresa ha implementado nuevas medidas de seguridad para identificar el uso indebido, incluidos clasificadores para detectar acciones potencialmente dañinas. Anthropic anima a los desarrolladores a utilizar la función beta para tareas de bajo riesgo mientras la tecnología madura.
El lanzamiento de Anthropic de los Claude 3.5 Sonnet y Claude 3.5 Haiku actualizados destaca el impulso de la compañía para expandir las capacidades de IA manteniendo normas de seguridad. La incorporación de capacidades experimentales de uso de computadoras representa un novedoso paso adelante en el potencial de la IA para realizar tareas de propósito general, brindando a los desarrolladores nuevas posibilidades para explorar.
Créditos de imagen: antrópico