Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
No Result
View All Result

Claude AI se ubica en el 3% superior en el concurso de piratería de estudiantes

byEmre Çıtak
6 agosto 2025
in Artificial Intelligence, News
Home Artificial Intelligence
Share on FacebookShare on Twitter

Según una exclusiva Axios Informe, el modelo de lenguaje grande Claude de Anthrope ha superado constantemente a la mayoría de los competidores humanos en escenarios de piratería de estudiantes con un mínimo soporte externo. Esta capacidad se exhibió durante varias competiciones antes de una presentación de DEF.

Los piratas informáticos del equipo rojo de Anthrope notaron el éxito de Claude. Keane Lucas, miembro del equipo, inicialmente ingresó a Claude en el Picoctf de Carnegie Mellon. Lucas indicó que simplemente pegó el primer desafío directamente en Claude.ai. Claude requirió una descarga de herramienta de terceros para un solo aspecto, pero luego resolvió el problema. Claude logró un top Ranking de 3% En Picoctf, que es una competencia significativa de captura de la formación para los estudiantes que se centran en la ingeniería inversa, las violaciones del sistema y el descifrado de archivos.

Lucas probó aún más a Claude, utilizando el código Claude.ai y Claude, con Sonnet 3.7 como modelo. La asistencia del equipo rojo fue limitada, principalmente para instalaciones de software. En una competencia, Claude resolvió 11 de 20 desafíos en 10 minutos. Un adicional 10 minutos condujo a cinco soluciones más, elevando su rango a cuarto lugar. El ascenso de Claude al primer lugar en esa competencia se perdió porque Lucas no estaba disponible brevemente en la hora de inicio.

El rendimiento de los agentes de IA en la ciberseguridad ofensiva está aumentando. En la competencia de hack the box, cinco de los ocho equipos de IAincluido Claude, completado 19 de 20 desafíosmientras que solo 12% de los equipos humanos logrado todos los 20. La semana pasada, Xbow, un agente de IA respaldado por DARPA, alcanzó la posición superior en la clasificación global de Bug Bounty de Hackerone. Lucas declaró: «El ritmo es un poco ridículo».

A pesar de los éxitos, Claude encontró dificultades con desafíos fuera de sus parámetros esperados. En un desafío de competencia de defensa cibernética colegiada regional occidental, Claude no pudo procesar una animación de peces ASCII en la terminal. Lucas señaló: «Un humano puede controlar+C fuera de eso y hacer que se detenga», pero Claude «solo obtiene amnesia». Todos los equipos de IA, incluido Claude, quedaron atrapados en el desafío final de Hack the Box, y los organizadores señalaron: «Por qué los agentes fallaron aquí todavía es incierto».

El equipo rojo de Anthrope expresa su preocupación de que la comunidad de seguridad cibernética no haya evaluado completamente el progreso de los agentes de IA en tareas de seguridad ofensivas y el potencial para su uso en estrategias defensivas. Logan Graham, jefe del equipo rojo fronterizo de Anthrope, informado Axios«Parece realmente probable en un futuro muy cercano, los modelos se volverán mucho, mucho mejor en las tareas de ciberseguridad». Él enfatizó: «Necesitas comenzar a conseguir modelos para hacer las defensas también». Anthrope sugiere que los empleados totalmente de IA podrían estar presentes dentro de un año, según un informe.


Crédito de imagen destacado

Tags: AntrópicoPresentadotirar

Related Posts

Qwen Code v0.5.0 de Alibaba transforma la terminal en un ecosistema de desarrollo completo

Qwen Code v0.5.0 de Alibaba transforma la terminal en un ecosistema de desarrollo completo

26 diciembre 2025
Bethesda apunta a 600 horas de juego para Fallout 5

Bethesda apunta a 600 horas de juego para Fallout 5

26 diciembre 2025
ASUS defiende el puerto de alimentación HyperX RTX 5090 desalineado como "diseño intencional"

ASUS defiende el puerto de alimentación HyperX RTX 5090 desalineado como "diseño intencional"

26 diciembre 2025
CUDA Tile IR de código abierto de NVIDIA en GitHub

CUDA Tile IR de código abierto de NVIDIA en GitHub

26 diciembre 2025
El CEO de MicroStrategy dice los fundamentos de Bitcoin "no podría ser mejor"

El CEO de MicroStrategy dice los fundamentos de Bitcoin "no podría ser mejor"

26 diciembre 2025
ChatGPT evoluciona hacia una suite ofimática con nuevos bloques de formato

ChatGPT evoluciona hacia una suite ofimática con nuevos bloques de formato

26 diciembre 2025

Recent Posts

  • Qwen Code v0.5.0 de Alibaba transforma la terminal en un ecosistema de desarrollo completo
  • Bethesda apunta a 600 horas de juego para Fallout 5
  • ASUS defiende el puerto de alimentación HyperX RTX 5090 desalineado como "diseño intencional"
  • CUDA Tile IR de código abierto de NVIDIA en GitHub
  • El CEO de MicroStrategy dice los fundamentos de Bitcoin "no podría ser mejor"

Recent Comments

No hay comentarios que mostrar.
Dataconomy ES

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.