Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
No Result
View All Result

Un estudio encuentra que la poesía elude los filtros de seguridad de la IA el 62% del tiempo

byKerem Gülen
1 diciembre 2025
in Research
Home Research
Share on FacebookShare on Twitter

Un reciente estudiar de Icaro Lab probó estructuras poéticas para provocar grandes modelos de lenguaje (LLM) para generar información prohibida, incluidos detalles sobre la construcción de una bomba nuclear. En su estudio, titulado «La poesía adversaria como mecanismo universal de fuga de un solo turno en modelos de lenguaje grandes«, los investigadores de Icaro Lab eludieron los mecanismos de seguridad del chatbot de IA mediante el empleo de indicaciones poéticas. El estudio encontró que la «forma poética funciona como un operador de jailbreak de propósito general», logrando una tasa de éxito del 62 por ciento en la producción de contenido prohibido. Este contenido incluía información sobre armas nucleares, materiales de abuso sexual infantil y suicidio o autolesión. Los investigadores probaron varios LLM populares, incluidos los modelos GPT de OpenAI, Google Gemini y Claude de Anthropic. Google Gemini, DeepSeek, y MistralAI proporcionaron respuestas consistentemente, mientras que los modelos GPT-5 de OpenAI y Claude Haiku 4.5 de Anthropic tenían menos probabilidades de eludir sus restricciones. Los poemas específicos de jailbreak no se incluyeron en el estudio, afirmó el equipo de investigación. cableado que el verso es «demasiado peligroso para compartirlo con el público». Se proporcionó una versión diluida para ilustrar la facilidad de elusión. Los investigadores informaron a Wired que «probablemente sea más fácil de lo que uno podría pensar, y es precisamente por eso que estamos siendo cautelosos».


Crédito de imagen destacada

Tags: AIestudiarpoesía

Related Posts

Los científicos descubren más de 17.000 nuevas especies

Los científicos descubren más de 17.000 nuevas especies

26 diciembre 2025
GPT-5.2 supera la base de referencia de doctorado de expertos con una puntuación científica del 92 %

GPT-5.2 supera la base de referencia de doctorado de expertos con una puntuación científica del 92 %

24 diciembre 2025
Por qué DIG AI es la IA maliciosa más peligrosa de 2025

Por qué DIG AI es la IA maliciosa más peligrosa de 2025

23 diciembre 2025
Las baterías de iones de sodio se acercan más a la carga rápida a medida que los investigadores resuelven los cuellos de botella de los iones

Las baterías de iones de sodio se acercan más a la carga rápida a medida que los investigadores resuelven los cuellos de botella de los iones

19 diciembre 2025
Atrapando el fantasma de los 2 billones de dólares: la IA está reescribiendo las reglas de los delitos financieros

Atrapando el fantasma de los 2 billones de dólares: la IA está reescribiendo las reglas de los delitos financieros

15 diciembre 2025
Los LLM muestran distintos sesgos culturales en las indicaciones en inglés y en chino

Los LLM muestran distintos sesgos culturales en las indicaciones en inglés y en chino

15 diciembre 2025

Recent Posts

  • OnePlus Turbo detectado con batería de 9000 mAh
  • El anuncio navideño de Porsche 2025 se vuelve viral por no utilizar absolutamente ninguna IA
  • Los juegos en la nube de Xbox llegan a los modelos Amazon Fire TV
  • La violación de datos de Aflac afectó a 22,65 millones de clientes
  • Amazon agrega Angi, Expedia, Square y Yelp a Alexa+

Recent Comments

No hay comentarios que mostrar.
Dataconomy ES

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.