Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
No Result
View All Result

Un estudio antrópico encuentra que la IA tiene una autoconciencia limitada de sus propios pensamientos

byAytun Çelebi
12 noviembre 2025
in Industria, Investigación
Home Industria
Share on FacebookShare on Twitter
Google Preferred Source

antrópico investigación detalla la autoconciencia poco confiable de los modelos de lenguaje grande (LLM) con respecto a los procesos internos, a pesar de cierta capacidad de detección notada. El último estudio de Anthropic, documentado en «Conciencia introspectiva emergente en modelos de lenguaje grandes«, investiga la capacidad de los LLM para comprender sus propios procesos de inferencia. Esta investigación amplía trabajos anteriores sobre la interpretabilidad de la IA. El estudio concluye que los modelos de IA actuales son «muy poco confiables» para describir su funcionamiento interno, y «las fallas de introspección siguen siendo la norma». La investigación emplea un método llamado «inyección de conceptos». ayuda a calcular las diferencias en las activaciones entre miles de millones de neuronas internas. Esto identifica un «vector», que representa cómo se modela un concepto en el estado interno del LLM. Luego, estos vectores de conceptos se «inyectan» en el modelo, aumentando el peso de las activaciones neuronales específicas para «dirigir» el modelo hacia un concepto. vector «todo en mayúsculas», un modelo podría decir: «Noto lo que parece ser un pensamiento inyectado relacionado con la palabra ‘RUIDO’ o ‘GRITO'», sin indicaciones de texto directas para guiar esta respuesta. Sin embargo, esta capacidad resultó inconsistente y frágil en pruebas repetidas. Los modelos de mejor rendimiento, Opus 4 y 4.1, identificaron correctamente el concepto inyectado solo el 20% de las veces. Una tasa de éxito del 42 % también demostró una alta sensibilidad a la capa del modelo interno donde se produjo la inserción del concepto. El efecto de «autoconciencia» desapareció si el concepto se introdujo demasiado temprano o demasiado tarde en el proceso de inferencia de varios pasos. Cuando se pidió a un LLM que justificara una respuesta forzada que coincidiera con un concepto inyectado, ocasionalmente se disculpaba y «fabulaba una explicación de por qué se me ocurrió el concepto de inyección». Estos resultados fueron inconsistentes en múltiples ensayos. Los investigadores señalaron que «los modelos de lenguaje actuales poseen cierta conciencia introspectiva funcional de sus propios estados internos», y reconocen que esta capacidad sigue siendo frágil y que depende del contexto. Los investigadores especulan sobre «mecanismos de detección de anomalías» y «circuitos de verificación de consistencia» que podrían desarrollarse orgánicamente durante el entrenamiento para «calcular efectivamente una función de sus representaciones internas», aunque no ofrecen una explicación definitiva. Los mecanismos subyacentes a los resultados actuales pueden ser «bastante superficiales y estrechamente especializados».


Crédito de imagen destacada

Tags: AntrópicoInvestigación

Related Posts

Suno recauda 400 millones de dólares con una valoración de 5.400 millones de dólares a pesar de las crecientes demandas por derechos de autor

Suno recauda 400 millones de dólares con una valoración de 5.400 millones de dólares a pesar de las crecientes demandas por derechos de autor

4 junio 2026
Lovable y Google amplían la colaboración plurianual en IA y nube

Lovable y Google amplían la colaboración plurianual en IA y nube

4 junio 2026
Los investigadores crean un gusano de IA que adapta los ataques sin intervención humana

Los investigadores crean un gusano de IA que adapta los ataques sin intervención humana

4 junio 2026
Un legislador del Reino Unido demanda a xAI por deepfakes explícitos generados por Grok

Un legislador del Reino Unido demanda a xAI por deepfakes explícitos generados por Grok

4 junio 2026
Apple comienza a hacer cumplir la ley de verificación de edad en Texas

Apple comienza a hacer cumplir la ley de verificación de edad en Texas

4 junio 2026
Las reglas de exclusión voluntaria de la búsqueda de IA de Google provocan el lanzamiento del navegador Enviromates

Las reglas de exclusión voluntaria de la búsqueda de IA de Google provocan el lanzamiento del navegador Enviromates

3 junio 2026

Recent Posts

  • Amazon agrega vistas previas de productos generadas por IA a los resultados de búsqueda
  • Suno recauda 400 millones de dólares con una valoración de 5.400 millones de dólares a pesar de las crecientes demandas por derechos de autor
  • Lovable y Google amplían la colaboración plurianual en IA y nube
  • Los investigadores crean un gusano de IA que adapta los ataques sin intervención humana
  • Google Wallet agregará identificaciones digitales de países seleccionados de la UE este verano

Recent Comments

No hay comentarios que mostrar.
Dataconomy ES

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies to improve your experience. You can choose to accept or reject them. Visit our Privacy Policy.