Los abogados de The New York Times y Daily News afirman que OpenAI eliminó inadvertidamente datos cruciales relacionados con su demanda de derechos de autor contra la empresa por el uso no autorizado de su contenido, según un TechCrunch informe. El incidente ocurrió después de que OpenAI aceptara brindar acceso a sus conjuntos de datos de capacitación para ayudar a los demandantes a verificar el uso de sus materiales protegidos por derechos de autor.
La demanda alega que OpenAI ha eliminado artículos de The New York Times y Daily News sin obtener permiso para entrenar sus modelos. En respuesta a la demanda, OpenAI proporcionó dos máquinas virtuales para que los abogados de los editores buscaran en sus datos de capacitación su contenido protegido por derechos de autor. Desde el 1 de noviembre, los equipos jurídicos han dedicado más de 150 horas a esta búsqueda. Sin embargo, el 14 de noviembre, los ingenieros de OpenAI borraron por error todos los datos de búsqueda almacenados en una de las máquinas virtuales, como se señala en una presentación presentada ante el Tribunal de Distrito de EE. UU. para el Distrito Sur de Nueva York.
Los intentos de OpenAI de recuperar los datos eliminados fueron en su mayoría exitosos, pero la pérdida de la estructura de carpetas y los nombres de los archivos inutilizaron los datos recuperados para rastrear dónde se incluyeron los artículos de los demandantes en la capacitación de la IA. La carta presentada por los abogados de los demandantes enfatizaba que tuvieron que reconstruir su trabajo, consumiendo muchos recursos y tiempo.
A pesar de la eliminación de datos, el abogado aclaró que no hay indicios de que el incidente haya sido intencionado. Expresaron su preocupación de que OpenAI esté en una posición ideal para buscar en sus propios conjuntos de datos, lo que indica la obligación de ayudar en la investigación de posibles infracciones de derechos de autor.
OpenAI acaba de hacer que macOS sea más inteligente con la compatibilidad con la aplicación ChatGPT
OpenAI sostiene que el uso de datos disponibles públicamente para entrenar sus modelos se considera «uso justo». La empresa sostiene que no necesita conceder licencias ni compensar estos contenidos, aunque se beneficie de sus productos de IA. No obstante, OpenAI ha celebrado acuerdos de licencia con varios editores, incluidos nombres destacados como Associated Press y Financial Times. Si bien los términos específicos de estos acuerdos siguen sin revelarse, se informa que Dotdash, uno de los socios, recibe al menos 16 millones de dólares al año.
OpenAI aún tiene que emitir una declaración sobre el incidente o sus implicaciones para su relación con los demandantes.
Crédito de la imagen destacada: Jonathan Kemper/Unsplash