Los ejecutivos de NVIDIA autorizaron el uso de millones de libros pirateados de Anna's Archive para la formación en IA, según una demanda colectiva ampliada. La demanda, que cita documentos internos de NVIDIA, alega que la empresa se puso en contacto con Anna's Archive para obtener acceso de alta velocidad a sus datos. NVIDIA se ha beneficiado del auge de la inteligencia artificial, con un aumento de los ingresos debido a la alta demanda de sus chips de aprendizaje de IA y servicios de centro de datos. NVIDIA desarrolla sus propios modelos de IA, incluidos NeMo, Retro-48B, InstructRetro y Megatron. Estos modelos se entrenan utilizando hardware NVIDIA y grandes bibliotecas de texto, de manera similar a las prácticas de otras empresas de tecnología. La empresa ha enfrentado desafíos legales por parte de los titulares de derechos de autor con respecto a sus metodologías de capacitación. Los autores demandaron por primera vez a NVIDIA a principios de 2024 por infracción de derechos de autor, alegando que los modelos de inteligencia artificial de la compañía fueron entrenados en el conjunto de datos Books3, que incluía obras protegidas por derechos de autor de Bibliotik sin permiso. NVIDIA defendió sus acciones como uso legítimo, afirmando que los libros son correlaciones estadísticas con sus modelos de IA. Sin embargo, durante el descubrimiento surgieron nuevas pruebas. Los demandantes presentaron una demanda enmendada el viernes pasado, ampliando el alcance de la demanda al agregar más libros, autores y modelos de inteligencia artificial. La queja enmendada incluye reclamos más amplios de «biblioteca en la sombra». Los autores, incluido Abdi Nazemian, ahora citan correos electrónicos y documentos internos de NVIDIA, alegando que la compañía descargó voluntariamente millones de libros con derechos de autor. La denuncia afirma que «las presiones competitivas llevaron a NVIDIA a la piratería», lo que implica la colaboración con Anna's Archive. Según la denuncia enmendada, un miembro del equipo de estrategia de datos de NVIDIA se puso en contacto con Anna's Archive para preguntar sobre la adquisición de sus materiales pirateados para el entrenamiento previo de grandes modelos de lenguaje, incluido Anna's Archive. La denuncia afirma que Anna's Archive cobró decenas de miles de dólares por el «acceso de alta velocidad» a sus colecciones, y NVIDIA buscó detalles sobre este acceso. La denuncia alega que Anna's Archive advirtió a NVIDIA que el contenido de su biblioteca fue adquirido y mantenido ilegalmente. Según se informa, Anna's Archive pidió a los ejecutivos de NVIDIA permiso interno para proceder, el cual fue concedido en el plazo de una semana. Después de recibir el permiso de la dirección de NVIDIA, Anna's Archive proporcionó acceso a sus libros pirateados. Anna's Archive ofreció a NVIDIA acceso a aproximadamente 500 terabytes de datos, incluidos millones de libros que normalmente están disponibles a través del sistema de préstamo digital de Internet Archive. La denuncia no especifica si NVIDIA pagó a Anna's Archive. NVIDIA también enfrenta acusaciones de utilizar otras fuentes pirateadas, incluidas LibGen, Sci-Hub y Z-Library, además de la base de datos Books3. Los autores alegan que NVIDIA no solo descargó y utilizó libros pirateados para su capacitación en inteligencia artificial, sino que también distribuyó scripts y herramientas que permitieron a los clientes corporativos descargar «The Pile», que contiene el conjunto de datos pirateados de Books3. Estas acusaciones introducen nuevas acusaciones de infracción indirecta y contributiva, afirmando que NVIDIA generó ingresos de los clientes al facilitar el acceso a estos conjuntos de datos pirateados. Los autores buscan una compensación por daños y perjuicios para los autores nombrados y potencialmente para cientos de personas más que se unen a la demanda colectiva. Esta revelación marca la primera divulgación pública de correspondencia entre una importante empresa tecnológica estadounidense y Anna's Archive. La primera denuncia consolidada y enmendada, archivado en el Tribunal de Distrito de los Estados Unidos para el Distrito Norte de California, nombra a los autores Abdi Nazemian, Brian Keene, Stewart O'Nan, Andre Dubus III y Susan Orlean.




