Internet Archive ha perdido una importante batalla legal después de que el Tribunal de Apelaciones de Estados Unidos confirmara una decisión en Hachette v. Internet Archive, afirmando que sus prácticas de digitalización y préstamo de libros violaban la ley de derechos de autor. El caso surgió de la iniciativa Biblioteca Nacional de Emergencia del Archivo durante la pandemia, que permitió el préstamo digital sin restricciones de libros, lo que provocó la reacción negativa de editores y autores. El tribunal rechazó la defensa del uso justo del Archivo, aunque reconoció su condición de organización sin fines de lucro. Este fallo fortalece el control de los autores y editores sobre sus obras. Pero inmediatamente me recuerda cómo las herramientas de inteligencia artificial entrenan y utilizan datos en Internet, incluidos libros y más. Si el trabajo de la organización sin fines de lucro Internet Archive no es un uso justo, ¿cómo utilizan estos datos las herramientas de inteligencia artificial pagadas?
A pesar de numerosos Demandas por derechos de autor de IAdatos basados en texto de medios de comunicación Por lo general, no da lugar a decisiones duras contra las herramientas de IA, que a menudo terminan en asociaciones con actores principales.
Se podría pensar que es diferente y argumentar que Internet Archive utiliza libros directamente, pero aunque las herramientas de IA se basan en todos los datos que tienen para generar su ensayo, aún puede obtener extractos específicos o respuestas más detalladas de ellas si utiliza un mensaje bien elaborado.
El caso Hachette v. Internet Archive pone de relieve importantes preocupaciones sobre la forma en que los modelos de IA adquieren datos de entrenamiento, especialmente cuando se trata de materiales protegidos por derechos de autor, como libros. Los sistemas de IA suelen depender de grandes conjuntos de datos, incluidos textos protegidos por derechos de autor, lo que plantea desafíos legales similares en relación con el uso sin licencia. Si los tribunales restringen la digitalización y el uso de obras protegidas por derechos de autor sin permiso, las empresas de IA pueden tener que obtener licencias para los textos utilizados en el entrenamiento, lo que sumará complejidad y posibles costos. Esto podría limitar el acceso a conjuntos de datos diversos y de alta calidad, lo que en última instancia afectará el desarrollo y la innovación de la IA.
Además, el caso subraya las limitaciones de la uso justo La defensa en el contexto del uso transformador, que suele ser fundamental para justificar el uso de datos textuales a gran escala por parte de la IA. Si los tribunales consideran de forma estricta lo que constituye un uso justo, los desarrolladores de IA podrían enfrentarse a más restricciones sobre cómo acceder y utilizar libros protegidos por derechos de autor. Esta tensión entre proteger los derechos de los autores y mantener el acceso abierto al conocimiento podría tener consecuencias de largo alcance para el futuro de las prácticas de entrenamiento de la IA y el uso ético de los datos.
¿Necesitas profundizar más en el caso? Aquí tienes todo lo que necesitas saber al respecto.
Explicación del caso Hachette contra Internet Archive
Hachette v. Internet Archive es un caso legal importante que se centra en la ley de derechos de autor y los límites de la doctrina del “uso justo” en el contexto de las bibliotecas digitales. El caso comenzó en 2020, cuando varias grandes editoriales (Hachette, HarperCollins, Penguin Random House y Wiley) demandaron a Internet Archive, una organización sin fines de lucro dedicada a preservar copias digitales de sitios web, libros y otros medios.
El caso se centró en la práctica del Archivo de escanear libros y prestarlos en línea.
La historia detrás de la demanda contra Internet Archive
El Biblioteca abierta El proyecto, dirigido por Internet Archive, se creó para permitir que la gente tomara prestados libros en formato digital. Así es como funcionaba:
- Internet Archive compró copias físicas de libros.
- Escanearon estos libros y los convirtieron en formato digital.
- La gente podía tomar prestada una versión digital, pero sólo una persona a la vez podía sacar prestado un libro, tal como si se tomara prestado un libro físico de una biblioteca normal.
El Archivo de Internet pensó que esto era legal porque sólo permitía que una persona tomara prestado un libro a la vez. Llamaron a este sistema Préstamos digitales controlados (CDL)La idea era hacer que el préstamo digital funcionara igual que el préstamo físico de la biblioteca.
Cuando la pandemia de COVID-19 golpeó a principios de 2020, muchas bibliotecas tuvieron que cerrar, lo que dificultó el acceso a los libros. Para ayudar, Internet Archive lanzó el Biblioteca Nacional de Emergencias (NEL) en marzo de 2020. Este programa cambió las cosas:
- La NEL permitió que varias personas tomaran prestada la misma copia digital de un libro al mismo tiempo, lo que eliminó la regla de que solo una persona podía tomar prestada la misma copia digital.
- El objetivo era brindar acceso a los libros a más personas durante la pandemia, especialmente a estudiantes e investigadores que estaban atrapados en casa.
Aunque la NEL se suponía que sería temporal, molestó a los autores y editores, quienes argumentaron que permitir que muchas personas tomaran prestada la misma copia digital sin permiso era como robarles su trabajo.
Revuelta de los editores
En junio de 2020, las grandes editoriales demandaron a Internet Archive. Afirmaban:
- El Internet Archive no tenía permiso para escanear sus libros ni prestarlos digitalmente.
- Al hacer esto, Internet Archive estaba violando sus derechos de autor, que le otorgan el derecho exclusivo de controlar cómo se copian y comparten sus libros.
- El enfoque de la NEL, que permitía a muchas personas tomar prestadas copias digitales a la vez, era especialmente perjudicial para su negocio y constituía esencialmente piratería.
Los editores argumentaron que las acciones de Internet Archive perjudicaban el mercado de sus libros. Dijeron que la gente estaba obteniendo versiones digitales gratuitas en lugar de comprar libros electrónicos o pedirlos prestados a bibliotecas autorizadas.
La defensa de Internet Archive
Internet Archive se defendió afirmando que su trabajo estaba protegido por uso justoEl uso legítimo permite el uso limitado de material protegido por derechos de autor sin permiso para fines educativos, de investigación y de comentarios. El Archivo señaló lo siguiente:
- Estaban proporcionando una Transformador servicio brindando a los lectores acceso a libros físicos en un nuevo formato digital.
- No obtenían ningún beneficio de ello, ya que son una organización sin fines de lucro cuya misión es preservar el conocimiento y hacerlo accesible.
- La NEL fue una respuesta temporal a la pandemia y estaban tratando de ayudar a las personas que no podían acceder a los libros durante la crisis.
También señalaron su Préstamos digitales controlados Sistema de préstamo de libros como forma de respetar las leyes de derechos de autor. Bajo el sistema de préstamo de libros, solo una persona podía tomar prestado un libro a la vez, como en una biblioteca física.
Las decisiones del tribunal
Sentencia del Tribunal de Distrito (marzo de 2023)
En marzo de 2023, un tribunal federal falló a favor de los editores. El juez John G. Koeltl dictaminó que las acciones de Internet Archive no estaban protegidas por el uso legítimo. Dijo:
- El préstamo digital del Internet Archive no fue Transformador Porque no añadían nada nuevo a los libros, simplemente los copiaban en formato digital, lo que no era suficiente para calificar como uso legítimo.
- El tribunal también determinó que el préstamo de libros por parte del Archivo perjudicaba el mercado de las versiones impresas y digitales de los libros. Al ofrecer copias digitales gratuitas, se consideraba que el Archivo de Internet competía con las ventas de libros electrónicos de las editoriales.
- El tribunal Concluido que el Archivo había creado obras derivadaslo que significa que hicieron nuevas versiones de los libros (copias digitales) sin permiso.
Sentencia del Tribunal de Apelaciones (agosto de 2023)
Internet Archive apeló la decisión ante un tribunal superior, el Tribunal de Apelaciones de Estados Unidos para el Segundo Circuito, con la esperanza de revocar el fallo. Sin embargo, el tribunal de apelaciones también falló a favor de los editores, pero hizo una aclaración importante:
- El tribunal reconoció que Internet Archive es una no lucrativo organización y no comercial. Esta distinción era importante porque el uso comercial a menudo puede debilitar una defensa de uso legítimo, pero en este caso, el tribunal reconoció que el Archivo no estaba motivado por el lucro.
- A pesar de ello, el tribunal estuvo de acuerdo en que las acciones del Archivo no estaban protegidas por el uso justo, a pesar de ser una organización sin fines de lucro.
En resumen
El caso Hachette v. Internet Archive ha demostrado que incluso las organizaciones sin fines de lucro como Internet Archive no pueden digitalizar y prestar libros libremente sin violar las leyes de derechos de autor. Esta sentencia también podría afectar la forma en que las empresas de IA utilizan materiales con derechos de autor para entrenar sus sistemas. Si las organizaciones sin fines de lucro enfrentan tales restricciones, las herramientas de IA podrían necesitar obtener licencias para los datos que utilizan. Incluso si ya las han obtenido. Empecé a hacer algunos tratosMe pregunto, ¿qué pasa con el primeras entradas?
Crédito de la imagen destacada: Eray Eliaçik/Bing