Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the fast-indexing-api domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/buwemyhm/public_html/wp-includes/functions.php on line 6121

Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the health-check domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/buwemyhm/public_html/wp-includes/functions.php on line 6121
Operai podría haber entrenado su IA en libros robados - Dataconomy ES
Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
No Result
View All Result

Operai podría haber entrenado su IA en libros robados

byKerem Gülen
3 abril 2025
in Artificial Intelligence, News
Home Artificial Intelligence

Operai enfrenta acusaciones de capacitar a sus modelos de IA en material con derechos de autor sin permiso, como un nuevo papel alega que la compañía usó libros con paredes de pago de O’Reilly Media para capacitar a su modelo GPT-4O. El proyecto de divulgaciones de IA, una organización sin fines de lucro cofundada por Tim O’Reilly e Ilan Strauss, publicó el artículo.

Los modelos de IA funcionan como motores de predicción, patrones de aprendizaje de datos extensos como libros y películas para extrapolar de las indicaciones. Mientras que algunos laboratorios de IA están utilizando datos generados por IA a medida que disminuyen las fuentes del mundo real, la capacitación en datos puramente sintéticos conlleva riesgos, como impactar el rendimiento de un modelo.

La metodología del artículo, De-capasdetermina si un modelo distingue entre los textos de los humanos y Parafrases generadas por IA. Esto sugiere si el modelo tiene conocimiento previo de sus datos de capacitación. Los investigadores sondearon GPT-4O, GPT-3.5 Turbo y otros modelos Operai, utilizando 13,962 extractos de 34 libros en O’Reilly para estimar la probabilidad de inclusión en los conjuntos de datos de capacitación.

Los resultados indicaron que GPT-4O reconoció significativamente más contenido de libros O’Reilly O’Reilly que modelos más antiguos como GPT-3.5 Turbo. Según el artículo, GPT-4O Probablemente reconoce muchos libros no públicos de O’Reilly publicados antes de su fecha de corte de capacitación. O’Reilly no tiene un acuerdo de licencia con Openai, según el documento.

Los coautores reconocen que el método no es infalible y OpenAI podría haber recopilado extractos de las entradas ChatGPT de los usuarios. Otra advertencia es que los modelos OpenAI más recientes, incluido GPT-4.5, no fueron evaluados.

OpenAI, que aboga por las restricciones de derechos de autor más sueltas, ha buscado datos de capacitación de mayor calidad, contratando a los periodistas para ajustar los resultados del modelo. La compañía también tiene acuerdos de licencia con editores de noticias y ofrece mecanismos de exclusión para los propietarios de derechos de autor. Operai no ha comentado en el periódico.


Crédito de imagen destacado

Tags: chatgptopadai

Related Posts

Alphaevolve: Cómo la nueva IA de Google apunta a la verdad con la autocorrección

Alphaevolve: Cómo la nueva IA de Google apunta a la verdad con la autocorrección

15 mayo 2025
Tiktok está implementando textos alternativos generados por AI para una mejor acesibilidad

Tiktok está implementando textos alternativos generados por AI para una mejor acesibilidad

15 mayo 2025
La IA de YouTube ahora sabe cuándo estás a punto de comprar

La IA de YouTube ahora sabe cuándo estás a punto de comprar

15 mayo 2025
El CEO de Soundcloud admite que los términos de IA no eran lo suficientemente claros, emiten nuevos compromisos

El CEO de Soundcloud admite que los términos de IA no eran lo suficientemente claros, emiten nuevos compromisos

15 mayo 2025
¿Listo para un chatgpt que realmente te conozca?

¿Listo para un chatgpt que realmente te conozca?

14 mayo 2025
Lightricks presenta el modelo de video 13B LTX para la generación de videos HQ AI

Lightricks presenta el modelo de video 13B LTX para la generación de videos HQ AI

14 mayo 2025

Recent Posts

  • El impacto de las telas inteligentes en el rendimiento de la ropa táctica
  • Databricks apuesta grande en Postgres sin servidor con su adquisición de neón de $ 1 mil millones
  • Alphaevolve: Cómo la nueva IA de Google apunta a la verdad con la autocorrección
  • Tiktok está implementando textos alternativos generados por AI para una mejor acesibilidad
  • Trump obliga a Apple a repensar su estrategia de iPhone de la India

Recent Comments

No hay comentarios que mostrar.
Dataconomy ES

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.