EE. UU: New Media Alliance publica un informe sobre el uso de obras para entrenar las herramientas de inteligencia artificial

28 Nov, 2023

Sofia Alphin Arevalo

Sofia Alphin Arevalo.

El 30 de octubre de 2023, News Media Alliance – organización representante de la industria de los medios en Estados Unidos -, publicó el informe titulado “Cómo el uso generalizado de obras protegidas para entrenar y alimentar sistemas generativos de inteligencia artificial constituye una infracción de derechos de autor y no se considera fair use” (White Paper: How the pervasive copying of expressive works to train and fuel generative artificial intelligence systems is copyright infringement and not a fair us) que tiene como objeto abordar el uso no autorizado de periódicos, revistas y medios digitales, para el entrenamiento de modelos de aprendizaje de Inteligencia Artificial (IA).

Según el informe, se evidencia que los desarrolladores han utilizado de manera no autorizada una gran cantidad de contenido protegido proveniente de noticias, revistas y medios digitales. Las cifras reveladas indican que el contenido utilizado es superior al disponible en la base de datos utilizada por Common Crawl, – organización sin fines de lucro que se dedica a recopilar y almacenar datos a gran escala de la web para ofrecerlos como un recurso público-.

El informe también destaca que los medios de comunicación ocupan el tercer lugar entre las fuentes más utilizadas por los desarrolladores para entrenar la IA. Según el análisis de datos, la mitad de los diez sitios web más destacados en el conjunto de entrenamiento pertenecen a medios de comunicación.

Por otro lado, el documento resalta que las empresas tecnológicas de IA sostienen la utilización no autorizada de contenido protegido basándose en el artículo 107 del Título 17 del Código de los Estados Unidos (Title 17 U.S. Code Copyright) sobre las excepciones del fair use. Este artículo permite el uso de una obra protegida perteneciente a otro titular sin autorización previa cuando, siendo necesario analizar de forma individual cada uno de los siguientes criterios, “el propósito y el carácter del uso de la obra; la naturaleza de la obra protegida por el derecho de autor; la cantidad y la sustancialidad de la parte utilizada en relación con su conjunto y, por último, el efecto del uso sobre el mercado potencial o el valor del trabajo protegido”.

Derivado de lo anterior, las empresas argumentan que el uso de estas obras no cumple con un propósito distinto al de las obras originales, ya que simplemente reproducen contenido protegido para imitar su expresión, sin agregar algo sustancialmente novedoso a la obra.

En contraste, el informe indica que la argumentación basada en el fair use busca invalidar los mercados de licencias ya establecidos para estas obras. Es decir, el uso no autorizado de noticias, revistas y medios digitales con fines de entrenamiento basados en el fair use se interpreta como una sustitución directa del propósito original de obtener licencias.

También señala que el entrenamiento de modelos de aprendizaje de IA tiene fines comerciales, contribuyendo al aumento de las valoraciones de las compañías tecnológicas a niveles significativos, por lo que no hay justificación convincente para permitir el uso no autorizado de obras creativas sin compensación adecuada a los titulares de los derechos.

Además, el informe indica que los resultados generados por los modelos de IA entran en competencia directa con el contenido protegido. En relación con lo anterior, el funcionamiento de los programas de IA va más allá de la simple tarea de ayudar a los usuarios a encontrar información original, como los buscadores de información, sino que pueden llegar a generar contenido que infringe los derechos de propiedad intelectual de los titulares de las obras originales.

Finalmente, el informe propone una serie de recomendaciones entre las que se incluye, que los desarrolladores deben ser transparentes y abiertos sobre el uso de obras protegidas en modelos de IA; la industria y los responsables políticos deben entender que el uso no autorizado de contenido protegido para entrenar IA constituye una infracción y, por último, los titulares de derechos de propiedad intelectual deben poder otorgar licencias para el uso de su contenido de manera eficiente y en términos justos.

Fuentes: News Media Alliance (White Paper: How the pervasive copying of expressive works to train and fuel generative artificial intelligence systems is copyright infringement and not a fair use).

Cookie	Duración	Descripción
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Actualidad

EE. UU: New Media Alliance publica un informe sobre el uso de obras para entrenar las herramientas de inteligencia artificial