EE. UU: New Media Alliance publica un informe sobre el uso de obras para entrenar las herramientas de inteligencia artificial

  • 28 Nov, 2023
  • Sofia Alphin Arevalo
Estados UnidosInteligencia ArtificialNew Media Allianceobras protegidas

Sofia Alphin Arevalo.

El 30 de octubre de 2023, News Media Alliance – organización representante de la industria de los medios en Estados Unidos -, publicó el informe titulado “Cómo el uso generalizado de obras protegidas para entrenar y alimentar sistemas generativos de inteligencia artificial constituye una infracción de derechos de autor y no se considera fair use” (White Paper: How the pervasive copying of expressive works to train and fuel generative artificial intelligence systems is copyright infringement and not a fair us) que tiene como objeto abordar el uso no autorizado de periódicos, revistas y medios digitales, para el entrenamiento de modelos de aprendizaje de Inteligencia Artificial (IA).

Según el informe, se evidencia que los desarrolladores han utilizado de manera no autorizada una gran cantidad de contenido protegido proveniente de noticias, revistas y medios digitales. Las cifras reveladas indican que el contenido utilizado es superior al disponible en la base de datos utilizada por Common Crawl, – organización sin fines de lucro que se dedica a recopilar y almacenar datos a gran escala de la web para ofrecerlos como un recurso público-.

El informe también destaca que los medios de comunicación ocupan el tercer lugar entre las fuentes más utilizadas por los desarrolladores para entrenar la IA. Según el análisis de datos, la mitad de los diez sitios web más destacados en el conjunto de entrenamiento pertenecen a medios de comunicación.

Por otro lado, el documento resalta que las empresas tecnológicas de IA sostienen la utilización no autorizada de contenido protegido basándose en el artículo 107 del Título 17 del Código de los Estados Unidos (Title 17 U.S. Code Copyright) sobre las excepciones del fair use. Este artículo permite el uso de una obra protegida perteneciente a otro titular sin autorización previa cuando, siendo necesario analizar de forma individual cada uno de los siguientes criterios, “el propósito y el carácter del uso de la obra; la naturaleza de la obra protegida por el derecho de autor; la cantidad y la sustancialidad de la parte utilizada en relación con su conjunto y, por último, el efecto del uso sobre el mercado potencial o el valor del trabajo protegido”.

Derivado de lo anterior, las empresas argumentan que el uso de estas obras no cumple con un propósito distinto al de las obras originales, ya que simplemente reproducen contenido protegido para imitar su expresión, sin agregar algo sustancialmente novedoso a la obra.

En contraste, el informe indica que la argumentación basada en el fair use busca invalidar los mercados de licencias ya establecidos para estas obras. Es decir, el uso no autorizado de noticias, revistas y medios digitales con fines de entrenamiento basados en el fair use se interpreta como una sustitución directa del propósito original de obtener licencias.

También señala que el entrenamiento de modelos de aprendizaje de IA tiene fines comerciales, contribuyendo al aumento de las valoraciones de las compañías tecnológicas a niveles significativos, por lo que no hay justificación convincente para permitir el uso no autorizado de obras creativas sin compensación adecuada a los titulares de los derechos.

Además, el informe indica que los resultados generados por los modelos de IA entran en competencia directa con el contenido protegido. En relación con lo anterior, el funcionamiento de los programas de IA va más allá de la simple tarea de ayudar a los usuarios a encontrar información original, como los buscadores de información, sino que pueden llegar a generar contenido que infringe los derechos de propiedad intelectual de los titulares de las obras originales.

Finalmente, el informe propone una serie de recomendaciones entre las que se incluye, que los desarrolladores deben ser transparentes y abiertos sobre el uso de obras protegidas en modelos de IA; la industria y los responsables políticos deben entender que el uso no autorizado de contenido protegido para entrenar IA constituye una infracción y, por último, los titulares de derechos de propiedad intelectual deben poder otorgar licencias para el uso de su contenido de manera eficiente y en términos justos.

 

Fuentes: News Media Alliance (White Paper: How the pervasive copying of expressive works to train and fuel generative artificial intelligence systems is copyright infringement and not a fair use).

Volver arriba