Para que ChatGPT, Gemini o Meta AI respondan bien a la ingente cantidad de preguntas que sus usuarios y usuarias le hacemos cada día, años antes las empresas que hay detrás tomaron una decisión: conseguir datos a toda costa y de donde fuera. Libros, artículos periodísticos, letras de canciones, ilustraciones, código fuente. Su premisa era clara: era mejor pedir perdón que pedir permiso.
Así que hoy los juzgados están llenos de demandas, miles de millones de dólares en juego y el modelo de negocio de la IA en el banquillo. Durante años, la piratería fue cosa de particulares bajándose películas. Ahora son las mayores empresas del mundo las que han hecho algo parecido, pero a gran escala y con una tecnología que estructuralmente la vulnera. Lo que decidan los jueces marcará cómo se construye la inteligencia artificial a partir de ahora.
Igual que tú te preparas mejor para un examen si además de coger el libro de clase, te vas a la biblioteca y te lees libros recomendados y amplías con otras lecturas asociadas con el tema que estés repasando, a los diferentes equipos de investigación detrás de los grandes modelos de IA se les ocurrió que con enormes datasets y de fuentes variadas el resultado era mejor. El problema es que ese tremendo volumen de datos no cae del cielo: lo cogieron de la web, de bibliotecas digitales y de repositorios LibGen o Z-Library. La defensa habitual de empresas como OpenAI es es el fair use y las excepciones de minería de texto y datos, asegurando que usan datos sin licencia de forma legítima. Así que los tribunales van caso por caso.
Si entrenar modelos de IA con contenido protegido es o no fair use es la cuestión de derechos de autor más importante a las que los tribunales se han enfrentado. En función del resultado, las empresas se enfrentan a un futuro negro: el abono de licencias de forma retroactiva, limpieza de bases de datos y por supuesto, cambiar cómo recopilan sus datos desde ya. Y tienen demandas para aburrir: más de 100 denuncias activas en junio de 2026, según el gráfico.
Es importante destacar que este gráfico hace referencia únicamente a los tribunales de Estados Unidos. Además, en Europa es otro cantar. El viejo continente tiene una normativa más restrictiva: exige eliminar los datos tras usarlos y permite a los creadores reservar sus derechos. La AI Act obliga a publicar qué datos se usaron en el entrenamiento, algo que las empresas han evitado de forma sistemática.
El gráfico en cuestión es obra de David McCandless para Information is Beautiful y lo ha elaborado a partir de datos de ChatGPTisEatingTheWorld.com, reportajes de Wired y noticias de referencia. Y su trabajo es meritorio: hablar de litigios no es fácil, pero él ha conseguido sintetizarlo en un único gráfico para saber quién demanda a quién en el mundo de la IA.
En el centro están las empresas tecnológicas demandadas y en el exterior, quienes demandan: desde escritores a medios pasando por plataformas y artistas. Cada categoría se representa con un color y cuanto más grande es el círculo, mayor es la empresa. Hay además un disclaimer: para que el gráfico se vea mejor, cuando un demandante tiene varias demandas abiertas, solo se muestra la del demandado principal. Vamos, que hay muchas más de las que vemos.
El mapa de los conflictos
A un lado, las empresas que construyeron los modelos de IA, como OpenAI, Google, Meta, Anthropic, NVIDIA y Perplexity, entre otros. A otro, demandantes de todo tipo que alegan que sus obras fueron usadas sin permiso ni compensación para entrenar sistemas que ahora se han vuelto su competencia. El resumen es que todas las grandes de empresas de IA están recibiendo demandas de casi todas las categorías creativas. Algunos grandes casos:
- Bartz vs. Anthropic. La empresa liderada por Dario Amodei acordó pagar 1.500 millones de dólares tras demostrarse que había descargado cientos de miles de libros de repositorios no oficiales. El tribunal validó el entrenamiento como fair use, pero no la forma de conseguirlos.
- Kadrey vs. Meta. La empresa de Mark Zuckerberg ganó en la parte de entrenamiento, pero sigue en juicio por haber distribuido contenido pirata.
- New York Times vs. OpenAI, aún en curso. El Times alega que ChatGPT reproduce sus artículos casi literalmente, sustituyendo la fuente original.
- Disney vs. Midjourney, aún en curso: Los grandes estudios de entretenimiento pelean contra la generación de imágenes.
- Concord, BMG y Universal vs. Anthropic, aún en curso. Las grandes discográficas míticas demandan por reproducir letras protegidas.
La Oficina de Derechos de Autor de EE.UU. publicó en mayo de 2025 un informe de 108 páginas concluyendo que no hay una respuesta universal: determinar si el uso de obras para entrenar IA es fair use requiere analizar cada caso por separado. Y ni todas las empresas son iguales ni todos los usos.
Lo que sí que está claro es que este sistema de «pedir perdón en lugar de permiso» tiene un precio: Anthropic ha demostrado que se puede salir airosa aún pagando 1.500 millones de dólares porque su valoración es de 183.000 millones de dólares. Así que la respuesta corta es que a día de hoy, le ha merecido la pena. La cuestión de fondo es si va a seguir habiendo un aluvión de demandas o si se van a fijar normas más claras sobre el uso de datos y va a haber alguien con mano firme y conocimientos para aplicarlas.
En Xataka | Quién está ganando realmente la carrera de la IA, en un gráfico que pone en aprietos a Google
Fuente informativa
#Quién #está #demandando #quién #mapa #los #juicios #explica #todo




