Meta Platforms entrenó sus modelos de IA utilizando versiones pirateadas de libros protegidos por derechos de autor, con la aprobación de su director ejecutivo, Mark Zuckerberg.
Según documentos judiciales recientemente divulgados, un grupo de autores alega que el gigante de las redes sociales sabía que estaban utilizando trabajo pirateado para entrenar sus sistemas de inteligencia artificial.
En su presentación judicial, los autores dijeron que los documentos internos presentados por Meta durante el proceso de descubrimiento mostraban que la empresa de redes sociales conocía los libros pirateados. Según The Guardian , su director ejecutivo, Zuckerberg, respaldó el uso del conjunto de datos LibGen, un enorme archivo de libros en línea. Esto fue a pesar de las advertencias dentro del equipo ejecutivo de IA de la compañía de que se trata de un conjunto de datos que "sabemos que es pirateado".
El autor estadounidense Ta-Nehisi Coates, la comediante Sarah Silverman y otros escritores que demandaron a la compañía por infracción de derechos de autor hicieron las acusaciones en presentaciones que se hicieron públicas el miércoles en un tribunal federal de California.
Los autores llevaron a Meta a los tribunales en 2023 por acusaciones de que la empresa de redes sociales estaba haciendo un mal uso de sus libros para entrenar modelos de inteligencia artificial, específicamente Llama, su modelo de lenguaje de gran tamaño que impulsa sus chatbots.
Originario de Rusia, el conjunto de datos Library Genesis o LibGen es una "biblioteca en la sombra" que afirma contener millones de novelas, libros de notificaciones y artículos de revistas científicas.
En 2024, un tribunal federal de Nueva York pidió a los operadores anónimos de LibGen que pagaran a un grupo de editores 30 millones de dólares en daños y perjuicios por infracción de derechos de autor.
Este es uno de los muchos otros que alegan que se utilizó trabajo protegido por derechos de autor de autores, artistas y otras personas para entrenar herramientas de inteligencia artificial generativa como el chatbot ChatGPT sin el consentimiento de los propietarios. Los profesionales creativos han advertido que utilizar su trabajo sin su consentimiento pone en peligro sus modelos de negocio.
Según Reuters , los acusados, sin embargo, han argumentado que hicieron un uso legítimo del material protegido por derechos de autor.
En el caso Meta, los autores habrían pedido permiso al tribunal el miércoles para presentar una denuncia actualizada. En sus argumentos, indicaron que nueva evidencia mostraba que las empresas de redes sociales utilizaron el conjunto de datos de entrenamiento de IA LibGen, que incluye millones de obras pirateadas, y lo distribuyeron a través de torrents de igual a igual.
Según ellos, Zuckerberg "aprobó el uso por parte de Meta del conjunto de datos LibGen a pesar de las preocupaciones dentro del equipo ejecutivo de IA de Meta (y otros en Meta) de que LibGen es 'un conjunto de datos que sabemos que está pirateado'".
La presentación también cita un memorando que hacía referencia a las iniciales de Zuckerberg, señalando que "después de la escalada a MZ", el equipo de IA de Meta "ha sido aprobado para usar LibGen".
El año pasado, un juez de distrito de EE.UU., Vince Chhabria, desestimó las acusaciones de que el texto generado por los modelos de IA de Meta infringía los derechos de autor de los autores y de que Meta había despojado ilegalmente de la información de gestión de derechos de autor de los libros. Esto se refiere a información sobre la obra, incluido el título, el nombre del autor y el propietario de los derechos de autor.
Sin embargo, se permitió a los demandantes modificar sus reclamaciones. En sus argumentos de esta semana, los autores dijeron que la evidencia reforzaba sus reclamos de infracción y justificaba revivir su caso de información de gestión de derechos de autor agregando una nueva acusación de fraude informático.
Durante una audiencia el jueves, el juez dijo que permitiría a los autores presentar una denuncia enmendada, aunque se mostraba escéptico sobre los méritos de las acusaciones de fraude.
Consiga un trabajo Web3 bien remunerado en 90 días: la hoja de ruta definitiva