Un juez federal dictaminó que OpenAI debe revolucionar todas sus comunicaciones internas con abogados para explicar por qué eliminó dos enormes reservas de libros pirateados de una famosa “biblioteca fantasma” que se acusa a la empresa de tecnología de utilizar para formar ChatGPT.
Magistrado del Tribunal Federal de Manhattan, Ona Wang gobernado el lunes que las cambiantes razones del gigante tecnológico para eliminar los datos socavaron cualquier argumento de que esas razones podrían estar protegidas por el privilegio abogado-cliente.
“OpenAI sigue afirmando que no tiene Infringir deliberadamente las obras protegidas por derechos de autor de los demandantes del grupo.. Un jurado tiene derecho a conocer la base de la supuesta buena fe de OpenAI”, escribió Wang en su fallo de 28 páginas. “Lo que importa es que OpenAI ha puesto en duda su estado de ánimo, y OpenAI no puede utilizar selectivamente el privilegio abogado-cliente para restringir de esta manera la investigación de las pruebas por parte de los demandantes colectivos sobre la supuesta buena fe de OpenAI”.
El juez está supervisando una demanda colectiva masiva contra Microsoft y OpenAI, que incluye las noticias diarias, periódicos afiliados a Tribune Publishing y MediaNews Group y otros medios de comunicación que acusan al gigante tecnológico de infracción de derechos de autor.
El fallo de Wang del lunes se centra en un grupo de demandantes que incluye a Gremio de Autores y una larga lista de escritores exitosos como “Un juego de tronos” El escriba George RR Martin y el autor de thriller legal John Grisham. Los autores afirman que OpenAI utilizó libros pirateados de la famosa biblioteca en línea “LibGen”, que dos tribunales ordenaron su cierre durante la última década, para entrenar sus productos de inteligencia artificial, después de que un empleado los descargara en 2018.
Durante el proceso de descubrimiento, los demandantes descubrieron que OpenAI eliminó los dos tesoros, llamados “Libros1” y “Libros2”, en 2022 (que se cree que contienen más de 100.000 libros), un año antes de que comenzara cualquier litigio.
“En ese momento, OpenAI afirmó que los conjuntos de datos se habían eliminado por “falta de uso”. Estos son los únicos conjuntos de datos de entrenamiento que, según OpenAI, se han eliminado alguna vez”, escribió Wang. “Posteriormente, cuando los demandantes del grupo buscaron conocer los motivos de la eliminación de los conjuntos de datos Books1 y Books2, OpenAI afirmó el privilegio abogado-cliente. La posición de OpenAI sobre si los motivos de la eliminación son privilegiados ha cambiado varias veces”.
Wang ordena a OpenAI que entregue a los demandantes las comunicaciones que ya revisó, todas las demás comunicaciones escritas con los abogados internos de la compañía sobre por qué se eliminaron los conjuntos de datos, así como cualquier referencia interna a LibGen que OpenAI haya redactado o retenido previamente.
Los equipos legales de Authors Guild y OpenAI no respondieron de inmediato a los mensajes en busca de comentarios.
Un portavoz de OpenAI dijo a Law360: “No estamos de acuerdo con la decisión y tenemos la intención de apelar”.



