ai
Imagen original de Mind Matters.

OpenAI enfrenta una demanda colectiva por privacidad de datos

Una nueva demanda contra OpenAI podría decidir si el uso por parte de la empresa de datos de capacitación extraídos del Internet público puede continuar.

OpenAI se enfrenta a una demanda colectiva federal donde se le acusa de apropiación indebida de información personal con fines de capacitación.

OpenAI, la empresa desarrolladora de ChatGPT, enfrenta una demanda colectiva federal presentada esta semana en California, donde se le acusa de apropiación indebida de información personal con fines de capacitación.

La demanda, presentada en el Distrito Norte de California, enumera 15 causas de acción. Entre estas, se encuentran incluidas las violaciones de la Ley de Abuso y Fraude Informático, la Ley de Privacidad de las Comunicaciones Electrónicas y varias leyes estatales de derechos del consumidor y agravios de derecho consuetudinario.

Los reclamos se centran en la idea de que OpenAI esencialmente “robó” la información privada de los demandantes y la usó para crear un producto de gran valor sin compensación. Así relata la denuncia:

OpenAI usó los datos robados para entrenar y desarrollar [ChatGPT] utilizando grandes modelos de lenguaje… y algoritmos de lenguaje profundo para analizar y generar un lenguaje similar al humano que puede usarse para una amplia gama de aplicaciones.

¿Contenido por y para el pueblo?

Al tomar datos del Internet público que, sin embargo, contenían información de identificación personal, sostienen los demandantes, OpenAI ha violado su privacidad. (Las identidades de los demandantes no se divulgaron completamente en la demanda, pues se solicitó permiso al tribunal para mantenerlos en privado, con la esperanza de evitar un “escrutinio intrusivo”).

Además de los daños monetarios, los demandantes solicitaron tomar una serie de medidas correctivas contra los supuestos crímenes de OpenAI. Entre estas medidas está el establecimiento de un consejo de IA independiente para la gobernanza y el acceso abierto a toda la información personal recopilada por OpenAI.

Datos públicos

Es muy probable que el caso confirme la suposición de que el uso de datos del Internet público para la capacitación en IA constituye un uso justo según la ley de derechos de autor de los EE. UU. Esto supondría que los creadores de IA como OpenAI no podrían ser considerados responsables por violar los derechos de autor.

Sin embargo, si bien esta denuncia no analiza en detalle el argumento del uso justo o fair use, una segunda demanda colectiva, esta iniciada por dos autores con sede en Massachusetts, alega más directamente violaciones de derechos de autor por parte de OpenAI con respecto al material de los autores que se utiliza para ayudar a entrenar a la IA.

Así lo explica la segunda demanda también presentada en el Tribunal de Distrito Norte de California.

Debido a que los Modelos de lenguaje de OpenAI no pueden funcionar sin la información expresiva extraída de los trabajos de los Demandantes (y otros) y retenida dentro de ellos, los Modelos de lenguaje de OpenAI en sí mismos están infringiendo trabajos derivados.