Ex empleado de OpenAI rompe el silencio y denuncia violaciones masivas de copyright

Filtraciones

Un ex investigador de OpenAI, la compañía líder en el desarrollo de inteligencia artificial, está denunciando las prácticas de entrenamiento de IA de la empresa, alegando que OpenAI violó la ley de derechos de autor para entrenar sus modelos de IA, y argumentando que el modelo comercial actual de OpenAI puede trastocar el negocio de Internet tal como lo conocemos, según informa The New York Times.

El ex empleado, un joven de 25 años llamado Suchir Balaji, trabajó en OpenAI durante cuatro años antes de decidir dejar la empresa de inteligencia artificial debido a preocupaciones éticas. Según Balaji, debido a que ChatGPT y otros productos de OpenAI se han comercializado tan intensamente, la práctica de OpenAI de extraer material en línea en masa para alimentar sus modelos de inteligencia artificial hambrientos de datos ya no satisface los criterios de la doctrina del uso justo. OpenAI, que actualmente enfrenta varias demandas por derechos de autor, incluido un caso de alto perfil presentado el año pasado por el NYT , ha argumentado lo contrario .

Suchir Balaji

«Si crees lo que yo creo», dijo Balaji al NYT , «tienes que dejar la empresa».

Las advertencias de Balaji, que describió en una publicación en su blog personal, se suman a la creciente controversia en torno a la recopilación y el uso de material con derechos de autor por parte de la industria de la IA para entrenar modelos de IA , que se llevó a cabo en gran medida sin una regulación gubernamental integral y fuera de la vista del público.

«Dado que la IA está evolucionando tan rápidamente», dijo el abogado de propiedad intelectual Bradley Hulbert al NYT , «es hora de que el Congreso de EE.UU. intervenga».

Balaji, que fue contratado en 2020, fue uno de los varios miembros del personal encargados de recopilar y organizar datos de capacitación recopilados en la web que, con el tiempo, se incorporarían a los grandes modelos de lenguaje (LLM) de OpenAI. Como en ese momento OpenAI todavía era técnicamente solo una empresa de investigación bien financiada, el problema de los derechos de autor no era un problema tan importante .

«En un proyecto de investigación, en general, se puede entrenar con cualquier tipo de datos», dijo Balaji al NYT . «Esa era la mentalidad en ese momento».

Pero, cuando se lanzó ChatGPT en noviembre de 2022, dice Balaji, sus sentimientos comenzaron a cambiar. Después de todo, el chatbot ya no era un proyecto de investigación a puerta cerrada; en cambio, impulsado por los LLM de OpenAI, se estaba comercializando para uso en empresas, incluso en casos en los que la IA se estaba utilizando para producir contenido o servicios que reflejaban o imitaban directamente el material fuente protegido por derechos de autor con el que se había entrenado, amenazando así los medios de vida y los modelos de ganancias de esas mismas personas y empresas.

«Este no es un modelo sostenible», dijo Bilaji al NYT , «para el ecosistema de Internet en su conjunto».

Por su parte, en una declaración al NYT , OpenAI —que desde entonces ha abandonado por completo sus raíces sin fines de lucro— argumentó que construye sus «modelos de IA utilizando datos disponibles públicamente, de una manera protegida por el uso justo y principios relacionados» y que eso es «crucial para la competitividad de Estados Unidos».

Hay que destacar que el New York Times ha demandado a OpenAI por el uso sin licencia de su material bajo derechos de autor. Afirman que la compañía y su socio Microsoft usaron millones de artículos informativos del periódico para entrenar a su algoritmo que desde entonces busca competir por el mismo mercado.

OpenAI también ha sido demandada por Sarah SilvermanTa-Nahisi Coates, George R. R. Martin, Jonathan Franzen, John GrishamCenter for Investigative ReportingThe Interceptvarios periódicos (como The Denver Post y el Chicago Tribune), y una cantidad de YouTubers.

Con información de futurism.com y gizmodo.com