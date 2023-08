Ora che il New York Times vorrebbe fare causa a OpenAI per il suo utilizzo "inappropriato" degli articoli del giornale per l'apprendimento di ChatGPT, sembra essersi scoperchiato il vaso di Pandora dei dataset dell'Intelligenza Artificiale: secondo uno studio, infatti, questi ultimi sarebbero pieni di libri coperti da copyright.

La notizia arriva da un lungo report del The Atlantic, che spiega che i dataset di LLaMA, ChatGPT e Bard sono pieni di materiale protetto dal diritto d'autore o dal copyright in qualche sua forma. Ovviamente, l'utilizzo di questi materiali a qualsiasi fine, compreso il training e l'addestramento dell'IA e dei suoi Large Language Model (LLM), sarebbe proibito secondo le normative vigenti negli Stati Uniti e nel resto del mondo.

L'Atlantic, però, spiega che le Big Tech farebbero leva sulla segretezza dei propri dataset per infarcirli di materiali protetti da copyright: poiché nessuno, senza un mandato giudiziario, può accedere alle informazioni contenute in queste enormi banche date, OpenAI, Meta, Google e compagnia avrebbero deciso di approfittarne per utilizzare materiali protetti dal diritto d'autore per insegnare alle proprie IA a pensare e parlare.

Il caso è esploso dopo le critiche del New York Times all'IA, che si potrebbero infine tradurre in una vera e propria causa legale per infrazione del copyright contro OpenAI nei prossimi mesi. A dare inizio al dibattito sulla questione, però, è stata una causa legale intentata dagli scrittori Sarah Silverman e Richard Kadrey contro Meta presso un tribunale della California. L'accusa? Semplice: aver utilizzato i loro libri per addestrare l'IA di LLaMA, attualmente disponibile in open access per il grande pubblico.

Accanto a Silverman e Kadrey, quest'ultimo con ben 15 bestseller del New York Times a suo nome, gli autori che sembrano apparire nelle analisi di The Atlantic, effettuate su dei dataset parziali di LLaMA e GPT-4, sono Stephen King, Michael Pollan e Zadie Smith, tutti grandi romanzieri e saggisti di fama internazionale. Resta solo da capire se gli autori abbiano concesso o meno alle Big Tech di utilizzare i loro libri come fonte di apprendimento per l'IA.