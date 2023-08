Sembra che il primo scandalo dell'era dell'IA sia esploso. Se la presunta causa del New York Times contro OpenAI è stata la prima avvisaglia, quello che è avvenuto nelle scorse ore sembra essere un vero e proprio terremoto: tantissime testate internazionali hanno bloccato l'accesso ai loro contenuti a GPTBot di OpenAI.

GPTBot è il bot che raccoglie contenuti per ChatGPT. Si tratta di un programma di data scraping utilizzato da OpenAI per reperire materiali disponibili online con i quali portare avanti il training della propria IA. Finora, GPTBot ha raccolto dati a destra e a manca, sul web arrivando, secondo alcuni, a raccogliere opere protette da copyright, tra cui i libri di Stephen King e gli articoli del New York Times e di tantissime altre testate online.

Sembra però che questa prassi stia per finire: dopo che il NYT ha rivisto le sue condizioni generali per gli utenti in modo da impedire il data scraping dei suoi articoli senza il consenso esplicito dell'editore del giornale, anche una lunga serie di altre testate stanno per fare lo stesso. Tra di esse abbiamo la CNN, Reuters, la ABC, l'Australian Community Media (ACM, che possiede tutti i più grandi giornali dell'Australia, come il Canberra Times e il Newcastle Herald) e persino il Chicago Tribune.

In altre parole, alcuni dei più grandi giornali mondiali, americani e australiani stanno bloccando l'accesso ai loro contenuti da parte delle aziende al lavoro sull'IA, a partire da OpenAI. Difficile dire cosa farà ora OpenAI di fronte al problema: una soluzione potrebbe essere la ricerca di contratti e partnership con alcuni dei giornali che hanno bloccato GPTBot; un'altra, a costo decisamente minore, potrebbe semplicemente essere quella di rivolgersi ad altre fonti per i propri dataset. Con tutti i rischi che l'addio ai giornali più autorevoli del pianeta comporta, ovviamente.

Intanto, comunque, OpenAI non ha preso posizione sulla questione: al contrario, in un post sul suo blog degli scorsi giorni, l'azienda ha spiegato che "permettere l'accesso di GPTBot al tuo sito può aiutare i modelli IA a diventare più accurati, migliorandone in generale le capacità e la sicurezza".