Quali libri ha “letto” ChatGPT per addestrare il suo modello multimodale? A svelarlo è il ricercatore David Bamman dell’Università di Berkley in California, che insieme ad alcuni colleghi ha condotto una ricerca molto interessante.

Una scoperta incredibile ma allo stesso tempo casuale, che ha permesso a Bamman di evidenziare come ChatGPT abbia letto oltre 50 libri, tra cui molti classici della fantascienza e del fantasy.

Nel corso della ricerca, Bamman stava lavorando su “Orgoglio e Pregiudizio” di Jane Austen, e per tale ragione ha girato i suoi interrogativi a ChatGPT, scoprendo che il chatbot ha fornito risposte estremamente accurate sull’argomento, quasi come se avesse letto il libro. A questo punto insieme al suo team ha continuato ad interrogare ChatGPT su altri libri, dando un punteggio di conoscenza ad ognuno di questi: più alto era, più alte erano le probabilità che l’avesse letto e che quindi le informazioni dei testi fossero contenute nel set di dati studiato. Terminata questa fase, i ricercatori hanno messo insieme le loro scoperte in una ricerca.

Il risultato? Sono oltre 50 i romanzi che hanno contribuito all’addestramento di ChatGPT. La platea è variegata e si parte da classici come Moby Dick, Il Colore Viola, Furore, Quel che resta del giorno e la Lettera Scarlatta. Tuttavia, il punteggio più elevato è stato registrato dai libri di fantascienza e fantasy come Harry Potter e La Pietra Filosofale, 1984, Il Signore degli Anelli, Fahrenheit 451, Il mondo nuovo, Neuromante ed Il Cacciatore di Androidi. Non poteva mancare Il Trono di Spade, Il Codice da Vinci, e Guida Galattica per Autostoppisti.

ChatGPT però non è un grande fan di 007, e ha letto solo un paio di romanzi della saga di Ian Fleming. Tra i testi meno conosciuti invece figurano Shining ed I Diari di Bridget Jones.

Bamman, nel sottolineare che le fonti utilizzate per l’addestramento dei modelli sono destinate ad influenzarli, pone una domanda: “cosa succede quando un bot divora libri di narrativa su tutti i tipi di mondi oscuri e distopici? In che modo questo genere di letteratura può influenzare il comportamento di questi modelli al di fuori dell’ambito letterario e della narrativa? C’è molto lavoro da fare in questo senso. Non abbiamo ancora la risposta a questa domanda”. A riguardo, quest’oggi è arrivato anche l’allarme di un ex dirigente Google sull’IA.