Nel bel mezzo del suo boom di popolarità, pare che ChatGPT stia già incontrando forti critiche presso gli esperti, l'opinione pubblica e, soprattutto, i policy-maker di tutto il mondo.

Le notizie delle ultime settimane ne sono un esempio lampante: il Garante della Privacy italiano ha bloccato ChatGPT, sollevando dubbi sulle procedure di acquisizione e utilizzo dei dati degli utenti da parte di OpenAI; allo stesso modo, un gruppo di esperti di IA ha chiesto alla FTC di bloccare lo sviluppo di ChatGPT, considerandolo uno strumento problematico sia per la privacy che per la sicurezza di chi lo utilizza.



Pochi giorni prima, anche il CEO di OpenAI Sam Altman aveva parlato dei rischi connessi a ChatGPT e all'IA in generale, invitando il pubblico a non farsi illusioni troppo positive sul loro impatto nella vita di tutti i giorni.

Dopo una fase di enorme notorietà e consenso pressoché unanimi, dunque, sembra ora che i nodi critici dell'Intelligenza Artificiale stiano venendo al pettine, anche se forse non è ben chiaro a tutti quali essi possano essere: spesso, infatti, si parla di cybersecurity, privacy e vulnerabilità dei modelli linguistici collegando tra loro le tre cose, con il rischio di generare confusione e ulteriore complessità in un panorama già piuttosto sfaccettato: cerchiamo di fare chiarezza.



L'IA come "cartina tornasole" di Internet

Fin dai primi giorni di ChatGPT, l'IA di OpenaAI è stata accusata di utilizzare un linguaggio violento, razzista, sessista e omofobo.

In effetti, quella delle distorsioni del linguaggio è una delle maggiori criticità dei chatbot: in una conversazione riportata dal Corriere della Sera, per esempio, ChatGPT sembra mostrare pregiudizi sull'Italia del sud, mentre più di recente OpenAI ha dovuto correggere dei "segni di razzismo" di GPT4, il nuovo modello linguistico di ChatGPT, sviluppato - anche - per correggere le falle di GPT3.5, una delle quali era proprio quella di adottare un linguaggio decisamente poco inclusivo o addirittura apertamente discriminatorio. Anche il canale Twitch di Seinfeld in IA, che propone episodi dell'omonima serie TV in pixel art generati dall'Intelligenza Artificiale, era brevemente scomparso dalla piattaforma viola in seguito ad accuse di transfobia e odio razziale nei confronti degli afroamericani, ovviamente violando le linee guida di Twitch.

Di recente ha però fatto scalpore il caso di un'IA (quella di Microsoft) che ha professato il suo amore per un redattore del New York Times, consigliandogli di lasciare sua moglie e fuggire con lei: una love story perfetta per un sci-fi distopico.



Ancora peggio, Artificial Intelligence News ha riportato la storia dell'IA medica francese Nabla, basata su GPT3, che avrebbe consigliato a un paziente di suicidarsi anziché proporgli delle cure per i suoi problemi.



Ma perché l'IA dà queste risposte al confine tra il violento e il discriminatorio? Gli esperti parlano di bias, affermando che molte delle IA attualmente esistenti sono razziste, omofobe e sessiste solo perché i dati da cui esse apprendono sono a loro volta razzisti, omofobi e sessisti.

In altre parole, il problema non sta tanto nell'IA, ma negli esseri umani, o quantomeno in quelli che frequentano più attivamente il web.

ChatGPT e le altre IA, infatti, utilizzano come proprio database una larga parte di Internet per come lo conosciamo: il fatto che esse siano xenofobe non deve preoccuparci (solo) per il bias di queste ultime, ma perché ciò conferma che il web è stracolmo di contenuti discriminatori, al punto da orientare un software che usa Internet stesso come proprio "cervello" a comportamenti che la maggior parte delle persone condannerebbero immediatamente se provenissero da un essere umano. Il problema, insomma, trascende l'IA e finisce per riguardare l'auto-percezione dell'Uomo su Internet, che sembra sprigionare tutti quelle tendenze negative che nella vita reale vengono celate dai freni etici, morali e sociali. Per certi versi, insomma, l'IA non fa altro che mettere in luce quelli che sono dei problemi intrinsechi di un sistema fallato: se noi siamo razzisti, misogini, omofobi e transfobici, ciò che creiamo lo sarà a sua volta.



Un caso emblematico è quello dell'IA utilizzata da Amazon per le risorse umane fino al 2018. Si trattava di un'intelligenza artificiale basata sul machine learning ben più basilare di ChatGPT, Bard e compagni, che si occupava di preselezionare i curriculum arrivati all'azienda, evitando una grossa mole di lavoro ai suoi addetti alle risorse umane. Dopo qualche mese di utilizzo, il colosso di Seattle ha scoperto che l'IA "cassava" quasi tutti i curriculum femminili e quelli di persone appartenenti ad alcune minoranze, come gli afroamericani e i latinoamericani.

L'Intelligenza Artificiale di Amazon era razzista e sessista? No: essa si limitava ad usare come propri parametri i dati raccolti in precedenza tra gli impiegati in carne e ossa del settore HR, che a loro volta evitavano profili femminili e non-bianchi per via di un pregiudizio che li portava a considerare i potenziali impiegati neri, sudamericani o di sesso femminile più "problematici" o meno efficienti rispetto ai candidati maschi bianchi.



Un cattivo maestro forma un cattivo studente, insomma: sarebbe troppo facile incolpare l'IA delle sue derive, come fa chi arriva a parlare di "IA senziente" di fronte a casi di questo tipo. La realtà è che l'Intelligenza Artificiale è uno specchio della realtà umana che fornisce un'immagine cristallina delle idee diffuse tra la popolazione globale (o almeno tra quella che ha accesso a internet): se l'IA è razzista, noi siamo razzisti; se l'IA è misogina, noi siamo misogini.



Il nodo della privacy

Fortunatamente, però, dei recenti aggiornamenti hanno introdotto delle precauzioni contro il linguaggio scorretto di ChatGPT e compagnia. Non si tratta di una soluzione sostanziale, ma di una "toppa" piazzata all'ultimo su un problema ben più ampio, ma tanto è bastato per farci (quasi) dimenticare il problema dell'IA.

La mossa del Garante della Privacy italiano, insieme al ban di ChatGPT in Cina per ragioni di sicurezza, invece, hanno riportato sotto ai riflettori un'altra criticità dell'IA, ossia la presunta mancanza di privacy dei dati che vengono forniti come materiali di apprendimento ai modelli linguistici e ai Chatbot.

La questione è in realtà molto complessa, anche perché prima dell'apertura di un'istruttoria da parte del Garante italiano della Privacy nessuno si era mai preoccupato della questione della sicurezza dei dati degli utenti di ChatGPT.

In realtà, comunque, anche l'azione del Garante non esprime preoccupazioni di ordine generale ma si ricollega a un data breach risalente al 20 marzo, a causa del quale ChatGPT aveva smesso di funzionare per tutti gli utenti e aveva svelato alcuni dati degli iscritti con abbonamenti Premium.



La stessa OpenAI, però, ha confermato di aver rispettato le regole italiane sulla privacy, nonché il GDPR europeo: difficile dire come si chiuderà la questione, anche se un intervento diretto dell'UE e dei suoi organismi giudiziari si fa sempre più probabile, specie per quanto riguarda la verifica dell'adesione di OpenAI e ChatGPT al GDPR.



In termini più sostanziali, al di là del data breach del 20 marzo, il Garante ha sottolineato la mancanza di un'informativa per gli utenti di ChatGPT che spieghi quali dati vengono raccolti dalle conversazioni, dove vengono immagazzinati e come vengono riutilizzati successivamente per l'addestramento dell'IA: un problema particolarmente sentito per il Chatbot di OpenAI, che d'altro canto si migliora proprio apprendendo dalle sue conversazioni con gli utenti.

Il timore è dunque che ChatGPT possa diffondere dati sensibili a terzi dopo averli "assorbiti" da una chat privata con un altro utente, convinto magari dell'assoluta privacy delle sue chiacchierate con l'IA.

In più, il Garante evidenzia la "mancanza di una base giuridica che giustifichi la raccolta e la conservazione massiccia dei dati", pur ammettendo di sapere che essi vengono utilizzati per addestrare l'IA di OpenAI. Non sembra dunque essere in discussione il fine della raccolta dati, ma la modalità con cui essa viene effettuata: una questione formale più che sostanziale, dunque.



In generale, a qualcuno potrebbe sembrare che il "caso" di OpenAI somigli molto a quello del database di volti umani di ClearView AI: a questo giro, però, le finalità del progetto non vengono criticate come lesive della privacy, come invece avveniva per la controversa raccolta dati di ClearView, che partiva da fotografie pubblicate sui social network e sul web da utenti ignari, e non da chi utilizzava consciamente una piattaforma accettandone i termini di servizio.



Una nuova era per le truffe sul web?

La terza grande questione è invece quella della cybersecurity. Il problema della sicurezza online è entrato prepotentemente nel dibattito pubblico sull'Intelligenza Artificiale con il leak dell'IA LLaMA di Facebook di un paio di settimane fa.

Il modello linguistico di Meta è finito online su 4Chan in una forma pressoché completa, permettendo a chiunque, malintenzionati inclusi, di usarlo come più desidera.

Come è stato possibile che Mark Zuckerberg e soci si siano lasciati sfuggire l'intero codice sorgente della propria IA? Meta ha deciso di non offrire applicativi "intermedi" tra IA e utenza, come fatto da OpenAI con ChatGPT, da Microsoft con Bing e da Google con Bard, ma di concedere il codice sorgente del proprio modello linguistico (LLaMA, per l'appunto), a tutti gli sviluppatori che si fossero iscritti a un apposito programma in open access. Meta sperava evidentemente che i partecipanti fossero tutti onesti, ma sembra aver sovrastimato la moralità di Internet.

Oppure, l'azienda non crede che il suo modello linguistico possa essere usato per scopi nefasti: ciò spiegherebbe anche perché, all'atto pratico, nonostante le previsioni catastrofiste di alcuni esperti, truffe e campagne di disinformazione AI-based ancora non sembrano esistere.



Se il leak di LLaMA non ha - per ora - prodotto conseguenze degne di nota, è pur vero che il futuro prospettato dagli analisti per la cybersecurity nell'era dell'IA non sembra essere dei più rosei. Le capacità di scrittura "umana" dei Chatbot, alcuni dei quali possono persino replicare le modalità e gli stili di autori umani, potrebbe infatti avere serissime ripercussioni sulle campagne di phishing. Con un phishing 2.0 garantito dall'IA, le truffe via mail e via messaggio potrebbero aumentare rapidamente e, soprattutto, diventare molto più efficaci nel raggiungere i loro scopi, cioè nel raggirare chi viene colpito: i Chatbot potrebbero diventare in grado di inviare messaggi di natura strettamente personale per dare maggiore credibilità alle truffe, magari basandosi sulle loro informazioni personali liberamente disponibili online e sui social.

Allo stesso tempo, l'IA potrebbe peggiorare il problema dello spam, non solo aumentandone il volume e rendendolo più efficace ma, anche in questo caso, creando messaggi "personali" basati sulle informazioni degli utenti da colpire.

Addirittura, l'Intelligenza Artificiale potrebbe facilmente camuffarsi da essere umano e intavolare intere conversazioni-truffa via mail o messaggio con utenti ignari, con il classico scopo di farsi inviare denaro o informazioni sensibili.



L'altro fronte che preoccupa gli esperti è quello della disinformazione. Agli albori di ChatGPT aveva fatto scalpore il fatto che una testata come CNET avesse pubblicato articoli scritti dall'IA (poi rimossi), ma ora i contenuti web AI-based sono ovunque.

ChatGPT, Midjourney e altre Intelligenze Artificiali possono facilmente gestire ogni fase del processo creativo di un video, di un'immagine, di un articolo di giornale, ma anche di un intero sito web o persino di una pagina social capace di diventare virale. In questo modo, l'IA si renderebbe perfetta per campagne di disinformazione a basso budget e dall'ampia portata, rischiando di aggiungere ulteriore incertezza alle informazioni reperite in rete, già rese molto meno attendibili rispetto a qualche anno fa dal proliferare della disinformazione consapevole, effettuata con scopi eminentemente politici ed economici.

L'IA potrebbe persino legarsi ai deepfake nel mimare personaggi famosi, producendo discorsi e video estremamente attendibili per promuovere agende politiche controverse o prodotti discutibili, ai danni di un'utenza media ancora ignara dei rischi che il web dell'"era dell'IA" potrebbe portare con sé.



Certo, uno sviluppo etico dell'Intelligenza Artificiale potrebbe anche creare dei Chatbot anti-Chatbot, capaci di identificare l'IA sul web, nonché i testi e i video prodotti da quest'ultima. Allo stesso modo, se i principali provider di posta elettronica (Gmail e Outlook, per esempio) si dotassero di sistemi anti-spam AI-based, il rischio di un aumento verticale delle truffe potrebbe essere facilmente arginato.

Si tratta, però, di soluzioni "tappabuchi" che certamente non risolvono nel merito il problema principale dell'IA: l'Intelligenza Artificiale ha enormi poteri. E, come un certo arrampicamuri ci insegna, da grandi poteri derivano anche grandi responsabilità.