Ora che ChatGPT per Android è disponibile anche in Italia, chiunque abbia uno smartphone, un tablet o un PC può utilizzare il Chatbot di OpenAI in modo gratuito. Un'ottima notizia, se non fosse che le prestazioni di ChatGPT starebbero peggiorando a vista d'occhio, almeno stando a quanto riportano gli utenti. Ma cosa sta succedendo, esattamente?

Come vi avevamo riportato già a metà luglio, uno studio delle Università di Stanford e Berkeley ha svelato che ChatGPT è diventato più "stupido" negli ultimi mesi. Il problema principale starebbe nel passaggio da GPT-3.5 a GPT-4.0: il nuovo Large Language Model di OpenAI, infatti, sarebbe peggiore del predecessore, specie in ambiti come le capacità logiche, a causa di un training ancora incompleto.

Secondo la ricerca, l'accuratezza di GPT-4.0 sarebbe crollata rispetto a quella di GPT-3.5: nel campo delle domande di logica, in particolare, l'accuratezza di GPT-3.5 sarebbe pari all'86,8%, con un trend in aumento tra i mersi di marzo e giugno 2023. Nello stesso periodo, l'affidabilità di GPT-4 è sprofondata dal 97,6%, dunque ben maggiore di quella del predecessore, fino al 7,4%.

Al contempo, i ricercatori hanno spiegato che GPT-4 ha smesso di spiegare i procedimenti con cui è pervenuto alle sue soluzioni: nella sua prima iterazione, quella di marzo 2023, il LLM spiegava passaggio per passaggio ogni suo calcolo e ogni scelta logica, mentre ora sembra farlo molto meno spesso. Ciò dipende in parte dalle diversità del codice di base di GPT-4 e di GPT-3.5, che potrebbero aver prodotto dei risultati inaspettati per OpenAI, ma anche dal fatto che, per via dei diversi sistemi di training adottati, le "strade" utilizzate dai due LLM per risolvere il medesimo problema sono ampiamente diverse l'una dall'altra.

Il problema principale, però, è che ChatGPT è una "black box". Poiché il codice di base e gli algoritmi che fanno funzionare l'IA sono segreti (ricordate quando OpenAI ha minacciato di uscire dall'Eurozona pur di non fornire il suo codice all'Unione Europea?), è impossibile capire perché il Chatbot si comporti come sta facendo. Non è dunque un caso che moltissimi accademici chiedano l'accesso agli algoritmi e ai modelli di OpenAI per ragioni puramente scientifiche. Per il momento, però, la startup sembra non volerne sapere.