Avete presente la sorprendente demo dell'IA Google Gemini, che in pochi giorni ha raccolto milioni di visualizzazioni su YouTube? Ebbene, gli appassionati di tecnologia stanno discutendo in merito alle modalità utilizzate da BigG per presentare le potenzialità della tecnologia, visto che sono arrivate accuse di "falsificazione".

A tal proposito, nella giornata del 7 dicembre 2023, dunque il giorno seguente all'uscita del video coinvolto, è stato pubblicato un articolo di TechCrunch, a firma Devin Coldewey, titolato "La migliore demo di Gemini di Google è stata falsificata". Di certo le accuse non sono di poco conto, ma vale la pena approfondire le motivazioni che hanno portato il noto portale a puntare il dito contro l'azienda di Mountain View.

Nel video coinvolto, che potete recuperare mediante il canale YouTube ufficiale di Google, Gemini funge come una sorta di "amico IA", in grado di interpretare, essenzialmente in tempo reale, quanto viene mostrato dall'utente tramite fotocamera, "conversando" con quest'ultimo tramite testo e voce. Dalla possibilità di giocare a indovinare i Paesi a partire da una cartina geografica fisica fino al riconoscimento dell'imitazione di una scena di un film da un video mostrato dallo smartphone. Di certo la demo di Google Gemini ha lasciato a bocca aperta più di qualcuno.



Tuttavia, al netto dell'indicazione in merito al fatto che "la latenza è stata ridotta e gli output di Gemini sono stati accorciati", è stata un'altra spiegazione a non convincere. TechCrunch afferma infatti senza mezzi termini che "il video non è reale", partendo da una segnalazione effettuata da Parmy Olson di Bloomberg su Twitter X.

Tutto inizia da un post, il cui link risiede direttamente nella descrizione del video, pubblicato sul blog ufficiale di Google, in cui viene spiegato come è stata effettivamente realizzata la demo. Da questo contenuto sono nati i primi dubbi, che si sono poi espansi per via di alcune dichiarazioni di BigG in merito: "abbiamo inizialmente acquisito filmati per testare le capacità di Gemini in una vasta gamma di sfide. Poi abbiamo fornito prompt a Gemini utilizzando fotogrammi di immagini fisse provenienti dai filmati e suggerimenti testuali".

Essenzialmente, dunque, si è passati per immagini e sono stati forniti dei "consigli" all'IA. Le accuse di TechCrunch vertono quindi sul fatto che un utente, che potrebbe non andare ad approfondire per bene il contenuto in descrizione, potrebbe travisare il modo in cui sono avvenute le interazioni per realizzare la demo di Google Gemini.

Per quanto l'IA sia infatti in grado, in un certo senso, di svolgere tali operazioni e in ottica futuro potrebbe potenzialmente riuscirci anche in modi simili a quanto mostrato nel video, si tratta di una questione di velocità, precisione e modalità di interazione. Un esempio pratico è quello relativo al minuto 02:45 circa del video, in cui si vede una persona giocare a sasso-carta-forbici.

Nel video si nota Gemini rispondere subito "So cosa stai facendo! Stai giocando a sasso-carta-forbici", mentre sul blog viene spiegato che attualmente risulta necessario fornire come prompt tutti e tre i gesti contemporaneamente come immagini fisse, andando poi a chiedere all'IA "Cosa pensi che stia facendo? Suggerimento: è un gioco", così che poi possa rispondere "Stai giocando a sasso-carta-forbici".



Insomma, l'IA riesce effettivamente a riconoscere l'interazione, ma TechCrunch accusa Google di non aver indicato in modo preciso agli utenti, direttamente nell'ambito del video (che viene pubblicizzato dalla stessa BigG come "hands-on"), le modalità di interazione utilizzate. In ogni caso, la risposta di Google non si è fatta attendere, visto che l'azienda di Mountain View ha dichiarato che il contenuto "mostra i risultati reali di Gemini. [...] Abbiamo apportato alcune modifiche alla demo (ma siamo stati sinceri e trasparenti su questo)".

Al netto della questione, che era bene approfondire per comprendere perché si sta parlando di accuse di "falsificazione" in questo ambito, saranno i test concreti a darci maggiori dettagli in merito alle potenzialità di Google Gemini, che sembrano comunque essere importanti, andando oltre alle modalità utilizzate in questo specifico contesto.