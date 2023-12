Nella giornata di ieri abbiamo pubblicato su queste pagine il primo video hands on di Google Gemini, la nuova intelligenza artificiale che ha stupito tutto. Il filmato ha stupito tutti per le incredibili capacità messe in mostra dall’intelligenza artificiale, ma un editoriale di Bloomberg ha fatto lumi sulla questione.

La giornalista Parmy Olson infatti ha pubblicato un pezzo in cui analizza quasi frame per frame la clip, che ha messo in mostra delle capacità innate con l’elaborazione dei suggerimenti partendo da alcune immagini.

Google ha però ammesso che la demo in questione non era in tempo reale, ma frutto dell’utilizzo di alcuni fotogrammi di immagini fisse. Nella descrizione del filmato, infatti, è presente un disclaimer quanto mai chiaro: “ai fini di questa demo, la latenza è stata ridotta e gli output di Gemini sono stati abbreviati per brevità” si legge nel testo, che ha fatto andare su tutte le furie la giornalista.

Nello stesso pezzo pubblicato su Bloomberg, Olson racconta che Google ha ammesso - quando gli è stato chiesto un commento - che la demo del video non è avvenuta in tempo reale con istruzioni vocali ma ha utilizzato fotogrammi di immagini fisse provenienti da riprese grezze e quindi ha scritto gli output testuali a cui Gemini ha risposto. Secondo Olson, “questo è molto diverso da ciò che Google sembrava suggerire: che una persona potesse avere una conversazione vocale fluida con Gemini mentre guardava e rispondeva in tempo reale al mondo che lo circonda”.

The Verge ha interpellato Google per ottenere qualche risposta e dettaglio in merito, ed a riguardo il motore di ricerca ha indicato un post di Oriol Vinalys in cui spiega come il team ha realizzato il video. "Tutti i suggerimenti e gli output dell'utente nel video sono reali, abbreviati per brevità" si legge nel post di Vinyals, secondo cui “il video illustra come potrebbero essere le esperienze utente multimodali realizzate con Gemini. L’abbiamo realizzato per ispirare gli sviluppatori.”