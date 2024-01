Mentre si stanno ancora cercando metodi efficaci per capire se un testo è stato generato dall'IA, il mondo Tech inizia a guardare in modo importante a quello che potrebbe essere il prossimo fronte in cui quest'ultima potrebbe attirare particolarmente l'attenzione. Google ha infatti annunciato il modello text-to-video Lumiere.

Come riportato anche da Ars Technica e The Verge, il nuovo modello di generazione di video IA fa uso del diffusion model Space-Time-U-Net (STUNe), che come si evince dal nome risulta in grado di comprendere dove si trovano gli elementi nello "spazio", potendoli dunque muovere con l'avanzare del video, il più possibile in modo realistico.

Essenzialmente, dunque, si fa riferimento alla possibilità per l'intelligenza artificiale di riuscire a generare il video in un singolo processo, anziché dover generare molte immagini fisse e andare poi a sfruttarle per realizzare il risultato finale. Si tratta quindi di un passo in avanti non di poco conto per il mondo IA, come si apprende anche dall'apposito paper pubblicato su arXiv.

In modo associato a quest'ultimo, tra l'altro, è stato pubblicato un video YouTube di presentazione in cui a un certo punto si vede persino Iron Man. Per ulteriori dettagli sul progetto, potrebbe interessarvi dare un'occhiata al portale del progetto Lumiere di Google Research. In ogni caso, quel che risulta chiaro è che anche in casa Google si sta proseguendo in modo importante nello studio di sistemi text-to-video, che secondo più di qualcuno rappresenteranno la prossima categoria in grado di stupire sul fronte IA.