Mentre Image Creator di Bing AI raggiunge il pieno potenziale, gli Intel Labs in collaborazione con Blockade Labs sono già passati al livello successivo, proponendo un modello di IA generativa, in grado di fare qualcosa di decisamente esaltante.

Come potrete osservare nel video in apertura, infatti, quello proposto dal team di ricerca del team blu è un nuovo sistema in grado di generare immagini 3D a 360 gradi con un semplice input testuale. Il nome del potente strumento è Latent Diffusion Model for 3D (LDM3D), che sfrutta l'intelligenza artificiale per creare contenuti davvero impressionanti.

Si tratta del primo modello del suo genere, come spiega Intel nel suo comunicato, ovvero capace di generare non solo immagini, stili e colori, ma anche una mappa di profondità per andare a creare un ambiente - seppur ancora statico - in tre dimensioni e a tutto tondo, con una maggiore accuratezza rispetto ai sistemi di post-elaborazione.

Sotto "la scocca" c'è un dataset di immagini e mappe di profondità per un totale di 10.000 campioni provenienti dal database LAION-400M, contenente oltre 400 milioni di coppie immagine-didascalia, poi dati in pasto al modello di stima Dense Prediction Transformer, in grado di fornire un calcolo di profondità relativa molto preciso.

I supercomputer AI utilizzati per alimentare il modello sono chiaramente di fattura Intel, dotati di processori Intel Xeon con acceleratori AI Intel Habana Gaudi. Il modello è attualmente messo in modo dall'applicazione DepthFusion, sviluppata in tandem da Intel e Blockade.

Sempre a proposito di IA, avete mai sentito parlare dell'IA generativa che crea video a partire da testo?