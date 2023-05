Se siete tra coloro che hanno provato a far generare immagini IA a DALL-E (o servizi simili), potreste aver riscontrato qualche "grattacapo" nel riuscire a ottenere un testo realizzato in modo corretto. Questo è infatti stato finora un "tallone d'Achille" per l'IA generativa, ma adesso c'è una novità chiamata DeepFloyd IF.

A tal proposito, come fatto notare anche da TechCruch, il succitato servizio legato a DeepFloyd, gruppo di ricerca associato a Stability AI, si prefigge l'obiettivo di portare miglioramenti importanti in uno dei campi che ha sempre dato "filo da torcere" al mondo dell'intelligenza artificiale in generale. Ecco allora che questo modello text-to-image punta a rendere leggibile il testo IA nelle immagini.

Il dataset su cui si basa il tutto comprende infatti oltre un miliardo di immagini e testi, cosa che ha consentito di "addestrare" a dovere l'intelligenza artificiale per questo scopo. Per funzionare, il tutto ha bisogno di una GPU con almeno 16GB di memoria, ma in questo modo prompt relativi, ad esempio, a una scritta da posizionare sulla maglietta di un soggetto generato dall'IA diventano una possibilità concreta.

DeepFloyd IF non è in ogni caso utilizzabile per scopi commerciali, ma è distribuito in open source. Potreste per il resto voler dare un'occhiata al portale ufficiale di NightCafe per maggiori indicazioni sulla versione early access. Insomma, il mondo dell'intelligenza artificiale generativa sta effettuando importanti passi in avanti anche in termini di testo applicato alle immagini.