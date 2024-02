Stability AI ha tolto il velo dal nuovo modello per la generazione di immagini, battezzato Stable Cascade, che secondo la descrizione non è solo più veloce ma anche più potente rispetto al suo predecessore Stable Diffusion.

Il nuovo tool è in grado di generare immagini e fornire diverse variazioni, ma è anche in grado di aumentare la risoluzione di fotografie già esistenti. Le opzioni messe a disposizione dei clienti sono tante: inclusa anche la modifica del testo nelle immagini, ma anche l’inpainting ed outpanding di specifiche parti degli scatti.

Con Canny Edge invece gli utenti potranno creare delle nuove immagini partendo dai bordi di foto già esistenti: insomma, le novità sono davvero tante e Stable Cascade è destinato a cambiare in maniera importante il settore.

Il nuovo modello può già essere scaricato direttamente da Github, ed è solo a disposizione degli sviluppatori e ricercatori: almeno nel momento in cui scriviamo, infatti, non è disponibile per uso commerciale.

Stable Cascade si differenzia da Stable Diffusion per non essere un LLM: piuttosto, si tratta di tre diversi modelli che si basano sull’architettura Würstchen. Il primo comprime i prompt di testo per poi passarli agli stadi A e B che si occuperanno della decodificazione delle richieste. Questa suddivisione dei prompt porta ad una riduzione della memoria necessaria ed un minor tempo di completamento, a fronte di prestazioni migliori anche a livello di qualità. Secondo quanto emerso, in un test Stable Cascade ha impiegato 10 secondi per generare un’immagine, rispetto ai 22 secondi impiegati dal modello SDXL attualmente utilizzato.