Usualmente pensiamo alle intelligenze artificiali per generare immagini, dalla recentemente rilasciata DALL-E di OpenAI a Midjourney, passando per Stable Diffusion. Tuttavia, un ricercatore ha deciso di provare a sfruttare quest'ultima per la compressione delle immagini, facendo registrare risultati impressionanti.

Come riportato da ArsTechnica, l'ingegnere del software svizzero Matthias Bühlmann ha pubblicato su Medium una spiegazione relativa al fatto che il succitato modello di sintesi di immagini IA, che generalmente verrebbe utilizzato per generare immagini a partire da un input testuale, può risultare interessante anche per ridurre il peso delle immagini, tra l'altro con meno artefatti visivi rispetto a WebP e JPG.

Bühlmann ha sfruttato quanto avviene nel processo di codifica delle immagini dell'IA, lasciando a Stable Diffusion "trasformare" un'immagine da 512 x 512 pixel in una da 64 x 64 pixel. Quest'ultima risulta poi avere un peso contenuto, ma è anche "espandibile" (decodificabile) nuovamente a 512 x 512 pixel potenzialmente con ottimi risultati.

Nel corso dei test, il ricercatore ha provato a comprimere in questo modo l'immagine di un lama, ovvero quella che potete vedere in calce alla notizia. Il risultato è un file dal peso di 4,97kB, inferiore a quello legato a JPG (5,66kB) e WebP (6,74kB), mentre l'immagine sembra risultare più dettagliata e con meno artefatti visivi. Un risultato impressionante per un'IA pensata per un altro tipo di utilizzo.

Tuttavia, ci sono delle questioni importanti da approfondire. Infatti, per quanto la "scoperta" risulti intrigante, bisogna tenere bene a mente il fatto che l'IA potrebbe "inventare" dettagli ricostruendo l'immagine, nonché che per il momento questo sistema non torna molto utile quando ci sono di mezzo volti e testo. Oltre a questo, per ora il tutto richiede, senza entrare troppo in tecnicismi, tempo di decodifica aggiuntivo e un file di 4GB che rappresenta la conoscenza di centinaia di milioni di immagini di Stable Diffusion 1.4.

Tuttavia, la questione apre potenzialmente le porte a un nuovo tipo di utilizzo per i modelli di sintesi delle immagini IA.