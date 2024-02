Negli scorsi giorni, Tim Cook aveva confermato che Apple avrebbe lanciato la sua IA generativa nel 2024. Ora, la Mela Morsicata ha fatto un grandissimo passo avanti in tal senso, rilasciando un modello IA open-source per l'editing delle immagini. Non solo: il modello non richiederà alcuna competenza specifica, ma funzionerà in linguaggio naturale.

La notizia arriva da portali del calibro di VentureBeat e Macrumors, che hanno confermato che l'IA di Apple si chiama MGIE, ovvero "MLLM-Guided Image Editing", dove la sigla MLLM significa a sua volta "Multimodal Large Language Model". Il rilascio dell'IA in formato open-source da parte del colosso di Cupertino fa seguito alla pubblicazione di un paper, disponibile su ArXiv, che spiega il funzionamento di MGIE e lo sviluppo dell'IA.

La peculiarità del modello è quella di tradurre il linguaggio naturale in operazioni di editing fotografico sui singoli pixel dell'immagine: per esempio, il modello può migliorare l'illuminazione di una fotografia, può incrementarne o ridurne il contrasto e la nitidezza, può applicare alcuni effetti artistici e può persino apportare modifiche ad alcune sue sezioni, inserendo e rimuovendo oggetti, testi o altri contenuti. Infine, l'IA può effettuare alcune operazioni di editing basilare, come il ritaglio dell'immagine, il suo ridimensionamento e la rotazione, oppure ancora l'inserimento di grane e filtri. Il tutto, ovviamente, a partire dalle istruzioni dell'utente.

Negli esempi forniti dai ricercatori, per esempio, l'utente può chiedere all'IA di "aumentare la luminosità e la nitidezza" della foto, oppure di "rimuovere l'albero di Natale dallo sfondo", oppure ancora di "modificare la glassa sulle ciambelle e renderla alla fragola". Si passa dunque dalle richieste di editing più semplici a quelle più complesse, capaci di modificare alcune caratteristiche fondamentali dell'immagine.

Quella appena rilasciata dal colosso di Cupertino è la seconda IA proprietaria di Apple ad arrivare sul mercato: a dicembre, per esempio, l'azienda aveva rilasciato Ferret, un'IA specializzata nella descrizione delle immagini. Come Ferret, anche MGIE è il risultato di una collaborazione di Apple con un'università, questa volta la University of California, ed è stato presentato nel corso della International Conference on Learning Representations (ICLR) del 2024.