Un’indagine pubblicata dall’Università di Stanford lancia l’allarme sull’addestramento dei sistemi d’intelligenza artificiale. Come si può leggere nel rapporto dell’Università di Stanford, l’indagine ha rilevato centinaia di immagini note di materiale pedopornografico in un set di dati utilizzato per addestrare modelli di generazione d’immagini.

Il set di dati è noto come LAION-5B ed al suo interno sarebbero presenti quasi 1700 immagini illecite raccolte dai social media e dai siti per adulti. Secondo l’Università “i modelli addestrati su questo set di dati, noto come LAION-5B, vengono utilizzati per creare immagini di nudo fotorealistiche generate dall'intelligenza artificiale”.

Per la scoperta i ricercatori hanno esaminato gli hash e gli identificatori delle immagini per poi inviarli a siti come PhotoDNA, che si occupano di rilevare materiale contenente abusi su minori. Anche il Canadian Centre for Child Protection ha effettuato le verifiche del caso.

In risposta allo studio completo, che si può leggere direttamente attraverso questo indirizzo, LAION ha evidenziato come la sua politica sia di “tolleranza zero per i contenuti illegali”, ed ha annunciato che sta rimuovendo i dati incriminati per “garantire che siano sicuri prima di ripubblicarli”.

Il set di dati è comunque utilizzato per addestrare Stable Diffusion, ed anche lo sviluppatore Stabiity AI ha sottolineato le proprie guide interne che prevedono il divieto d’uso dei tool per usi impropri.