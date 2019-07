Nell’era di “Big Data” la raccolta delle informazioni digitali è alla base di tutto: dalla moderna ricerca medica alle analisi di mercato passando per lo sviluppo delle IA. Un recente studio però sottolinea come sia praticamente impossibile rendere completamente anonimo un qualsiasi set di dati.

In generale si presuppone che una serie di dati ritenuti anonimi siano privati tutte quelle informazioni che possano permettere l’identificazione personale, lasciando gli operatori liberi di lavorare senza il rischio di invadere la privacy di un individuo.

Tuttavia, i dati possono essere “de-anonimizzati” in vari modi: nel 2008 alcuni utenti di Netflix sono stati individuati incrociando i dati anonimi sulle valutazioni della nota piattaforma di streaming con quelle del portale IMDb; allo stesso modo gli indirizzi di casa dei taxisti di New York sono stati scoperti analizzando una serie di dati sui singoli viaggi degli utenti che avevano viaggiato sulle loro vetture.

I ricercatori dell’Université Catholique de Louvain in Belgio e dell’Imperial College di Londra hanno creato un modello che permette di stimare la facilita con cui de-anonimizzare un determinato set di dati. Secondo il report bastano 15 informazioni per rendere identificabile il 99,98% delle persone che abitano in Massachusetts: più la popolazione si restringe più diventa facile identificare i singoli soggetti.

Nonostante questo, alcune aziende broker come Experian vendono pacchetti “anonimi” che contengono molte più informazioni per singolo utente: in particolare in un set venduto alla società Alteryx erano presenti ben 248 attributi singoli per circa 120 milioni di americani.

I ricercatori guidati da Luc Rocher sostengono che le attuali tecniche per rendere anonimi i dati sono del tutto insufficienti e permettono alle aziende di aggirare facilmente le leggi come il GDPR (regolamento generale sulla protezione dei dati).

Altri approcci però potrebbero essere più in linea con le attuali esigenze sulla privacy: Apple e Uber per esempio usano una tecnica di “privacy differenziale” che permette di confondere deliberatamente le informazioni in modo da rendere impossibile il collegamento diretto con il singolo utente. Anche la crittografia omomorfica consente di manipolare i dati riconducibili alle singole persone sostituendoli con altre informazioni “fake” ma dal contenuto statistico identico.

Insomma, le nostre informazioni non sono del tutto al sicuro nel vasto mondo di internet. Nell’attesa che la tecnologia possa risolvere il problema sarebbe cosa buona e giusta non trattare i nostri dati personali con leggerezza.