In futuro potrebbe risultare più semplice risalire agli hacker grazie alle potenzialità messe in campo dal machine learning. Un gruppo di ricercatori ha elaborato un sistema in grado di scansionare ed analizzare il codice di un programma, che sfrutta il machine learning per identificare alcuni tratti distintivi utili ad identificarne l'autore.

Per funzionare in modo corretto l'algoritmo che lo governa deve essere "istruito" a riconoscere il modo in cui un determinato autore compila il codice, basandosi su alcuni esempi reali, che potrebbero essere delle piccole porzioni dei programmi creati in precedenza dall'hacker: da questi è in grado di evidenziare e memorizzare delle particolarità ricorrenti, che se si ripresentano in malware o altri programmi malevoli possono aiutare a determinare l'identità del loro autore.

Il sistema è stato messo alla prova con il Code Jam di Google, e si è rivelato abbastanza accurato: il test ha coinvolto 600 programmatori ed 8 sample di codice per ognuno di essi, e nell'83% dei casi è riuscito ad identificare con successo il creatore di un programma.

Le sue potenzialità potrebbero tornare molto utili in futuro agli investigatori ed agli organi di polizia, dato che spesso risalire a chi ha creato un malware non è certo cosa facile, ma anche se i risultati ottenuti dai test sono molto promettenti potrebbe passare diverso tempo prima di vedere questo sistema in azione, per una questione di privacy. Risulta molto difficile infatti partecipare al progetto, e quindi contribuire in prima persona al suo sviluppo fornendo del codice da identificare, rimanendo completamente anonimi.