Vi sarà certamente capitato almeno una volta nella vita: è estate, fa caldo, sentite il ​​bisogno di un gelato rinfrescante. Avreste però mai pensato che potrebbe aver a che fare con la matematica?

Mi spiego meglio: l'aumento delle temperature e l'aumento del consumo di ghiaccio sono due variabili statistiche dipendenti linearmente; sono cioè correlate. Se aumenta una, aumenta l'altra. Più fa caldo, più viene consumato ghiaccio.



In statistica, le correlazioni sono importanti per prevedere il comportamento futuro delle variabili. Tali previsioni scientifiche sono spesso richieste dai media, che si tratti di risultati, ad esempio, calcistici o elettorali, o commerciali, ad esempio il fabbisogno di ghiaccio (o gelato) quando aumentano le temperature.



Per misurare la dipendenza lineare, gli scienziati usano il cosiddetto coefficiente di correlazione, introdotto per la prima volta dallo scienziato britannico Sir Francis Galton (1822-1911) negli anni 1870, e poco dopo, il matematico Karl Pearson fornì una giustificazione matematica formale per il coefficiente di correlazione. Pertanto, i matematici parlano della "correlazione di Pearson".



Questo, a patto che la dipendenza delle variabili sia lineare.



René Schilling, professore di Probabilità alla TU di Dresda, sottolinea "Fino ad ora, ci sono voluti molti sforzi computazionali (usiamo spesso i pc per svolgere questi compiti) per rilevare le dipendenze tra più di due variabili, in particolare quando sono coinvolte relazioni non lineari. Abbiamo ora trovato una soluzione efficace e pratica a questo problema".



Il Dr. Björn Böttcher, il Prof. Martin Keller-Ressel e il Prof. René Schilling dell'Istituto di stocastica matematica di Dresda hanno sviluppato una misura di dipendenza chiamata "multivarianza a distanza".



Martin Keller-Ressel spiega: "Per misurare la dipendenza, vengono registrati non solo i valori delle variabili osservate, ma anche le loro distanze reciproche, e da queste matrici di distanza viene calcolata la multivarianza di distanza. Questo passaggio intermedio consente il rilevamento di dipendenze complesse, che il normale coefficiente di correlazione semplicemente ignorerebbe. Il nostro metodo può essere applicato a domande di bioinformatica, ad esempio."



In oltre, in un successivo studio, è stato dimostrato che il coefficiente di correlazione classico e altre misure di dipendenza note possono essere trovate come casi limite dalla multivarianza a distanza.