-
Sì. L’immagine della Data Science è quella di poter ottenere risposte a partire da qualsiasi tipo di dati. L’essenza della statistica è meno clamorosa: si tratta di prestare attenzione ai dati e al modo in cui sono stati ottenuti. La statistica pone domande scettiche come:
-
Siamo sicuri che quel bel risultato non sia solo rumore?
-
Come sono stati raccolti questi dati? C’è stato un bias di selezione? Se sì, cosa possiamo fare al riguardo?
-
Quante metriche abbiamo guardato prima di arrivare a questo sorprendente risultato? Molte? Cosa possiamo fare al riguardo?
-
Qualcos’altro oltre alla causalità potrebbe spiegare perché X e Y si muovono insieme? Come possiamo controllare altri fattori Z che potrebbero essere coinvolti?
Porre questo tipo di domande, ed essere in grado di rispondere bene, è assolutamente fondamentale per prendere buone decisioni con i dati.
Riassumendo, sì, la scienza dei dati ha bisogno di statistica. Perché usare i dati con noncuranza è spesso peggio che non usarli affatto.
-