Mentire con le statistiche

Siamo nell’epoca dei dati, sovrabbondanti e in tempo reale e, soprattutto, big. Se non sono big non sono dati di valore. Sappiamo che dalla disponibilità dei dati dipende la possibilità di una maggiore intelligence, ovvero il potere di comprendere la situazione e agire nel migliore dei modi per raggiungere gli obiettivi che ci si è posti. Quindi più dati = più intelligenza, no?

Se il tema ti appassiona potresti apprezzare un saggio di qualche anno fa, Mentire con le statistiche, dedicato ad analizzare come si forma la nostra conoscenza del mondo attraverso i dati di cui leggiamo e che spesso vengono portati a supporto di tesi e decisioni a tutti i livelli, da quello personale a quello della politica internazionale. La lettura critica e consapevole dei dati e delle tesi ad esse collegate è una componente necessaria della cultura generale dell’uomo del nostro tempo. Coi dati, infatti, abbiamo più conoscenza ma siamo anche più esposti all’errore. Per questo motivo è relativamente facile mentire con le statistiche, in particolare con le persone che non hanno il tempo e la possibilità di comprendere il quadro generale nel quale esse si situano.

La crescita del PIL italiano langue? Non raggiungeremo lo 0,9%? Allora chiediamo al governo di fare un decreto per ridurre il numero di cifre dell’IBAN del conto corrente: sarà più facile ricordarselo e quindi indicarlo a chi ci deve dei soldi e quindi rimetteremo in movimento l’economia e combatteremo i pagamenti in contanti e l’evasione. Una prova? I paesi in cui l’IBAN è composto da meno cifre hanno un reddito pro-capite più elevato:

20151206_A

Ovviamente non è così, anche se la richiesta di avere un IBAN un po’ meno lungo potrebbe essere ragionevole. L’errore in questo caso è che si è deciso di ritagliare un perimetro di analisi opportunamente costruito per dimostrare la tesi. Molte volte non c’è una cattiva intenzione alla base di questo procedimento: il ragionamento umano è spesso guidato dal desiderio di dimostrare una tesi e a questo si accompagnano gli esempi più utili per farlo o, più semplicemente, gli esempi conosciuti.

Invece, se il perimetro dell’analisi si estende a tutti i paesi europei, si ricava che la relazione tra lunghezza del’IBAN e reddito pro capite non esiste, nonostante la linea di tendenza continui a puntare verso il basso:

20151206_B

La rappresentatività del dato e il perimetro a cui esso si applica è un tema di analisi che noi in H2 conosciamo bene. Il problema è che ognuno di noi vive in un particolare segmento socio-culturale e incontra con maggior frequenza persone e situazioni tipiche del proprio segmento: la ricerca campionaria ti apre alla conoscenza e alla rappresentazione di fenomeni che sono lontani dalla tua sensibilità e dal tuo modo di intendere le cose. Per riuscire in questo intento, la prassi di ricerca deve assicurare ai campioni la loro eterogeneità e capacità di rappresentare segmenti e aree sociodemografiche, culturali e di consumo diverse.

Il mondo che osserviamo con le nostre ricerche evolve a velocità molto elevata. Ma non tutti vanno alla stessa velocità e noi dobbiamo tenerne conto quando costruiamo i nostri campioni, altrimenti finiremo per rappresentare solo quelli come noi o come te che adesso leggi questo post.