influencer is not causation

Belen Rodriguez riesce a fare con un post quello che non è riuscito agli ambientalisti in 25 anni: arriva l’ok alla Riserva naturale di Punta Bianca
Dagli anni Sessanta la grande roccia di Agrigento è danneggiata da esercitazioni dell’esercito nel vicino poligono. Le associazioni chiedono da tempo la tutela dell’area e l’ultimo sit-in è di pochi giorni fa. Ma il governatore si decide solo dopo l’uscita social della showgirl.

da ilFattoQuotidiano.it del 9 novembre 2021

Esistono due fallacie logiche note con locuzioni latine molto simili: post hoc ergo procter hoc e cum hoc ergo procter hoc, spesso abbreviate in post hoc e cum hoc.

Con post hoc si intende l’errore di chi interpreta due eventi occorsi in sequenza come causa il primo e come conseguenza il secondo, per il solo fatto di essersi verificati uno subito dopo o poco dopo l’altro.

L’esempio più attuale e plateale è quello di chi si convince che i vaccini anti-covid siano letali perché alcune persone muoiono poco tempo dopo ricevuto una dose. Ignorando il fatto ovvio che nessun vaccino garantisce l’immortalità.

Il giornale satirico Lercio (che mi regala momenti di ilarità) così ha titolato per mostrare l’ingenuità di un simile ragionamento:

oltre a proporre un’altra notizia totalmente assurda ma (o proprio per questo) godibile che sovverte l’ordine temporale tra (presunta) causa ed effetto:

Più sottile è la fallacia cum hoc, che consiste nel ritenere, di due eventi occorsi contemporamente, che uno sia la causa dell’altro, senza una valida argomentazione.

Nel mondo anglosassone questa fallacia è più nota con la frase correlation is not causation, anche se in realtà il termine correlazione non riguarderebbe due eventi singoli ma due fenomeni d’insieme.

Uno degli esempi più famosi che illustra il motto correlation is not causation recita più o meno così: nel periodo in cui si mangiano più gelati si registra anche un numero maggiore di morti per annegamento, quindi il consumo di gelati aumenta il rischio di annegare. Ovviamente non è così: consumo di gelati e annegamenti sono sì correlati, ma dipendono entrambi dalla stagione estiva, e dunque tra i due non esiste un nesso causale diretto.

Eppure i notiziari ci propongono molto frequentemente esempi di questo tipo, seppure meno plateali, consapevolmente o inconsapevolmente. Io stesso in passato ne ho commentato alcuni, come quando un giornale ha sostenuto che la banda larga aiuterebbe a migliorare il proprio reddito.

Ma torniamo alle coppie di eventi singoli.

quando i piccoli scalano le graduatorie


Se si guarda appunto alla copertura percentuale relativa alla prima dose, spiccano i piccoli borghi

A chiudere la graduatoria provinciale ci sono dei piccoli comuni:

da l’Eco di Bergamo del 24 agosto 2021

L’articolo dell’Eco fa il punto sulla campagna vaccinale degli adolescenti in Provincia di Bergamo, rilevando che sia i comuni con il più alto tasso di copertura che con quello più basso sono dei comuni di piccola dimensione demografica.

In effetti è proprio così, sia per i vaccinati parziali (quelli cioè che hanno ricevuto solo una dose delle due previste) che per i vaccinati completi.

Ho rielaborato i dati provinciali, suddividendoli in due gruppi, quello dei comuni meno popolosi e quello dei comuni più popolosi, in modo che avessero la stessa numerosità (cioè fissando la soglia del numero di adolescenti della fascia 12-19 anni a poco meno di 240). I due grafici seguenti riportano la distribuzione dei comuni piccoli e grnadi, per tasso di vaccinazione (parziale e completa).


La media del tasso di vaccinati è un poco più alta nel gruppo dei piccoli comuni rispetto a quella nei grandi comuni (di circa quattro punti percentuali e mezzo per la prima dose e di circa due punti percentuali e mezzo per le due dosi), quindi qualcuno potrebbe essere portato a ritenere che sia naturale che i tassi più alti si registrino nel primo insieme. Ma lo stesso succede anche per i tassi più bassi, e la giustificazione precedente non vale più.

Invero che i piccoli comuni si trovino ai primi come agli ultimi posti della graduatoria non è una sopresa e non deve apparire come tale.

la zona rossa


Sull’errore, se così vogliamo chiamarlo, che ha portato la Lombardia a essere dichiarata zona rossa per una settimana si è aperta una discussione completamente distorta e fuorviante.

E non mi riferisco alla diatriba sulla responsabilità degli eventi; ciascuno, districandosi tra le differenti e in alcuni casi un po’ ingarbugliate versioni della Regione e dell’Istituto Superiore di Sanità, può alla fine essersi fatto un’idea più o meno precisa di come siano andate le cose.

Ciò che appare del tutto fuori luogo è la feroce opposizione, sempre e comunque, all’istituzione di una zona rossa, considerata come il male assoluto. Esternazioni moralistiche che, ancora prima che l’errore diventasse palese, hanno definito la zona rossa come una punizione immeritata stanno su un piano che è e deve rimanere totalmente estraneo a quello dell’azione finalizzata a proteggere la salute pubblica.

L’epidemia è la malattia, la zona rossa è la cura. Ora, si può legittimamente e anche pesantemente criticare l’efficacia della cura, lo farò anch’io più avanti, ma confondere la prima con la seconda è un assurdo logico che non aiuta a comprendere e ad affrontare il problema.

Ma altrettanto discutibile è l’insistenza sul danno che l’errata istituzione della zona rossa avrebbe provocato. A mio avviso non solo il danno non si può provare, ma di più: potrebbe rivelarsi un beneficio.

Mi spiego.

due positivi due misure

Rene Magritte fair use wikiart

Nessun test diagnostico è infallibile. E’ così anche per i test effettuati per rilevare l’infezione da coronavirus: c’è sempre la possibilità di ottenere un falso positivo, ovvero di sbagliare dichiarando che il virus è presente quando in realtà non c’è, o un falso negativo, ovvero di sbagliare concludendo che il virus è assente quando in realtà c’è.

Il cosiddetto tampone molecolare ha una probabilità estremamente piccola di generare un falso positivo, inferiore all’1%, ma la frequenza dei falsi negativi è nell’ordine del 20%-30% può arrivare, ma solo nelle primissime fasi dell’infezione, al 20%-30%, ché il test molecolare è in assoluto il più affidabile. Con il test sierologico falsi positivi e falsi negativi hanno una frequenza di qualche punto percentuale.

Anche se non si può mai escludere la possibilità di un falso positivo, la plausibilità di un simile caso va valutata tenendo conto di tutte le altre informazioni note. Per esempio, è ragionevole ritenere, in base ai dati appena riportati, che abbia un valore più probante la positività di un tampone molecolare che quella di un test sierologico; ma anche che l’esito positivo di un test effettuato su una persona scelta a caso risulti meno convincente di quello su un contatto stretto di un contagiato già accertato.

Eppure, la cronaca recente ci ha presentato due episodi di positività nei quali i giornalisti, invece di valutare con attenzione tutte le informazioni disponibili, hanno sposato acriticamente la versione più immediatamente spendibile, rinunciando a indagare la sua attendibilità. Di più, paradossalmente, nei due casi la stampa ha sostenuto posizioni opposte, una volta accreditando la versione di un falso positivo, nell’altro trascurandola.

la lastra di Gramellini

Perché Vincenzo De Luca ha deciso di mostrare la lastra dei polmoni di un trentasettenne ricoverato al Cotugno di Napoli con il Covid?

De Luca è un presidente di Regione, e il compito istituzionale dei presidenti non consiste nello spaventare i cittadini, ma nel far funzionare gli ospedali, dotandoli dei posti di terapia intensiva che in questi mesi di tregua si sarebbero potuti e dovuti allestire, magari nel tempo dedicato a mostrare lastre e minacciare l’uso di lanciafiamme in tv.

da il caffé de Il Corriere della Sera del 24 ottobre 2020

Il mio è uno sfogo. Dettato dalla sempre più forte insofferenza verso le stupidaggini che mi capita di leggere e sentire a proposito dell’epidemia in corso. Da tutte le parti. Non solo da quella dei politici, senza distinzioni di sorta, incapaci di comprendere il quadro della situazione ed elaborare strategie concrete e coraggiose, e di alcuni presunti o reali esperti del settore (virologi, immunologi, epidemiologi, anestesisti, e chi più ne ha più ne metta) le cui vanesie e vacue dichiarazioni hanno avuto effetti tanto nefasti, ma anche di giornalisti e commentatori telesivisi che invece di fare le pulci ai primi e ai secondi, evidenziandone le evidenti bugie ma soprattutto le fallacie nelle loro argomentazioni, si crogiolano nel dispensare perle di saggezza che in realtà sono perle di sciocchezza. Pericolose, oltretutto, perché danno un’idea distorta di come affrontare la drammatica situazione che stiamo vivendo.

stop comunque

cortesia di Rodrigo Olivera

“In caso di giocatore positivo a coronavirus, non possiamo escludere la sospensione del campionato”.
In una intervista a ‘Dribbling’, su RaiDue, il presidente della Figc, Gabriele Gravina non esclude che la serie A possa fermarsi del tutto.

da la Repubblica del 7 marzo 2020

In queste ore gli eventi si susseguono veloci e la decisione di fermare in ogni caso il campionato sembra imminente.

Mi sembra comunque interessante discutere dell’ipotesi “di giocatore positivo”. Istintivamente, infatti, subito dopo avere letto il titolo della notizia, ho pensato: sicuramente c’è (almeno) un giocatore positivo! Ma ho anche imparato che a volte il calcolo delle probabilità è controintuitivo. E così mi sono messo a fare qualche conto per valutare quanto è probabile l’ipotesi prospettata. Per fortuna il calcolo è molto semplice; somiglia a quello che descrive il paradosso dei compleanni e che ho già svolto in passato commentando un paio di episodi di cronaca.

Supponiamo che in Italia la percentuale di infetti nella popolazione sia dell’1%, e, siccome il virus non fa distinzione tra una professione e un’altra, di poter adottare la stessa percentuale anche per l’insieme dei giocatori.

Considerando una rosa di 20 giocatori per squadra, i calciatori di serie A sarebbero 400, e il numero atteso di giocatori infetti sarebbe l’1% di 400, cioè 4; analogamente, conteggiando 25 giocatori per squadra si avrebbero 500 calciatori, di cui 5 infetti.

Le due proporzioni precedenti però non permettono di fare valutazioni probabilistiche, nello specifico di indicare con quale probabilità c’è almeno un caso positivo. Abbiamo bisogno di un calcolo più mirato.

doppia sopravvivenza

con il comunicato odierno Iliad afferma che il 97% dei clienti intervistati raccomanderebbe Iliad ad amici e parenti (secondo una scala di gradimento da “abbastanza” a “molto”).

da MondoMobileWeb del 3 dicembre 2019

Giusto qualche giorno fa scrivevo di distorsione da sopravvivenza e ora mi ritrovo sottomano la notizia di cronaca perfetta.

Cos’è la distorsione da sopravvivenza? Lo ripeto: il fenomeno per cui la composizione di un’insieme risulta alterata dal fatto che alcuni elementi che vi apparterrebbero inizialmente vengono eliminati prima dell’osservazione finale.

L’esempio paradigmatico riportato da quasi tutti gli articoli e i libri sull’argomento è un caso storico.

il clima(x) dell’ultimatum

cortesia di Max Pixel

Si è svolta l’altro giorno in diversi paesi del mondo e con grande risalto mediatico la manifestazione per il clima (sic). Tante testate insistono sul fatto che ci sarebbe davvero poco tempo per scongiurare il disastro («Solo 11 anni per fermare la crisi, poi sarà irreversibile», titola per esempio il Corriere della Sera del 15 marzo 2019), probabilmente riprendendo le conclusioni dell’ultimo rapporto dell’agenzia intergovernativa dell’Onu sui cambiamenti climatici.

E’ un messaggio che si ripete senza soluzione di continuità. Ecco di seguito una carrellata di titoli di articoli che mi ha restituito una semplice ricerca, limitata peraltro all’ultimo anno, tratti dalla stampa nazionale:

  • Clima, l’allarme dell’Iss: «Restano solo 20 anni per salvare il Pianeta» – Corriere della Sera, 3 dicembre 2018
  • Clima alla resa dei conti: abbiamo solo 10 o 15 anni per invertire la rotta – Earth Day Italia, 9 Maggio 2018
  • Riscaldamento Globale E Cambiamenti Climatici: Nuovo Rapporto ONU, Ci Restano Solo Dieci Anni Per Mettere Le Cose A Posto – Reccom Magazine, 8 ottobre 2018

e internazionale:

  • Scientists say 25 years left to fight climate change – Public Radio International, 13 settembre 2018
  • Climate Scientists to World: We Have Only 20 Years Before There’s No Turning Back – NRDC, 12 ottobre 2018
  • The point of no return for our planet is only 17 years away – The Outline, 30 agosto 2018

Allentando di poco i criteri temporali di ricerca si trovano altri articoli, come questo, che risale a meno di due anni fa, e con il quale concludo la rassegna:

  • Clima, ci restano solo tre anni per evitare la catastrofe – Linkiesta, 30 giugno 2017

Insomma, è tempo di prendere le cose sul serio. Chi ritiene sia giusto e utile seminare il terrore (sbagliando peraltro obiettivo) si espone al rischio di ridicolizzare la sua causa.

dare i numeri sul var

cortesia di Raúl Pérez Lara

Nelle prime 20 giornate […] si sono disputate in totale 198 partite. In queste ci sono stati 55 cambi di decisione indotti dal VAR. Ci sono stati 10 errori gravi […].

Tiziano Pieri, ex arbitro di serie A, su ilsuddidiario.net, 8 gennaio 2018

Nelle prime 20 giornate di campionato, abbiamo contato 58 decisioni giuste prese con l’ausilio delle immagini […] contro le 26 decisioni sbagliate prese pur potendo avvalersi del supporto tecnologico. Un rapporto di due a uno, sicuramente migliorabile, che comunque deve far riflettere: nel 66% delle situazioni dubbie, dal Var è arrivato un assist a chi era in campo a fischiare evitando un errore.

il Corriere dello sport, 9 gennaio 2018

Il Var […] analizza sempre tutto […]. Soltanto in 70 […] casi, il Var ha interloquito con l’arbitro in campo e in 20 occasioni ha cambiato le decisioni del campo. Su 900 casi, in totale, sono stati commessi solo 5 errori quindi il bilancio è positivo.

Marcello Nicchi, presidente degli arbitri, su diariodelweb.it, 10 gennaio 2018

In 210 partite, quindi, sono state 1.078 le verifiche eseguite con la Var, verifiche che hanno prodotto 60 correzioni delle decisioni arbitrali, di cui 11 errate, incluse 7 che hanno influenzato il risultato. Si parla, quindi, di una percentuale di errore pari all’1%, rispetto ad una percentuale del 5,6% di errori senza VAR (0,28 errori a partita in media).

redazione di calcioefinanza.it, 15 gennaio 2018

Ecco in sintesi i numeri di questa (incompleta) rassegna stampa dell’ultima settimana:

sito ilsussidiario.net corrieredellosport.it diariodelweb.it calcioefinanza.it
fonte Pieri (ex arbitro) testata Nicchi (presidente arbitri) Rizzoli (designatore arbitrale)
giornate 20 20 20 19
partite 198 210
verifiche 900 1078
correzioni arbitrali 55 20 60
errori 10 26 5 11

Oltre a rendere evidente che anche nelle statistiche sugli errori ci sono invariabilmente degli errori (e forse una quota di pressapochismo, almeno in alcuni), è la dimostrazione che più dati non significa necessariamente maggiore precisione, e che in ogni operazione di classificazione, soprattutto se di eventi controversi, una certa componente soggettiva è ineliminabile.

Ma c’è una considerazione ancora più importante da fare.

perché l’attuale dinamica migratoria impoverisce tutti

migranti.jpg

cortesia di Radio Alfa

Se da un lato il tema dell’immigrazione raccoglie opinioni fortemente polarizzate, da un punto di vista strettamente matematico le cose sono molto più semplici: l’attuale ondata migratoria di cui siamo testimoni impoverisce tutti: sia il nostro paese, che riceve i migranti, che i paesi di partenza, da dove se ne vanno.

Si tratta di una conclusione che poggia su un argomento noto da tempo come effetto di Will Rogers, la cui dimostrazione è alla portata di tutti dato che non richiede nessuna conoscenza matematica approfondita, e proprio per questo mi stupisce che nessuno l’abbia mai presentata finora. O almeno, io non l’ho mai letta, e mi propongo qui di riparare a questa lacuna.

Per introdurre tale dimostrazione, occorre osservare in via preliminare che i fenomi fenomeni migratori non sono tutti uguali ma possono distinguersi secondo diverse caratteristiche: per esempio, il contesto geopolitico, economico, sociale, eccetera, dei paesi coinvolti.

Qui in particolare mi interessa classificare i fenomeni migratori secondo due variabili: il livello medio di ricchezza che sono in grado di produrre i migranti nei paesi che lasciano e in quelli che li ospitano. Espliciterò per semplicità tali variabili solo secondo due livelli: sopra la media e sotto la media, così da arrivare alla suddivisione descritta nella tabella che segue.