lo strano caso dei numeri di immuni

Da quando è stata lanciata su tutto il territorio nazionale, il 15 giugno scorso, in Italia si sono contati circa 10 mila contagi, di questi scovati grazie a Immuni appena 47. Fatte le debite proporzioni, calcolando che ad averla installata sul proprio smartphone è il 7,7% della popolazione complessiva, almeno 7-800 casi si sarebbero dovuti attribuire alla app, invece qui siamo allo zero virgola qualcosa.

da La Stampa, 1 agosto 2020

Così qualche giorno fa Paolo Russo, commentando il misero numero di casi di covid19 individuati, concludeva che c’è qualcosa di serio che non funziona nell’app Immuni.

I numeri sono stati poi aggiornati dal Ministero dell’Innovazione, ma rimangono comunque estremamente modesti. In ogni caso, su Il Post Maurizio Codogno ha spiegato che ciò non dipende da un qualche difetto del sistema o del comportamento dei suoi utenti, ma è una conseguenza diretta della bassa percentuale di persone che usano l’app.

Qui vorrei semplicemente estendere la sua spiegazione aiutandomi con un semplice diagramma e una tabella numerica.

a caso è il meglio

L’altra sera, in uno dei talk-show più seguiti su un canale privato, la conduttrice, […] interloquendo con un ministro, ha creduto di sfondare una porta aperta sottolineando ironicamente come l’idea di effettuare un test di immunità su 150mila italiani sia risibile, dato che gli italiani sono 60 milioni. Lo stesso ministro, peraltro, non ha saputo obiettare alcunché su questo punto.

La signora in questione, come purtroppo la maggioranza degli italiani (ma la cosa vale anche all’estero), ignora del tutto che la rappresentatività di una campione non dipende affatto dal suo rapporto con l’ampiezza della popolazione ma dalla sua numerosità assoluta.

Massimo Negrotti su l’Opinione del 5 maggio 2020

Mi par di capire che Massimo Negrotti non sopporti Lilli Gruber. Anche a me i suoi modi non piacciono (più per il loro carattere fazioso che per quello saccente), ma sul punto contestato sono più indulgente. Mi sorprende di più invece, se le cose sono andate come l’autore del pezzo descrive, l’inerzia del ministro che se pure non conoscesse dovrebbe farsi spiegare da chi sa, prima di farsi intervistare in televisione.

Sono più indulgente non solo perché immagino che la Gruber sia in buona (anzi, cattiva) compagnia di tanti altri suoi colleghi, ma anche perché tutti i numeri sull’epidemia diffusi giornalmente dalla protezione civile soffrono di distorsioni da selezione che possono generare un fraintendimento della legge ricordata da Negrotti.

Cerco di spiegarmi ricorrendo nuovamente alla metafora che ho usato l’ultima volta. Abbiamo un enorme barattolo zeppo di caramelle gialle e rosse, e dobbiamo stimare la quota di caramelle rosse che contiene. Quante ne dobbiamo togliere e contare, per stimare adeguatamente la percentuale effettiva (diciamo, sbagliando al più dell’1%)? La risposta più semplice è: tutte o quasi (ovvero, almeno il 99%), se non sappiamo esattamente come è stato riempito il barattolo! Infatti, può darsi che siano state versate nel barattolo prima tutte le caramelle gialle, che quindi si sono accumulate sul fondo, e poi tutte quelle rosse, che quindi sono rimaste in superficie, o viceversa.

mille lucciole per lanterne

cortesia di Robert Anasch

Coronavirus, il mistero di Ferrera paese senza contagi. “Venite a studiarci”
Mille abitanti in provincia di Pavia, nessuno positivo. Per il sindaco un’occasione: “Analizzate il sangue dei residenti”. Ma dalla Regione è arrivato il no.

da la Repubblica, 30 marzo 2020

Purtroppo il sindaco ha preso una grossa cantonata. Meglio sia finita così, anche se il rifiuto a indagini sembra dettato più da questioni burocratiche che dalla reale comprensione del caso.

Quando ho letto di un paese di soli mille abitanti, ho pensato subito a un artefatto statistico. Più precisamente, al prevedibile effetto della legge secondo cui un insieme di piccoli gruppi presenta maggiore variabilità relativa di un insieme di grandi gruppi.

Vediamo di spiegare il concetto, che è più semplice da illustrare che da enunciare, con un esperimento ideale.

quanti sono i contagiati in Italia

Ho scritto qualche giorno fa che l’evolversi della situazione sarebbe stato veloce e così è stato.

Devo cercare di mettere per iscritto in fretta le mie idee se non voglio che tra qualche giorno appaiano sorpassate.

Nessuno sa quanti sono i contagiati da coronavirus. Nessuno. I numeri che vengono comunicati giornalmente dalle autorità e riportati sugli organi d’informazione rappresentano, come in molti hanno capito, una tremenda sottostima del numero di contagiati, perché si riferiscono solo ai casi sintomatici, anzi, forse anche solo ai casi più gravi tra i sintomatici.

In teoria basterebbe un campione probabilistico di qualche migliaio di test in tutta Italia per avere una ragionevole stima della percentuale (e del numero) di contagiati. Cioè un campione selezionato scegliendo a caso tra tutti gli italiani, eventualmente rispettando delle quote per ripartizione geografica, fascia d’età e genere.

Conoscere il numero dei contagiati aiuterebbe a capire a che punto è davvero l’epidemia, tanto che un gruppo di esperti ha lanciato un appello per effettuare una massiccia campagna di test. Sull’iniziativa però ci sono pareri discordanti; qualcuno ha espresso dubbi sull’attendibilità e sull’effetto dei risultati. In particolare perché, nei casi asintomatici allo stadio iniziale, non si sa in quale percentuale, il test tramite tampone non sarebbe in grado di rilevare la presenza del virus e l’esito negativo potrebbe portare le persone a comportarsi senza più la necessaria prudenza, mettendo a rischio chi viene in contatto con loro.

Comunque sia, i ventimila e passa contagiati ufficiali sono solo i casi accertati. Sul numero, molto verosimilmente rilevante, di quelli che sfuggono alla rilevazione siamo solo nella condizione di fare delle ipotesi.

una differenza che fa la differenza

cortesia di Wikipedia

Il reddito di cittadinanza è riuscito nell’intento di ridurre la povertà nel nostro Paese. È il giudizio del presidente dell’Inps Pasquale Tridico []: “Il tasso di povertà nel nostro Paese si è ridotto di 8 punti percentuali”

da la Repubblica del 20 dicembre 2019

C’è qualcosa che non va.
Per spiegare cosa, devo aprire un inciso e presentare un esempio numerico non direttamente legato al caso in questione.

Supponiamo che un qualche indice che vale 25 subisca una variazione negativa arrivando a 18.

Possiamo immaginare un contesto e un’unità di misura qualsiasi: i due valori possono esprimere indifferentemente un reddito espresso in migliaia di euro, o l’ammontare di una popolazione in milioni di abitanti, o il tempo medio di risoluzione di una pratica in giorni o mesi, o quello che volete voi. La variazione assoluta dell’indice, misurata dalla semplice differenza tra i due valori, è pari a 25-18 = 7. Quella relativa (o percentuale), misurata rapportando la semplice differenza al primo valore, è pari a 7/25 = 0.28 = 28%. Fin qui, non c’è possibilità di fraintendimento, perché l’unità di misura della variazione chiarisce di che tipo è: se la variazione è espressa senza percentuale, sottindendendo la stessa unità di misura dei due valori cui si riferisce, allora è assoluta; se invece è espressa in forma percentuale, allora è relativa.

Le cose si complicano leggermente quando invece l’indice rappresenta una qualche grandezza percentuale.

per un pugno di vegani

cortesia di Jannis Brandt

Il rapporto Eurispes correla questa abitudine alimentare anche con l’orientamento politico, ed emerge una sorpresa. Parafrasando Gaber: “Il vegano per scelta è più di destra, vegetariano forse di sinistra”. L’8,1% di chi si colloca a destra o nel centro destra è vegano, contro lo 0,9% di chi si colloca a sinistra o nell’estrema sinistra. È inoltre vegano il 2,8% di chi ha votato Movimento 5 stelle. A sinistra sono tuttavia vegetariane 14 persone su 100, il doppio di chi si dichiara di centro destra. È vegetariano il 5,5% degli elettori del Movimento.

da infodata.ilsole24ore.com dell’8 ottobre 2019

Solo qualche giorno fa m’è capitato di leggere l’articolo pubblicato nella sezione infodata del sole 24 ore lo scorso mese, sulla relazione tra veg(etari)anesimo e orientamento politico. L’analisi riprende pari pari i risultati della ricerca Eurispes Rapporto Italia 2019 pubblicata a febbraio di quest’anno. La relazione tra dieta alimentare e orientamento politico può apparire sorprendente, per cui ho provato a indagarla. Finendo, lo anticipo, per smontarla.

fuga dalla sosta

cortesia di shuets udono

Dai risultati della ricerca, condotta su un campione di 1.220 persone di tutta la penisola con un’età compresa tra i 18 e i 74 anni, è emerso che il 17,7% degli italiani con patente di guida, cioè circa 7,7 milioni di automobilisti, ha danneggiato almeno una volta un veicolo in sosta.

Ma ciò che più colpisce è la scorrettezza: dall’indagine emerge infatti che 1,3 milioni di automobilisti hanno preferito andar via senza lasciare alcun recapito, anziché lasciare il classico bigliettino lasciato sul parabrezza. A conti fatti, parliamo del 16,5% di chi ha dichiarato di aver danneggiato un’auto in sosta.

da quattroruote.it del 24 giugno 2019

Qualcuno potrebbe chiedersi: come si fa a intervistare poco più di un migliaio di persone e a concludere che gli automobilisti che hanno avuto un certo comportamento sono diversi milioni?

Nel caso in esame c’è un numero non dichiarato che spiega la prima cifra assoluta: 43,5 milioni di automobilisti nella fascia d’età considerata; numero ricavato, presumibilmente, dagli archivi della motorizzazione civile. Applicando a questa cifra la percentuale rilevata tra gli intervistati, si ottiene per l’appunto 43,5*17,7% = 7,7 milioni, che rappresenta la stima del numero complessivo di automobilisti italiani che avrebbero vissuto lo stesso genere di episodi di quelli intervistati. Analogamente, gli 1,3 milioni di automobilisti scorretti si ottengono applicando la percentuale del 16,5% ai 7,7 milioni precedenti.

E’ legittimo fare una simile proporzione?

commentare l’acqua fresca

cortesia di Vito Parlato

Acque balneari italiane, il 95% risulta di eccellenza ma ci sono più siti inquinati

Una buona e una cattiva notizia, servite insieme. L’Italia entra nella top ten dei Paesi europei, collocandosi nona, per l’ottima qualità delle sue acque di balneazione, ma al contempo è anche prima in Europa per la quantità di siti, ben 89, con acque balneabili di bassa qualità. Il giudizio arriva dal Rapporto Ue sulle acque balenabili 2018 della Commissione europea e dell’Agenzia Ue per l’ambiente (Eea)

da la Repubblica, 23 giugno 2019

Mi era capitato di scrivere di balneabilità delle coste tre anni fa, scrivendo di una rilevazione in teoria allarmante ma in pratica insignificante.

Anche questa volta, nonostante un titolo formalmente corretto a differenza di tante altre occasioni, la sostanza è abbastanza evanescente.

Tanto per cominciare, occupare il nono posto su ventotto non è un risultato di particolare rilievo. L’articolo non scrive esplicitamente in base a quale criterio è compilata la classifica, anche se lascia intendere che sia la percentuale di acque balneabili di ottima qualità. In tal caso però non è giusto affermare che l’Italia entra nella top ten dato che anche secondo il rapporto dell’anno precedente l’Italia occupava la stessa posizione.

La buona notizia, insomma, non è così buona. Anzi, non è nemmeno una notizia.

mai dire mai due volte

cortesia di Nazionale Calcio

Il Napoli non perde mai due volte

[I]nteressante statistica in vista di … Napoli-Genoa, gara valida per la 31esima giornata della Serie A 2018-2019. […]

Gli azzurri sono reduci dal KO patito nel turno infrasettimanale sul campo dell’Empoli […]. In questa stagione dopo ogni KO sono comunque arrivati dei punti: in 3 occasioni altrettante vittorie, in 1 circostanza un segno X.

da TuttoNapoli.net, 7 aprile 2019

Spiegavo poco tempo fa che le previsioni (o le affermazioni) basate sulle statistiche nel calcio non hanno alcun valore effettivo. Di più, le ho definite un semplice azzardo, come scommettere sull’esito del lancio di una moneta.

A questo proposito l’articolo della citazione iniziale rappresenta un caso perfetto da commentare. Nel titolo, al posto di “Il Napoli quest’anno non ha mai perso due volte di fila”, che risulterebbe una constatazione evidente ma poco originale, si è scelto “Il Napoli non perde mai due volte di fila” che è una generalizzazione eclatante ma per nulla dimostrata.

Infatti, si potrebbe pensare che con cinque sole sconfitte in trenta partite non sia così improbabile subire due sconfitte di fila. La cosa interessante nel caso in esame è che i numeri in gioco permettono di misurare esattamente quanto è fondata una siffatta generalizzazione.

un obiettivo equivoco

In questi giorni gli utenti italiani di Wikipedia che accedono alle pagine dell’enciclopedia si trovano di fronte diversi avvisi che li invitano a fare una donazione. E’ la campagna di raccolta fondi per l’enciclopedia che si ripete una o più volte l’anno in ogni area geografica del mondo, per ricordare a tutti che Wikipedia ha bisogno del supporto economico dei suoi utenti. Nel corso degli anni il testo dei messaggi è cambiato più volte. Se in alcune passate occasioni è stato usato un tono drammatico, prospettando che la sopravvivenza e l’indipendenza di Wikipedia fossero in pericolo, il tono di quest’anno è senz’altro misurato e riflette il fatto che Wikipedia è oramai una realtà consolidata.

In ogni caso, A fronte di un’ipotesi utopistica (se tutti coloro che stanno leggendo questo avviso donassero due euro) viene presentata una conclusione che, sia nella versione attuale (potremmo permetterci di far crescere Wikipedia negli anni a venire) che in alcune di quelle passate (la nostra raccolta fondi sarebbe completa nel giro di un’ora), personalmente non mi ha mai convinto.