un anno di esponenziale: non c’è senza tre

esponenziale: puntata uno

Articoli precedenti della serie:

  1. prologo

Si dice che una rondine non fa primavera. Ma allora quante rondini fanno primavera? Ecco, una domanda analoga può valere anche a proposito del termine esponenziale: quanti numeri occorrono per parlare di crescita esponenziale?

Non si tratta di una questione accademica, tutt’altro. Nel primo articolo di questa serie abbiamo visto che per esponenziale si intende un cambiamento repentino e sostenuto, oppure percentualmente costante, ma che le due interpretazioni, risultando indipendenti l’una dall’altra, possono ingenerare confusione. Discutere del numero dei dati che articolisti e commentatori presentano come prova di uno sviluppo esponenziale è la maggior parte delle volte l’indicatore più utile per distinguere tra le due interpretazioni, ma non solo: aiuta a capire se davvero certe cifre meritano un’attenzione particolare, al di là degli appellativi con cui sono descritte.

Ecco a titolo di esempio gli estratti di alcune notizie pubblicate lo scorso anno.

un anno di esponenziale: prologo

esponenziale: puntata zero

In base ai dati di google, nel 2019 risultano essere state pubblicate 50.100 pagine contenenti la parola esponenziale, salite nel 2020 a 86.200 e nel 2021 a 506mila. Una crescita sbalorditiva, forse anche sostenuta dai tanti articoli che in tempo di pandemia descrivono la diffusione dei contagi con questa parola.

L’uso sempre più esteso della parola ha coinvolto praticamente tutti i campi dell’informazione: dallo sport all’economia passando per mille discipline, nella cronaca spicciola come nei discorsi sui massimi sistemi, ogni statistica sembra buona per dichiarare esponenziale l’evoluzione di un qualche fenomeno.

Ma è davvero così? Cioè, cosa significa davvero la parola esponenziale? e quale dinamica descrive esattamente?

influencer is not causation

Belen Rodriguez riesce a fare con un post quello che non è riuscito agli ambientalisti in 25 anni: arriva l’ok alla Riserva naturale di Punta Bianca
Dagli anni Sessanta la grande roccia di Agrigento è danneggiata da esercitazioni dell’esercito nel vicino poligono. Le associazioni chiedono da tempo la tutela dell’area e l’ultimo sit-in è di pochi giorni fa. Ma il governatore si decide solo dopo l’uscita social della showgirl.

da ilFattoQuotidiano.it del 9 novembre 2021

Esistono due fallacie logiche note con locuzioni latine molto simili: post hoc ergo procter hoc e cum hoc ergo procter hoc, spesso abbreviate in post hoc e cum hoc.

Con post hoc si intende l’errore di chi interpreta due eventi occorsi in sequenza come causa il primo e come conseguenza il secondo, per il solo fatto di essersi verificati uno subito dopo o poco dopo l’altro.

L’esempio più attuale e plateale è quello di chi si convince che i vaccini anti-covid siano letali perché alcune persone muoiono poco tempo dopo ricevuto una dose. Ignorando il fatto ovvio che nessun vaccino garantisce l’immortalità.

Il giornale satirico Lercio (che mi regala momenti di ilarità) così ha titolato per mostrare l’ingenuità di un simile ragionamento:

oltre a proporre un’altra notizia totalmente assurda ma (o proprio per questo) godibile che sovverte l’ordine temporale tra (presunta) causa ed effetto:

Più sottile è la fallacia cum hoc, che consiste nel ritenere, di due eventi occorsi contemporamente, che uno sia la causa dell’altro, senza una valida argomentazione.

Nel mondo anglosassone questa fallacia è più nota con la frase correlation is not causation, anche se in realtà il termine correlazione non riguarderebbe due eventi singoli ma due fenomeni d’insieme.

Uno degli esempi più famosi che illustra il motto correlation is not causation recita più o meno così: nel periodo in cui si mangiano più gelati si registra anche un numero maggiore di morti per annegamento, quindi il consumo di gelati aumenta il rischio di annegare. Ovviamente non è così: consumo di gelati e annegamenti sono sì correlati, ma dipendono entrambi dalla stagione estiva, e dunque tra i due non esiste un nesso causale diretto.

Eppure i notiziari ci propongono molto frequentemente esempi di questo tipo, seppure meno plateali, consapevolmente o inconsapevolmente. Io stesso in passato ne ho commentato alcuni, come quando un giornale ha sostenuto che la banda larga aiuterebbe a migliorare il proprio reddito.

Ma torniamo alle coppie di eventi singoli.

i vaccini in prospettiva

Ho letto su twitter una brillante analisi di Christina Pagel che esamina l’impatto della pandemia sulle differenti fasce d’età della popolazione per fornire qualche previsione sugli effetti a breve termine dalla politica di vaccinazione.

La ripropongo qui, senza alcuna ambizione di originalità, ma solo adattandola ai dati italiani che sono riuscito a raccogliere.

Procediamo per passi.

Primo passo: mettiamo a confronto la distribuzione per età della popolazione con quella dei casi confermati.

Se risultassero sensibilmente differenti, si identificherebbero quelle fasce di età che più delle altre sono colpite dal covid e, di conseguenza, contribuiscono anche alla diffusione della malattia. Un’informazione utile, almeno potenzialmente, per decidere la priorità nelle vaccinazioni.
Ma la composizione delle due barre si somiglia molto, a indicare che il covid colpisce all’incirca nella stessa misura tutte le fasce di età, con l’eccezione dei più giovani. E, del resto, occorre essere prudenti nel trarre conclusioni da questo confronto, perché il numero dei casi accertati sottostima fortemente il numero dei casi effettivi, e non è detto che la distribuzione per età di questi ultimi corrisponda a quella dei primi, che dipende anche dalla politica con cui si eseguono i test. Diventa più facile, infatti, trovare casi positivi tra i giovani, gli adulti o gli anziani semplicemente facendo più test in quegli stessi gruppi.

Secondo passo: esaminiamo anche la distribuzione per età dei malati che sono stati ricoverati in ospedale.

la zona rossa


Sull’errore, se così vogliamo chiamarlo, che ha portato la Lombardia a essere dichiarata zona rossa per una settimana si è aperta una discussione completamente distorta e fuorviante.

E non mi riferisco alla diatriba sulla responsabilità degli eventi; ciascuno, districandosi tra le differenti e in alcuni casi un po’ ingarbugliate versioni della Regione e dell’Istituto Superiore di Sanità, può alla fine essersi fatto un’idea più o meno precisa di come siano andate le cose.

Ciò che appare del tutto fuori luogo è la feroce opposizione, sempre e comunque, all’istituzione di una zona rossa, considerata come il male assoluto. Esternazioni moralistiche che, ancora prima che l’errore diventasse palese, hanno definito la zona rossa come una punizione immeritata stanno su un piano che è e deve rimanere totalmente estraneo a quello dell’azione finalizzata a proteggere la salute pubblica.

L’epidemia è la malattia, la zona rossa è la cura. Ora, si può legittimamente e anche pesantemente criticare l’efficacia della cura, lo farò anch’io più avanti, ma confondere la prima con la seconda è un assurdo logico che non aiuta a comprendere e ad affrontare il problema.

Ma altrettanto discutibile è l’insistenza sul danno che l’errata istituzione della zona rossa avrebbe provocato. A mio avviso non solo il danno non si può provare, ma di più: potrebbe rivelarsi un beneficio.

Mi spiego.

Italia terra di lotterie, scontrini e giocatori


Da PagoPa fanno sapere a Repubblica che a mandare in tilt l”app – in realtà solo la parte “portafoglio” dove caricare le carte – è il boom di richieste di richieste, oltre 6 mila al secondo – che hanno mandato in sovraccarico i servizi bancari.

In effetti l’app ora conta 6,3 milioni di download, mentre erano 4 milioni a novembre e un milione a luglio.

da repubblica.it del 7 dicembre

L’inizio del discusso programma di rimborsi sui pagamenti elettronici, con annessa lotteria di stato, è slittato dal 1 dicembre a domani, 8 dicembre. L’app IO che avrebbe dovuto permettere a tutti i cittadini di partecipare non era ancora completa in tutte le sue funzioni ed è stata aggiornata nelle scorse ore. E da quel momento, una marea di italiani si è precipitata a immettere i dati delle prorie carte e del prorio conto corrente su cui ricevere lo sconto del 10% sui prossimi acquisti eseguito con pagamenti elettronici. Del resto, non poteva essere diversamente, essendo a ridosso del via all’iniziativa.

Una marea sì ma… 6mila italiani al secondo… Un calcolo velocissimo mi dice che 6mila accessi al secondo per 60 secondi al minuto per 60 minuti all’ora per 24 ore fanno più di 500 milioni di accessi in un giorno, quando gli italiani sono appena 60 milioni.

E considerato che bambini e anziani senza carte di credito non possono iscriversi, e che, anzi, come lo stesso articolo segnala, a oggi solo 6,3 milioni di cittadini hanno installato l’app, a 6 mila accessi al secondo basterebbe poco più di un quarto d’ora per permettere a tutti i cittadini richiedenti di completare la propria registrazione.

Insomma, 6 mila accessi al secondo non è il volume medio delle richieste ma quello di picco che ha mandato in crisi la piattaforma. Ma soprattutto. Si tratta di un numero di accessi cui non corrisponde, molto verosimilmente, lo stesso numero di utenti. In altre parole: è più plausibile che siano i tentativi reiterati e insistenti di un certo numero di utenti a generare la gran parte delle richieste di accesso e a ingolfare la piattaforma, che d’altra parte da l’impressione di essere stata sviluppata in maniera non certo impeccabile, mandandola in tilt.

Se tutti i 6,3 milioni di utenti venissero invitati a presentarsi a orari prestabiliti, scaglionando uniformemente gli accessi nelle prossime 24 ore, sarebbe sufficiente, lato piattaforma, poter resistere a un carico di circa 70 accessi al secondo. Ovviamente ora non è possibile programmare una cosa del genere e forse non lo sarebbe stato nemmeno prima. Ma rende comunque l’idea che, come utenti, basta avere un po’ di pazienza perché tutto vada a posto. Lasciando passare un po’ di tempo tra un tentativo e l’altro, o riprovando in un orario sulla carta meno affollato. Suvvia, scontrini e lotteria non scappano.

due positivi due misure

Rene Magritte fair use wikiart

Nessun test diagnostico è infallibile. E’ così anche per i test effettuati per rilevare l’infezione da coronavirus: c’è sempre la possibilità di ottenere un falso positivo, ovvero di sbagliare dichiarando che il virus è presente quando in realtà non c’è, o un falso negativo, ovvero di sbagliare concludendo che il virus è assente quando in realtà c’è.

Il cosiddetto tampone molecolare ha una probabilità estremamente piccola di generare un falso positivo, inferiore all’1%, ma la frequenza dei falsi negativi è nell’ordine del 20%-30% può arrivare, ma solo nelle primissime fasi dell’infezione, al 20%-30%, ché il test molecolare è in assoluto il più affidabile. Con il test sierologico falsi positivi e falsi negativi hanno una frequenza di qualche punto percentuale.

Anche se non si può mai escludere la possibilità di un falso positivo, la plausibilità di un simile caso va valutata tenendo conto di tutte le altre informazioni note. Per esempio, è ragionevole ritenere, in base ai dati appena riportati, che abbia un valore più probante la positività di un tampone molecolare che quella di un test sierologico; ma anche che l’esito positivo di un test effettuato su una persona scelta a caso risulti meno convincente di quello su un contatto stretto di un contagiato già accertato.

Eppure, la cronaca recente ci ha presentato due episodi di positività nei quali i giornalisti, invece di valutare con attenzione tutte le informazioni disponibili, hanno sposato acriticamente la versione più immediatamente spendibile, rinunciando a indagare la sua attendibilità. Di più, paradossalmente, nei due casi la stampa ha sostenuto posizioni opposte, una volta accreditando la versione di un falso positivo, nell’altro trascurandola.

una moltiplicazione dopo l’altra

cortesia di Audrey Penven

Il mese scorso la bbc ha pubblicato un articolo che sostiene come la mancata comprensione del principio sottostante la crescita esponenziale (in inglese, exponential growth bias) renda le persone più maldisposte a conformarsi ai comportamenti indicati per evitare il contagio e, più in generale, ad accettare i provvedimenti attuati per contenere l’epidemia.

L’articolo è stato poi scopiazzato ripreso nei giorni seguenti, senza molta originalità, da diverse testate nazionali.

doppia sopravvivenza

con il comunicato odierno Iliad afferma che il 97% dei clienti intervistati raccomanderebbe Iliad ad amici e parenti (secondo una scala di gradimento da “abbastanza” a “molto”).

da MondoMobileWeb del 3 dicembre 2019

Giusto qualche giorno fa scrivevo di distorsione da sopravvivenza e ora mi ritrovo sottomano la notizia di cronaca perfetta.

Cos’è la distorsione da sopravvivenza? Lo ripeto: il fenomeno per cui la composizione di un’insieme risulta alterata dal fatto che alcuni elementi che vi apparterrebbero inizialmente vengono eliminati prima dell’osservazione finale.

L’esempio paradigmatico riportato da quasi tutti gli articoli e i libri sull’argomento è un caso storico.

l’orientale ovvero la padella col buco

cortesia di IlSistemone

Guido Trombetti su La Repubblica del 15 luglio si lamenta dei risultati poco lusinghieri ottenuti dalle università campane nella recente classifica stilata dal Censis, incappando tuttavia in diverse incongruenze.

Ecco le sue due premesse.

Sui fattori che vengono considerati per scegliere un ateneo piuttosto che un altro:

Nello scegliere l’università i ragazzi, e le loro famiglie, adoperano i più disparati criteri. Certamente la fama degli atenei. Ma anche le esperienze spicciole narrate da amici e parenti. Certamente incidono i costi necessari a frequentarne uno lontano piuttosto che uno vicino. Ma anche il fascino di nuove esperienze di vita. Come conta la qualità delle strutture e dei servizi. E, ma invero poco, la qualità del corpo docente.

Sulla valenza delle classifiche degli atenei.

Infine incombe sulle scelte la foresta di classifiche in circolazione. Ce ne sono in giro molte. Alcune serie. Altre meno. I parametri scelti per stilarle variano. E con essi i risultati. Per cui l’unico valore che si può riconoscere è quello di una indicazione di massima.

Poi così prosegue.