sistema fallibile

Dal tgcom:

I due sei milionari di Napoli, centrati nella stessa ricevitoria con giocate piazzate a un giorno di distanza, sono il frutto di un errore. A spiegare quanto accaduto, il titolare della ricevitoria in Corso Vittorio Emanuele. In pratica i ricevitori avrebbero stampato due volte alcune delle combinazioni che la Sisal invia a ogni estrazione. “E’ stata una svista, abbiamo stampato due blocchi identici di schedine”, ha affermato il titolare.

La notizia della recente doppia vincita al superenalotto ha originato un fiume di commenti. Qualcuno parla di coincidenza, ma se debbiamo credere a Freud (e non solo a lui) le coincidenze non esistono. Che pensare allora?

Mettendo subito in chiaro che non ho alcun interesse a considerare le vari(opint)e ipotesi di un’estrazione truccata o pilotata, a mio avviso molto poco plausibili, vorrei presentare e discutere l’episodio come se fosse un semplice problema di calcolo delle probabilità, concentrandomi solamente sulla versione ufficiale dell’errore involontario e sull’alternativa della doppia compilazione come prassi abituale. Non sono un assiduo frequentatore di ricevitorie, quindi non posso dire di essere un grande conoscitore dell’ambiente, però la possibilità che un gestore stampi due volte dei blocchi di schedine per risparmiare tempo mi sembra in effetti una tra le possibilità alternative più ragionevoli.

Nota bene: Non ho intenzione di sostenere l’esistenza di un complotto, ne di fare illazioni su comportamenti che, in ogni caso, non sono illeciti. Ho solo preso spunto da un episodio di cronaca per discutere a livello didattico un problema interessante. Se iniziate a leggere, siete pregati di arrivare fino alla fine.

Dunque, in accordo con questa premessa, supponiamo ipoteticamente che esistano solo due possibilità:

  1. il gestore stampa per sbaglio due volte un blocco di schedine;
  2. il gestore per sua comodità stampa sempre due volte tutti i blocchi di schedine

e vediamo di calcolare la probabilità delle due ipotesi sapendo che si è verificata la doppia vincita. Si tratta di una banale applicazione del teorema di Bayes, ma, a beneficio di chi non sa nulla di calcolo delle probabilità, prometto di non usare nessuna formula e di tenere il discorso al livello più informale che mi è possibile.

Se il gestore sostiene di stampare i blocchi che gli vengono consegnati solo una volta, allora possiamo dargli credito, attribuendo a priori (cioè: prima del verificarsi di qualunque evento) alla versione A una probabilità del 99% e alla versione B la restante probabilità dell’1%. Mi pare una scelta molto, molto onesta. Si consideri che nei test di paternità, è consuetudine considerare le due alternative (la persona che si è sottoposta al prelievo è il padre – la persona che si è sottoposta al prelievo non è il padre) alla pari, attribuendo a entrambe la stessa probabilità: 50% e 50%.

Per comodità di calcolo, ammettiamo anche che il gestore abbia 1.000 blocchi di schedine, tutte differenti, da stampare e che riesca a vendere 1.000 blocchi di schedine. Più avanti accennerò anche a cosa succede con numeri differenti. Nel caso A, c’è un solo identico blocco venduto due volte (quello ristampato per errore). Nel caso B invece ci sono 500 diversi blocchi (non importa quali) venduti due volte.

Quale è la probabilità che venga estratta una combinazione riportata su una schedina doppia? Se le possibili combinazioni nel gioco del superenalotto sono N, allora per quanto appena descritto tale probabilità è 1/N nel caso A e 500/N nel caso B.

Dunque a posteriori (cioè considerato il verificarsi della doppia vincita) il rapporto tra la probabilità dei due casi A e B è 99%/1% × 1/500, cioè 99/500 che si può ragionevolmente approssimare a 1/5. Pertanto la probabilità a posteriori di A è di circa il 17% e quella di B è di circa l’83%.

Troppo difficile? Proviamo a ragionare in quest’altro modo, del tutto equivalente.

Supponiamo di avere mille gestori di ricevitoria, dei quali, per le probabilità a priori assegnate, 990 (il 99% di 1000) stampano (caso A) due volte un solo blocco di schedine per errore mentre gli altri 10 (l’1% di 1000) stampano (caso B) per loro comodità due volte tutti i blocchi di schedine che vendono. Ora immaginiamo di ripetere tante volte l’estrazione finché la combinazione vincente non corrisponde a quella di una schedina di uno dei mille blocchi a disposizione del gestore. In tale evenienza, per ogni gestore del caso A la probabilità che la schedina estratta faccia parte del blocco venduto doppio è di 1/1000, quindi tra tutti i gestori del caso A il numero di vincite doppie attese è 990/1000 ≈ 1, mentre ogni gestore del caso B vende 500 blocchi doppi e la probabilità che la schedina vincente faccia parte di uno di questi è di 500/1000, così che il numero di vincite doppie attese tra tutti i gestori del caso B è di 10 × 500/1000 = 5. In conclusione, per ogni vincita doppia che fa capo al caso A ce ne sono cinque che fanno capo al caso B, ovvero, esattamente come prima, la probabilità del caso A data la vincita della schedina doppia è di 1/(1+5) ≈ 0.83 cioè l’83%.

In pratica, siamo partiti da una valutazione molto favorevole alla prima versione dei fatti, ma il verificarsi della vincita doppia ha stravolto questa valutazione facendo schizzare in alto la probabilità dell’altra versione dei fatti. Alla luce della doppia vincita la versione dell’errore “isolato” diventa insomma decisamente meno convincente di quella del comportamento sistematico.

A questo punto, forse non è superfluo ribadire che non sono un esperto di giocate alla ricevitoria. Non so quindi se il numero di blocchi che ho immaginato, mille, sia più o meno vicino a quello gestito in una ricevitoria di medie dimensioni. Il calcolo che ho descritto può però essere facilmente esteso a probabilità a priori diverse da quelle che abbiamo definito e a un numero di blocchi qualunque. Lascio al lettore interessato verificare il caso generale che la probabilità a posteriori del caso A vale


dove p è la probabilità a priori del caso A e K il numero dei blocchi di schedine. Nel caso in cui si ponga p=50%, allora l’espressione precedente si riduce a 2/(2+K), ed è facile calcolare che anche per numeri di K non molto grandi la probabilità a posteriori di A diventa piuttosto piccola. Per esempio per K=100 la probabilità di A è di poco inferiore al 2%.

La mia rozza descrizione del problema può poi essere un po’ raffinata, contemplando delle ipotesi intermedie tra il caso A e il caso B (per esempio, che il gestore stampi non tutti i blocchi a sua disposizione due volte, ma solo una quota q). La cosa, però, va al di là dei miei propositi iniziali. Qui ho voluto solo approfittare di un caso di cronaca per illustrare nel modo più semplice possibile come giudicare in termini probabilistici un episodio più o meno singolare che ci viene presentato come coincidenza.

Licenza Creative Commons This opera is licensed under a Creative Commons License.

1 pensiero su “sistema fallibile

  1. Pingback: sei-uno-zero-nove » Blog » ti piace vincere facile?

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.