la legge delle scommesse democratiche

logo fifa 2018
L’altro giorno scorrendo la cronologia delle battute sul mio profilo twitter fa ho scoperto due modelli scientifici di previsione dei risultati dei mondiali di calcio che rendono pubblici i loro pronostici: quello di alcuni ricercatori di economia dell’università di Rennes e quello di FiveThirtyEight, la società di Nate Silver. Sono peraltro sicuro che ce ne siano altri.

Entrambi i modelli usano i dati statistici della serie storica delle partite giocate da ciascuna nazionale negli ultimi decenni per simulare il risultato di tutti gli incontri previsti dal calendario e determinare così le probabilità di superamento della fase a gironi e di ciascun turno in quella a eliminazione diretta, differenziandosi nel modo in cui dai dati statistici si passa alle simulazioni degli incontri.
Il metodo predittivo di Fivethirtyeight è più analitico perché oltre alle statistiche di partite passate (numero di gol, tiri in porta, azioni, eccetera) considera quelli dei giocatori (numero di minuti giocati in ogni singola partita) per costruire per ciascuna squadra due indici compositi di attacco e di difesa, che vengono poi convertiti in numero di potenziali gol fatti e subiti. A chi è interessato consiglio la lettura della pagina che descrive in dettaglio il metodo di previsione, molto chiara ed esauriente.
Il metodo dell’Università di Rennes invece usa i soli risultati delle partite passate, dandoli in pasto poi a non meglio precisati algoritmi di intelligenza artificiale, la cui caratteristica è quella di aggiornare le previsioni ogni volta che vengono acquisiti nuovi risultati.

Confesso di non essere un fanatico dir questi modelli predittivi, dubitando della loro efficacia, perché credo che ogni singola partita possa essere determinata da uno o più imponderabili episodi di gioco che sfuggono a qualunque previsione, anche dei commentatori e degli esperti dell’ambiente più attenti e informati. O, detto in parole più tecniche, perché ogni singola partita è come un campione troppo piccolo per far emergere nettamente il segnale rispetto al rumore.

Tuttavia vorrei approfittare dell’attuale divulgazione di questi modelli per esporre un’idea che ho da tempo sulle previsioni che offrono.

Come si può misurare l’efficacia di questi modelli?

Si potrebbe, per esempio, valutare a posteriori la probabilità di vittoria assegnata alla nazionale che effettivamente conquisterà il titolo di campione del mondo. Oppure si potrebbe contare il numero di partite di cui è stato azzeccato il punteggio esatto o almeno il risultato (vittoria/pareggio/sconfitta). Ritengo tuttavia tali criteri poco discriminanti per scegliere, per esempio, tra un modello e l’altro. Mi fa sorridere, per esempio, l’affermazione dei ricercatori di Rennes che vantano una percentuale di risultati azzeccati del 60% contro il 33% di chi cerca di indovinare a caso ogni volta. Basterebbe escludere il pareggio, il risultato che le regole del gioco tendono a scoraggiare, per arrivare al 40% puntando a caso. Se poi per ogni partita si prevedesse la vittoria della squadra più forte, si arriverebbe vicini al 60%. Quindi non mi pare un valore così notevole.

Oppure, e in questo sta la mia idea, si potrebbe valutare il modello tanto più efficace quanto più alta è la cifra che permette di guadagnare, in base al confronto tra le quote assegnate ai risultati di ciascuna partita dal modello e dagli allibratori.

Consideriamo per esempio una ipotetica finale tra Inghilterra e Belgio, supponendo che il modello assegni alla vittoria delle due squadre rispettivamente le probabilità di 60% e 40%. Una scommessa equa assegnara in caso di vittoria del Belgio la vincita di 1/40%=2,5 (perché, a fronte di 100 immaginarie ripetizioni della finale, dove si punta sempre 1 euro, la spesa è pari a 1×100=100 e altrettanto la vincita attesa 2,5×40=100). Se però i bookmakers assegnano alle due squadre probabilità di vittoria rispettivamente pari a 80% e 20%, allora la loro quota pagata per il successo del Belgio è pari a 1/20%=5 (per semplicità, evito al momento di considerare il loro margine di guadagno, detto aggio).
Quindi, ammettendo di confidare ciecamente nella bontà del modello, scommettere sulla vittoria del Belgio presso i bookmaker diventa vantaggioso, perché la quota che offrono è più alta di quella equa secondo il modello. Si può cioè scommettere 1 euro nella speranza di vincerne 5, mentre la vincita attesa dovrebbe essere 2,5. Ovviamente, a partita conclusa l’incertezza sul risultato svanisce, e si realizzerà o una perdita di 1 (l’ammontare della scommessa) o un guadagno di 5-1=4 (la vincita ottenuta al netto dell’ammontare della scommessa).
Ripetendo questo ragionamento per tutte le partite, e quindi puntando sempre sulla squadra di cui i bookmaker sottostimano la probabilità di vittoria, si può calcolare a torneo concluso la vincita o perdita media prodotta dal modello, che rappresenterebbe la misura della sua efficacia. A torneo in corso, ci si può limitare a stabilire quali sono le scommesse più vantaggiose. Sempre, lo ripeto, supponendo la validità del modello di previsione.

In effetti mi sono messo di buona lena e ho effettuato tutti i calcoli necessari per le partite ancora a venire del torneo, cioè i quarti, le semifinali e la finale.

Come prima cosa ho raccolto le quote di tutti i bookmaker disponibili su oddschecker.com relative al piazzamento delle otto squadre ancora il lizza per il titolo finale (nonostante il patetico blocco delle leggi italiane), quindi ho selezionato i dieci con le condizioni più favorevoli per gli scommettitori (cioè quelli con l’aggio minore), convertendo le loro quote in probabilità, e calcolandone la media. L’immagine è relativa alle quote per la vittoria nella finalissima.

quote bookmaker vincitore fifa 2018

Quindi ho costruito una tabella che per ogni squadra confronta le probabilità di passaggio dei tre turni ancora da giocare, secondo gli allibratori e secondo ciascuno dei due modelli considerati

  vincitore finalista semifinalista
  (1) (2) (3) (1) (2) (3) (1) (2) (3)
Brazil 24.5% 30.0% 33.1% 36.2% 42.0% n/a 61.6% 64.0% 78.9%
France 18.7% 15.0% 24.6% 30.6% 26.0% n/a 65.8% 62.0% 69.6%
England 17.8% 15.0% 11.4% 39.1% 36.0% n/a 67.7% 62.0% 66.1%
Belgium 13.0% 11.0% 10.7% 21.5% 19.0% n/a 38.4% 36.0% 21.1%
Croatia 12.7% 12.0% 8.7% 32.9% 30.0% n/a 61.8% 61.0% 76.5%
Uruguay 5.5% 6.0% 7.9% 11.7% 12.0% n/a 34.2% 38.0% 30.4%
Russia 4.4% 5.0% 2.4% 15.5% 16.0% n/a 38.2% 39.0% 23.5%
Sweden 3.5% 6.0% 1.2% 12.5% 18.0% n/a 32.3% 38.0% 33.9%

(1) bookmaker (2) FiveThirtyEight (3) Rennes

Infine, per agevolare il confronto ho rappresentato i dati della tabella in tre grafici, uno per ciascun turno, limitandomi a commentare estensivamente solo il primo, alla vittoria del torneo.

previsioni vincitore fifa 2018

I pallini rappresentano le valutazioni numeriche dei bookmaker e dei due modelli considerati, che possono considerarsi espresse come probabilità (riportate in alto) o come quote (in basso). Ho scelto di adottare un asse logaritmico che rende le differenze in termini relativi tra due probabilità equivalenti alle differenze tra le corrispondenti quote, e che facilita l’individuazione degli scarti più grandi a prescindere dai valori piccoli o grandi di probabilità e quote.
I pallini neri indicano le valutazioni dei bookmaker e le relative barre punteggiate definiscono gli intervalli intorno ai loro valori che, per via degli aggi, annullano la convenienza di di piccoli scostamenti dalle loro quote.

Le frecce indicano le scommesse vantaggiose se si attribuisce validità ai modelli, cioè quelle per cui i bookmaker offrono quote molto più alte di quelle attese: sulla Svezia (1) per il modello di FiveThirtyEigth, su Uruguay (2), Francia (3) e Brasile (4) per il modello dell’Università di Rennes.

Allo stesso modo per le finaliste e semifinaliste si sarebbe dovuto puntare sulla Svezia secondo FiveThirtyEight e per le semifinaliste su Brasile e Croazia secondo Rennes, come si vede nei due grafici seguenti.

previsioni semifinaliste fifa 2018
previsioni finaliste fifa 2018

Devo a questo punto concludere il mio discorso sull’efficacia predittiva di questi modelli. Come ho già detto, non penso che anche i più dettagliati dati statistici analitici possano aiutare a stabilire con precisione le probabilità dei risultati di una partita di calcio. Se non fornissero indicazioni attendibili, sarebbe più utile fidarsi delle quotazioni dei bookmaker. Se invece fossero validi, offrirebbero un metodo per guadagnare individuando quelle partite su cui è più vantaggioso scommettere; stando così le cose prenderebbero piede, ma il crescente numero di giocate sulle partite più vantaggiose farebbe calare le loro quote, avvicinando un po’ alla volta le le quotazioni dei bookmaker si avvicinerebbero alle loro. In definitiva, tanto varrebbe, di nuovo, affidarsi alle quotazioni dei bookmaker. Ho chiamato questo processo la legge delle scommesse democratiche: è il numero delle scommesse (e il loro volume) che determina le probabilità, e non il viceversa.

Si tratta dello stesso meccanismo che determina la cosiddetta efficienza dei mercati finanziari: l’aqcuisto di un titolo sulla base di fondate informazioni che suggeriscono una sua possibile crescita di valore ne determina un aumento del prezzo di acquisto che fa diminuire la convenienza dello stesso acquisto, fino ad annullarla.

In definitiva, non conviene perderci tanto tempo. A meno di non avere una passione per l’analisi dei dati, come nel mio caso :)

1 pensiero su “la legge delle scommesse democratiche

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.