da il Post, 11 gennaio 2016
Per rispondere alla domanda con cui è titolato l’articolo a il Post hanno scorso la serie storica degli ultimi trenta campionati di serie A contando quante volte la squadra al comando della classifica nel girone d’andata ha terminato in testa anche il girone di ritorno, vincendo così il campionato.
Credo che il valore di simili precedenti sia pressoché nullo. Ogni campionato fa storia a sé, la condizione fisica, psicologica e la situazione ambientale delle squadre di questo campionato sono molto diverse non solo da quelle di dieci anni fa ma anche da quelle dello scorso anno, e il fatto che nel passato ci siano state rimonte riuscite, fallite e/o corse solitarie poco o nulla dice sulla probabilità che si verifichino oggi o in un dato campionato futuro. L’unica evidente indicazione fornita dal titolo di campione d’inverno è che, come in tutti i tornei, chi si trova in testa a metà percorso è avvantaggiato perché gli avversari per superarlo sono ovviamente obbligati ad avere un ritmo superiore per recuperare i punti di scarto.
Quest’ultima considerazione suggerisce che le possibiltà di vittoria finale dipendano anche e soprattutto dai punti di vantaggio rispetto alle dirette inseguitrici, che la sola posizione in classifica nasconde (come ho più volte ricordato). Più precisamente, maggiore è il distacco che la squadra campione d’inverso ha rispetto alla seconda in classifica, maggiore dovrebbe essere la sua probabilità di vincere il campionato.
Così, pur senza pretendere di ottenere informazioni determinanti a fare una previsione sull’esito campionato in corso, mi è venuta l’idea, o meglio, lo sfizio, di rivedere la serie storica dei campionati di serie A per misurare l’importanza del fattore distacco, calcolando la frequenza della vittoria finale della squadra prima in classifica al termine del girone di andata al variare dei punti di vantaggio sulla seconda (o sulle seconde).
Un esercizio in teoria semplice ma in pratica molto laborioso, essenzialmente nella parte di raccolta ed elaborazione dei dati storici. Infatti non ho trovato pubblicate su alcun sito le classifiche al termine dei gironi di andata degli ultimi campionati, ma solo (come per esempio su www.italia1910.com) i risultati delle partite in calendario. Ho dovuto quindi: a) scrivere un programma di web scraping per raccogliere i risultati di tutte le partite degli ultimi campionati, sulla falsariga di quanto avevo fatto in un mio precedente lavoro e b) ricostruire, con l’ausilio di un foglio elettronico, le classifiche dei gironi di andata a partire dai risultati delle partite.
Ho deciso di limitare la mia analisi solo agli ultimi 21 anni, da quando cioè è stata introdotta la regola che assegna tre punti a ogni vittoria, anziché due come in precedenza. E’ evidente infatti che un distacco di tre punti, per esempio, ha meno valore quando la vittoria vale tre punti piuttosto che quando la vittoria ne vale due. Dopodiché, per non restringere ulteriormente l’insieme dei campionati ho ritenuto utile non distinguere i campionati a 18 squadre da quelli a 20 squadre.
La tabella che segue mostra il risultato finale dell’elaborazione.
annata | squadra campione d’inverno |
punti girone andata |
punti di distacco dalla seconda in classifica |
squadra vincitrice del campionato |
---|---|---|---|---|
1994-1995 | juve | 36 | 1 | juve |
1995-1996 | milan | 34 | 1 | milan |
1996-1997 | juve | 33 | 4 | juve |
1997-1998 | juve | 38 | 1 | juve |
1998-1999 | fiorentina | 35 | 3 | milan |
1999-2000 | juve | 36 | 1 | lazio |
2000-2001 | roma | 39 | 6 | roma |
2001-2002 | roma | 36 | 1 | juve |
2002-2003 | milan | 39 | 3 | juve |
2003-2004 | milan-roma | 42 | 0 | milan |
2004-2005 | juve | 44 | 2 | juve |
2005-2006 | juve | 52 | 10 | juve |
2006-2007 | inter | 51 | 9 | inter |
2007-2008 | inter | 49 | 7 | inter |
2008-2009 | inter | 43 | 3 | inter |
2009-2010 | inter | 45 | 5 | inter |
2010-2011 | milan | 40 | 4 | milan |
2011-2012 | juve | 41 | 1 | juve |
2012-2013 | juve | 44 | 5 | juve |
2013-2014 | juve | 52 | 8 | juve |
2014-2015 | juve | 46 | 5 | juve |
In base ai dati contenuti nella tabella ho riassunto quindi il conteggio delle vittorie finali rispetto ai punti di vantaggio al termine del girone di andata nel grafico sottostante.
Le barre verticali in semitrasparenza indicano in quanti campionati sugli ultimi 21 il girone di andata si è concluso con un distacco inferiore al numero di punti riportati sull’asse orizzontale, mentre la linea spezzata descrive come varia la frequenza delle vittorie finali della squadra campione d’inverno in tali campionati. Si va dal 50% di frequenza di vittoria finale nei campionati con 0 punti di vantaggio (un solo caso con due squadre a pari punti) all’80% circa conteggiando tutti e 21 i campionati esaminati, dove il distacco registrato più ampio è stato di 10 punti. L’andamento della linea spezzata non è sempre crescente come ci si aspetterebbe, c’è infatti un tratto in discesa, ma occorre tenere conto che il numero di campionati esaminati (21) è davvero esiguo, anche in relazione all’intervallo dei punti di vantaggio registrati (da 0 a 10).
Insomma, i precedenti dei campionati a tre punti per vittoria dicono che la percentuale di vittoria finale del campione d’inverno con un vantaggio di meno di 4 punti è del 60% circa. Ma, come già detto, i precedenti non sono molti (negli ultimi 21 campionati solo 11 volte il vantaggio del campione d’inverno è stato inferiore ai 4 punti) e hanno per me un valore prevalentemente annedottico.
Sarebbe interessante costruire una statistica analoga scorrendo conteggiando un numero più consistente dei campionati meno recenti, quando vigeva la regola dei due punti pe vittoria. Ma il tempo richiesto per l’analisi va oltre le mie disponibilità, e dunque questa volta mi accontanto del poco e imperfetto che ho fatto. :)