storia di un campionato

Durante le mie navigazioni delle scorse settimane, m’è capitato di leggere prima sul quotidiano online BergamoNews un grafico animato (a sinistra un fotogramma) sull’evolversi della posizione in classifica dell’Atalanta nel corso del campionato appena concluso, e poi sul blog FiveThirthyEight, dello statistico statunitense Nate Silver, un altro grafico (a destra), stavolta non animato, sull’evolversi delle previsioni circa i play off del torneo di pallacanestro statunitense NBA.

M’è venuta quindi l’idea di combinare le due cose, riproducendo la struttura del secondo grafico per applicarla al contesto del primo. Di proporre cioè un grafico che anche se statico (ma comunque interattivo) riesca in modo chiaro e semplice a mostrare i cambiamenti nella classifica del campionato durante tutto il suo svolgimento.

Ho dovuto come prima cosa trovare un sito che avesse pubblicato la classifica per ciascuna delle 38 giornate del campionato, quindi approntare un programma di web scraping per prelevare tutti i dati, e infine realizzare il grafico replicando lo schema che avevo scelto adattato in alcuni particolari.

Per il primo punto mi sono servito delle pagine pubblicate sul sito datasport.it; per il secondo punto ho usato Google App Script in un foglio elettronico su Google Drive (un’accoppiata davvero comoda), per il terzo, la libreria JavaScript HighCharts (strumento altrettanto comodo per i grafici strutturati).

Ed ecco il risultato del mio lavoro.

Il lato sinistro appare molto più intricato del destro, perché il peso di una singola vittoria o sconfitta è tanto più grande quanto minore è il numero delle partite giocate fino a quel momento. Succede quasi ogni anno di avere una sorpresa nelle giornate iniziali, sorpresa che viene poi riassorbita strada facendo per effetto della regressione verso la media. L’impresa dell’Atalanta, che è risalita dal quartultimo posto all’ottava giornata al terzo finale, rappresenta una notevole eccezione.

Ma a parte queste banali osservazioni, è utile notare che l’intricatezza complessiva del grafico misura quanto un campionato sia combattuto e avvincente. Ciò perché quante più squadre sono a pochi punti di distanza l’una dall’altra tanto più facile diventa osservare dei sorpassi in classifica, che si traducono, visivamente, nell’accavallamento delle linee relative alle loro posizioni. Per inciso, anche la decisione di spalmare le partite di uno stesso turno su più giorni ha come effetto, probabilmente voluto o comunque ben accetto, di creare dei sorpassi virtuali, che poi però non risultano dalle classifiche di fine giornata.

La lotta è in generale più serrata al centro della classifica, dove di solito l’affollamento è maggiore. Ma il grafico evidenzia che in testa e in fondo alla classifica del campionato italiano l’incertezza è stata pressoché nulla, con le prime due posizioni e le ultime due posizioni che sono state occupate dalle stesse squadre pressoché dall’inizio. Se c’è stata un po’ di trepidazione è stata per la conquista dei posti immediatamente alle spalle dei primi due e per evitare la terzultima posizione.

Ci sono alcuni temi che mi piacerebbe sviluppare: l’interpretazione grafica dell’incertezza in una classifica, e il confronto dei grafici relativi ai campionati delle serie maggiori dei principali paesi europei. Tornerò sull’argomento dovessi riuscire a raccogliere tutte le idee e i dati necessari.


Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.