Siamo all’inizio dell’anno nuovo, e in attesa che il girone di ritorno della stagione 18-19 della serie A italiana riparta, possiamo divertirci a consultare le precedenti annate che riguardano, per una questione di congruenza, solo e soltanto le stagioni con venti club al via. Molti di voi già conoscono questo schema; tuttavia, ho pensato di “abbellirlo” con qualche novità utile. Per prima cosa, sotto le serie corrispondenti ai piazzamenti, sempre e soltanto sei, anche se in futuro non escludo di poterli estenderli sino a sette/otto, troviamo oltre ai valori minimi, massimi e medi la deviazione standard e relativo coefficiente di variazione (più è basso e maggiormente attendibile è il punteggio medio).
(tasto destro, apri immagine in un’altra scheda)
Nella parte destra del foglio, nell’immagine sopra, ci sono altri dettagli che rivestono un certo interesse. Specializzandoli per un obiettivo, ho selezionato una porzione di quei dati. Nella fattispecie ne abbiamo due in particolare: la somma dei punteggi dalla prima alla quarta e quella che va dalla terza alla sesta. In questi scenari, dunque, escludendo dal nostro scopo i due piazzamenti più lontani (il primo o il quarto posto sono in effetti gli unici che contano), taglieremo via gli “squilibri” e potremo capire meglio come le pretendenti maggiormente indiziate abbiano performato tutte insieme nel caso della classifica finale o come lo stiano facendo in quello del solo girone d’andata. Ho cercato di capire, per esempio, se, in genere, all’andata si vada più forte che al ritorno ed ho scoperto, eliminando le differenze tra i due insiemi di punteggio che producono uno scarto dal +1 al -1, che, nei restanti dieci casi, solo tre volte fanno di più al ritorno mentre per sette volte ne totalizzano di meno. Traspare, dunque, una certa tendenza nel realizzare meno punti nelle seconde diciannove di campionato piuttosto che nelle prime.
Per quanto attiene al solo girone d’andata, per certi aspetti lo scenario più interessante perché invita a tentare d’immaginare quali possano essere i punteggi finali sufficienti per conquistare gli obiettivi, ci sono altre novità
(tasto destro, apri immagine in un’altra scheda)
All’altezza di ciascun piazzamento, evidenziati con un forecolor rosso scuro subito prima d’incontrare min., media, max, dev std e coeff di variazione, troverete il “range percentile” (ovvero il rango espresso sotto forma di percentuale riferito ad un set di dati) dei valori delle colonne “pt.” (moltiplicato per 2 e ipotizzando così che identico risultato avvenga pure per il ritorno). Questo valore viene confrontato con quelli della serie della classifica finale (immagine nr.1) relativi al primo ma anche al quarto posto. Dove è presente 100% significa che quel punteggio è sufficiente o va oltre il massimo già conseguito, se non viene indicata nessuna percentuale significa che il valore, in quel modo generato, è ancora più basso del minimo registrato.
A seguire, evidenziato con il colore di sfondo verde, si incontra l’indice di correlazione di ciascuna serie raffrontata con quella della classifica finale. Il valore che esso assume è compreso tra −1 (correlazione inversa) e 1 (correlazione diretta e assoluta), con un indice pari a 0 che comporta l’assenza di correlazione. Si noti come tra la serie che riguardi il primo ed il quarto posto l’indice sia abbastanza alto, così come le somme dei punteggi [prima-quarta] e [terza-sesta].
Andando nella parte destra, ci sono in aggiunta altre undici colonne. Le prime cinque hanno il primo posto come target, in quella di mezzo ci sono le somme dei punteggi di tutte mentre nelle ultime cinque l’obiettivo è il quarto posto. Le più interne (la nr. 5 e la nr. 7) espongono rispettivamente la somma dalla prima alla quarta (nr.5) e dalla terza alla sesta (nr.7) , ma solo per il girone d’andata. Le più esterne (la nr. 1 e la nr. 11) le stesse somme di cui sopra ma riferite al girone di ritorno. Le colonne raggruppate sotto l’intestazione “range percentile” si riferiscono o a quello del girone d’andata oppure a quello della classifica finale ma, in questo caso, moltiplicato per due così come è stato fatto per ciascun piazzamento sopra descritto ed a fianco di ciascuna di esse il punteggio a cui “simmetricamente” corrisponderebbero nella classifica finale.
Venendo all’attualità, il punteggio con cui ha chiuso la Lazio al IV posto è tra i più bassi riscontrati per quel piazzamento. Nei quattordici precedenti, infatti, solo una volta se n’è registrato uno peggiore e sempre solo uno a pari merito; nei restanti dodici, tutte hanno fatto meglio. Il range percentile di 64, poi, ovvero (32*2), se collazionato alla serie della classifica finale, offre un modesto 15%. La somma dei punti, tuttavia, dal terzo al sesto posto (132) è poco al di sotto della media del girone d’andata e, se si dovesse ripetere anche al ritorno, restituirebbe un range percentile sulla serie finale del 43,5%: un risultato che avrebbe una corrispondenza di 67 punti finali e quasi compenserebbe, tra l’altro, la media su 38 partite che è esattamente di 267. Punto le mie fiches sulla classe di punteggio finale [66/67/68] come la più probabile.
Su suggerimento del nostro amico nonché grande sodale rossonero, Christian Callegari, membro del CD di “Milanisti 1899” ho messo in cantiere, per il futuro, le seguenti migliorie:
- Maggior profondità della serie, estendendola alla settime ed ottava posizione.
- Coefficienti specifici che tengano conto anche della storia match to match, incontro per incontro.
- Coefficienti correttivi circa la partecipazione o meno alle Coppe Europee.
- Incidenza (non statistica) ma opzionalmente discrezionale del mercato di gennaio e customizzabile
- Customizzazioni varie come l’inserimento di un determinato punteggio e conseguente calcolo del rango percentile, l’intero calendario rossonero per simulazioni di varia natura.
Ad maiora,
Raffaele Greco
P.S. il file excel da cui è tratto il presente studio è disponibile su richiesta all’indirizzo: avvocatodeldiavoloblog@gmail.com