Come potete vedere, Columbus ha tirato meno frequentemente quando è in vantaggio. Questa è una tendenza abbastanza tipica.
Utilizzando la regressione logistica, possiamo valutare l’effetto dei tiri e della qualità dei tiri sulle probabilità di una squadra in vantaggio di subire il prossimo gol. Il modello che ho costruito, come quello di Garry, scompone una partita in una sequenza di stati di gioco. La partita inizia sullo 0-0, e ogni volta che viene segnato un gol, inizia un nuovo segmento di stato di gioco. Il mio modello prende come input il numero di tiri della squadra in vantaggio e la qualità media di quei tiri (usando il modello dei gol attesi del sito) durante un segmento. Quindi produce la probabilità che la squadra subisca il prossimo gol.
In generale, le squadre che tirano di più hanno meno probabilità di subire il prossimo gol in una partita. Le squadre che tirano meglio hanno anche meno probabilità di subire il prossimo gol. Se includiamo solo le situazioni in cui una squadra è in vantaggio di un gol, gli stessi risultati valgono. Tuttavia, se guardiamo solo i tempi verso la fine dei giochi e dove le squadre sono in vantaggio di un gol – situazioni in cui il parcheggio del bus sarebbe appropriato – le cose cambiano.
Per esaminare il problema in questo modo, ho costruito modelli separati usando dati filtrati da quando inizia ogni segmento. Ho filtrato i dati in questo modo perché spero di rispondere alla domanda su quando una squadra dovrebbe iniziare a entrare in un guscio difensivo. Usare l’ora di inizio del segmento, penso sia un buon proxy, anche se non perfetto, per questo. Per esempio, quindi, per vedere se parcheggiare l’autobus è una buona tattica su un gol dopo 70 minuti, il modello è costruito utilizzando i dati da segmenti di gioco che iniziano su o dopo il segno 70 minuti. Si noti che, come punto di interesse, ho anche incluso come variabile nel modello il fatto che la squadra in vantaggio sia in casa o in trasferta.
Il grafico qui sotto mostra i minuti per cui ho filtrato, e se ciascuna delle tre variabili per la squadra in vantaggio – tiri, qualità dei tiri e sede (casa o trasferta) – ha un effetto statisticamente significativo sul fatto che la squadra subisca un gol.