Som du kan se, skød Columbus sjældnere, når de var i front. Dette er en ret typisk tendens.
Ved hjælp af logistisk regression kan vi evaluere effekten af skud og skudkvalitet på et førende holds chancer for at indkassere det næste mål. Den model, jeg har bygget, opdeler ligesom Garry’s model en kamp i en sekvens af spiltilstande. Kampen begynder ved 0-0, og hver gang der scorer et mål, begynder et nyt spiltilstandssegment. Min model tager som input det antal skud, som det førende hold tager, og den gennemsnitlige kvalitet af disse skud (ved hjælp af webstedets model for forventede mål) i løbet af et segment. Den udsender derefter sandsynligheden for, at det pågældende hold indkasserer det næste mål.
Generelt er det mindre sandsynligt, at hold, der skyder mere, indkasserer det næste mål i en kamp. Hold, der skyder bedre, er også mindre tilbøjelige til at indkassere det næste mål. Hvis vi kun medtager situationer, hvor et hold er foran med ét mål, gælder de samme resultater. Hvis vi imidlertid kun ser på tidsrammer mod slutningen af kampene, og hvor holdene er foran med et mål – situationer, hvor det ville være hensigtsmæssigt at parkere bussen – ændrer tingene sig.
For at undersøge problemet på denne måde har jeg bygget separate modeller ved hjælp af data filtreret efter, hvornår hvert segment begynder. Jeg har filtreret dataene på denne måde, da jeg håber at kunne besvare spørgsmålet om, hvornår et hold bør begynde at gå ind i en defensiv skal. At bruge starttidspunktet for segmentet er efter min mening en god, men ikke perfekt proxy for dette. For f.eks. at se, om det er en god taktik at parkere bussen op et mål efter 70 minutter, er modellen altså bygget op med data fra kampsegmenter, der begynder på eller efter de 70 minutter. Bemærk, at jeg som et punkt af interesse også har medtaget, om det førende hold er hjemme eller ude som en variabel i modellen.
Diagrammet nedenfor viser det minutmærke, jeg har filtreret efter, og om hver af de tre variabler for det førende hold – skud, skudkvalitet og spillested (hjemme eller ude) – har en statistisk signifikant effekt på, om det pågældende hold indkasserer et mål.