Zoals je kunt zien, schoot Columbus minder vaak als het op voorsprong stond.
Met behulp van logistische regressie kunnen we het effect van schoten en de kwaliteit van de schoten op de kans op een tegendoelpunt voor de koploper evalueren. Het model dat ik heb gebouwd, net als dat van Garry, splitst een wedstrijd op in een opeenvolging van spelverlopen. De wedstrijd begint bij 0-0, en elke keer dat een doelpunt wordt gescoord, begint een nieuwe spelstatus. Mijn model neemt als input het aantal schoten dat het leidende team neemt, en de gemiddelde kwaliteit van die schoten (met behulp van het verwachte doelpuntenmodel van de site) gedurende een segment. Het model geeft vervolgens de kans dat dat team het volgende doelpunt tegen krijgt.
In het algemeen hebben teams die meer schieten minder kans om het volgende doelpunt in een wedstrijd tegen te krijgen. Teams die beter schieten hebben ook minder kans om het volgende doelpunt tegen te krijgen. Als we alleen situaties bekijken waarin een ploeg één doelpunt voor staat, gelden dezelfde resultaten. Maar als we alleen kijken naar de periodes tegen het einde van een wedstrijd en wanneer een ploeg één doelpunt voor staat – situaties waarin de bus parkeren op zijn plaats zou zijn – dan veranderen de zaken.
Om het probleem op deze manier te onderzoeken, heb ik afzonderlijke modellen gebouwd met gegevens die zijn gefilterd op het tijdstip waarop elk segment begint. Ik heb de gegevens op deze manier gefilterd omdat ik een antwoord hoop te vinden op de vraag wanneer een team moet beginnen met een defensieve schil. Ik denk dat het gebruik van de begintijd van het segment hiervoor een goede, hoewel niet perfecte, proxy is. Om bijvoorbeeld te zien of de bus parkeren een goede tactiek is bij een doelpunt na 70 minuten, wordt het model gebouwd met gegevens van wedstrijdsegmenten die beginnen op of na het 70 minuten punt. Merk op dat ik als een punt van belang ook heb opgenomen of de leidende ploeg thuis of uit is als een variabele in het model.
De grafiek hieronder toont de minuut markering waarop ik heb gefilterd, en of elk van de drie variabelen voor de leidende ploeg – schoten, kwaliteit van het schot, en locatie (thuis of uit) – een statistisch significant effect heeft op het al dan niet toestaan van een doelpunt door die ploeg.