Jak widać, Columbus strzelał rzadziej, gdy był na prowadzeniu. Jest to dość typowy trend.
Używając regresji logistycznej, możemy ocenić wpływ strzałów i jakości strzałów na szanse drużyny prowadzącej na zdobycie kolejnej bramki. Model, który zbudowałem, podobnie jak model Garry’ego, dzieli mecz na sekwencję stanów gry. Gra zaczyna się przy stanie 0-0, a za każdym razem, gdy zostanie strzelona bramka, rozpoczyna się nowy segment stanu gry. Mój model bierze jako dane wejściowe liczbę strzałów oddanych przez drużynę prowadzącą oraz średnią jakość tych strzałów (używając modelu oczekiwanych bramek na stronie) podczas segmentu. Następnie wylicza prawdopodobieństwo zdobycia przez tę drużynę następnej bramki.
Ogólnie, drużyny, które oddają więcej strzałów mają mniejsze prawdopodobieństwo zdobycia następnej bramki w meczu. Drużyny, które oddają lepsze strzały, również mają mniejsze prawdopodobieństwo zdobycia następnej bramki. Jeśli weźmiemy pod uwagę tylko sytuacje, w których drużyna ma przewagę jednego gola, wyniki będą takie same. Jednakże, jeśli spojrzymy tylko na przedziały czasowe pod koniec meczu, w których drużyny prowadzą jedną bramką – sytuacje, w których parkowanie autobusu byłoby właściwe – wszystko się zmienia.
Aby zbadać problem w ten sposób, zbudowałem oddzielne modele używając danych przefiltrowanych przez to, kiedy każdy segment się zaczyna. Przefiltrowałem dane w ten sposób, ponieważ mam nadzieję odpowiedzieć na pytanie, kiedy drużyna powinna zacząć przechodzić do defensywnej skorupy. Użycie czasu rozpoczęcia segmentu, jak sądzę, jest dobrym, choć nie idealnym wyznacznikiem. Na przykład, aby sprawdzić, czy parkowanie autobusu jest dobrą taktyką w przypadku zdobycia bramki po 70 minutach, model jest tworzony na podstawie danych z segmentów gry, które rozpoczynają się w 70 minucie lub później. Zauważ, że jako ciekawostkę dodałem również to, czy drużyna prowadząca jest u siebie czy na wyjeździe jako zmienną w modelu.
Wykres poniżej pokazuje minuty, które przefiltrowałem oraz to, czy każda z trzech zmiennych dla drużyny prowadzącej – strzały, jakość strzałów i miejsce spotkania (u siebie czy na wyjeździe) – ma statystycznie istotny wpływ na to, czy ta drużyna zdobywa bramkę.