Wie man sieht, schoss Columbus weniger häufig, wenn es in Führung lag. Das ist ein ziemlich typischer Trend.
Mit Hilfe der logistischen Regression können wir die Auswirkungen von Schüssen und Schussqualität auf die Chancen einer führenden Mannschaft, das nächste Tor zu kassieren, bewerten. Das von mir erstellte Modell unterteilt, wie das von Garry, ein Spiel in eine Folge von Spielzuständen. Das Spiel beginnt beim Stand von 0:0, und jedes Mal, wenn ein Tor erzielt wird, beginnt ein neues Spielzustandssegment. Mein Modell nimmt als Eingaben die Anzahl der Schüsse der führenden Mannschaft und die durchschnittliche Qualität dieser Schüsse (unter Verwendung des Modells für erwartete Tore der Website) während eines Segments. Es gibt dann die Wahrscheinlichkeit aus, dass diese Mannschaft das nächste Tor kassiert.
Im Allgemeinen ist es für Mannschaften, die mehr schießen, weniger wahrscheinlich, das nächste Tor in einem Spiel zu kassieren. Mannschaften, die besser schießen, haben auch eine geringere Wahrscheinlichkeit, das nächste Tor zu kassieren. Betrachtet man nur Situationen, in denen eine Mannschaft mit einem Tor in Führung liegt, sind die Ergebnisse identisch. Betrachtet man jedoch nur die Zeitspannen gegen Ende der Spiele, in denen die Mannschaften mit einem Tor in Führung liegen – Situationen, in denen es angebracht wäre, den Bus zu parken -, ändert sich die Situation.
Um das Problem auf diese Weise zu untersuchen, habe ich separate Modelle mit Daten erstellt, die danach gefiltert wurden, wann jedes Segment beginnt. Ich habe die Daten auf diese Weise gefiltert, da ich hoffe, die Frage beantworten zu können, wann eine Mannschaft beginnen sollte, sich in die Defensive zu begeben. Die Verwendung der Startzeit des Segments ist meiner Meinung nach ein guter, wenn auch nicht perfekter Anhaltspunkt dafür. Um zum Beispiel herauszufinden, ob es eine gute Taktik ist, den Bus zu parken, wenn man nach 70 Minuten ein Tor kassiert, wird das Modell anhand von Daten aus Spielabschnitten erstellt, die an oder nach der 70-Minuten-Marke beginnen. Interessanterweise habe ich auch die Variable „Heim- oder Auswärtsspiel der führenden Mannschaft“ in das Modell aufgenommen.
Das folgende Diagramm zeigt die Minutenmarke, nach der ich gefiltert habe, und ob jede der drei Variablen für die führende Mannschaft – Schüsse, Schussqualität und Spielort (Heim- oder Auswärtsspiel) – einen statistisch signifikanten Effekt darauf hat, ob diese Mannschaft ein Tor kassiert.