Punkten ist nicht alles

Rate-Statistiken wie Yards per Carry und Yards per Attempt haben gegenüber kumulativen Statistiken wie Total Yards enorme Vorteile: Sie beobachten erbrachte Leistungen in ihrem Kontext, der Anzahl der Versuche. Aber wie sehr sind Rate-Statistiken selbst verzerrt durch andere Faktoren wie zB Big Plays?

Wenn wir uns das Passpiel der NFL ansehen, gibt es bereits etliche tolle und wichtige Metriken. PFR spuckt Net Yards per Attempt und Adjusted Net Yards per Attempt aus, die beide deutlich bessere Indikatoren für Erfolg sind als reine YPA. Football Outsiders passing DVOA bietet ein gesamtheitliches Bild einer Pass-Offense im Kontext jedes einzelnen Downs und beinhaltet Anpassungen für Gegnerstärke. Und Advanced NLF Stats distillieren mit ihren Air Yards wunderbar die Yards after Catch aus den passing Yards raus.

Eine ähnliche Idee möchte ich hier auch vorstellen. Und zwar gibt es wie bei YAC auch bei Running Backs schon länger die „Befürchtung“, dass ihre Rate-Metrik – Yards per Carry – durch Big Plays massiv verzerrt wird. 2006 schrieb Mike Tanier:

The 4.0-4.1 yard average is an arithmetic mean: add up all the yards, divide by the attempts. The arithmetic mean is easily skewed by extremes in data. A 75-yard run can increase a starting running back’s rushing average by several tenths of a point by the end of a season. This skewing always increases rushing averages: there are several 50+ yard rushes every year, but no 50+ yard losses on running plays.

Die Ergebnisse dieser Studie waren, dass die „wahren“ YPC vermutlich um ein ganzes Yards überhöht sind durch wenige Big Plays:

Long runs make up only about nine percent of all rushing plays, but they increase the league rushing average by over 40 percent.

Pass to score

Was, wenn es im Passspiel ähnliche Effekte gibt? Das Grundproblem, das Big Plays für Rate-Stats darstellen, ist dort nämlich dasselbe: Die Endzone, die so oft das Ende eines Big Plays darstellt, schneidet die erzielten Yards bei einem willkürlichen Punkt ab, der nichts mit der Qualität der beiden Teams in besagtem Spielzug zu tun hat. Sprich, wenn  ein QB und ein WR die Defense besiegen, dann ist der resultierte TD mal ein 30yarder, mal ein 90yarder, was erhebliche Auswirkungen auf die Stats der beteiligten Spieler hat. Die zugrundeliegende Leistung war dieselbe in beiden Fällen, aber die Stats variieren heftig aufgrund der Line of Scrimmage, für die der Spielzug ja „nichts kann“.

Aus diesem Grund habe ich mir die passing stats der 2013er Saison angesehen, um herauszufinden, ob wir Verzerrung jener Art, wie wir sie bei RBs sehen, auch finden können. Die einfachste Art, wie ich die BigPlays rausrechnen kann, ist indem wir einfach alle pass TDs aus den Stats rauslöschen. Dieses Vorgehen ist sehr verkürzt natürlich, da es auch kurze TDs entfernt, die nicht 20+ Yards machen, aber besagte TDs sind ja auch bewusst so designed um die Nähe der Endzone auszunützen, ihre Länge wird also genauso von der zufälligen LOS-Position beeinflusst wie jene der langen Counterparts.

Nehmen wir ein Besipiel: Die Minnesota Vikings haben letztes Jahr 3427 Yards auf 546 Versuchen erzielt, was eine 6.3 YPA Average ergibt. Sie haben auch 18 Pass TDs geworfen, die für 466 dieser Yards verantwortlich sind. Man sieht hier schon, dass die YPA der scoring plays deutlich höher als der sonstige Durchschnitt ist: 25.9 Yards legte der durchschnittliche Vikings Pass TD zurück, der höchste Wert in der Liga.

Subtrahiert man diese Werte bekommt man ein Gefühl dafür, wie gut die Vikings den Ball bewegt haben, wenn sie mal nicht zum score warfen (was der Regelfall ja ist). Die 528 restlichen Attempt lieferten 2961 Yards und eine 5.6 YPA. Wir sehen hier also eine große Differenz zwischen den beiden YPAs: Obwohl die TDs nur 3.3% aller Vikings Pässe darstellen, heben sie die Vikings YPA um ganze 0.7 Punkte an, was einem Anstieg von 10.7% entspricht.

Okay, wer  noch?

Diese Diskrepanz weist daraufhin, dass die Vikings-YPA-Statistik sehr verzerrt ist von den wenigen Big Plays, deren Länge massiv von der LOS beeinflusst ist. In den 97% der Fällen, wo die Vikings den Ball „nur“ bewegen, erreichen sie mit 5.6 YPA, einen deutlich schlechteren Wert als sonst.

Aber andere Teams haben auch besagte Verzerrungen, manche mehr, manche weniger. Die Differenz zwischen der Prozentanzahl an scoring plays und dem von ihnen verursachten Anstieg der YPA (im Vikings-Fall also 7.4%) ist ein Maß dafür, wie stark die Ratestats verzerrt sind. Hier ein Blick auf die normalen und Score-Statistiken der am meisten verzerrten Teams:

Team Pass Att Pass Yards Pass Y/A Pass Y/A Rank   TDs Score Yards Score Y/A Score Y/A Rank
NOR 628 4087 6,5 15 39 872 22,4 5
CLE 681 4040 5,9 29 26 617 23,7 2
MIN 546 3427 6,3 21 18 466 25,9 1
TEN 533 3496 6,6 14 22 490 22,3 6
BUF 522 3103 5,9 28 16 367 22,9 3
IND 582 3725 6,4 19 23 501 21,8 7
PHI 508 4110 8,1 1 32 716 22,4 4
CAR 473 3043 6,4 18 24 458 19,1 12
SEA 417 2979 7,1 8 27 514 19,0 13

Und hier die dazugehörigen Non-Scoring Werte und die Differenz in Prozentzahlen:

Team Non-Score Att Non-Score Yard Non-Score Y/A Non-Score Y/A Rank % of Att that scored % of Y/A achieved by scoring %diff
NOR 589 3215 5,5 28 6,2% 16,1% 9,9%
CLE 655 3423 5,2 31 3,8% 11,9% 8,1%
MIN 528 2961 5,6 26 3,3% 10,7% 7,4%
TEN 511 3006 5,9 16 4,1% 10,3% 6,2%
BUF 506 2736 5,4 30 3,1% 9,0% 6,0%
IND 559 3224 5,8 20 4,0% 9,9% 5,9%
PHI 476 3394 7,1 5 6,3% 11,9% 5,6%
CAR 449 2585 5,8 22 5,1% 10,5% 5,4%
SEA 390 2465 6,3 12 6,5% 11,5% 5,1%

Wir sehen hier also, dass die Vikings mit 7.4% noch nicht einmal das verzerrteste Team sind, auch wenn ihre 25.9 Scoring YPA die Liga toppen. Noch viel extremer verzerrt sind die Big Play Kapazunder schlechthin, die New Orleans Saints. Ein ganzes zusätzliches Yard an YPA generieren die Saints durch ihre 39 TDs.

So, pay Graham?

Jimmy_Graham
Jimmy Graham, der einsamste TE? Pic by Jeffrey Beall

Die Schlussfolgerung hieraus ist natürlich vielfältig. Die Idee, dass Jimmy Graham der beste TE der Liga ist, wird dadurch nur verstärkt. Da er maßgeblich an den scoring Plays der Saints beteiligt ist, konzentriert sich sehr viel offensive Feuerkraft in ihm. Ich finde zwar Taniers Argument, dass ihn das noch lange nicht zu einem WR macht, sehr schlüssig, aber dass 94% der Saints Offense im Ligakeller herumgrundelt und sich mit Teams wie Buffallo und Jacksonville herumprügelt bei der Frage, wer langsamer den Ball bewegt ist, schon sehr bemerkenswert finde ich. Es zeigt auch auf, dass Brees jenseits von ihm (und mit den kommenden Releases von Sproles und Moore) nicht viel Konstanz im Passspiel aufzuweisen hat.

Dass es kein Team gab, bei dem die Prozent-Differenz negativ war, bekräftigt mich in der Idee, dass diese YPA-Verzerrung ein realer Effekt ist: Jedes Team hat eine mehr oder weniger große Verzerrung ihrer Stats durch Big Plays. Aber es gab auch eine Kehrseite, nämlich jene Teams, die am wenigsten verzerrt waren:

Team % of Att that scored
% of Y/A by scores %diff
BAL 3,1% 3,1% 0,0%
NWE 3,8% 4,3% 0,5%
STL 4,3% 4,9% 0,5%
DEN 8,1% 8,7% 0,6%
CHI 5,5% 6,1% 0,6%
SDG 5,9% 6,8% 0,9%
HOU 3,0% 4,2% 1,2%
SFO 5,0% 6,5% 1,5%
GNB 4,6% 6,5% 1,9%

Baltimore ist das einzige Team, dessen YPA komplett real auch abbilden, wie gut das Team den Ball unabhängig von der LOS bewegt. Die Liste ist eine bunte Mischung aus gescheiterten Offenses, die quasi ähnlich schlecht im Scoren waren wie im nicht-Scoren, und großartigen QBs, deren Effizienz am ganzen Feld deutlich zu spüren ist (Brady, Manning).

Auch bemerkenswert hier sind die Chargers. Ihr dritter Platz in Pass Y/A war für viele ein fluky Ergebnis, aber diese Analyse belegt eigentlich wie wenig fluyk das war: Die Chargers haben kaum YPA-Verzerrung durch ein paar wenige Big Plays gehabt und waren somit genuin großartig darin, den Ball via Rivers zu bewegen. Zum Abschluss also hier nun die Tabelle der besten Teams in Non-Scoring Y/A, also der Ausdruck, wie gut sie de Ball bewegt haben in den 95.6% der Pässe, die in keinen Punkten endeten:

Team Non-Scoring Att Non-Scoring Yards Non-Scoring Y/A Non-Scoring Y/A Rank
SDG 512 3796 7,4 1
DEN 620 4565 7,4 2
NWE 626 4525 7,2 3
SFO 399 2875 7,2 4
PHI 476 3394 7,1 5
GNB 544 3810 7,0 6
CHI 547 3796 6,9 7
DET 605 3932 6,5 8
CIN 554 3545 6,4 9
ARI 550 3510 6,4 10
PIT 558 3557 6,4 11
SEA 390 2465 6,3 12
DAL 553 3401 6,1 13
ATL 633 3761 5,9 14
OAK 502 2977 5,9 15
TEN 511 3006 5,9 16
STL 484 2843 5,9 17
NYG 549 3199 5,8 18
HOU 614 3544 5,8 19
IND 559 3224 5,8 20
WAS 591 3403 5,8 21
CAR 449 2585 5,8 22
NYJ 467 2665 5,7 23
KAN 522 2942 5,6 24
BAL 600 3373 5,6 25
MIN 528 2961 5,6 26
MIA 570 3193 5,6 27
NOR 589 3215 5,5 28
JAX 576 3142 5,5 29
BUF 506 2736 5,4 30
CLE 655 3423 5,2 31
TAM 492 2459 5,0 32

Natürlich gehört hier noch gesagt, dass die Analyse selbstverständlich in Zukunft verfeinert werden könnte, indem man sich die Veränderungen in NY/A (oder ANY/A) anschauen könnte, anstatt nur Y/A zu betrachten, wie ich es hier aus Zeitgründen getan habe. Auch wäre es sehr interessant in weiterer Folge die Korrelation zwischen den Scoring/Big Plays (auch inklusive Pick Sixes zB) und dieser hier vorgestellten „dunklen Materie“ an stillen Pässen und zukünftigem Passerfolg zu betrachten.

Aber vorest einmal ist es nicht schlecht, sich in Erinnerung zu rufen, dass Punkte zwar über alles entscheiden in der NFL, dass wir aber mindestens ebensoviel lernen können aus der Mehrheit der Plays, die nicht am Highlightreel landen.

Beitragsbild by Keith Allison under CC BY-SA 2.0 (cropped)

Ein Gedanke zu „Punkten ist nicht alles“

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s