¿Existe alguna estadística real detrás del "teorema de Pitágoras del béisbol"?


10

Estoy leyendo un libro sobre sabermetría, específicamente Mathletics de Wayne Winston, y en el primer capítulo presenta una cantidad que se puede usar para predecir la tasa de victorias de los equipos: y parece insinuar que, a mitad de temporada, puede usarse para predecir la tasa de ganancias mejor que La tasa de victorias de la primera mitad de la temporada. Él generaliza la fórmula a donde es la proporción de puntos anotados contra puntos. Luego encuentra el exponente que mejor se ajusta para predecir el% de juegos ganados, para 3 deportes, y encuentra para

Points Scored2Points Scored2+Points Against2% Games Won,
RexpRexp+1,
R
Baseball: exp2,
Football: exp2.7,
Basketball: exp14.
Pero me di cuenta de que puede expresar el% de juegos ganados en términos de puntos anotados y puntos en contra para cada juego , específicamente% de los juegos ganados son exactamente la fracción de juegos donde los puntos anotados , es mayor que los puntos contra : Donde es la función del indicador.iPSiPAi
1ni=1nI(PSi>PAi),
I

Por lo tanto, mi pregunta es:

(i=1nPSi)x(i=1nPSi)x+(i=1nPAi)x1ni=1nI(PSi>PAi)

¿Hay alguna forma analítica de encontrar el MLE para ? Perdóname si he cometido algún error ingenuo, sobre todo me autodidacta estadísticas.x

Respuestas:


8

Los fundamentos matemáticos / estadísticos para la "regla de Pitágoras" se examinaron en Miller (2007). Este documento mostró que si el número de carreras anotadas por cada equipo en cada juego sigue una distribución de Weibull con un parámetro de forma común pero diferentes parámetros de escala, entonces la forma generalizada de la regla de Pitágoras (con poder generalizado ) emerge como lo predicho probabilidad de ganarγγ

Ese documento también se ajusta al modelo propuesto de Weibull a los datos de béisbol de 14 equipos que juegan en la Liga Americana de 2004. Los resultados muestran un ajuste razonable del modelo, con usando varias técnicas de estimación. Esto sugiere que la regla pitagórica generalizada puede ser una técnica de predicción razonable para la predicción de pérdidas y ganancias, pero el parámetro de potencia debe ser un poco menor que el valor al cuadrado que aparece en el libro de Winston.γ^1.74-1.82


Miller, S. (2007) Una derivación de la fórmula pitagórica de ganar-perder en el béisbol . Oportunidad 20 (1) , págs. 40-48.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.