Tengo una pregunta sobre el cálculo del factor de contracción de James-Stein en el artículo de Scientific American de 1977 de Bradley Efron y Carl Morris, "La paradoja de Stein en estadística" .
Reuní los datos para los jugadores de béisbol y se dan a continuación:
Name, avg45, avgSeason
Clemente, 0.400, 0.346
Robinson, 0.378, 0.298
Howard, 0.356, 0.276
Johnstone, 0.333, 0.222
Berry, 0.311, 0.273
Spencer, 0.311, 0.270
Kessinger, 0.289, 0.263
Alvarado, 0.267, 0.210
Santo, 0.244, 0.269
Swoboda, 0.244, 0.230
Unser, 0.222, 0.264
Williams, 0.222, 0.256
Scott, 0.222, 0.303
Petrocelli, 0.222, 0.264
Rodriguez, 0.222, 0.226
Campaneris, 0.200, 0.285
Munson, 0.178, 0.316
Alvis, 0.156, 0.200
avg45
es el promedio después de al bate y se denota como en el artículo. avgSeason
Es el final de la temporada promedio.
El estimador de James-Stein para el promedio ( ) viene dado por z = ˉ y + c ( y - ˉ y ) y el factor de contracción c está dado por (página 5 del artículo de Scientific American 1977) c = 1 - ( k - 3 ) σ 2
donde es el número de medios desconocidos. Aquí hay 18 jugadores, entonces k = 18 . Puedo calcular ∑ ( y - ˉ y ) 2 usando valores. Pero no sé cómo calcular σ 2 . Los autores dicen que c = 0.212 para el conjunto de datos dado.avg45
Intenté usar y σ 2 y para σ 2 pero no dan la respuesta correcta de c = 0.212
¿Alguien puede ser tan amable de hacerme saber cómo calcular para este conjunto de datos?