Wilk, MB y Gnanadesikan, R. 1968. Métodos de trazado de probabilidad para el análisis de datos.
Biometrika 55: 1-17. Enlace Jstor si tiene acceso
Este documento tiene, en el momento de mi escritura, casi 50 años, pero aún se siente fresco e innovador. Utilizando una gran variedad de ejemplos interesantes y sustanciales, los autores unifican y amplían una variedad de ideas para trazar y comparar distribuciones utilizando el marco de parcelas QQ (cuantil-cuantil) y PP (probabilidad-probabilidad). Las distribuciones aquí significan ampliamente cualquier conjunto de datos o de números (residuales, contrastes, etc., etc.) que surjan en sus análisis.
Las versiones particulares de estas gráficas se remontan a varias décadas, más obviamente gráficas de probabilidad normal o de puntuaciones normales. que son en estos términos gráficos cuantil-cuantil, es decir, gráficos de cuantiles observados versus cuantiles esperados o teóricos de una muestra del mismo tamaño de una distribución normal (gaussiana). Pero los autores muestran, con modestia pero con confianza, que las mismas ideas pueden extenderse fácilmente, y prácticamente con la informática moderna, para examinar otros tipos de cuantiles y trazar los resultados automáticamente.
Los autores, que trabajaban en Bell Telephone Laboratories, disfrutaron de las instalaciones informáticas de vanguardia, e incluso muchas universidades e instituciones de investigación tardaron aproximadamente una década en ponerse al día. Incluso ahora, las ideas en este documento merecen una aplicación más amplia de la que tienen. Es un texto o curso introductorio raro que incluye cualquiera de estas ideas además de la trama QQ normal. Los histogramas y las gráficas de caja (cada una de ellas muy útil, pero no obstante incómoda y limitada de varias maneras) continúan siendo los principales elementos básicos cuando se introducen las gráficas de distribuciones.
A nivel personal, aunque las ideas principales de este documento han sido familiares durante la mayor parte de mi carrera, disfruto releerlo cada dos años más o menos. Una buena razón es el placer por la forma en que los autores producen ideas simples pero poderosas con buenos resultados con ejemplos serios. Otra buena razón es la forma en que el documento, que está escrito de manera concisa, sin el más mínimo rastro de arrogancia, insinúa extensiones de las ideas principales. Más de una vez, he redescubierto giros en las ideas principales cubiertas explícitamente en sugerencias laterales y comentarios adicionales.
Este no es solo un documento para aquellos especialmente interesados en gráficos estadísticos, aunque en mi opinión eso debería incluir a todos los interesados en estadísticas de cualquier tipo. Promueve formas de pensar acerca de las distribuciones que son prácticamente útiles para desarrollar las habilidades e ideas estadísticas de cualquier persona.