Acabo de ver una conferencia sobre inferencia estadística ("comparación de proporciones y medios"), parte de una introducción al curso en línea de estadísticas. El material tenía tan poco sentido para mí como siempre lo hace (a estas alturas debo haber visto estas cosas docenas de veces, distribuidas en las últimas tres décadas).
Estoy buscando un libro sobre "Estadísticas básicas-101" (estimación puntual, evaluación estimada, inferencia estadística, prueba de hipótesis, diseño de estudio) que toma en serio el problema de convencer a un lector escéptico ...
A continuación, doy algunos ejemplos del tipo de pregunta que el autor que estoy buscando tomaría en serio y sabe cómo abordar de manera convincente.
Pero primero déjenme tomarme un minuto para enfatizar que en esta publicación no estoy haciendo estas preguntas. ¡Por favor, no les contestes! Los doy solo como ejemplos, y a modo de "prueba de fuego" (para el tipo de autor de búsqueda).
Si una "proporción" es simplemente la media de una variable booleana (es decir, una que toma solo los valores 0 y 1), ¿por qué se enseñan diferentes procedimientos para hacer inferencia estadística con "proporciones" y con "medias"?
Si la distribución normal es tan robusta que asumir la normalidad da buenos resultados incluso en los casos en que esos datos no están distribuidos de manera normal, y si la distribución t es tan normal, ¿por qué tanto alboroto por usar la distribución t en lugar de ¿normal?
Que exactamente son "grados de libertad" y por qué nos preocupamos por ellos?
¿Qué significa hablar del valor "verdadero" de un parámetro, considerando que solo estamos usando distribuciones que parecen similares a los datos?
¿Cómo es que el "análisis exploratorio de datos" es algo bueno, mientras que el "espionaje de datos" es algo malo?
Como he dicho, me desanima el actitud que implica el descuido de tales preguntas. No es la "postura epistemológica" lo que quiero ver en alguien que me está enseñando algo. Estoy buscando autores que respeten el escepticismo y la racionalidad del lector, y que sepan cómo abordarlos (sin necesariamente pasar a páginas y páginas de formalismos y tecnicismos).
Me doy cuenta de que esto es una tarea difícil, y tal vez especialmente cuando se trata de estadísticas. Por lo tanto, no espero que muchos autores lo hayan logrado. Pero en este momento estaría contento con encontrar solo uno .
Permítanme agregar que no soy reacio a las matemáticas. Por el contrario, me encantan las matemáticas. (Me siento cómodo con el análisis [también conocido como "cálculo avanzado"], álgebra lineal, teoría de probabilidad, incluso teoría de medidas básicas).
Dicho esto, mi interés en este momento está en las estadísticas "aplicadas", "prácticas", "cotidianas", "del mundo real" (en oposición a las sutilezas teóricas). (¡Pero tampoco quiero un libro de cocina!)
FWIW, he leído los primeros capítulos del análisis de datos usando regresión y modelos multinivel / jerárquicos de Gelman y Hill, y me gusta el tono de los autores. Su enfoque es práctico, pero entra en la teoría cuando sea necesario. También a menudo dan un paso atrás, y evalúan las prácticas estándar de manera crítica, y ofrecen opiniones sinceras que apelan al sentido común de un lector escéptico. Desafortunadamente, estos autores no han escrito un libro dedicado al tema que estoy preguntando en esta publicación ("Estadísticas 101", como se describe anteriormente). También soy consciente de que uno de estos autores (Gelman) fue coautor del muy apreciado análisis de datos bayesianos. , pero, nuevamente, esto no es lo que estoy buscando en este momento.
EDITAR:
Dikran Marsupial plantea la siguiente objeción:
No creo que haya necesariamente nada malo en descuidar las preguntas, llega un punto en el que abordar cada pregunta resta valor a la exposición de los conceptos básicos, que a menudo es más importante (¡especialmente en un libro de estadísticas 101!).
Estoy de acuerdo con eso. Sería más exacto para mí decir que estoy buscando un "segundo vistazo a las estadísticas básicas". De hecho, con esto como mi motivación, miré los libros de texto utilizados en cursos de posgrado sobre inferencia (por ejemplo), y descubrí que ellos también descuidaban preguntas como las que he enumerado. En todo caso, parecían incluso menos inclinados a profundizar en tales preguntas (para que puedan centrarse en asuntos como las condiciones para una convergencia u otra de esto o aquello ...).
El problema es que los libros más avanzados están dirigidos a una radicalmente diferente población de lectores, uno donde el "escepticismo del extraño" se ha agotado drásticamente. IOW, aquellos que están tomando estadísticas de nivel de posgrado han pasado el punto de ser molestados por las preguntas que me molestan. . Ya no son escépticos sobre ninguna de estas cosas. (¿Cómo superaron el escepticismo? Quizás algunos nunca fueron demasiado críticos en primer lugar, especialmente si aprendieron sus estadísticas desde el principio; sé que yo no era un estudiante de primer año particularmente crítico, por ejemplo, aunque no lo hice tome estadísticas entonces. Otros pueden haber tenido maestros que completaron donde sus libros de texto se quedaron cortos. Algunos pudieron haber sido lo suficientemente inteligentes como para descubrir las respuestas a tales preguntas por sí mismos. Quién sabe).