Cómo NO usar estadísticas


15

Esta es una especie de pregunta abierta pero quiero ser claro. Dada una población suficiente, es posible que pueda aprender algo (esta es la parte abierta) pero, sea lo que sea que aprenda sobre su población, ¿cuándo es aplicable a un miembro de la población?

Por lo que entiendo de las estadísticas, nunca es aplicable a un solo miembro de una población, sin embargo, a menudo me encuentro en una discusión donde la otra persona dice "Leí que el 10% de la población mundial tiene esta enfermedad" y continúo concluir que cada décima persona en la sala tiene esta enfermedad.

Entiendo que diez personas en esta sala no es una muestra lo suficientemente grande como para que la estadística sea relevante, pero aparentemente muchas no lo son.

Luego está esta cosa sobre muestras suficientemente grandes . Solo necesita sondear una población lo suficientemente grande como para obtener estadísticas confiables. Esto, sin embargo, ¿no es proporcional a la complejidad de la estadística? Si estoy midiendo algo que es muy raro, ¿eso no significa que necesito una muestra mucho más grande para poder determinar la relevancia de tal estadística?

La cuestión es que realmente cuestiono la validez de cualquier periódico o artículo cuando se trata de estadísticas, de la forma en que se usa para generar confianza.

Eso es un poco de historia.

Volviendo a la pregunta, ¿de qué maneras NO puedes o NO puedes usar estadísticas para formar un argumento ? Negué la pregunta porque me gustaría saber más sobre conceptos erróneos comunes con respecto a las estadísticas.


2
Esta es solo una respuesta muy parcial, por lo que en realidad no la publicaré como respuesta. Usted ESTÁ en lo correcto al decir que las estadísticas complejas necesitan poblaciones más grandes; te estás refiriendo al concepto de "grados de libertad", que es simplemente el número de variables independientes menos uno. Además, al hacer algo como una prueba p, su umbral de rechazo depende de la cantidad de grados de libertad además del valor p que elija (generalmente .05).

2
Si más personas leen Hooke's How to Tell the Liars de los estadísticos , tal vez no haya tantos "tontos estadísticos" como los que tenemos ahora en el mundo.
JM no es estadístico

1
Creo que podría beneficiarse de hacer esta pregunta en el intercambio de estadísticas de pila: marqué la pregunta, por lo que tal vez se trasladará allí.
InterestedGuest

Ni siquiera sabía que teníamos un foro dedicado al análisis estadístico. Me gustaría mover la pregunta, si supiera cómo ...

Respuestas:


2

Para sacar conclusiones sobre un grupo basado en la población, el grupo debe ser representativo de la población e independiente. Otros han discutido esto, así que no me detendré en esta pieza.

Otra cosa a considerar es la no intuitividad de las probabilidades. Supongamos que tenemos un grupo de 10 personas que son independientes y representativas de la población (muestra aleatoria) y que sabemos que en la población el 10% tiene una característica particular. Por lo tanto, cada una de las 10 personas tiene un 10% de posibilidades de tener la característica. La suposición común es que es bastante seguro que al menos 1 tendrá la característica. Pero ese es un problema binomial simple, podemos calcular la probabilidad de que ninguno de los 10 tenga la característica, es aproximadamente el 35% (converge a 1 / e para un grupo más grande / probabilidad más pequeña) que es mucho más alto de lo que la mayoría de la gente supondría. También hay un 26% de posibilidades de que 2 o más personas tengan la característica.


9

A menos que las personas en la sala sean una muestra aleatoria de la población mundial, cualquier conclusión basada en estadísticas sobre la población mundial será muy sospechosa. Una de cada 5 personas en el mundo es china, pero ninguno de mis cinco hijos es ...


6
  1. Para abordar la aplicación excesiva de estadísticas a muestras pequeñas, recomiendo contrarrestar con bromas bien conocidas ("Estoy muy emocionada, mi madre está embarazada de nuevo y mi hermano bebé será chino". "¿Por qué?" "He leído que cada cuarto bebé es chino ").

  2. En realidad, recomiendo bromas para abordar todo tipo de conceptos erróneos en las estadísticas, consulte http://xkcd.com/552/ para ver la correlación y la causalidad.

  3. El problema con los artículos de periódicos rara vez es el hecho de que tratan un fenómeno raro.

  4. La paradoja de Simpson viene a la mente como ejemplo de que las estadísticas rara vez se pueden usar sin un análisis de las causas.


2
La variación de la broma del "bebé chino" que escuché tenía a la futura madre temerosa de que su bebé pudiera ser considerado un extranjero ilegal y, por lo tanto, deportado ...
JM no es un estadístico

3

Hay un interesante artículo de Mary Gray sobre el mal uso de las estadísticas en casos judiciales y cosas así ...

Gray, Mary W .; Estadísticas y derecho. Matemáticas. revista 56 (1983), no. 2, 67–81



1

¿Análisis estadístico o datos estadísticos?

Creo que este ejemplo en su pregunta se relaciona con datos estadísticos: "Leí que el 10% de la población mundial tiene esta enfermedad". En otras palabras, en este ejemplo, alguien está usando números para ayudar a comunicar la cantidad de manera más efectiva que simplemente decir 'muchas personas'.

Supongo que la respuesta a su pregunta está oculta en la motivación del hablante sobre por qué está usando números. Podría ser comunicar mejor alguna noción o podría ser mostrar autoridad o podría ser deslumbrar al oyente. Lo bueno de decir números en lugar de decir 'muy grande' es que las personas pueden refutar el número. Vea la idea de Popper sobre la refutación.


0

Hipótesis: UN

(Libro de texto) Resultado: No rechazarUN (σ=C)

Su declaración: UN se sostiene con probabilidad σ!

Correcto sería: En este caso, no sabes nada. Si quieres "probar"UN, tu hipótesis tiene que ser ¬UN; rechazarlo conσ para obtener la declaración deseada.


0

Por lo que entiendo de estadísticas, nunca es aplicable a un solo miembro de una población

No es verdad. Depende de la aplicación.

Ejemplo: decadencia nuclear en física. La tasa de desintegración define la probabilidad de una desintegración de cada núcleo . Tomas cualquier núcleo y tendrá exactamente la misma probabilidad de descomposición, que estableciste por experimentación en la muestra.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.