Estadísticamente significativo vs. independiente / dependiente

¿Cuál es la diferencia entre tener algo estadísticamente significativo (como una diferencia entre dos muestras) y establecer si un grupo de números es independiente o dependiente?

statistical-significance independence

— Elpezmuerto
fuente

La importancia en una prueba t de muestras independientes solo significa que la probabilidad (si el valor nulo fuera verdadero) de muestrear una diferencia de medias tan extrema como la diferencia de medias que usted realmente muestreó es menor que 0.05.

Esto no tiene ninguna relación con dependiente / independiente. "Dependiente" significa que la distribución de algunas observaciones individuales está relacionada con la distribución de otras, por ejemplo, A) son la misma persona que realiza la misma prueba por segunda vez, B) las personas de cada grupo se corresponden con alguna variable previa a la prueba, C) las personas en los dos grupos están relacionadas (es decir, la familia). "Independiente" significa que no existe tal conexión.

— Brian
fuente

Observando también que p = 0.05 es un umbral algo arbitrario. Si cree que 1:20 es una posibilidad demasiado alta de un falso positivo, entonces su p debería ser menor.

— naught101

¿Por qué parar en -tests? $t$

Se puede pensar en dos variables que son no correlacionados como dos vectores ortogonales, exactamente igual que el y los ejes en un sistema de coordenadas tridimensional cartesiana dos. $x$ $y$

Cuando cualquiera de los dos vectores, digamos y está correlacionado con el otro, habrá una cierta parte de x que se puede proyectar en y y viceversa. Con eso en mente, es bastante fácil ver que desde entonces, $\mathbf{x}$ $\mathbf{y}$

\begin{aligned} ⟨ x, y ⟩ & = ‖ x ‖ ‖ y ‖ \cos (θ) \\ \frac{⟨ x, y ⟩}{‖ x ‖ ‖ y ‖} & = \cos (θ) = r \end{aligned}

$\begin{align*} \left<\mathbf{x},\mathbf{y}\right>&=\|x\|\|y\|\cos\left(\theta\right)\\ \frac{\left<\mathbf{x},\mathbf{y}\right>}{\|x\|\|y\|}&=\cos\left(\theta\right)=r \end{align*}$

Donde es el coeficiente de correlación de Pearson y es el producto interno de los argumentos. Cuando aprendí esto, me quedé totalmente impresionado por lo geométricamente simple que es la idea de correlación. Y esta definitivamente no es la única forma de medir la correlación entre dos (o más) variables. $r$ $\left<\cdot,\cdot\right>$

La prueba de significación es un juego de pelota diferente. A menudo queremos saber cuánto difieren dos (o más) grupos en alguna variable de resultado como resultado de alguna manipulación que se realizó en dichos grupos. Como dijo Brian, desea saber si los dos grupos provienen de la misma distribución, por lo tanto, calcula la probabilidad de muestrear la diferencia de medias (escalada por el error estándar de la media) que obtuvo de su experimento, dado que la hipótesis nula (no hay diferencia significativa en los medios) es cierto. En la investigación del comportamiento (y a menudo en otros lugares) si esta probabilidad es menor a 0.05, puede concluir que la diferencia en los dos (o más) medios probablemente se deba a su manipulación.

EDITAR : Dilip Sarwate señaló que dos variables no correlacionadas pueden ser estadísticamente dependientes, así que saqué la primera parte. Gracias por eso.

— Phillip Cloud
fuente

Wow, mi fondo de matemáticas es mucho más avanzado que mi fondo de estadísticas. Me parece una forma realmente intuitiva de entender la r de Pearson. Esta respuesta es realmente útil, ¡gracias!

— naught101

¡Especialmente el concepto de que la covarianza es solo un producto interno!

— naught101

-1 para "Se puede pensar que dos variables son independientes (a veces también llamadas no correlacionadas)" Independencia no es lo mismo que no estar correlacionado; Las variables aleatorias no correlacionadas pueden ser muy dependientes.

— Dilip Sarwate

OK, gracias por solucionar el problema. Estoy invirtiendo mi voto negativo.

— Dilip Sarwate