¿Puedo usar una prueba t pareada cuando las muestras se distribuyen normalmente pero su diferencia no lo es?

Tengo datos de un experimento en el que apliqué dos tratamientos diferentes en condiciones iniciales idénticas, produciendo un número entero entre 0 y 500 en cada caso como resultado. Quiero usar una prueba t pareada para determinar si los efectos producidos por los dos tratamientos son significativamente diferentes. Los resultados para cada grupo de tratamiento se distribuyen normalmente, pero la diferencia entre cada par no se distribuye normalmente (asimétrica + una cola larga).

¿Puedo usar una prueba t pareada en este caso, o se viola el supuesto de normalidad, lo que significa que debería usar una prueba no paramétrica de algún tipo?

t-test normality-assumption

— John Doucette
fuente

El experimento se basa en una simulación. Puedo establecer las condiciones iniciales de la simulación como me plazca. Por lo tanto, para cada par, comienzo con las mismas condiciones iniciales y aplico dos algoritmos diferentes.

— John Doucette

Por lo que usted describe, estos sonidos parecen grupos independientes. ¿Aplicó ambos tratamientos a cada caso o hay alguna otra coincidencia? ¿Cuál es la correlación entre las condiciones? Su redacción es extraña ... ¿quiere decir que tiene un valor en la cola que lo hace asimétrico?

— John

Pensando más en ello, estoy menos seguro de que sean dependientes, pero tal vez puedas arrojar algo de luz sobre ello. La correlación análoga en el mundo real sería: Tengo una persona. Se administra el tratamiento uno y se toma una medida. Luego retrocedo el tiempo, y en su lugar administro el tratamiento dos. Se toma nuevamente una medida. Me parece que estas medidas deben considerarse correlacionadas. Quizás no deberían?

— John Doucette

También, con la no normalidad, la distribución es tanto asimétrico y tiene una cola larga (con múltiples valores atípicos). Eliminar algunos de los valores atípicos no lo haría normal.

— John Doucette

Si las distribuciones univariadas son normales e independientes, entonces la distribución de las diferencias debe ser normal. Su falta de normalidad demuestra una dependencia entre las dos distribuciones. La dependencia no es simplemente la correlación: también debe haber algo más.

— whuber

Una prueba t pareada solo analiza la lista de diferencias pareadas y supone que la muestra de valores se muestrea aleatoriamente de una población gaussiana. Si ese supuesto se viola gravemente, la prueba t pareada no es válida. La distribución a partir de la cual los valores de antes y después son muestras es irrelevante: solo la población de las diferencias se muestrea de las materias.

— Harvey Motulsky
fuente

Entonces, digamos que si analizo un modelo no lineal y genero y_observado en el tiempo = i. ¿Puedo hacer una prueba t pareada que compare cada valor observado con el valor real en el momento i? Supongamos también que tengo los datos observados para 100 intervalos de tiempo, y pronostique mis números a los mismos intervalos

— dassouki