¿Hay alguna prueba estadística que sea paramétrica y no paramétrica? Esta pregunta fue formulada por un panel de entrevista. ¿Es una pregunta válida?
¿Hay alguna prueba estadística que sea paramétrica y no paramétrica? Esta pregunta fue formulada por un panel de entrevista. ¿Es una pregunta válida?
Respuestas:
Es fundamentalmente difícil determinar exactamente qué se entiende por "prueba paramétrica" y "prueba no paramétrica", aunque existen muchos ejemplos concretos en los que la mayoría estará de acuerdo en si una prueba es paramétrica o no paramétrica (pero nunca ambas) . Una búsqueda rápida dio esta tabla , que imagino representa una distinción práctica común en algunas áreas entre pruebas paramétricas y no paramétricas.
Justo encima de la tabla mencionada hay una observación:
"... los datos paramétricos tienen una distribución normal subyacente ... Cualquier otra cosa no es paramétrica".
Puede ser un criterio aceptado en algunas áreas que asumimos normalidad y usamos ANOVA, y esto es paramétrico, o no asumimos normalidad y usamos alternativas no paramétricas.
Quizás no sea una muy buena definición, y en mi opinión no es realmente correcta, pero puede ser una regla práctica. Principalmente porque el objetivo final de las ciencias sociales, por ejemplo, es analizar los datos, y ¿de qué sirve poder formular un modelo paramétrico basado en una distribución no normal y luego no poder analizar los datos?
Una definición alternativa es definir "pruebas no paramétricas" como pruebas que no se basan en suposiciones de distribución y pruebas paramétricas como cualquier otra cosa.
La definición anterior, así como la última presentada, define una clase de pruebas y luego define la otra clase como el complemento (cualquier otra cosa). Por definición, esto descarta que una prueba pueda ser paramétrica y no paramétrica.
La verdad es que también la última definición es problemática. ¿Qué pasa si hay ciertas suposiciones naturales "no paramétricas", como la simetría, que se pueden imponer? ¿Eso convertirá una estadística de prueba que, de lo contrario, no se basa en supuestos de distribución en una prueba paramétrica? ¡La mayoría diría que no!
Por lo tanto, hay pruebas en la clase de pruebas no paramétricas que pueden hacer algunas suposiciones de distribución siempre que no sean "demasiado paramétricas". El límite entre las pruebas "paramétricas" y las "no paramétricas" se ha vuelto borroso, pero creo que la mayoría mantendrá que una prueba es paramétrica o no es paramétrica, tal vez no puede ser ninguna de las dos, pero decir que es ambas Tiene poco sentido.
Tomando un punto de vista diferente, muchas pruebas paramétricas son (equivalentes a) pruebas de razón de probabilidad. Esto hace posible una teoría general, y tenemos una comprensión unificada de las propiedades de distribución de las pruebas de razón de probabilidad bajo condiciones de regularidad adecuadas. Las pruebas no paramétricas, por el contrario, no son equivalentes a las pruebas de razón de probabilidad per se no hay probabilidad y sin la metodología unificadora basada en la probabilidad tenemos que obtener resultados de distribución caso por caso. La teoría de la probabilidad empírica.desarrollado principalmente por Art Owen en Stanford es, sin embargo, un compromiso muy interesante. Ofrece un enfoque basado en la probabilidad de las estadísticas (un punto importante para mí, ya que considero la probabilidad como un objeto más importante que un valor , por ejemplo) sin la necesidad de supuestos de distribución paramétricos típicos. La idea fundamental es un uso inteligente de la distribución multinomial en los datos empíricos, los métodos son muy "paramétricos" pero válidos sin restringir los supuestos paramétricos.
Las pruebas basadas en la probabilidad empírica tienen, en mi humilde opinión, las virtudes de las pruebas paramétricas y la generalidad de las pruebas no paramétricas, por lo tanto, entre las pruebas que se me ocurren, se acercan más para calificar para ser paramétricas como no paramétricas, aunque lo haría No use esta terminología.
Paramétrico se usa en (al menos) dos significados: A - Para declarar que está asumiendo la familia de la distribución de ruido hasta sus parámetros. B - Para declarar que está asumiendo la relación funcional específica entre las variables explicativas y el resultado.
Algunos ejemplos:
El término "semi-paramétrico" generalmente se refiere al caso B y significa que no está asumiendo toda la relación funcional, sino que tiene suposiciones más leves como "aditivo en alguna transformación suave de los predictores".
También podría tener suposiciones más suaves sobre la distribución del ruido, como "todos los momentos son finitos", sin especificar específicamente la forma de la distribución. Que yo sepa, no existe un término para este tipo de suposición.
Tenga en cuenta que la respuesta se relaciona con los supuestos subyacentes detrás del proceso de generación de datos. Cuando se dice "prueba paramétrica", uno generalmente se refiere a no paramétrico en sentido A. En esto es lo que quiso decir, entonces respondería "no". Sería imposible ser paramétrico y no paramétrico en el mismo sentido al mismo tiempo.
Supongo que eso depende de lo que quieren decir con "paramétrico y no paramétrico"? Al mismo tiempo exactamente ambos, o una mezcla de los dos?
Muchos consideran que el modelo de riesgos proporcionales de Cox es semiparamétrico, ya que no calcula de forma paramétrica el riesgo de referencia.
O puede optar por ver muchas estadísticas no paramétricas como realmente paramétricas masivas.
Bradley, en sus Pruebas estadísticas sin distribución clásicas (1968, p. 15-16 - vea esta pregunta para una cita) aclara la diferencia entre las pruebas sin distribución y las pruebas no paramétricas , que según él a menudo se combinan entre sí, y da un ejemplo de una prueba libre de distribución paramétrica como la prueba de Signos para la mediana. Esta prueba no presupone la distribución subyacente de la población muestreada de valores variables, por lo que no tiene distribución . Sin embargo, si la mediana seleccionada es correcta, los valores superiores e inferiores deben seleccionarse con la misma probabilidad, analizando muestras aleatorias de
Actualizar