Puede citar el Teorema de No Free Lunch si lo desea, pero también puede citar los Modus Ponens (también conocidos como la Ley de Desapego , la base del razonamiento deductivo), que es la raíz del Teorema de No Free Lunch .
El teorema de no almuerzo gratis abarca una idea más específica: el hecho de que no existe un algoritmo que pueda adaptarse a todos los propósitos. En otras palabras, el Teorema de No Free Lunch básicamente dice que no hay una bala mágica algorítmica . Esto se basa en los Modus Ponens, porque para que un algoritmo o una prueba estadística den el resultado correcto, debes satisfacer las premisas.
Al igual que en todos los teoremas matemáticos, si violas las premisas, entonces la prueba estadística está vacía de sentido y no puedes derivar ninguna verdad de ella. Entonces, si desea explicar sus datos utilizando su prueba, debe asumir que se cumplen las premisas requeridas, si no se cumplen (y usted lo sabe), entonces su prueba está completamente equivocada.
Esto se debe a que el razonamiento científico se basa en la deducción: básicamente, su prueba / ley / teorema es una regla de implicación , que dice que si tiene la premisa A
, puede concluir B
: A=>B
pero si no tiene A
, puede tener B
o no B
, y ambos casos son ciertos , ese es uno de los principios básicos de la inferencia / deducción lógica (la regla Modus Ponens). En otras palabras, si viola las premisas, el resultado no importa y no puede deducir nada .
Recuerde la tabla binaria de implicación:
A B A=>B
F F T
F T T
T F F
T T T
Entonces, en tu caso, para simplificar, tienes Dependent_Variables => ANOVA_correct
. Ahora, si usa variables independientes, así Dependent_Variables
es False
, entonces la implicación será verdadera, ya que Dependent_Variables
se viola el supuesto.
Por supuesto, esto es simplista, y en la práctica su prueba ANOVA aún puede arrojar resultados útiles porque casi siempre hay cierto grado de independencia entre las variables dependientes, pero esto le da la idea de por qué no puede confiar en la prueba sin cumplir con los supuestos .
Sin embargo, también puede usar pruebas cuyas premisas no satisfacen el original al reducir su problema: al relajar explícitamente la restricción de independencia, su resultado aún puede ser significativo, aunque no garantizado (porque entonces sus resultados se aplican al problema reducido, no al problema completo, por lo que no puede traducir todos los resultados, excepto si puede probar que las restricciones adicionales del nuevo problema no afectan su prueba y, por lo tanto, sus resultados).
En la práctica, esto a menudo se usa para modelar datos prácticos, usando Naive Bayes, por ejemplo, modelando variables dependientes (en lugar de independientes) usando un modelo que asume variables independientes, y sorprendentemente a menudo funciona muy bien, y a veces es mejor que los modelos de contabilidad. para las dependencias . También puede interesarle esta pregunta sobre cómo usar ANOVA cuando los datos no satisfacen exactamente todas las expectativas .
En resumen: si tiene la intención de trabajar en datos prácticos y su objetivo no es probar ningún resultado científico, sino crear un sistema que simplemente funcione (es decir, un servicio web o cualquier aplicación práctica), el supuesto de independencia (y tal vez otros supuestos) puede ser relajado, pero si está tratando de deducir / probar alguna verdad general , siempre debe usar pruebas que pueda garantizar matemáticamente (o al menos asumir de manera segura y comprobable) que cumple todas las premisas .