Mi experiencia es principalmente en aprendizaje automático y estaba tratando de aprender qué significaba la prueba de hipótesis bayesiana. Estoy de acuerdo con la interpretación bayesiana de la probabilidad y la conozco en el contexto de los modelos gráficos probabilísticos. Sin embargo, lo que me confunde es lo que significa la palabra "Hipótesis" en el contexto de la inferencia estadística.
Creo que me estoy confundiendo sobre el vocabulario al que estoy acostumbrado en el aprendizaje automático frente a lo que normalmente se usa en estadística e inferencia.
En el contexto del aprendizaje supervisado , normalmente pienso en la hipótesis como la función predictiva que asigna ejemplos a sus etiquetas, es decir, . Sin embargo, me parece que el término hipótesis, en las lecturas que estoy haciendo, no tiene el mismo significado. Permítanme pegar un extracto de las lecturas que estoy leyendo:
Si lees atentamente también dice:
Hay un modelo diferente para los datos observados ...
si usaran la palabra modelo. Para mí, la palabra modelo me hace pensar en un conjunto de funciones donde seleccionamos una función predictiva específica. es decir, una clase de hipótesis de función. Por ejemplo, podría ser la clase de hipótesis de funciones cuadráticas (polinomio de grado 2). Sin embargo, me parece que usan la palabra modelo e hipótesis como sinónimos en este extracto (donde para mí son palabras completamente diferentes).
Luego continúa mencionando que podemos anteponer las hipótesis (algo completamente razonable para hacer en un entorno bayesiano):
También podemos caracterizar los datos con una hipótesis actual:
y actualizar nuestras creencias actuales dados algunos datos (y la regla de Baye):
Sin embargo, supongo que estoy más acostumbrado a poner una estimación bayesiana a un parámetro particular (por ejemplo, ) de una clase de hipótesis en lugar de a toda la clase de hipótesis. Básicamente, dado que parece que estas "hipótesis" no son las mismas hipótesis del contexto de aprendizaje automático al que estoy acostumbrado, me parece que estas hipótesis son más similares a un parámetro específico que a una clase de hipótesis.
En este punto, estaba convencido de que "hipótesis" significaba lo mismo que en la función predictiva (parametrizada por un parámetro , por ejemplo), pero creo que estaba equivocado ...
Para empeorar aún más mi confusión, más tarde estas mismas lecturas continuaron para especificar una "hipótesis" particular para cada ejemplo de entrenamiento que observaron. Déjame pegar un extracto de lo que quiero decir:
La razón por la que esto me confunde es que, si interpreto la hipótesis como un parámetro, entonces para mí no tiene sentido especificar un parámetro específico para cada valor de muestra que vemos. En este punto, llegué a la conclusión de que realmente no sabía qué querían decir con hipótesis, así que publiqué esta pregunta.
Sin embargo, no me rendí por completo, investigué qué significa la hipótesis en las estadísticas frecuentistas y encontré el siguiente video de la academia Khan . Ese video realmente tiene mucho sentido para mí (¡tal vez eres un frecuente! :) . Sin embargo, parece que obtienen una gran cantidad de datos (como un "conjunto de muestras") y, en función de las propiedades del conjunto de muestras, deciden si aceptan o rechazan la hipótesis nula sobre los datos. Sin embargo, en el contexto bayesiano que estoy leyendo, me parece que por cada vector de datos [punto] que se observa, "lo etiquetan" con una hipótesis con la "Prueba de razón de verosimilitud":
La forma en que asignan la hipótesis a cada muestra de datos, incluso parece un entorno de aprendizaje supervisado en el que estamos adjuntando una etiqueta a cada conjunto de entrenamiento. Sin embargo, no creo que eso sea lo que están haciendo en este contexto. ¿Qué están haciendo? ¿Qué significa asignar una hipótesis a cada muestra de datos? ¿Cuál es el significado de una hipótesis? ¿Qué significa la palabra modelo?
Básicamente, después de esta larga explicación de mi confusión, ¿alguien sabe qué significa la prueba de hipótesis bayesiana en este contexto?
Si necesita alguna aclaración o algo para mejorar mi pregunta o para que la pregunta tenga sentido, estoy más que feliz de ayudar :)
En mi búsqueda de una respuesta, encontré algunas cosas útiles relacionadas con la prueba de hipótesis estadísticas:
Este aborda una buena introducción al tema si vienes de un fondo CS (como yo):
¿Cuál es una buena introducción a las pruebas de hipótesis estadísticas para informáticos?
En algún momento pregunté sobre los "parámetros predeterminados" (que debería haber definido lo que quise decir. Pensé que era un término estándar pero no lo es, así que aquí lo abordaré) y creo que lo que realmente quise decir es cómo especifica parámetros para cada hipótesis que tenga. Por ejemplo, ¿cómo decide cuál es su hipótesis nula y sus parámetros? Hay una pregunta relacionada con eso:
Cómo especificar la hipótesis nula en la prueba de hipótesis