¿Admitiría un bayesiano que hay un valor de parámetro fijo?


40

En el análisis de datos bayesianos, los parámetros se tratan como variables aleatorias. Esto se deriva de la conceptualización subjetiva bayesiana de la probabilidad. Pero, ¿reconocen teóricamente los bayesianos que hay un verdadero valor de parámetro fijo en el "mundo real"?

Parece que la respuesta obvia es 'sí', porque tratar de estimar el parámetro sería casi absurdo. Una cita académica para esta respuesta sería muy apreciada.


2
Dame ese parámetro y definiré una distribución para él. :-)
Anne van Rossum

Respuestas:


43

En mi humilde opinión "sí"! Aquí está una de mis citas favoritas de Groenlandia (2006: 767):

A menudo se dice (incorrectamente) que "los parámetros son tratados como fijados por los frecuentistas pero como aleatorios por los bayesianos". Tanto para los frecuentistas como para los bayesianos, el valor de un parámetro puede haberse fijado desde el principio o puede haberse generado a partir de un mecanismo físicamente aleatorio. En cualquier caso, ambos suponen que ha adquirido un valor fijo que nos gustaría saber. El Bayesiano usa modelos de probabilidad formales para expresar incertidumbre personal sobre ese valor. La "aleatoriedad" en estos modelos representa la incertidumbre personal sobre el valor del parámetro; no es una propiedad del parámetro (aunque deberíamos esperar que refleje con precisión las propiedades de los mecanismos que produjeron el parámetro).

Groenlandia, S. (2006). Perspectivas bayesianas para la investigación epidemiológica: I. Fundamentos y métodos básicos. Revista Internacional de Epidemiología , 35 (3), 765–774.


2
Siendo un poco contraria, ¿no se podría argumentar que la (posición, momento) de una partícula es un "parámetro" que podríamos tratar de estimar? Uno podría argumentar que no hay un valor "fijo" de este parámetro, y que deberíamos considerarlo genuinamente como una distribución. En cuanto a las incógnitas específicamente como distribuciones en lugar de valores fijos, parece ser lo que la naturaleza hace en ciertas situaciones. No creo que este razonamiento sea muy atractivo para un bayesiano en la práctica, pero creo que para responder completamente a la pregunta de los OP es necesario debatir la naturaleza de la aleatoriedad.
chico

3
No veo qué es 'poco agradable' al considerar una distribución como el objetivo de la inferencia. De hecho, indexar cosas con parámetros es de todos modos opcional, por ejemplo, uno puede afirmar su incertidumbre utilizando distribuciones sobre funciones directamente (ver Neal y Williams sobre procesos gaussianos). Y no es necesario tener una visión particular de la "aleatoriedad" para representar la incertidumbre con el cálculo de probabilidad. Inferencia basada en el muestreo (teoría) podría decirse que no necesita una teoría de este tipo, pero por lo que puedo ver bayesianismo no es (o al menos no tiene por qué ser.)
conjugateprior

2
No estoy de acuerdo con que un Bayesiano asuma que un parámetro tiene un valor fijo y es solo su incertidumbre personal lo que los impulsa a definir el parámetro como una distribución en lugar de un punto. He tratado de ampliar eso en mi respuesta. Su incertidumbre personal / teórica es parte de la distribución, pero me parece que su modelo está promediando esencialmente las variables que quedan fuera del modelo y eso crea una distribución, incluso si sus antecedentes personales son muy precisos.
Wayne

29

La concepción bayesiana de una probabilidad no es necesariamente subjetiva (cf Jaynes). La distinción importante aquí es que el Bayesiano intenta determinar su estado de conocimiento con respecto al valor del parámetro mediante la combinación de una distribución previa de su valor plausible con la probabilidad que resume la información contenida en algunas observaciones. Por lo tanto, como bayesiano, diría que estoy contento con la idea de que el parámetro tiene un valor verdadero, que no se conoce exactamente, y el propósito de una distribución posterior es resumir lo que sé sobre sus valores plausibles, basado en mis suposiciones anteriores y las observaciones.

Ahora, cuando hago un modelo, el modelo no es la realidad. Entonces, en algunos casos, el parámetro en cuestión existe en realidad (por ejemplo, el peso promedio de un wombat) y en algunas preguntas no existe (por ejemplo, el verdadero valor de un parámetro de regresión; el modelo de regresión es solo un modelo del resultado de las leyes físicas que rigen el sistema, que en realidad no pueden ser capturadas completamente por el modelo de regresión). Por lo tanto, decir que hay un valor de parámetro fijo verdadero en el mundo real no es necesariamente cierto.

Por otro lado, sugeriría que los más frecuentes dirían que hay un valor verdadero para la estadística, pero tampoco saben cuál es, pero tienen estimadores e intervalos de confianza en sus estimaciones que (en cierto sentido ) cuantifica su incertidumbre con respecto a la plausibilidad de diferentes valores (pero la concepción frecuentista de una probabilidad les impide expresar esto como directamente).


Siempre pensé que las "probabilidades subjetivas" se llamaban subjetivas porque se refieren a una propiedad del sujeto que realiza el cálculo (es decir, su conocimiento) en lugar de una propiedad de la realidad objetiva (por ejemplo, la distribución de peso de un dado no perfectamente justo).
nikie

1
α

Lo sé, pero todavía son probabilidades subjetivas, ¿verdad? Porque todavía están describiendo el conocimiento del sujeto sobre algún parámetro (que, para un frecuentista, no sería una variable aleatoria en absoluto)
nikie

No hay necesariamente un tema. Un conjunto de robots o computadoras podrían realizar el mismo cálculo y llegar a la misma conclusión, ya sea utilizando un enfoque bayesiano frecuentista u objetivista. Es el estado del conocimiento, independientemente del sujeto que realiza el cálculo, por lo que es objetivo más que subjetivo.
Dikran Marsupial

17

Para su punto principal, en Bayesian Data Analysis (3rd ed., 93), Gelman también escribe

Desde la perspectiva del análisis de datos bayesianos, a menudo podemos interpretar estimaciones puntuales clásicas como resúmenes posteriores exactos o aproximados basados ​​en algún modelo de probabilidad total implícito. En el límite del tamaño de muestra grande, de hecho, podemos usar la teoría asintótica para construir una justificación bayesiana teórica para la inferencia clásica de máxima verosimilitud.

Entonces, tal vez no sean los bayesianos quienes deberían "admitir" que existen, en verdad, valores de parámetros reales únicos, ¡sino frecuentistas que deberían recurrir a las estadísticas bayesianas para justificar sus procedimientos de estimación! (Lo digo con la lengua firmemente en la mejilla).

Pr(θEl |y)

Pero la idea de que hay parámetros únicos en la naturaleza o en los sistemas sociales es solo una suposición simplificadora. Puede haber algún proceso adornado que genere resultados observables, pero descubrir ese sistema es increíblemente complicado; suponiendo que hay un único valor de parámetro fijo simplifica el problema dramáticamente. Creo que esto va al centro de su pregunta: los bayesianos no deberían tener que "admitir" hacer esta simplificación más de lo que deberían hacerlo los frequentistas.


¿Le importaría explicar por qué rechaza que la inferencia bayesiana se base en la probabilidad subjetiva? Los textos introductorios que he leído (Kruschke, Lynch) parecen enmarcarlo de esa manera. ¿Es que es solo parcialmente subjetivo (viniendo de lo anterior)?
ATJ

@ATJ Espero que esto aclare mi punto. Hay otros argumentos que uno podría avanzar, pero el verdadero punto de conflicto para mí fue la suposición implícita de que las estadísticas bayesianas son subjetivas de una manera que otros paradigmas no lo son. Por ejemplo, argumentaría en contra de la caracterización en la cita de Bernd porque parece tan "personal" favorecer un método de estimación puntual imparcial sobre un marco de variabilidad posterior.
Sycorax dice Reinstate Monica

@ATJ, los textos introductorios cuentan una historia para motivar los métodos. Algo como esa historia puede haber motivado originalmente los métodos. Pero eso no significa que esa historia tenga mucha influencia en los supuestos que las personas hacen al aplicar esos métodos en la práctica. (Y la historia puede ser absurda: por ejemplo, la idea de que las probabilidades involucradas en las estadísticas se pueden definir en términos de frecuencias de la forma en que los textos introductorios frecuentas a veces dicen que no tiene sentido - los documentos de "15 Argumentos" de Google Alan Hajek Eso no significa que las estadísticas frecuentas no funcionen, lo ha hecho.)
Marte

9

¿Crees que hay un único "parámetro fijo verdadero" para algo como la contribución del consumo de leche al crecimiento de un niño? ¿O por la disminución del tamaño de un tumor en función de la cantidad de químico X que inyecta en el cuerpo de un paciente? Elija cualquier modelo con el que esté familiarizado y pregúntese si realmente cree que hay un valor verdadero, universal, preciso y fijo para cada parámetro, incluso en teoría.

Ignore el error de medición, solo mire su modelo como si todas las mediciones fueran perfectamente precisas e infinitamente precisas. Dado su modelo, ¿cree que cada parámetro tiene un valor de punto específico de manera realista?

El hecho de que tenga un modelo indica que está omitiendo algunos detalles. Su modelo tendrá una cierta imprecisión porque está promediando los parámetros / variables que ha omitido para hacer un modelo, una representación simplificada de la realidad. (Del mismo modo que no hace un mapa 1: 1 del planeta, complete con todos los detalles, sino más bien un mapa 1: 10000000, o alguna simplificación. El mapa es un modelo).

Dado que está promediando las variables excluidas, los parámetros para las variables que incluya en su modelo serán distribuciones, no valores de puntos.

Eso es solo una parte de la filosofía bayesiana: estoy ignorando la incertidumbre teórica, la incertidumbre de medición, los antecedentes, etc., pero me parece que la idea de que sus parámetros tienen distribuciones tiene sentido intuitivo, de la misma manera que las estadísticas descriptivas tienen distribución.


7

Pero, ¿reconocen teóricamente los bayesianos que hay un verdadero valor de parámetro fijo en el "mundo real"?

θ0 0θ0 0


θ0 00 0

2

Si vamos y combinamos el bayesianismo con un universo determinista (antes de que digas algo con la palabra 'cuántico', coméntame y recuerda que esto no es física. Intercambio de pilas) obtenemos algunos resultados interesantes.

Haciendo explícitos nuestros supuestos:

  1. Tenemos un agente bayesiano que forma parte y observa un universo determinista.
  2. El agente tiene recursos computacionales limitados.

Ahora, el universo determinista puede ser uno donde los átomos son pequeñas bolas de billar newtonianas. Puede ser completamente no cuántico. Digamos que lo es.

El agente ahora lanza una moneda justa. Piense en eso por un segundo, ¿qué constituye una moneda justa en un universo determinista? ¿Una moneda que tiene una razón de probabilidad de 50/50?

¡Pero es determinista! Con suficiente potencia informática, puede calcular exactamente cómo caerá la moneda, simplemente simulando un modelo de una moneda que se voltea de la misma manera.

En un universo determinista, una moneda justa sería un disco de metal con densidad uniforme. Ninguna fuerza lo obliga a pasar más tiempo con una cara hacia abajo que la otra (piense en cómo funcionan los dados ponderados).

Entonces el agente lanza una moneda justa. Sin embargo, el agente no es lo suficientemente poderoso. No tiene ojos lo suficientemente afilados para medir cómo gira la moneda cuando se lanza, ve que solo se ve borrosa.

Y así dice: "Esta moneda aterrizará cara con un 50% de probabilidad". La falta de información conduce a las probabilidades.

Podemos mirar el espacio de fase de cómo se lanza una moneda. Un gran sistema de coordenadas multidimensional con ejes pertenecientes a la dirección de lanzamiento, fuerza de lanzamiento, giro de la moneda, velocidad y dirección del viento, etc. Un solo punto en este espacio corresponde a un único coinflip posible.

Si le pedimos al agente de antes que coloree en el sistema de coordenadas con un gradiente de escala de grises correspondiente a la asignación de probabilidad de cabezas del agente para cada lanzamiento dado, la mayoría lo coloreará con un tono uniforme de gris.

Si gradualmente le damos computadoras internas más potentes con las cuales calcular las probabilidades de cabezas, será capaz de hacer coloraciones cada vez más exigentes. Cuando finalmente le demos la computadora interna más poderosa, haciéndola omnisciente, efectivamente pintará un tablero de ajedrez extraño.

Las monedas justas no están hechas de probabilidades, están hechas de metal. Las probabilidades existen solo en estructuras computacionales. Eso dice el bayesiano.


-3

Hay antecedentes inadecuados, por ejemplo Jeffreys, que tiene una cierta relación con la matriz de información de los pescadores. Entonces no es subjetivo.


2
¿Podría explicar cómo la previa de Jeffreys y su relación con la matriz de información de Fisher significa que la inferencia bayesiana no es subjetiva? Según tengo entendido, la razón principal para usar el anterior de Jeffreys es que es invariable para las parametrizaciones alternativas del modelo. Además, en un entorno multidimensional, estos antecedentes de Jeffrey pueden ser muy informativos, y los resultados son controvertidos (Gelman, BDA 3, p. 53). ¿Esto socava su 'objetividad'?
Sycorax dice Reinstate Monica

@ user777, ya que se basa en parámetros de la densidad disponible, es objetivo. Supongamos que multiplico la probabilidad por 1, ¿tengo entonces subjetivo previo para la probabilidad? Dado que la probabilidad posterior está relacionada con la probabilidad x anterior.
Analista

Y los frecuentistas también tienen que invocar Axiom of The True Model si quieren usar la probabilidad ... :)
Analista
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.