¿Quiénes son los frecuentistas?


55

Ya teníamos un hilo preguntando quiénes son bayesianos y uno preguntando si los frecuentistas son bayesianos , pero no había ningún hilo preguntando directamente quiénes son frecuentistas . Esta es una pregunta que fue hecha por @whuber como un comentario a este hilo y pide ser respondida. ¿Existen (hay algunos frecuentistas autoidentificados)? ¿Tal vez fueron inventados por bayesianos que necesitaban un chivo expiatorio para criticar las estadísticas principales?

Meta-comentario a las respuestas que ya se dieron: Como contraste, las estadísticas bayesianas no solo se definen en términos de usar el teorema de Bayes (los que no son de Bayes también lo usan), ni sobre el uso de la interpretación subjetivista de la probabilidad (no llamaría a ningún laico) decir cosas como "¡Apuesto a que la posibilidad es menor que 50:50!", un Bayesiano), entonces ¿podemos definir el frecuentismo solo en términos de la interpretación adoptada de la probabilidad? Por otra parte, las estadísticas probabilidad aplicada , por lo que debería definición de frequentism se centra exclusivamente en la interpretación de la probabilidad?


10
¿Todavía me gustaría saber qué es un "frecuente"? He visto este término usado como una referencia aparente a "cualquier no bayesiano", así como a alguien que se suscribe a una filosofía de probabilidad frequentista. Sé que hay muchos de los primeros, ¡pero no estoy seguro de que haya exponentes vivos de los últimos!
whuber

99
Cuenta conmigo como frecuentista, por favor. ¡Unámonos! ¡Unidos, seremos fuertes para destruir Bayesian en la puerta de una vez por todas!
Aksakal

10
@Aksakal repítelo infinitas veces y lo consideraré significativo;)
Tim

55
Cuidado a quien llamas bayesiano. Por DV Lindley "No hay nadie menos bayesiano que un bayesiano empírico". Muchos usuarios de los llamados métodos bayesianos no son realmente bayesianos. Ahora, con computadoras rápidas y MCMC, ¿todos de repente son bayesianos? Para muchos, es solo otro cálculo, como cualquier otro, no una filosofía profundamente arraigada. La población está dividida de manera disjunta, y solo entre frequentistas y bayesianos. ¿Qué tal alguien sin educación relevante, qué son? ¿Puede haber un grado (o frecuencia) de bayesianismo? ¿Quizás diferente en diferentes días de la semana o tipos de análisis?
Mark L. Stone el

10
Tim, me temo que este hilo podría verse afectado por la misma confusión que algunos hilos relacionados: a saber, existen métodos estadísticos frecuentas contra bayesianos y hay interpretaciones frecuentas contra bayesianas de probabilidad. ¡Estas son dos cuestiones diferentes! ¿Sobre cuál preguntas? La confusión ya es obvia ahora, en los comentarios a la respuesta de @ fcop; fcop habla sobre la definición / interpretación de probabilidad, mientras que usted mencionó OLS y esto se trata de métodos estadísticos.
ameba dice Reinstate Monica

Respuestas:


35

Algunas respuestas existentes hablan sobre inferencia estadística y otras sobre interpretación de probabilidad, y ninguna claramente hace la distinción. El objetivo principal de esta respuesta es hacer esta distinción.


La palabra "frecuentismo" (y "frecuenta") puede referirse a DOS COSAS DIFERENTES:

  1. Una es la pregunta sobre cuál es la definición o la interpretación de "probabilidad". Hay múltiples interpretaciones, siendo la "interpretación frecuentista" una de ellas. Frecuentistas serían las personas que se adhieren a esta interpretación.

  2. Otra es la inferencia estadística sobre los parámetros del modelo basados ​​en datos observados. Hay enfoques bayesianos y frecuentistas para la inferencia estadística, y los frecuentistas serían las personas que preferirían usar el enfoque frecuentista.

Ahora viene una especulación: creo que casi no hay frecuentistas del primer tipo (P-frecuentas) , pero hay muchos frecuentas del segundo tipo (S-frecuentas) .


Interpretación frecuente de probabilidad

La cuestión de qué es la probabilidad es un tema de intenso debate en curso con más de 100 años de historia. Pertenece a la filosofía. Recomiendo a cualquiera que no esté familiarizado con este debate al artículo de Interpretaciones de probabilidad en la Enciclopedia de filosofía de Stanford, que contiene una sección sobre interpretación (es) frecuente (s). Otra cuenta muy legible que conozco es este documento: Appleby, 2004, Probability es de caso único o nada , que está escrito en el contexto de los fundamentos de la mecánica cuántica, pero contiene secciones que se centran en lo que es la probabilidad.

Appleby escribe:

Frequentism es la posición de que un enunciado de probabilidad es equivalente a un enunciado de frecuencia sobre un conjunto elegido adecuadamente. Por ejemplo, según von Mises [21, 22], la afirmación "la probabilidad de que esta moneda salga cara es 0.5" es equivalente a la afirmación "en una secuencia infinita de lanzamientos, esta moneda saldrá cara con una frecuencia relativa límite 0.5" .

Esto puede parecer razonable, pero hay tantos problemas filosóficos con esta definición que apenas se sabe por dónde empezar. ¿Cuál es la probabilidad de que llueva mañana? Pregunta sin sentido, porque ¿cómo tendríamos una secuencia infinita de pruebas? ¿Cuál es la probabilidad de que la moneda en mi bolsillo salga cara? ¿Una frecuencia relativa de cabezas en una secuencia infinita de lanzamientos, dices? Pero la moneda desaparecerá y el Sol se convertirá en supernova antes de que se pueda terminar la secuencia infinita. Entonces deberíamos estar hablando de una secuencia infinita hipotética . Esto lo lleva a uno a la discusión de clases de referencia, etc., etc. En filosofía, uno no se escapa tan fácilmente. Y, por cierto, ¿por qué debería existir el límite?

Además, ¿qué pasaría si mi moneda saliera cara el 50% del tiempo durante el primer billón de años, pero luego comenzaría a salir cara solo el 25% del tiempo (experimento de Appleby)? Esto significa que por definición. Pero siempre estaremos observando durante los próximos mil millones de años. ¿Crees que tal situación no es realmente posible? Claro, pero ¿por qué? ¿Porque la no puede cambiar repentinamente? Pero esta oración no tiene sentido para un P-frecuentista.P(Heads)=1/4Frequency(Heads)1/2P(Heads)

Quiero mantener esta respuesta corta, así que me detengo aquí; ver arriba para las referencias. Creo que es realmente difícil ser un P-frecuentador acérrimo.

(Actualización: en los comentarios a continuación, @mpiktas insiste en que es porque la definición frecuentista carece de sentido matemático . Mi opinión expresada anteriormente es más bien que la definición frecuentista es filosóficamente problemática).


Enfoque frecuente de las estadísticas

Considere un modelo probabilístico que tiene algunos parámetros y permite calcular la probabilidad de observar los datos . Hiciste un experimento y observado una . ¿Qué puedes decir sobre ?P(Xθ)θXXθ

S-frecuentismo es la posición de que no es una variable aleatoria; Sus verdaderos valores en el mundo real son lo que son. Podemos tratar de estimarlos como algo , pero no podemos hablar significativamente sobre la probabilidad de que esté en algún intervalo (por ejemplo, ser positivo). La única cosa que podemos hacer, es para llegar a un procedimiento de construcción de un intervalo en torno a nuestra estimación de tal manera que este procedimiento tiene éxito en lo abarca verdadera con una frecuencia de éxito a largo plazo en particular (probabilidad particular).θθ^θθ

La mayoría de las estadísticas que se usan en las ciencias naturales hoy en día se basan en este enfoque, por lo que ciertamente hay muchos frecuentistas S en la actualidad.

(Actualización: si busca un ejemplo de un filósofo de la estadística, en oposición a los profesionales de la estadística, que defiende el punto de vista S-frecuentista, entonces lea los escritos de Deborah Mayo; +1 a la respuesta de @ NRH).


ACTUALIZACIÓN: sobre la relación entre el P-frecuentismo y el S-frecuentismo

@fcop y otros preguntan sobre la relación entre el P-frecuentes y el S-frecuente. ¿Una de estas posiciones implica otra? No hay duda de que históricamente el S-frecuentismo se desarrolló en base a la postura P-frecuentista; pero ¿se implican lógicamente entre sí?

Antes de abordar esta pregunta, debo decir lo siguiente. Cuando escribí anteriormente que casi no hay P-frecuentas, no quise decir que casi todo el mundo es P-subjetivo-bayesiano-a-la-de-finetti o P-propensitista-a-la-popper. De hecho, creo que la mayoría de los estadísticos (o científicos de datos o aprendices automáticos) son P-nada en absoluto, o P-cállate y calcula (para tomar prestada la famosa frase de Mermin ). La mayoría de las personas tienden a ignorar los problemas básicos. Y esta bien. No tenemos una buena definición de libre albedrío, inteligencia, tiempo o amor. Pero esto no debería evitar que trabajemos en neurociencia, o en IA, o en física, o que nos enamoremos.

En lo personal, yo no soy un S-frequentist, pero tampoco tengo ninguna visión coherente sobre fundamentos de la probabilidad.

Por el contrario, casi todos los que hicieron un análisis estadístico práctico son S-frecuentistas o S-Bayesianos (o tal vez una mezcla). Personalmente, publiqué artículos que contenían valores y nunca (hasta ahora) he publicado artículos que contengan anteriores y posteriores sobre los parámetros del modelo, por lo que esto me convierte en un S-frecuenta, al menos en la práctica.p

Por lo tanto, es claramente posible ser un S-frecuentes sin ser un P-frecuente, a pesar de lo que @fcop dice en su respuesta.

Bueno. Multa. Pero aún así: ¿puede un P-bayesiano ser un S-frecuenta? ¿Y puede un P-frecuentista ser un S-bayesiano?

Para un P-bayesiano convencido, probablemente sea atípico ser un S-frecuentista, pero en principio es totalmente posible. Por ejemplo, un P-bayesiano puede decidir que no tiene ninguna información previa sobre y, por lo tanto, adoptar un análisis S-frecuentista. Por qué no. Toda afirmación S-frecuenta puede ciertamente interpretarse con la interpretación de probabilidad P-bayesiana.θ

Para un P-frecuentista convencido de ser S-bayesiano es probablemente problemático. Pero entonces es muy problemático ser un P-frecuentista convencido ...


2
Los comentarios no son para discusión extendida; Esta conversación se ha movido al chat .
Glen_b

13

El trabajo de Kolmogorov sobre Fundamentos de la teoría de la probabilidad tiene la sección llamada "Relación con los datos experimentales" en la p.3. Esto es lo que escribió allí:

ingrese la descripción de la imagen aquí

ingrese la descripción de la imagen aquí

Está mostrando cómo se pueden deducir sus axiomas observando experimentos. Esta es una forma bastante frecuente de interpretar las probabilidades.

Tiene otra cita interesante para eventos imposibles (conjuntos vacíos):

ingrese la descripción de la imagen aquí

Por lo tanto, creo que si te sientes cómodo con estos argumentos, debes admitir que eres frecuente. Esta etiqueta no es exclusiva. Puedes ser bi-paradigmático (inventé la palabra), es decir, tanto frecuentista como bayesiano. Por ejemplo, me vuelvo bayesiano al aplicar métodos estocásticos a fenómenos que no son inherentemente estocásticos.

ACTUALIZACIÓN Como escribí anteriormente en CV, la teoría de Kolmogorov en sí misma no es frecuentista per se. Es tan compatible con la vista bayesiana como con la vista frecuentista. Puso esta linda nota al pie de la sección para dejar muy claro que se abstiene de la filosofía:

ingrese la descripción de la imagen aquí


1
bueno, la mayoría de los sistemas axiomáticos se derivan de "abstracción" o "generalización" de conceptos del mundo real. Lo mismo ocurre con el concepto (axiomas) de una '' métrica '', observaron el concepto del mundo real (distancia eucildean) y '' encontraron '' tres propiedades que usaron como '' axiomas '' en un espacio métrico. Pero su respuesta es buena (+1), muestra que Kolmogorov no `` inventó '' sus axiomas '' del aire '', desarrolló un sistema axiomático que estaba vinculado a la comprensión de lo que era la propagabilidad en ese momento .

1
¿Podría mirar los comentarios de @mpiktas a esta pregunta y decir que el propio Kolmogorov dio esa definición? ver comentarios en stats.stackexchange.com/questions/230415/…

2
@ fcop, recuerdo su respuesta. Parecía razonable. Definitivamente puedes derivar los axiomas de Bayes, y Kolmogorov lo muestra en el libro.
Aksakal

1
+1 Exactamente lo que tenía en mente (la nota al pie, en particular) cuando escribía comentarios a hilos relacionados. También último comentario de @Aksakal.
Graeme Walsh

1
@ Aksakal: refiriéndose a su comentario anterior: no fue '' su '' respuesta, sino mía :-)

8

Creo que es relevante mencionar a Deborah Mayo, quien escribe el blog Error Statistics Philosophy .

No afirmaré tener una comprensión profunda de su posición filosófica, pero el marco de las estadísticas de errores , como se describe en un artículo con Aris Spanos, incluye lo que se considera como métodos estadísticos frecuentas clásicos. Para citar el artículo:

Bajo el paraguas de los métodos estadísticos de error, uno puede incluir todos los métodos estándar que usan probabilidades de error basadas en las frecuencias relativas de errores en el muestreo repetido, a menudo llamado teoría de muestreo o estadística frecuentista .

Y más abajo, en el mismo documento, puedes leer que:

Para el error, la probabilidad del estadístico surge no para medir los grados de confirmación o creencia (real o racional) en las hipótesis, sino para cuantificar con qué frecuencia los métodos son capaces de discriminar entre hipótesis alternativas y cuán confiablemente facilitan la detección del error.


2
+1, Bien hecho por mencionar el blog de Mayo. De hecho, es la filósofa de la voz más vocal que apoya las estadísticas frecuentistas. La mayoría de las otras críticas en Internet en estos días están a favor de las estadísticas bayesianas.
ameba dice Reinstate Monica

6

Refiriéndome a este hilo y sus comentarios, creo que los frecuentas son aquellos que definen la "probabilidad" de un evento como la frecuencia relativa a largo plazo de la ocurrencia de ese evento. Entonces, si es el número de experimentos y el número de ocurrencias del evento entonces la probabilidad del evento , denotada por , se define como .nnAAAP(A)

P(A):=limn+nAn

No es difícil ver que esta definición cumple con los axiomas de Kolmogorov (porque tomar límites es lineal, ver también ¿Hay alguna base * matemática * para el debate bayesiano versus frecuentista? ).

Para dar tal definición, deben "creer" que este límite existe. Entonces los frecuentas son aquellos que creen en la existencia de este límite.

EDITAR el 31/8/2016: sobre la distinción entre frecuencia S y P

Como @amoeba distingue en su respuesta entre los frecuentistas S y los frecuentistas P, donde los frecuentistas P son el tipo de frecuentadores que defino anteriormente, y como también argumenta que es difícil ser un frecuentista P, agregué una sección EDITAR argumentar que lo contrario es cierto;

Sostengo que todos los S-frecuentes son P-frecuentes .

En la sección de Frecuencia S, @amoeba dice : "este procedimiento logra abarcar la verdadera con una frecuencia de éxito particular a largo plazo (probabilidad particular)".θ

En su respuesta, también afirma que los P-frecuentes son una especie rara.

Pero esta "frecuencia de éxito a largo plazo", utilizada para definir el frecuentismo S, es lo que él define como frecuentismo P, ya que es la interpretación de .P(CI^θ)

Por lo tanto, de acuerdo con sus definiciones, todos los S-frecuentes también son P-frecuentes. Por lo tanto, concluyo que los frecuentistas P no son tan raros como lo sostiene la ameba.

Hay aún más; @amoeba también argumenta que los S-frecuentas consideran el parámetro desconocido como fijo o no aleatorio, por lo tanto, no se puede hablar de '' probabilidad de que tenga un valor particular '', dice queθθθ

"Lo único que podemos hacer es idear un procedimiento para construir algún intervalo alrededor de nuestra estimación de manera que este procedimiento logre abarcar la verdadera con una frecuencia particular de éxito a largo plazo (probabilidad particular)".θ

¿Puedo preguntar cuál podría ser el origen del nombre '' frecuentista '': (a) la idea '' no aleatoria '' -idea o (b) la '' frecuencia de largo plazo ''?θ

¿Puedo preguntar también a @mpiktas que escribe en su comentario a la respuesta de ameba:

"Es muy difícil ser un p-frecuentista, porque es prácticamente imposible dar una definición matemáticamente sólida de tal probabilidad".

Si necesita una definición de P-frecuentes para definir el S-frecuente, ¿cómo puede uno ser más frecuente que S-frecuente?


3
@Tim: ¿por qué OLS sería '' frecuente ''?

2
Si es así, entonces toda la discusión sobre quiénes son frecuentas no parece tener mucho sentido ya que su alcance de interés es muy limitado y grandes áreas de estadísticas están fuera de su alcance ... (Incluyendo muchas áreas que son de interés de Bayesianos.) Lo que estoy diciendo es que esta no parece ser la definición, ya que es demasiado estrecha.
Tim

2
¿Qué creen los Bayesianos (autoproclamados, o simplemente pragmáticos que usan su "sombrero Bayesiano" para el interludio) es ? limn+nAn
Silverfish

1
@Silverfish bayesianos son libres de usar frecuencias de largo plazo como probabilidades si lo desean, solo los frecuentas no tienen opción. La diferencia clave es que un Bayesiano podría decir que , pero por inferencia estamos interesados ​​en definir una distribución sobre los valores plausibles de que obtenemos de las observaciones 1E12. p Hl i m n + n A / n p Hlimn+nA/npHlimn+nA/npH
Dikran Marsupial

3
fundamento de la teoría de la probabilidad precisamente por esa razón, es decir, para dar ciertas interpretaciones de la probabilidad de fondo matemático sólido. Ahora quiere regresar y "reinventar" la probabilidad con su definición "frecuenta". Encuentro esto engañoso, por lo tanto, rechazo sus respuestas. Puede ignorar esto, esta es la forma en que funciona el sitio, siempre existe la posibilidad de desacuerdo.
mpiktas

4

Pregunta realmente interesante!

Me puse en el campo frecuentista cuando se trata de comprender e interpretar las declaraciones de probabilidad, aunque no soy tan estricto acerca de la necesidad de una secuencia real de experimentos iid para fundamentar esta probabilidad. Sospecho que la mayoría de las personas que no compran la tesis de que "la probabilidad es una medida subjetiva de creencia" también pensaría en la probabilidad de esta manera.

Esto es lo que quiero decir: tome nuestra moneda "justa" habitual, con la asignación . Cuando escucho esto, formo una imagen de alguien lanzando esta moneda muchas veces y la fracción de cara se acerca a . Ahora, si se presiona, también diría que la fracción de cabezas en cualquier muestra aleatoria de una secuencia finita de tales lanzamientos de monedas también se acercará a medida que crece el tamaño de la muestra (supuesto de independencia).0.5 0.5P(H)=0.50.50.5

Como han dicho otros, la suposición más importante es que este límite existe y es correcto (es decir, el límite es ), pero creo que lo más importante es la suposición de que también existe el mismo límite para las submuestras elegidas al azar. De lo contrario, nuestra interpretación solo tiene significado en toda la secuencia infinita (por ejemplo, podríamos tener una autocorrelación fuerte que se promedia).0.5

Creo que lo anterior es bastante controvertido para los frecuentistas. Un bayesiano estaría más centrado en el experimento en cuestión y menos en el comportamiento a largo plazo: afirmarían que su grado de creencia de que el próximo lanzamiento será cara es ... punto final.P(H)=0.5

Para un caso simple como el lanzamiento de monedas, podemos ver que los enfoques frecuentista y bayesiano son funcionalmente equivalentes, aunque filosóficamente muy diferentes. Como Dikran Marsupial ha señalado, el Bayesiano puede estar utilizando el hecho de que empíricamente vemos monedas que salen cara arriba tan a menudo como las vemos colas (a largo plazo / frecuencia de muestreo grande como antes).

¿Qué pasa con las cosas que no pueden tener frecuencias de largo plazo? Por ejemplo, ¿cuál es la probabilidad de que Corea del Norte comience una guerra con Japón en los próximos 10 años? Para los frecuentistas, realmente nos quedamos en la estacada, ya que no podemos realmente describir las distribuciones de muestreo requeridas para probar tal hipótesis. Un bayesiano sería capaz de abordar este problema colocando la distribución de probabilidad sobre las posibilidades, muy probablemente en función de la aportación de expertos.

Sin embargo, surge una pregunta clave: ¿de dónde provienen estos grados de creencia (o valor asumido para la frecuencia a largo plazo)? Yo argumentaría desde la psicología y diría que estas creencias (especialmente en áreas lejos de los datos experimentales) provienen de lo que se conoce como heurística de disponibilidad y heurística de representatividad . Hay muchos otros que probablemente entren en juego. Argumento esto porque en ausencia de datos para calibrar nuestras creencias (¡hacia la frecuencia observada a largo plazo!), Debemos confiar en la heurística, por sofisticados que parezcamos.

El pensamiento heurístico mental anterior se aplica igualmente a los frequentistas y bayesianos. Lo que es interesante para mí es que, independientemente de nuestra filosofía, en la raíz, creemos más en algo que creemos que es más probable que sea cierto, y creemos que es más probable que sea cierto porque creemos que hay más formas para que sea cierto, o imaginamos que las vías que lo llevan a ser verdad sucederían con mayor frecuencia (con frecuencia :-) que aquellas que lo harían no cierto.

Dado que es un año electoral, tomemos un ejemplo político: ¿Qué creencia pondríamos en la declaración "Ted Cruz propondrá una prohibición de los rifles de asalto en los próximos 4 años". Ahora, tenemos algunos datos sobre esto de sus propias declaraciones, y probablemente pondríamos nuestra creencia previa en la verdad de esta declaración muy cerca de cero. ¿Pero por qué? ¿Por qué sus declaraciones anteriores nos hacen pensar de esta manera? Porque creemos que las personas altamente ideológicas tienden a "apegarse a sus armas" más que a sus contrapartes pragmáticas. ¿De donde viene esto? Probablemente a partir de los estudios realizados por psicólogos y nuestras propias experiencias con personas altamente basadas en principios.

En otras palabras, tenemos algunos datos y creemos que para la mayoría de los casos en los que alguien como Cruz podría cambiar de opinión, no lo harán (nuevamente, una especie de evaluación a largo plazo o de muestra grande).

Esta es la razón por la que "me reúno" con los frecuentistas. No es mi disgusto por la filosofía bayesiana (bastante razonable) o los métodos (¡son geniales!), Sino que si profundizo lo suficiente en por qué tengo creencias que carecen de un fuerte respaldo de muestras grandes, descubro que estoy confiando en algún tipo del modelo mental donde los resultados se pueden contar (si es implícito) o donde puedo invocar probabilidades a largo plazo en un subproceso particular (p. ej., los republicanos votan contra las medidas de control de armas X% del tiempo) para ponderar mi creencia de una manera u otra .

Por supuesto, esto no es realmente frecuente, y dudo que haya muchas personas que se suscriban a la interpretación de probabilidad de von Mieses al pie de la letra. Sin embargo, creo que muestra la compatibilidad subyacente entre la probabilidad bayesiana y la frecuencia frecuente: ambas son atractivas para nuestra heurística interna con respecto a la disponibilidad o lo que yo llamo el principio "Pachinko" sobre las frecuencias a lo largo de una cadena de causalidad.

Entonces, tal vez debería llamarme un "availabilist", para indicar que asigno probabilidades en función de la frecuencia con la que puedo imaginar un evento como resultado de una cadena de eventos (con cierto rigor / modelado, por supuesto). Si tengo muchos datos, genial. Si no lo hago, trataré de descomponer la hipótesis en una cadena de eventos y utilizaré los datos que tengo (anecdótico o "sentido común", según sea necesario) para evaluar con qué frecuencia me imagino que tal evento ocurra.

Perdón por la publicación larga, gran pregunta por cierto!


1
Hace enormes simplificaciones excesivas sobre el enfoque subjetivista de la probabilidad. Estoy de acuerdo en que la psicología desempeña un papel en la forma en que trabaja con los datos, pero también puede realizar análisis sesgados subjetivamente en un enfoque frecuentista. Algunos bayesianos sostienen que en el caso bayesiano al menos haces explícitas tus creencias subjetivas, en lugar de ignorarlas.
Tim

1
@Tim No estaba diciendo que los Frequentistas son más objetivos (vea mi primera parte sobre los principales supuestos para los Frecuentes). Además, lo que estaba señalando es que tanto los Frecuentes como los Bayesianos basan sus probabilidades en sus creencias sobre la frecuencia con la que algo ocurriría , o cuántas cosas deben suceder (y su probabilidad individual de hacerlo) para hacer algo verdadero.

1
@Tim ya que este no es un Post sobre Bayesianismo vs Frequentismo per se, dudo que haya dado su merecido ... ¡eso tomaría mucho espacio en la página! Fundamentalmente, todos confiamos en la heurística mental al pensar en la probabilidad, y estas heurísticas nos llevan a pensar en algunos tipos de eventos que pueden ocurrir "de más maneras" o que son "más accesibles en una red causal" que otros.

1
@Tim OK ... Agregué algunas langugae para aclarar cuando paso de mi (breve) discusión sobre bayesianismo a mi papel principal.

4

Como notó @amoeba , tenemos una definición frecuente de probabilidad y estadísticas frecuentistas . Todas las fuentes que he visto hasta ahora dicen que la inferencia frecuentista se basa en la definición frecuentista de probabilidad, es decir, entendiéndola como límite en proporción dados los sorteos aleatorios de números infinitos (como ya notaron @fcop y @Aksakal citando a Kolmogorov)

P(A)=limnnAn

Básicamente, hay una noción de alguna población de la que podemos tomar muestras repetidamente. La misma idea se usa en la inferencia frecuentista. Revisé algunos artículos clásicos, por ejemplo, de Jerzy Neyman , para rastrear los fundamentos teóricos de las estadísticas frecuentistas. En el 1937 Neyman escribió

( ia ) El estadístico se refiere a una población, , que por alguna razón u otra no puede estudiarse exhaustivamente. Solo es posible extraer una muestra de esta población que pueda estudiarse en detalle y usarse para formar una opinión sobre los valores de ciertas constantes que describen las propiedades de la población . Por ejemplo, puede desearse calcular aproximadamente la media de cierto carácter que poseen los individuos que forman la población , etc. ( ibπ π ππππ
) Alternativamente, el estadístico puede estar interesado en ciertos experimentos que, si se repiten en condiciones aparentemente idénticas, producen resultados variables. Tales experimentos se denominan experimentos aleatorios [...]
En ambos casos descritos, el problema al que se enfrenta el estadístico es el problema de la estimación. Este problema consiste en determinar qué operaciones aritméticas se deben realizar en los datos de observación para obtener un resultado, que se denominará una estimación, que presumiblemente no difiere mucho del verdadero valor del carácter numérico, ya sea de la población , como en ( ia ), o de los experimentos aleatorios, como en ( ib ). [...] En ( iaπ
) hablamos de un estadístico que extrae una muestra de la población estudiada.

En otro artículo (Neyman, 1977), se da cuenta de que la evidencia proporcionada en los datos debe verificarse observando la naturaleza repetida del fenómeno estudiado:

Normalmente, la 'verificación' o 'validación' de un modelo adivinado consiste en deducir algunas de sus consecuencias frecuentistas en situaciones no estudiadas previamente empíricamente, y luego en realizar experimentos apropiados para ver si sus resultados son consistentes con las predicciones. Muy en general, el primer intento de verificación es negativo: las frecuencias observadas de los diversos resultados del experimento no están de acuerdo con el modelo. Sin embargo, en algunas ocasiones afortunadas hay un acuerdo razonable y uno siente la satisfacción de haber "entendido" el fenómeno, al menos de manera general. Más tarde, invariablemente, aparecen nuevos hallazgos empíricos, que indican la insuficiencia del modelo original y exigen su abandono o modificación. ¡Y esta es la historia de la ciencia!

y en otro artículo Neyman y Pearson (1933) escriben sobre muestras aleatorias tomadas de una población fija

En la práctica estadística común, cuando los hechos observados se describen como "muestras", y las hipótesis se refieren a las "poblaciones", para las cuales se han extraído las muestras, los caracteres de las muestras, o como los denominaremos criterios, que han sido utilizado para probar hipótesis, a menudo parece estar arreglado por una intuición feliz.

Las estadísticas frecuentes en este contexto formalizan el razonamiento científico en el que se recopilan pruebas, luego se extraen nuevas muestras para verificar los hallazgos iniciales y, a medida que acumulamos más pruebas, nuestro estado de conocimiento se cristaliza. Nuevamente, como lo describe Neyman (1977), el proceso toma los siguientes pasos

( i ) Establecimiento empírico de frecuencias relativas a largo plazo aparentemente estables (o 'frecuencias' para abreviar) de eventos considerados interesantes, a medida que se desarrollan en la naturaleza.
( ii ) Adivinar y luego verificar el 'mecanismo de azar', cuya operación repetida produce las frecuencias observadas. Este es un problema de la "teoría de probabilidad frecuentista". Ocasionalmente, este paso se denomina 'construcción de modelos'. Naturalmente, el mecanismo de azar adivinado es hipotético.
( iii ) Usar el mecanismo de azar hipotético del fenómeno estudiado para deducir reglas de ajuste de nuestras acciones (o 'decisiones') a las observaciones para asegurar la más alta 'medida' de 'éxito'. [... de las "reglas de ajuste de nuestras acciones" es un problema de las matemáticas, específicamente de las estadísticas matemáticas.

Los frecuentes planifican su investigación teniendo en cuenta la naturaleza aleatoria de los datos y la idea de los sorteos repetidos de la población fija, diseñan sus métodos basados ​​en ellos y los utilizan para verificar sus resultados (Neyman y Pearson, 1933),

Sin esperar saber si cada hipótesis por separado es verdadera o falsa, podemos buscar reglas para gobernar nuestro comportamiento con respecto a ellas, y luego asegurarnos de que, a largo plazo, no nos equivoquemos demasiado.

Esto está relacionado con el principio de muestreo repetido (Cox y Hinkley, 1974):

(ii) Principio de muestreo repetido fuerte
De acuerdo con el principio de muestreo repetido fuerte, los procedimientos estadísticos deben evaluarse por su comportamiento en repeticiones hipotéticas en las mismas condiciones. Esto tiene dos facetas. Las medidas de incertidumbre deben interpretarse como frecuencias hipotéticas en repeticiones a largo plazo; Los criterios de optimización deben formularse en términos de comportamiento sensible en repeticiones hipotéticas.
El argumento para esto es que garantiza un significado físico para las cantidades que calculamos y que garantiza una estrecha relación entre el análisis que hacemos y el modelo subyacente que se considera que representa el estado de cosas "verdadero".

(iii) Principio de muestreo repetido
débil La versión débil del principio de muestreo repetido requiere que no sigamos procedimientos que, para algunos valores de parámetros posibles, darían, en repeticiones hipotéticas, conclusiones engañosas la mayor parte del tiempo.

Por el contrario, cuando utilizamos la máxima probabilidad, nos preocupa la muestra que tenemos , y en el caso bayesiano hacemos inferencia basada en la muestra y nuestros antecedentes, y cuando aparecen nuevos datos podemos realizar actualizaciones bayesianas. En ambos casos, la idea del muestreo repetido no es crucial. Los frecuentes recurren solo a los datos que tienen (como notó @WBT ), pero teniendo en cuenta que es algo aleatorio y debe considerarse como parte del proceso de muestreo repetido de la población (recuerde, por ejemplo, cómo la confianza los intervalos están definidos).

En el caso frecuentista, la idea del muestreo repetido nos permite cuantificar la incertidumbre (en estadística) y nos permite interpretar los eventos de la vida real en términos de probabilidad .


Como nota al margen, tenga en cuenta que ni Neyman (Lehmann, 1988) ni Pearson (Mayo, 1992) fueron tan frecuentes como podíamos imaginar. Por ejemplo, Neyman (1977) propone usar Empirical Bayesian y Maximum Likelihood para estimar puntos. Por otro lado (Mayo, 1992),

en la respuesta de Pearson (1955) a Fisher (y en otras partes de su trabajo) es que, en contextos científicos, Pearson rechaza tanto la razón de baja probabilidad de error a largo plazo [...]

Entonces parece que es difícil encontrar frecuentistas puros incluso entre los padres fundadores.


Neyman, J y Pearson, ES (1933). Sobre el problema de las pruebas más eficientes de hipótesis estadísticas. Transacciones filosóficas de la Royal Society A: Ciencias matemáticas, físicas y de ingeniería. 231 (694–706): 289–337.

Neyman, J. (1937). Esquema de una teoría de la estimación estadística basada en la teoría clásica de la probabilidad. Phil Trans. R. Soc. Lond. A. 236: 333–380.

Neyman, J. (1977). Probabilidad frecuentista y estadística frecuentista. Synthese, 36 (1), 97-131.

Mayo, DG (1992). ¿Pearson rechazó la filosofía estadística de Neyman-Pearson? Synthese, 90 (2), 233-262.

Cox, DR y Hinkley, DV (1974). Estadística teórica. Chapman y Hall.

Lehmann, E. (1988). Jerzy Neyman, 1894 - 1981. Informe técnico No. 155. Departamento de Estadística, Universidad de California.


1
+1 (ya hace unos días). Gracias por escribir esto, hay algunas buenas citas aquí y la lista de referencias es muy útil. A su vez, ahora he actualizado mi respuesta en varios lugares, pero principalmente al final, para aclarar la relación entre P y S-frecuentismo tal como lo veo. Ciertamente estoy de acuerdo en que históricamente S-freq se construyó sobre ideas de P-freq, como usted argumenta aquí, pero no creo que necesariamente se involucren entre sí.
ameba dice Reinstate Monica

4

Permítanme ofrecer una respuesta que conecta esta pregunta con una cuestión de importancia actual y muy práctica , la medicina de precisión, y al mismo tiempo responderla literalmente como se le preguntó: ¿Quiénes son frecuentas?

Los frecuentes son personas que dicen cosas como [1] (énfasis mío):

¿Qué significa un 10% de riesgo de un evento en la próxima década para la persona para la que se generó? Al contrario de lo que se piensa, este nivel de riesgo no es el riesgo personal de esa persona porque la probabilidad no es significativa en un contexto individual .

Por lo tanto, los frecuentistas interpretan la 'probabilidad' de tal manera que no tiene significado en un contexto singular como el de un paciente individual . Mi comentario de PubMed Commons sobre [1] examina las contorsiones que deben sufrir sus autores frecuentas para recuperar una noción de probabilidad aplicable al cuidado de un paciente individual. Observar cómo y por qué hacen esto puede resultar muy instructivo en cuanto a quién es un frecuentista . Además, el intercambio posterior poco esclarecedor en la sección de Cartas JAMA [2,3] es instructivo en cuanto a la importancia de reconocer explícitamente las limitaciones en las nociones frecuentistas de probabilidad y atacarlas directamentecomo tal. (Lamento que muchos usuarios de CV puedan encontrar que [1] se encuentra detrás de un muro de pago).

El excelente y altamente legible libro [4] de L. Jonathan Cohen recompensaría los esfuerzos de cualquier persona interesada en la pregunta del OP. Es de destacar que el libro de Cohen fue extrañamente citado por [1] en relación con la afirmación "la probabilidad no es significativa en un contexto individual", aunque Cohen claramente reprende esta opinión de la siguiente manera [4, p49]:

Tampoco está abierto a un teórico de la frecuencia afirmar que todas las probabilidades importantes son de hecho generales, no singulares. A menudo parece muy importante poder calcular la probabilidad de éxito de la apendicectomía de su propio hijo ...


1] Sniderman AD, D'Agostino Sr RB y Pencina MJ. "El papel de los médicos en la era de la analítica predictiva". JAMA 314, no. 1 (7 de julio de 2015): 25–26. doi: 10.1001 / jama.2015.6177. PubMed

2] Van Calster B, Steyerberg EW y Harrell FH. "Predicción de riesgo para individuos". JAMA 314, no. 17 (3 de noviembre de 2015): 1875-1875. doi: 10.1001 / jama.2015.12215. Texto completo

3] Sniderman AD, D'Agostino Sr RB y Pencina MJ. "Predicción de riesgo para individuos: respuesta". JAMA 314, no. 17 (3 de noviembre de 2015): 1875–76. doi: 10.1001 / jama.2015.12221. Texto completo

4] Cohen, L. Jonathan. Una introducción a la filosofía de la inducción y la probabilidad. Oxford: Nueva York: Clarendon Press; Oxford University Press, 1989. Enlace a las páginas escaneadas 46-53 y 81-83


1
Tim

Me gusta la cita "el riesgo puede considerarse como el nivel subjetivo en el que uno" cree "o está" preparado para apostar "a la aparición de una enfermedad o evento, 2 tal como uno apuesta en futuros eventos de una sola vez en juegos de deporte ". Gracias por su aporte y referencias.
Tim

2
Parece una buena respuesta, pero estoy un poco confundido. Creo que los frecuentistas están interesados ​​en procedimientos (experimentos) que, en teoría, podrían ejecutarse un número infinito de veces. No significa que no puedan hacer una predicción sobre el próximo lanzamiento de moneda, solo que sus preocupaciones / garantías se concentran en el proceso. Es cierto que dirían que "Estados Unidos ganará la Copa del Mundo este año" no es algo de lo que puedan decir nada, pero ¿no podrían decir algo sobre la apendicectomía de su hijo? Es único en un sentido, pero depende de las apendicectomías. los niños no lo son.
Wayne

@Tim, gracias por el enlace, que incluye [2] y [3]. He actualizado el texto de mi respuesta en consecuencia.
David C. Norris

2
@Wayne, sugeriría que la respuesta de ameba anterior, con su distinción entre los procedimientos estadísticos habitualmente asociados con la 'vista de frecuencia de probabilidad' y esa vista de frecuencia en sí misma, responda su comentario. Las personas pueden utilizar procedimientos estadísticos frecuentes y, sin embargo, interpretar y utilizar las probabilidades resultantes de manera fiducial o subjetivista. Solo hay que mirar el error perpetuo de interpretar los valores P como "la probabilidad de que la hipótesis nula sea verdadera" para ver que esto es así.
David C. Norris

3

"Frequentists vs. Bayesians" de XKCD (bajo CC-BY-NC 2.5 ), haga clic para discutir:

'¡Detector!  ¿Qué diría el estadístico bayesiano si le preguntara si el-- '[roll]' SOY UN DETECTOR NEUTRINO, NO UN GUARDIA DE LABERINTO.  En serio, ¿se te cayó el cerebro?  [rollo] '... sí'.

El punto general de la filosofía frecuentista ilustrada aquí es la creencia en sacar conclusiones sobre la probabilidad relativa de eventos basados ​​únicamente ("puramente") en los datos observados, sin "contaminar" ese proceso de estimación con nociones preconcebidas sobre cómo deberían o no ser las cosas. no debería ser. Al presentar una estimación de probabilidad, el frecuentista no tiene en cuenta las creencias previas sobre la probabilidad de un evento cuando hay observaciones disponibles para respaldar el cálculo de su probabilidad empírica. El frecuentista debe tener en cuenta esta información de fondo al decidir el umbral para la acción o la conclusión.

Como escribió Dikran Marsupial en un comentario conciso a continuación , "El punto valioso que la caricatura (tal vez involuntariamente) hace es que la ciencia es realmente más compleja y no podemos simplemente aplicar el" ritual nulo "sin pensar en el conocimiento previo".

Como otro ejemplo, al tratar de determinar / declarar qué temas están "en tendencia" en Facebook, los frecuentas probablemente agradecerían el enfoque de conteo más puramente algorítmico hacia el que Facebook está cambiando , en lugar del viejo modelo en el que los empleados seleccionarían esa lista basándose en parte en su Perspectivas propias sobre qué temas pensaron que "deberían" ser más importantes.


10
-1. Me encanta XKCD, pero sin ningún comentario, me temo que esto solo va a ser engañoso en este hilo. Y uno necesita bastantes comentarios para explicar correctamente cuáles son los temas pertinentes a este cómic. Si proporciona una discusión adecuada, eliminaré el voto negativo.
ameba dice Reinstate Monica

44
No es cierto que el enfoque frecuentista no tenga las nociones preconcebidas, están codificadas en el umbral de significación estadística. ISTR hay una buena cita de Fisher sobre esto dependiendo de la naturaleza del experimento. Este es completamente el problema con los frecuentas en la caricatura, simplemente no han establecido un valor apropiado para ya que no han tenido en cuenta el "conocimiento previo" sobre el problema (que el sol novato es extremadamente improbable) y ajustó la prueba en consecuencia. Usar el 95% todo el tiempo es parte del tan criticado "ritual nulo". α
Dikran Marsupial

44
El "ritual nulo" es una mala aplicación de las estadísticas frecuentistas, pero no es un problema con el frequintismo per se.
Dikran Marsupial

2
@Dikran Sus comentarios parecen (incorrectamente) equiparar "Frecuentista" con "usuario de NHST". Ese es el tipo de confusión que me ha preocupado.
whuber

3
@luchonacho FWIW hay una discusión sobre la caricatura de XKCD aquí stats.stackexchange.com/questions/43339/... El punto valioso que la caricatura (tal vez involuntariamente) hace es que la ciencia es realmente más compleja y no podemos simplemente aplicar el "nulo ritual "sin pensar en conocimiento previo.
Dikran Marsupial

3

(Una observación, tangencialmente relevante para la pregunta y el sitio).

La probabilidad se trata del estado objetivo de las cosas individuales . Las cosas no pueden tener intención y reciben sus estados del universo. Con una cosa, un evento (dándole su estado) siempre habrá sucedido: el evento ya se ha realizado allí, incluso si aún no ha sucedido, el futuro pasado de una cosa, también llamado "destino" o contingencia.

Una vez más, con probabilidad, el hecho del evento, que haya ocurrido o no, no importa, ya está allí [en oposición al significado que nunca está allí]; y como tal ya se ha vuelto innecesario y superfluo. El hecho debe descartarse, y esa invalidación es lo que llamamos "el evento es probable". Cualquier hecho sobre una cosa lleva en sí mismo su lado primitivo poco convincente, o la probabilidad del hecho (incluso el hecho que realmente ocurrió, lo reconocemos por pinchazo de incredulidad). Estamos inevitablemente "cansados ​​de las cosas" prepsíquicamente hasta cierto punto. Por lo tanto, solo queda cuantificar esa negación parcial de la facticidad, si es necesario un número. Una forma de cuantificar es contar. Otra es pesar . Un frecuentador lleva a cabo o se imagina una serie de pruebas que tiene ante sí y que se da vuelta para ver si el evento realmente sucede; El cuenta. Un bayesiano considera una serie de motivos psicológicos que lo arrastran detrás de él y que él examina; los pesa como cosas. Ambos hombres están ocupados con el juego mental de carga / excusa. Fundamentalmente, no hay mucha diferencia entre ellos.

La posibilidad se trata de potencialidades mías en el mundo. La posibilidad siempre es mía (la posibilidad de una lluvia es mi problema para optar por tomar un paraguas o mojarme) y no se trata de un objeto (el que considero posible o posible) sino el mundo entero para mí. La posibilidad siempre es 50/50 y siempre es convincente, porque implica, ya sea antes o después, mi decisión de cómo comportarme. Las cosas en sí mismas no tienen intenciones y, por lo tanto, posibilidades. No debemos confundir nuestras posibilidades de estas cosas con sus propias probabilidades de "determinismo estocástico". La probabilidad nunca puede ser "subjetiva" en el sentido humano.


Un lector observador puede sentir en la respuesta una excavación enmascarada ante la brillante respuesta en este hilo, donde @amoeba dice que piensa "there are almost no frequentists of the [probability definition] kind (P-frequentists)". Podría darse la vuelta: los definidores de probabilidad bayesianos no existen como clases diferentes. Porque, como he admitido, los bayesianos consideran los cambios de la realidad de la misma manera que los frecuentistas, como una serie de hechos; solo que estos hechos no son experimentos, antes recuerdos de "verdades" y "argumentos". Pero tales formas de conocimiento son fácticas y solo pueden contarse o sopesarse. La probabilidad que erige no se sintetiza como subjetiva, es decir , anticipatoria ("bayesiana" para ser) a menos que la expectativa humana(posibilidad) entra en escena para entrometerse. Y @amoeba ansiosamente lo deja entrar cuando imagina que "la moneda se desgastará y el Sol se convertirá en supernova".


0

Oh, he sido frecuente durante muchos años durante el año,
y he pasado todo mi tiempo escuchando los datos de oído,
pero ahora estoy regresando con Bayes en una gran tienda,
y nunca más volveré a jugar al frecuentista.

Porque no, nunca, no, nunca, nunca más. ¡
Jugaré al frecuentista, no, nunca más!

Entré en un laboratorio donde solía consultar.
Me dieron algunos datos, dije 'p eso para nosotros',
dije 'De ninguna manera, José' con una pequeña sonrisa, los
valores de P y evidentes simplemente no se reconcilian.

Coro

Dije que es tu prioridad que necesitamos arrojar luz,
y los ojos del investigador se abrieron con deleite,
dijo: "Mis puntos de vista anteriores son tan buenos como el resto, ¡
y seguramente un factor de Bayes es lo que funcionará mejor!"

Coro

Volveré a mis maestros, confesaré lo que he hecho
y les pediré que perdonen a su hijo pródigo.
Pero cuando me hayan perdonado, como siempre,
¡ya no volveré a ser el frecuentista!

Coro

Y no, no, nunca, no, nunca, nunca más. ¡
Jugaré al frecuentista, no, nunca, nunca más!

Fuente: AE Raftery, en The Bayesian Songbook, editado por BP Carlin, en http://www.biostat.umn.edu/ . Cantada con la melodía popular tradicional de 'The Wild Rover'. Citado en Open University M347 Mathematical Statistics, Unit 9.



Estoy de acuerdo con @Tim y -1 porque no veo cómo esto se suma a la discusión actual.
ameba dice Reinstate Monica
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.