¿Puedes decir que las estadísticas y la probabilidad son como la inducción y la deducción?


17

He leído este hilo , y me parece que se puede decir que:

  • estadística = inducción?
  • probabilidad = deducción?

Pero me pregunto si podría haber más detalles sobre la comparación que me estoy perdiendo. Por ejemplo, ¿las estadísticas son iguales a la inducción, o es solo un caso particular? Parece que la probabilidad es un caso secundario de deducción (ya que es un caso secundario de pensamiento matemático).

Sé que esta es una pregunta delicada, pero en cierto sentido es por eso que la hago, porque quiero estar seguro de cómo se pueden comparar estos términos con precisión.


No porque responda a su pregunta, sino porque están conectados: stats.stackexchange.com/questions/665/… (Realmente me gusta la respuesta de Mark / Peter) y stats.stackexchange.com/questions/2641/…
robin girard

Respuestas:


15

Creo que es mejor recapitular rápidamente el significado del razonamiento inductivo y deductivo antes de responder a su pregunta.

  • Razonamiento deductivo: "Los argumentos deductivos son intentos de mostrar que una conclusión se sigue necesariamente de un conjunto de premisas. Un argumento deductivo es válido si la conclusión se sigue necesariamente de las premisas, es decir, si la conclusión debe ser verdadera siempre que las premisas sean verdaderas . Un argumento deductivo es válido si es válido y sus premisas son verdaderas. Los argumentos deductivos son válidos o inválidos, sólidos o incorrectos, pero nunca son falsos o verdaderos ". ( Citado de Wikipedia , énfasis agregado).

  • "El razonamiento inductivo, también conocido como inducción o lógica inductiva, o conjetura educada en inglés coloquial, es un tipo de razonamiento que permite la posibilidad de que la conclusión sea falsa incluso cuando todas las premisas son verdaderas. Las premisas de un argumento lógico inductivo indican algún grado de apoyo (probabilidad inductiva) para la conclusión, pero no lo implican; es decir, no aseguran su verdad " . ( de wikipedia , énfasis agregado)

Para enfatizar la diferencia principal: mientras que el razonamiento deductivo transfiere la verdad de las premisas a las conclusiones, el razonamiento inductivo no lo hace. Es decir, mientras que para el razonamiento deductivo nunca amplía su conocimiento (es decir, todo está en las premisas, pero a veces está oculto y debe demostrarse mediante pruebas), el razonamiento inductivo le permite ampliar su conocimiento (es decir, puede obtener nuevas ideas que sin embargo, ya no están contenidos en las premisas por el costo de no saber su verdad).

¿Cómo se relaciona esto con la probabilidad y las estadísticas?

A mis ojos, la probabilidad es necesariamente deductiva. Es una rama de las matemáticas. Entonces, basado en algunos axiomas o ideas (supuestamente verdaderas) deduce teorías.

Sin embargo, la estadística no es necesariamente inductiva. Solo si intenta usarlo para generar conocimiento sobre entidades no observadas (es decir, para buscar estadísticas inferenciales, consulte también la respuesta de onestop). Sin embargo, si usa estadísticas para describir la muestra (es decir, estadísticas descriptivas) o si tomó una muestra de toda la población, todavía es deductivo ya que no obtiene más conocimiento o información ya que ya está presente en la muestra.

Entonces, si piensas en las estadísticas como el esfuerzo heroico de los científicos que intentan usar métodos matemáticos para encontrar regularidades que rigen la interacción de las entidades empíricas en el mundo, lo que en realidad nunca tiene éxito (es decir, nunca sabremos realmente si alguna de nuestras teorías es verdad), entonces, sí, esto es inducción. También es el Método Científico articulado por Francis Bacon, sobre el cual se funda la ciencia empírica moderna. El método lleva a conclusiones inductivas que son, en el mejor de los casos, altamente probables, aunque no seguras. Esto a su vez conduce a malentendidos entre los no científicos sobre el significado de una teoría científica y una prueba científica.


Actualización: después de leer la respuesta de Conjugate Prior (y después de pensar durante la noche) me gustaría agregar algo. Creo que la pregunta sobre si el razonamiento estadístico (inferencial) es deductivo o inductivo depende de qué es exactamente lo que le interesa, es decir, qué tipo de conclusión está buscando.

Si está interesado en conclusiones probabilísticas, entonces el razonamiento estadístico es deductivo. Esto significa que, si desea saber si, por ejemplo, en 95 de cada 100 casos el valor de la población está dentro de un cierto intervalo (es decir, intervalo de confianza), puede obtener un valor de verdad (verdadero o no verdadero) para esta declaración. Puede decir (si las suposiciones son ciertas) que es el caso de que en 95 de cada 100 casos el valor de la población esté dentro del intervalo. Sin embargo, en ningún caso empírico sabrá si el valor de la población está en su IC obtenido. Lo sea o no, pero no hay forma de estar seguro. El mismo razonamiento se aplica a las probabilidades en el valor p clásico y las estadísticas bayesianas. Puede estar seguro de las probabilidades.

Sin embargo, si le interesan las conclusiones sobre entidades empíricas (por ejemplo, dónde está el valor de la población), solo puede argumentar inductivamente. Puede utilizar todos los métodos estadísticos disponibles para acumular evidencia que respalde ciertas proposiciones sobre entidades empíricas o los mecanismos causales con los que interactúan. Pero nunca estará seguro de ninguna de estas proposiciones.

Para recapitular: el punto que quiero señalar es que es importante en lo que estás buscando. Probabilidades que puede deducir, pero por cada propuesta definitiva sobre cosas solo puede encontrar evidencia a favor. No más. Vea también el enlace de onestop al problema de inducción.


Gracias Henrik: la distinción entre las definiciones (y tus pensamientos sobre ellas) fue útil.
Tal Galili

Su actualización fue clara y al grano. Si hubiera podido darte otro (+1), lo haría.
Tal Galili

7

La estadística es el enfoque deductivo de la inducción. Considere los dos enfoques principales para la inferencia estadística: frequentista y bayesiano.

Suponga que es un frecuente (al estilo de Fisher, en lugar de Neyman por conveniencia). Se pregunta si un parámetro de interés sustantivo toma un valor particular, por lo que construye un modelo, elige una estadística relacionada con el parámetro y realiza una prueba. El valor p generado por su prueba indica la probabilidad de ver una estadística como o más extrema que la estadística calculada a partir de la muestra que tiene, suponiendo que su modelo sea correcto. Obtiene un valor p lo suficientemente pequeño como para rechazar la hipótesis de que el parámetro toma ese valor. Su razonamiento es deductivo: suponiendo que el modelo es correcto, o el parámetro realmente toma el valor de interés sustantivo, pero el suyo es una muestra poco probable de ver, o no toma ese valor.

Pasando de la prueba de hipótesis a los intervalos de confianza: tiene un intervalo de confianza del 95% para su parámetro que no contiene el valor de interés sustantivo. Su razonamiento es nuevamente deductivo: suponiendo que el modelo sea correcto, o bien este es uno de esos raros intervalos que aparecerán 1 de cada 20 veces cuando el parámetro realmente tenga el valor de interés sustantivo (porque su muestra es poco probable), o el El parámetro de hecho no tiene ese valor.

Ahora suponga que es bayesiano (al estilo de Laplace en lugar de Gelman). Los supuestos y cálculos de su modelo le dan una distribución de probabilidad (posterior) sobre el valor del parámetro. La mayor parte de la masa de esta distribución está lejos del valor de interés sustantivo, por lo que concluye que el parámetro probablemente no tiene este valor. Su razonamiento es nuevamente deductivo: suponiendo que su modelo sea correcto y si la distribución anterior representaba sus creencias sobre el parámetro, entonces sus creencias al respecto a la luz de los datos se describen por su distribución posterior, lo que pone muy poca probabilidad en ese valor. Dado que esta distribución ofrece poco soporte para el valor del interés sustantivo, puede concluir que el parámetro no tiene el valor. (O puede estar contento de indicar la probabilidad que tiene).

En los tres casos, obtiene una disyunción lógica para basar su acción en la cual se deriva deductivamente / matemáticamente de los supuestos. Estas suposiciones generalmente son sobre un modelo de cómo se generan los datos, pero también pueden ser creencias previas sobre otras cantidades.


1
Gracias Cp, haces un punto interesante. Aunque, desde la perspectiva de la respuesta de Henrik anterior, todavía estás en el ámbito de la inducción, ya que el razonamiento estadístico que describes es uno que involucra incertidumbre.
Tal Galili

Consulte la actualización (espero que sea comprensible) de mi respuesta, donde trato de abordar el problema que se menciona aquí.
Henrik

@Henrik Eso está más claro (al menos para mí). Solo una pequeña queja: no es exactamente el caso de que "el mismo razonamiento se aplica a las probabilidades en el valor p clásico y las estadísticas bayesianas". Este último le dará probabilidades de eventos únicos, por ejemplo, la probabilidad de que la media real esté entre algún valor y otro valor (aunque todas sus otras advertencias se aplican), mientras que los métodos frecuentadores 'clásicos' como los intervalos de confianza ni siquiera lo harán, a pesar de cariñosa y generalizada esperanza de que lo hagan. Su interpretación es de hecho como la describe.
conjugateprior

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.