¿Estadísticas no son matemáticas?


20

¿Las estadísticas son matemáticas o no?

Dado que son todos números, en su mayoría enseñados por departamentos de matemáticas y obtienes créditos de matemáticas por eso, me pregunto si las personas simplemente lo dicen en broma cuando lo dicen, como decir que es una parte menor de las matemáticas, o simplemente matemáticas aplicadas.

Me pregunto si algo como las estadísticas, donde no se puede construir todo sobre axiomas básicos, puede considerarse matemática. Por ejemplo, el valor , que es un concepto que surgió para dar sentido a los datos, pero no es una consecuencia lógica de principios más básicos.p


10
Referencia obligatoria de XKCD: xkcd.com/435 . De todos modos, ¿realmente importa?
nico

2
(i) ¿Cómo cuantificaríamos esas cosas? ¡No es que haya sido objeto de una encuesta! (ii) Los cálculos casi siempre involucran números, pero lo que lo hace estadístico , en mi opinión, generalmente no está en los cálculos . (iii) Cuando hice mi especialización en estadística de pregrado, no estaba en el departamento de matemáticas. El lugar en el que hice mi doctorado, bajo dos estadísticos bastante conocidos, tampoco era un departamento de matemáticas. (iv) No creo que sea una broma. Se relaciona con una idea muy importante: que lo que hace que las estadísticas sean "estadísticas" es más una forma de razonar sobre tipos particulares de problemas.
Glen_b -Reinstale a Monica el

66
Me siento obligado a dar una respuesta breve, ya que soy ex matemático puro (PhD y 3.5 años de postdoctorado en algún tipo de álgebra), y ahora un estadístico aplicado ... bueno, el tipo de estadísticas que aprendes para las estadísticas aplicadas, como " ¿Cuándo utilizo una prueba "o qué no, para un matemático, se parece a un libro de recetas, no a las matemáticas. Pero, por ejemplo, la estadística asintótica de van der Vaart es definitivamente un libro de matemáticas ... Hay muchos niveles intermedios, algunos de ellos no están bien poblados, creo que no hay suficientes libros que expliquen las estadísticas con muchos ejemplos reales y todos los aspectos matemáticos. detalles. t
Elvis

55
No sé qué hacer con la declaración, "el valor , que es un concepto que surgió para dar sentido a los datos, pero no es una consecuencia lógica de principios más básicos", ni siquiera estoy seguro de si realmente puede estar bien o mal. En su mayoría parece proceder de premisas confusas. p
gung - Restablece a Monica

12
@Guy Por analogía, podríamos caracterizar la química (otra "disciplina matemática") como teoría de distribución asintótica y álgebras C *. Hacerlo es nominalmente preciso, pero pierde por completo la esencia de lo que es la química y sus objetivos que ningún químico lo reconocería. Del mismo modo, compare su caracterización con lo que las principales sociedades profesionales dicen que es estadística : son mundos separados. "La ciencia de aprender de los datos y de medir, controlar y comunicar la incertidumbre". Ni una sola mención de probabilidad allí.
whuber

Respuestas:


15

La matemática se ocupa de abstracciones idealizadas que (casi siempre) tienen soluciones absolutas, o el hecho de que no exista tal solución generalmente puede describirse completamente. Es la ciencia de descubrir consecuencias complejas pero necesarias a partir de axiomas simples.

Las estadísticas usan matemáticas, pero no son matemáticas. Es una conjetura educada. Es un juego de azar.

Las estadísticas no se ocupan de abstracciones idealizadas (aunque sí usan algunas como herramientas), se ocupan de fenómenos del mundo real. Las herramientas estadísticas a menudo hacen suposiciones simplificadoras para reducir los desordenados datos del mundo real a algo que se ajuste al dominio del problema de una abstracción matemática resuelta. Esto nos permite hacer conjeturas informadas, pero eso es realmente todo lo que las estadísticas son: el arte de hacer conjeturas muy bien informadas.

Considere la prueba de hipótesis con valores p. Digamos que estamos probando algunas hipótesis con significancia , y después de recopilar datos encontramos un valor p de 0.001 . Entonces rechazamos la hipótesis nula a favor de una hipótesis alternativa.α=0.010.001

Pero, ¿qué es realmente este valor p? ¿Cuál es el significado? Nuestra estadística de prueba fue desarrollada de tal manera que se ajustara a una distribución particular, probablemente la t de Student. Bajo la hipótesis nula, el percentil de nuestra estadística de prueba observada es el valor p. En otras palabras, el valor p da la probabilidad de que obtengamos un valor tan lejos de la expectativa de la distribución (o más lejos) como el estadístico de prueba observado. El nivel de significación es una regla general bastante arbitraria: establecerlo en es equivalente a decir, "es aceptable si 1 de cada 100 repeticiones de este experimento sugiere que rechacemos el nulo, incluso si el nulo es cierto. "0.01

El valor p nos da la probabilidad de que observemos los datos disponibles dado que el nulo es verdadero (o más bien, siendo un poco más técnico, que observamos los datos bajo la hipótesis nula que nos da al menos un valor tan extremo del estadística probada como la que encontramos). Si vamos a rechazar el valor nulo, entonces queremos que esta probabilidad sea pequeña, que se acerque a cero. En nuestro ejemplo específico, descubrimos que la probabilidad de observar los datos que reunimos si la hipótesis nula era verdadera era solo del , por lo que rechazamos el nulo. Esta fue una suposición educada. Nosotros nunca realmente sabemos con certeza que la hipótesis nula es falsa usando estos métodos, que acabamos de desarrollar una medida de la fuerza con nuestra evidencia apoya la alternativa.0.1%

¿Usamos las matemáticas para calcular el valor p? Seguro. Pero las matemáticas no nos dieron nuestra conclusión. Con base en la evidencia, formamos una opinión educada, pero sigue siendo una apuesta. Hemos descubierto que estas herramientas son extremadamente efectivas en los últimos 100 años, pero las personas del futuro pueden sorprenderse con horror ante la fragilidad de nuestros métodos.


66
El valor p no es la probabilidad de que estemos equivocados cuando rechazamos la hipótesis nula, ya que eso también depende de H1 que no entra en el cálculo del valor p (bien ilustrado por i.stack.imgur.com/tStr4 .png - la probabilidad de que H0 esté mal y de que el sol haya explotado es bastante menor que p = 1/36).
Dikran Marsupial

¿Podría sugerir una mejor interpretación en lenguaje simple del valor p? "¿La probabilidad de que observemos los datos disponibles dado el nulo es verdadera" tal vez? Ya he profundizado mucho más en el ejemplo del valor p de lo que pretendía. Mi intención era hacer un punto sobre las estadísticas, no proporcionar un tutorial sobre la interpretación de los valores p. No quiero descarrilarme demasiado. Gracias por señalarlo, en cualquier caso.
David Marx

2
El valor p es la probabilidad de un resultado al menos tan extremo como el observado si la hipótesis nula es verdadera. Sin embargo, el punto de que el vínculo entre la plausibilidad de la hipótesis nula y el valor p es en gran medida subjetivo, más que una necesidad lógica, es un buen punto (+1). Últimamente me he estado preguntando si la prueba de hipótesis frecuentista es menos subjetiva que el enfoque bayesiano, donde al menos la subjetividad se hace más explícita.
Dikran Marsupial

No está claro para mí cómo su interpretación / definición del valor p difiere de la alternativa que ofrecí en mi último comentario. Ciertamente hay un grado de subjetividad en la prueba de hipótesis frecuentista, pero es el mismo tipo de subjetividad que se invoca al interpretar un factor de Bayes. Y no es que el nivel de significancia no se comunique (es decir, la subjetividad también se hace explícita aquí), a menudo se elige en función de la convención, mientras que generalmente se piensa más en la elección de antecedentes bayesianos (informativos).
David Marx

1
@David: El "al menos igual de extremo" hace una gran diferencia: la probabilidad del valor observado debajo del valor nulo no es en general el valor p, incluso para estadísticas de prueba discretas donde tiene sentido. Sé que es tangencial al punto que estabas haciendo, pero si Wikipedia puede hacerlo bien, deberíamos poder hacerlo en Cross Validated.
Scortchi - Restablece a Monica

10

Lengua firmemente en la mejilla:

Einstein aparentemente escribió

En cuanto a que las leyes de las matemáticas se refieren a la realidad, no son ciertas; y hasta donde están seguros, no se refieren a la realidad.

entonces la estadística es la rama de las matemáticas que describe la realidad. ; o)

Yo diría que la estadística es una rama de las matemáticas de la misma manera que la lógica es una rama de las matemáticas. Ciertamente incluye un elemento de filosofía, pero no creo que sea la única rama de las matemáticas donde ese es el caso (ver, por ejemplo, Morris Kline, "Matemáticas - La pérdida de certeza", Oxford University Press, 1980).


2
¿Es la lógica una rama de las matemáticas? ¿Incluyendo lógicas de tres valores y lógicas modales, o simplemente cálculo de predicados de primer orden? ¿Son todas las ciencias formales de alguna manera Matemáticas?
Scortchi - Restablece a Monica

Consideraría que el estudio de cualquier sistema para manipular símbolos de acuerdo con un conjunto de reglas (por ejemplo, lenguajes formales) es una variedad de matemáticas, así que sí, supongo que probablemente lo haría. El problema con las etiquetas es que no siempre son completamente descriptivas de todo a lo que se aplican (no diría que era exactamente un matemático, un estadístico o un informático, pero tengo algunos aspectos de los tres). Del mismo modo, a menudo se puede colocar lo mismo en más de una jerarquía, por lo que tal vez no haya una solución única para la pregunta.
Dikran Marsupial

Según su argumento, las estadísticas, como descripción de la realidad, comprenden también la geometría y la teoría cuántica de campos, pero no incluyen la prueba de hipótesis (porque la mayoría de las hipótesis son contrafácticas, están destinadas a ser falsificadas) y, por lo tanto, claramente no lo hacen. "describir la realidad").
whuber

La cita de Einstein era la lengua en la mejilla, y no debía ser tomada en serio; ¡Estoy bastante seguro de que no es exactamente lo que Einstein realmente tenía en mente!
Dikran Marsupial

5

Bueno, si dices " algo así como estadísticas, donde no puedes construir todo sobre axiomas básicos ", entonces probablemente deberías leer sobre la teoría axiomática de probabilidad de Kolmogorov. Kolmogorov define la probabilidad de manera abstracta y axiomática como puede ver en este pdf en la página 42 o aquí en la parte inferior de la página 1 y en las páginas siguientes .

Solo para darle una idea de sus definiciones abstractas, define una variable aleatoria como una función 'medible' como se explica de una manera más 'intuitiva' aquí: si una variable aleatoria es una función, entonces, ¿cómo definimos una función de un variable aleatoria

Con un número muy limitado de axiomas y utilizando resultados de la teoría de la medida (nuevamente matemática), puede definir conceptos que son variables aleatorias, distribuciones, probabilidad condicional, ... de manera abstracta y derivar todos los resultados bien conocidos, como la ley de los grandes números, ... de este conjunto de axiomas. Te aconsejo que lo pruebes y te sorprenderá la belleza matemática de la misma.

Para una explicación sobre los valores p me refiero a: ¿ Malentendido un valor P?


1
Sin embargo, ¿no existe todavía una distinción importante entre la Teoría de la probabilidad (Matemáticas) y su aplicación a los problemas de inferencia (Estadística)? Los enfoques bayesiano y frecuentista muestran el mismo aparato matemático ( típicamente o casi ) utilizado con conceptos de probabilidad bastante diferentes.
Scortchi - Restablece a Monica

@Scortchi: No estoy seguro de si los conceptos de probabilidad son diferentes para los frecuentistas y los bayesianos; ver stats.stackexchange.com/questions/230415/…

No veo ningún desacuerdo entre mi comentario y su respuesta a ¿Hay alguna base matemática para el debate bayesiano versus frecuentista? . Por "aparato matemático" quiero decir lo que sigue de los axiomas de Kolmogorov; por "conceptos" me refiero a las interpretaciones como frecuencia limitante, grado de creencia, etc. c.
Scortchi - Restablece a Monica

3

No tengo una base rigurosa o filosófica para responder esto, pero he escuchado que la queja de "estadísticas no es matemática" a menudo proviene de personas, generalmente de tipo físico. Creo que la gente quiere garantías de certeza de sus matemáticas, y las estadísticas (generalmente) solo ofrecen conclusiones probabilísticas con valores de p asociados. En realidad, esto es exactamente lo que me encanta de las estadísticas. Vivimos en un mundo fundamentalmente incierto, y hacemos lo mejor que podemos para entenderlo. Y hacemos un gran trabajo, considerando todas las cosas.


2

Tal vez sea porque soy un plebe y no he tomado ningún curso matemático avanzado, pero no veo por qué la estadística no es matemática. Los argumentos aquí y sobre una pregunta duplicada parecen argumentar dos puntos principales sobre por qué las estadísticas no son matemáticas * .

  1. No es exacto / seguro, y como tal se basa en suposiciones.
  2. Aplica matemática a los problemas y cada vez que aplica matemática ya no es matemática.

No es exacto y usa suposiciones

Las suposiciones / aproximaciones son útiles para muchas matemáticas.

Creo que las propiedades de un triángulo que aprendí en la escuela primaria se consideran matemáticas verdaderas, a pesar de que no son ciertas en la geometría no elucideana. Entonces, claramente una admisión de los límites, o expresado de otra manera "suponiendo que XYZ lo siguiente es válido", a una rama de las matemáticas no descalifica a la rama de ser matemáticas "verdaderas".

Estoy seguro de que el cálculo se consideraría una forma pura de matemáticas, pero los límites son la herramienta principal sobre la que lo construimos. Podemos seguir calculando hasta el límite, del mismo modo que podemos seguir haciendo que el tamaño de la muestra sea más grande, pero ninguno de los dos ofrece mayor información más allá de cierto umbral.

Una vez que aplica las matemáticas, no son matemáticas

La contradicción obvia aquí es que usamos las matemáticas para probar teoremas matemáticos, y nadie argumenta que probar los teoremas matemáticos no es matemática.

La siguiente afirmación podría ser que thing xno son matemáticas si las usas para obtener un resultado. Eso tampoco tiene ningún sentido.

La afirmación con la que estaría de acuerdo es que cuando utiliza los resultados de un cálculo para tomar una decisión, la decisión no es matemática . Eso no significa que el análisis previo a la decisión no sea matemática .

Creo que cuando usamos el análisis estadístico, todas las matemáticas realizadas son matemáticas reales. Solo cuando entregamos los resultados a alguien para que los interprete, las estadísticas salen de las matemáticas. Como tal, las estadísticas y los estadísticos están haciendo matemáticas reales y son matemáticos reales. Es la interpretación realizada por el negocio y / o la traducción de los resultados al negocio por el estadístico lo que no es matemática.

De los comentarios:

Whuber dijo:

Si reemplazara "estadísticas" por "química", "economía", "ingeniería" o cualquier otro campo que emplee las matemáticas (como la economía doméstica), parece que ninguno de sus argumentos cambiaría.

Creo que la diferencia clave entre "química", "ingeniería" y "equilibrar mi chequera" es que esos campos solo usan conceptos matemáticos existentes . Tengo entendido que los estadísticos como Guass ampliaron el cuerpo de conceptos matemáticos. Creo (esto puede ser descaradamente incorrecto) que para obtener un doctorado en estadística, debe contribuir, de alguna manera, a expandir el cuerpo de conceptos matemáticos. Los candidatos a doctorado en Química / Ingeniería no tienen ese requisito que yo sepa.

La distinción de que la estadística contribuye al cuerpo de conceptos matemáticos es lo que lo distingue de los otros campos que simplemente usan conceptos matemáticos .


*: La notable excepción es esta respuesta que efectivamente establece que los límites son artificiales debido a varias razones sociales. Creo que esa es la única respuesta verdadera, pero ¿dónde está la diversión en eso? ;)


1
Si reemplazara "estadísticas" por "química", "economía", "ingeniería" o cualquier otro campo que emplee las matemáticas (como la economía doméstica), parece que ninguno de sus argumentos cambiaría. Como tal, parece estar sin ninguna sustancia.
whuber

Los doctores en estadística no tienen que "contribuir al cuerpo de conceptos matemáticos". La mayoría de los doctores de estadísticas se otorgan por contribuciones a la metodología estadística y la teoría estadística . (Pocos matemáticos, en su caso, prestar atención a la literatura estadística. Simplemente no es una buena fuente de ideas nuevas o matemáticos fructíferos en general. Estoy no refiero a la literatura en la teoría de la probabilidad aquí.) Por otra parte, químicos, ingenieros, físicos , etc. a menudo crean (o, generalmente, recrean) ideas matemáticas en su trabajo; eso no convierte automáticamente sus campos en ramas de las matemáticas.
whuber

@whuber Eso es muy interesante. Parece que no tengo una pierna para pararse.
Erik

1
Para el registro, no he rechazado su contribución. Este es un tema delicado para muchos, por ejemplo, muchos departamentos de matemática de la universidad todavía están tratando de tratar a los estadísticos como matemáticos, en detrimento de ambos, por lo que es probable que provoquen algunas reacciones fuertes.
whuber

2
@whuber Soy lo suficientemente fuerte como para soportar algunos votos negativos independientemente. :) Creo que fuiste respetuoso en todo momento, así que no te preocupes por eso. Además de votar es anónimo por una razón. No hay necesidad de ir al registro.
Erik

2

Las pruebas estadísticas, los modelos y las herramientas de inferencia se formulan en el lenguaje de las matemáticas, y los estadísticos han demostrado matemáticamente libros gruesos de resultados muy importantes e interesantes sobre ellos. En muchos casos, las pruebas proporcionan evidencia convincente de que las herramientas estadísticas en cuestión son confiables y / o poderosas.

Las estadísticas y su comunidad pueden no ser lo suficientemente "puras" para los matemáticos de cierto gusto, pero definitivamente se invierte en matemáticas de manera extremadamente profunda, y las estadísticas teóricas son tanto una rama de las matemáticas como la física teórica o la informática teórica.


2
Hola Paul, como dices, las estadísticas están llenas de buenos teoremas y pruebas (+1), incluso hay una teoría axiomática de la probabilidad, desarrollada por Kolmogorov, como explico en mi respuesta.

-2

La "diferencia" se basa en: razonamiento inductivo vs. razonamiento deductivo vs. inferencia. Por ejemplo, ningún teorema matemático puede decir qué distribución o antes puede usar para sus datos / modelo.

Por cierto, las estadísticas bayesianas son un área axiomatizada.


Las matemáticas también necesitan un razonamiento inductivo ...
Elvis

@Elvis Sí, por eso mi ejemplo ... Estoy seguro de que sabes que no hay una respuesta general a esta pregunta ... He editado la respuesta, para tu placer ...
Compay Segundo

Realmente no entiendo tu punto.
Elvis

@CompaySegundo: No estoy seguro de que tenga un punto válido aquí, al menos, no está claramente establecido.
Quora Feans

1
@QuoraFea Probablemente estoy demasiado borracho ...
Compay Segundo

-2

Esta puede ser una opinión muy impopular, pero dada la historia y la formulación de los conceptos de estadística (y teoría de la probabilidad), considero que la estadística es una rama secundaria de la física .

De hecho, Gauss inicialmente formalizó el modelo de regresión de mínimos cuadrados en las predicciones astronómicas. La mayoría de las contribuciones a las estadísticas antes de Fisher fueron de físicos (o matemáticos altamente aplicados cuyo trabajo se llamaría Física según los estándares actuales): Lyapunov, De Moivre, Gauss y uno o más de los Bernoullis.

El principio general es la caracterización de errores y la aparente aleatoriedad propagada a partir de un número infinito de fuentes de variación no medidas. A medida que los experimentos se volvieron más difíciles de controlar, los errores experimentales debían describirse formalmente y explicarse para calibrar la preponderancia de la evidencia experimental contra el modelo matemático propuesto. Más tarde, a medida que la física de partículas profundizó en la física cuántica , la formalización de partículas como distribuciones aleatorias dio un lenguaje mucho más conciso para describir la aleatoriedad aparentemente incontrolable con fotones y electrones.

Las propiedades de los estimadores, como su media (centro de masa) y la desviación estándar (segundo momento de desviaciones) son muy intuitivas para los físicos. La mayoría de los teoremas de límites se pueden conectar libremente con la ley de Murphy, es decir, que la distribución normal limitante es la entropía máxima.

Entonces, la estadística es una rama secundaria de la física.


55
Esta tesis es tan inverosímil como ilógica. Como Stephen Stigler señala en sus libros, los psicólogos, economistas y la mayoría de los otros científicos sociales no adoptaron los métodos de los físicos durante hasta otro siglo debido a las dudas reales sobre su aplicabilidad y su interpretación. Esa es una evidencia prima facie de que la estadística es mucho más que una rama de la física. Otras disciplinas, que van desde la ingeniería hasta la biología, también emplean métodos físicos y teorías físicas, pero eso tampoco las convierte en ramas de la física, al menos de ninguna manera significativa o perspicaz.
whuber

¿El interés de Bernoulli en la probabilidad no se debió al juego en lugar de a la física?
Dikran Marsupial

@whuber Al igual que con mi campo, bioestadística, soy muy consciente de que estas ciencias aplicadas existieron en varias formas antes de su identificación distintiva como un campo de la ciencia. Sin embargo, creo que estos campos fueron precedidos formalmente por el campo de las estadísticas en sí. Por supuesto, este no es el caso de la física. El tema central en estas ciencias aplicadas es la formulación de un proceso como modelo que relaciona algún predictor con una respuesta. Quizás el lenguaje de la estadística nació en parte de la necesidad de generalizar conceptos que se apliquen a estos campos.
AdamO

1
Estás pensando en Jacobus Bernoulli, autor póstumo de ars conjectandi (ed. Nicholaus Bernoulli, 1713). Probablemente las últimas personas que parecieron estar motivadas por problemas de juego fueron Pascal y Fermat en 1654, pero incluso entonces parece que estaban usando ciertos problemas de juego (el "problema de los puntos") solo como un ejemplo motivacional y no como el foco de atención. su investigación (La erudición moderna en realidad rastrea el problema de los puntos del derecho contractual islámico c. 1200.) El último matemático notable que realmente estuvo motivado por el juego probablemente fue Cardano (1501-1576).
whuber

1
Diaconis el mago ? ¡No combinaría el juego con el espectáculo! Usted tiene un punto, pero podría retroceder un poco mejor al sugerir que muchos "inversores" son en realidad jugadores, de donde muchos teóricos en finanzas matemáticas podrían estar realmente motivados por esa forma de juego. Solo un pensamiento ... De todos modos, está claro que cuando Huygens publicó su pequeño tratado en 1657, la gente estaba creando una teoría de la probabilidad (y estadísticas) por razones mucho más profundas y de mayor alcance que hacerlo mejor en las mesas de juego. .
whuber
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.