¿Cuál es la diferencia entre predicción e inferencia?


37

Estoy leyendo " Una introducción al aprendizaje estadístico ". En el capítulo 2, discuten la razón para estimar una función .f

2.1.1 ¿Por qué estimar ?f

Hay dos razones principales por las cuales podemos desear estimar f : predicción e inferencia . Discutimos cada uno en su turno.

Lo he leído varias veces, pero todavía no estoy del todo claro sobre la diferencia entre predicción e inferencia. ¿Podría alguien proporcionar un ejemplo (práctico) de las diferencias?


55
Los autores de Una Introducción al Aprendizaje Estadístico nos han hecho un mal servicio aquí. Uno hace inferencias para hacer predicciones al igual que hace inferencias para comprender las causas y los efectos. Merriam-webster.com define "inferir" principalmente como "derivar como una conclusión de hechos o premisas". Eso cubre tanto el razonamiento causal como el predictivo. Es engañoso, confuso y contra el uso estándar a largo plazo limitar la definición de "inferir" para incluir solo cuestiones de causalidad. Entonces: contrastamos la inferencia predictiva con la inferencia causal.
rolando2

2
@ rolando2: Entonces supongo que también necesitamos inferencia descriptiva , es decir, inferencia sobre parámetros en modelos descriptivos (no causales).
kjetil b halvorsen

Respuestas:


29

Inferencia: dado un conjunto de datos, desea inferir cómo se genera la salida en función de los datos.

Predicción: Dada una nueva medición, desea utilizar un conjunto de datos existente para construir un modelo que elija de manera confiable el identificador correcto de un conjunto de resultados.


Inferencia: Desea averiguar cuál es el efecto de Age, Passenger Class y, Gender en sobrevivir al Titanic Disaster. Puede poner una regresión logística e inferir el efecto que tiene cada característica del pasajero en las tasas de supervivencia.

Predicción: Dada cierta información sobre un pasajero del Titanic, desea elegir entre el conjunto y ser correcto con la mayor frecuencia posible. (Consulte el compromiso de varianza de sesgo para la predicción en caso de que se pregunte cómo ser correcto con la mayor frecuencia posible).{lives,dies}


La predicción no gira en torno al establecimiento de la relación más precisa entre la entrada y la salida, la predicción precisa se preocupa por poner nuevas observaciones en la clase correcta con la mayor frecuencia posible.

Entonces, el 'ejemplo práctico' se reduce a la siguiente diferencia: dado un conjunto de datos de pasajeros para un solo pasajero, el enfoque de inferencia le brinda una probabilidad de sobrevivir, el clasificador le da la opción de elegir entre vidas o morir.

El ajuste de clasificadores es un tema muy interesante y crucial de la misma manera que lo es interpretar correctamente los valores p y los intervalos de confianza.


1
Buena respuesta. Pero cuando algunas personas escuchan la palabra "inferencia", piensan "inferencia causal". Es posible que desee decir algo al respecto también, aunque (o tal vez especialmente porque) ISLR no está enfocado en eso.
generic_user el

1
Creo que en el mundo del aprendizaje profundo la inferencia es más o menos lo mismo que la predicción, por ejemplo. blogs.nvidia.com/blog/2016/08/22/…
usuario1893354

1
Esto me parece una respuesta perfectamente buena.
gung - Restablece a Monica

3
Creo que esta respuesta es incorrecta, específicamente "el enfoque de inferencia te da una probabilidad de sobrevivir, el clasificador te da la opción de elegir entre vidas o morir", aún más específicamente la primera parte. Calcular la probabilidad de que un pasajero sobreviva es una predicción, específicamente una probabilidad. En el caso continuo sería un pronóstico de densidad. Entonces podemos limitar esta probabilidad predicha para obtener una clasificación difícil , sí. ...
S. Kolassa - Restablece a Mónica el

3
... Mientras que la predicción se trata de predecir los resultados , la inferencia se trata de comprender la relación de las entradas con el resultado: qué entrada tiene esa relación y cómo podemos distinguir una relación "verdadera" de una covarianza aleatoria (que es donde los valores p Adelante)? ¿Alguien puede explicarme dónde me equivoco?
S. Kolassa - Restablece a Mónica el

12

En general, al hacer el análisis de datos, imaginamos que existe algún tipo de "proceso de generación de datos" que da lugar a los datos, y la inferencia se refiere al aprendizaje sobre la estructura de este proceso, mientras que la predicción significa ser capaz de pronosticar los datos que provienen de él. . A menudo los dos van juntos, pero no siempre.

Un ejemplo donde los dos van de la mano sería el modelo de regresión lineal simple

Yyo=β0 0+β1Xyo+ϵyo.

β0 0β1


3
"pero el modelo no se traduce necesariamente en una perspectiva interesante sobre lo que está sucediendo detrás de las escenas." El término " cuadro negro " viene a la mente. :)
Alexis

o múltiples capas de redes neuronales
Shihab Shahriar Khan

"Pero hay otros tipos de modelos en los que uno puede hacer predicciones sensatas, pero el modelo no necesariamente conduce a ideas significativas sobre lo que está sucediendo detrás de escena", ¿a quién le importa? El problema de inferencia, tal como lo definió, sigue siendo el de determinar los parámetros del modelo. No entiendo por qué comienzas esta oración con "Pero" y por qué incluso escribiste esta oración, con respecto a tu definición de inferencia y predicción.
nbro

1
El uso de "pero" se debe a que tanto la descripción de los modelos anteriores como los siguientes son correctos, sin embargo, el siguiente modelo es distinto de la naturaleza de los primeros en formas que no habría esperado hasta que comprenda la distinción entre predicción e inferencia eso está siendo ilustrado. Ya estoy familiarizado con la distinción, sin embargo, este ejemplo me parece perspicaz y útil. +1
gung - Restablecer Monica

11

En la página 20 del libro, los autores brindan un hermoso ejemplo que me hizo comprender la diferencia.

Aquí está el párrafo del libro: Introducción al aprendizaje estadístico.

"Por ejemplo , en un entorno inmobiliario, uno puede tratar de relacionar los valores de las viviendas con datos como la tasa de criminalidad, la zonificación, la distancia a un río, la calidad del aire, las escuelas, el nivel de ingresos de la comunidad, el tamaño de las casas, etc. En este caso, uno podría estar interesado en cómo las variables de entrada individuales afectan los precios, es decir, ¿cuánto más valdrá una casa si tiene una vista del río? Este es un problema de inferencia . Alternativamente, uno simplemente podría estar interesado al predecir el valor de una casa dadas sus características: ¿ está esta casa subvalorada o sobrevalorada? Este es un problema de predicción ".


5

ytX1,tX2,t

yt=F(X1,t-1,X2,t-1)+εt

Ahora, si obtiene los datos sobre ingresos, diga series de ingresos personales disponibles de BEA, y construya la variable de la época del año, puede estimar la función f , luego conecte los últimos valores del ingreso de la población y la época del año en este función. Esto generará la predicción para el próximo trimestre de los ingresos de la tienda.

F/ /X2tβ2X2,t-1

Xestán correlacionados, es más difícil separar el impacto del predictor del impacto de otros predictores. Para la predicción, esto no importa, lo único que le importa es la calidad del pronóstico.


3

Imagínese, usted es médico en una unidad de cuidados intensivos. Usted tiene un paciente con fiebre fuerte y un número determinado de células sanguíneas y un peso corporal dado y cientos de datos diferentes y desea predecir si él o ella va a sobrevivir. Si es así, va a ocultar esa historia sobre su otro hijo a su esposa, si no, es importante que lo revele, mientras pueda.

El médico puede hacer esta predicción basándose en los datos de pacientes anteriores que tenía en su unidad. Basado en su conocimiento de software, puede predecir usando una regresión lineal generalizada (glm) o una red neuronal (nn).

1. Modelo lineal generalizado

Hay muchos parámetros correlacionados para la glm, por lo que para llegar a un resultado, el médico tendrá que hacer suposiciones (linealidad, etc.) y tomar decisiones sobre qué parámetros pueden tener influencia. La glm lo recompensará con una prueba t de importancia para cada uno de sus parámetros para que pueda reunir pruebas sólidas, de que el género y la fiebre tienen una influencia significativa, el peso corporal no necesariamente.

2. red neuronal

La red neuronal tragará y asimilará toda la información que haya en la muestra de pacientes anteriores. No le importará si los predictores están correlacionados y no revelará tanta información sobre si la influencia del peso corporal parece ser importante solo en la muestra en cuestión o en general (al menos no en el nivel de experiencia que el médico tiene que ofrecer). Solo calculará un resultado.

Que es mejor

El método a elegir depende del ángulo desde el que se mire el problema: como paciente, preferiría la red neuronal que utiliza todos los datos disponibles para una mejor suposición sobre lo que me sucederá sin suposiciones fuertes y obviamente erróneas como la linealidad. Como el médico, que quiere presentar algunos datos en una revista, necesita valores p. La medicina es muy conservadora: van a pedir valores p. Entonces, el médico quiere informar que, en tal situación, el género tiene una influencia significativa. Para el paciente, eso no importa, simplemente use cualquier influencia que la muestra sugiera que sea más probable.

En este ejemplo, el paciente quiere predicción, el lado científico del médico quiere inferencia. Principalmente, cuando quieres entender un sistema, entonces la inferencia es buena. Si necesita tomar una decisión donde no puede entender el sistema, la predicción tendrá que ser suficiente.


1
"Como paciente, preferiría la red neuronal ..." Parece ignorar el hecho de que grandes cantidades de datos pueden ser extremadamente difíciles de obtener en la ciencia clínica. Los conjuntos de datos de solo varias observaciones por grupo no son infrecuentes debido a preocupaciones de seguridad, privacidad y ética. Si puede hacer suposiciones defendibles sobre el proceso de generación de datos, puede hacer un uso mucho más eficiente de los datos.
Frans Rodenburg el

Se suponía que este era un escenario hipotético en el que uno puede relacionarse fácilmente con por qué el mismo problema aparentemente puede provocar preguntas de inferencia y problemas de predicción y por qué no son lo mismo. No estaba proponiendo métodos para predecir realmente las posibilidades de supervivencia de los pacientes y sí, soy muy consciente de lo difícil que puede ser obtener datos clínicos confiables de un tamaño notable. En mi humilde opinión, las buenas suposiciones / conocimiento del proceso de generación de datos ayudarán en la predicción, así como en la inferencia, por lo tanto, no hacen mucho para distinguir ambos.
Bernhard el

1

No estás solo aquí. Después de leer las respuestas, ya no estoy confundido, no porque entienda la diferencia, sino porque entiendo que está en el ojo del espectador y es inducido verbalmente. Ahora estoy seguro de que esos dos términos son definiciones políticas más que científicas. Tomemos, por ejemplo, la explicación del libro, la que las universidades intentaron usar como buena: "¿cuánto más valdrá una casa si tiene una vista del río? Este es un problema de inferencia". Desde mi punto de vista, esto es absolutamente un problema de predicción. Usted es propietario de una empresa de construcción civil y desea elegir el mejor terreno para construir el próximo conjunto de casas. Tienes que elegir entre dos ubicaciones en la misma ciudad, una cerca del río y la siguiente cerca de la estación de tren. Quieres predecirLos precios para ambos lugares. O quieres inferir . Va a aplicar los métodos exactos de estadística, pero nombra el proceso. :)


La idea de que una vista del río llevará un cierto precio es un causal interpretación. La predicción es agnóstico acerca de la causalidad: Puedo predecir los efectos de causas, las causas de los efectos, o 1 efecto de otro efecto w / similares causas. Considere mi amigo Billy, que es 5'10" y que tiene un gemelo idéntico, Bobby, que nunca he conocido. No obstante, se puede predecir que Bobby es 5'10" , pero si hago Billy más alto por él ascensor zapatos dando, no puedo predecir necesariamente Billy será igualmente alto.
Gung - Restablecer Mónica

El ejemplo que usted cita es simplemente un mal ejemplo, es por eso que es confuso. Definitivamente, hay más a la diferencia entre inferencia y prediciton de la "política".
Richard Hardy

1

Hay buena actuación de investigación que un fuerte predictor de si los prestatarios pagar sus préstamos es si sentían que utilizan para proteger sus pisos de rasguños hechos por patas de los muebles. Esta variable "sentido" será una ayuda, distinta a un modelo predictivo donde el resultado es pagar por defecto vs. Sin embargo, si los prestamistas quieren obtener una mayor influencia sobre este resultado, que será negligente al pensar que pueden hacerlo mediante la distribución sintió tan ampliamente como sea posible.

"¿Qué tan probable es esto prestatario para pagar?" es un problema de predicción; "¿Cómo puedo influir en el resultado?" es un problema de inferencia causal.


-1

y = f (x), entonces

predicción (lo que es el valor de Y con un valor dado de x: si el valor específico de x lo que podría ser el valor de Y

inferencia (cómo y cambia con el cambio en x): lo que podría ser el efecto sobre Y si x cambia

Predicción ejemplo: supongamos que Y representan el salario de una persona a continuación, si proporcionamos entrada tal como años de experiencia, grado como variables de entrada a continuación, nuestra función predice el sueldo del empleado.

Inferencia ejemplo: supongamos que el costo de vida cambia entonces cuánto es el cambio en el salario


No veo por qué esta respuesta merece dos votos negativos.
gung - Restablece a Monica
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.