Pensamientos prácticos sobre modelos explicativos versus predictivos


70

En abril, asistí a una charla en la serie de seminarios grupales de Estadística del Departamento de Matemáticas de la UMD llamada "¿Explicar o predecir?". La charla fue impartida por el profesor Galit Shmueli, que enseña en la Smith Business School de la UMD. Su charla se basó en una investigación que realizó para un artículo titulado "Modelado predictivo versus explicativo en la investigación de SI" , y un documento de trabajo de seguimiento titulado "¿Explicar o predecir?" .

El argumento del Dr. Shmueli es que los términos predictivo y explicativo en un contexto de modelado estadístico se han confundido, y que la literatura estadística carece de una discusión exhaustiva de las diferencias. En el documento, contrasta ambos y habla sobre sus implicaciones prácticas. Te animo a leer los periódicos.

Las preguntas que me gustaría plantear a la comunidad de profesionales son:

  • ¿Cómo define un ejercicio predictivo versus uno explicativo / descriptivo? Sería útil si pudiera hablar sobre la aplicación específica.
  • ¿Alguna vez has caído en la trampa de usar uno cuando quieres usar el otro? Ciertamente lo tengo. ¿Cómo sabes cuál usar?

2
Se propone cerrar esta pregunta. Ver: meta.stats.stackexchange.com/questions/213/… Veo que tiene 2 votos. ¿Podrían los votantes positivos o el OP comentar por qué les gustaría ver la pregunta permanecer abiertos en el metahilo?

9
En lugar de decir "esto debería estar cerrado. Alguien debería defenderlo", ¿qué tal comenzar explicando por qué quieres que se cierre? ¿Demasiado vago? Luego pida una aclaración. Esto me parece una pregunta razonable. El autor de la pregunta presenta un artículo y pregunta sobre la diferencia entre estadística predictiva y explicativa. El único cambio que haría a la pregunta es aclarar exactamente la pregunta para que sea más fácil votar.
JD Long

2
Ya he ofrecido una razón en el meta hilo. Siento que las 'meta discusiones' sobre la pregunta llenarían esta página en particular.

2
@Srikant @JD Voy a reforzar la pregunta. Gracias por la respuesta. Creo que este es un tema que merece discusión.
wahalulu

44
¿Podría agregar enlaces apropiados a la charla / documentos mencionados anteriormente?
chl

Respuestas:


39

En una oración

El modelado predictivo se trata de "¿qué es probable que suceda?", Mientras que el modelado explicativo se trata de "¿qué podemos hacer al respecto?"

En muchas oraciones

Creo que la principal diferencia es lo que se pretende hacer con el análisis. Sugeriría que la explicación es mucho más importante para la intervención que la predicción. Si desea hacer algo para alterar un resultado, es mejor que busque explicar por qué es así. El modelado explicativo, si se hace bien, le dirá cómo intervenir (qué entrada debe ajustarse). Sin embargo, si simplemente desea comprender cómo será el futuro, sin ninguna intención (o capacidad) de intervenir, es más probable que el modelado predictivo sea apropiado.

Como un ejemplo increíblemente laxo, usando "datos de cáncer".

Sería apropiado (o al menos útil) el modelo predictivo utilizando "datos sobre el cáncer" si financiara las salas de cáncer de diferentes hospitales. Realmente no necesita explicar por qué las personas contraen cáncer, solo necesita una estimación precisa de la cantidad de servicios que se requerirán. El modelado explicativo probablemente no ayudaría mucho aquí. Por ejemplo, saber que fumar conduce a un mayor riesgo de cáncer no le dice por sí solo si debe otorgar más fondos para la sala A o la sala B.

El modelado explicativo de los "datos sobre el cáncer" sería apropiado si quisiera disminuir la tasa nacional de cáncer; el modelado predictivo sería bastante obsoleto aquí. Es poco probable que la capacidad de predecir con precisión las tasas de cáncer lo ayude a decidir cómo reducirlo. Sin embargo, saber que fumar conduce a un mayor riesgo de cáncer es información valiosa, porque si disminuye las tasas de tabaquismo (por ejemplo, al hacer que los cigarrillos sean más caros), esto lleva a más personas con menos riesgo, lo que (con suerte) conduce a una disminución esperada del cáncer tarifas.

Mirando el problema de esta manera, pensaría que el modelado explicativo se centraría principalmente en variables que están en control del usuario, ya sea directa o indirectamente. Es posible que sea necesario recopilar otras variables, pero si no puede cambiar ninguna de las variables en el análisis, dudo que el modelo explicativo sea útil, excepto tal vez para darle el deseo de obtener control o influencia sobre esas variables. que son importantes El modelo predictivo, en términos generales, solo busca asociaciones entre variables, controladas por el usuario o no. Solo necesita conocer las entradas / características / variables independientes / etc. para hacer una predicción, pero debe poder modificar o influir en las entradas / características / variables independientes / etc. para intervenir y cambiar un resultado .


9
+1, bien hecho! Odio hacer trampas, pero quiero señalar que la predicción no tiene que ver con el futuro. Por ejemplo, un arqueólogo puede querer determinar (es decir, predecir) el nivel de lluvia en un área en un punto en el pasado mediante el conocimiento de los rastros (es decir, los efectos de la lluvia) que quedan.
gung - Restablece a Monica

@gung: pensé que redacté mi respuesta para que esto no sucediera. Claramente, perdí un lugar :-)
probabilidadislogic

Buena respuesta. Creo que en muchos casos necesitamos saber cómo es el futuro y por qué. Supongamos que, al estudiar el abandono de clientes, desea saber cuántos clientes (y exactamente qué cliente) abandonan el próximo N mes y luego por qué abandonan para que el marketing pueda intervenir para retenerlos. Entonces necesitamos tanto predictivo (para conocer el número futuro y los clientes) como explicativo para decirnos por qué, para que podamos reducir los abandonos. Entonces, ¿tenemos un modelo híbrido de ambos o uno es suficiente? Varty lo retoca diciendo: "La relación conocida puede surgir de un análisis explicativo / descriptivo o de alguna otra técnica"
Espanta

@gung Me encanta criticar : el arqueólogo desea predecir experiencias en su futuro (es decir, predecir dónde en algún momento en el futuro encontrará rastros de lluvias altas pasadas).
Alexis

@Alexis, eso es ciertamente posible, pero también es posible que ese no sea el interés principal de investigación del arqueólogo, y que esos datos ya hayan sido recopilados por otros investigadores (paleoclimatólogos) y el arqueólogo simplemente quiera usar esos datos para probar teorías que son su principal interés teórico ( Gill, 200 ).
gung - Restablece a Monica

30

En mi opinión, las diferencias son las siguientes:

Explicativo / descriptivo

Cuando buscamos una respuesta explicativa / descriptiva, el enfoque principal está en los datos que tenemos y buscamos descubrir las relaciones subyacentes entre los datos después de que se ha tenido en cuenta el ruido.

Ejemplo: ¿Es cierto que hacer ejercicio regularmente (digamos 30 minutos por día) conduce a una presión arterial más baja? Para responder a esta pregunta, podemos recopilar datos de los pacientes sobre su régimen de ejercicio y sus valores de presión arterial a lo largo del tiempo. El objetivo es ver si podemos explicar las variaciones en la presión arterial mediante variaciones en el régimen de ejercicio.

La presión arterial se ve afectada no solo por el ejercicio por una amplia variedad de otros factores, como la cantidad de sodio que come una persona, etc. Estos otros factores se considerarían ruido en el ejemplo anterior, ya que la atención se centra en descifrar la relación entre el régimen de ejercicio y presión sanguínea.

Predicción

Cuando hacemos un ejercicio predictivo, estamos extrapolando a lo desconocido usando las relaciones conocidas entre los datos que tenemos a mano. La relación conocida puede surgir de un análisis explicativo / descriptivo o alguna otra técnica.

Ejemplo: si hago ejercicio 1 hora por día, ¿en qué medida es probable que disminuya mi presión arterial? Para responder a esta pregunta, podemos utilizar una relación previamente descubierta entre la presión arterial y el régimen de ejercicio para realizar la predicción.

En el contexto anterior, el enfoque no está en la explicación, aunque un modelo explicativo puede ayudar con el proceso de predicción. También hay enfoques no explicativos (por ejemplo, redes neuronales) que son buenos para predecir lo desconocido sin necesariamente agregar a nuestro conocimiento la naturaleza de la relación subyacente entre las variables.


66
+1 Esta respuesta evita en gran medida la asociación confusa con la causalidad mediante el uso del lenguaje de explicación, descripción y relación. Esto le da un grado deseable de claridad.
whuber

44
En Explicación, escribió "el enfoque principal está en los datos que tenemos". Creo que está tratando de decir que la tarea es retrospectiva (en oposición a la naturaleza prospectiva de la predicción). En la explicación (léase "explicación causal") en realidad hay un gran enfoque en la teoría y el conocimiento del dominio y los datos se utilizan para probar estos supuestos / teorías. Por el contrario, en la predicción se basa más en los datos y tiene una mentalidad más abierta sobre las relaciones, porque no está buscando la causalidad sino más bien la correlación.
Galit Shmueli

@GalitShmueli Reg teoría / dominio de conocimiento, sí, estoy de acuerdo con ese punto. Simplemente estaba tratando de contrastar la predicción frente a la explicación enfocándome en lo que me parece la distinción clave: extrapolar el valor de una variable versus desenterrar la relación entre variables. En el proceso, por supuesto, soy culpable de descuidar sutiles matices entre los dos paradigmas.
varty

1
@varty Estoy de acuerdo con su punto: en la explicación / descripción le interesa una relación / efecto general / promedio, mientras que en la predicción le interesa predecir valores individuales (no necesariamente extrapolación)
Galit Shmueli

19

Una cuestión práctica que surge aquí es la selección variable en el modelado. Una variable puede ser una variable explicativa importante (p. Ej., Es estadísticamente significativa) pero puede no ser útil para fines predictivos (es decir, su inclusión en el modelo conduce a una peor precisión predictiva). Veo este error casi todos los días en artículos publicados.

Otra diferencia está en la distinción entre análisis de componentes principales y análisis factorial. La PCA se usa a menudo en la predicción, pero no es tan útil para la explicación. FA implica el paso adicional de rotación que se realiza para mejorar la interpretación (y, por lo tanto, la explicación). Hoy hay una buena publicación en el blog de Galit Shmueli sobre esto .

Actualización: surge un tercer caso en series de tiempo cuando una variable puede ser una variable explicativa importante pero simplemente no está disponible para el futuro. Por ejemplo, los préstamos hipotecarios pueden estar fuertemente relacionados con el PIB, pero eso no es muy útil para predecir futuros préstamos hipotecarios a menos que también tengamos buenas predicciones del PIB.


3
¿Por qué / cómo una variable explicativa importante reduciría la precisión predictiva?

3
@Srikant. Esto puede suceder cuando la variable explicativa tiene una relación débil pero significativa con la variable de respuesta. Entonces el coeficiente puede ser estadísticamente significativo pero difícil de estimar. En consecuencia, el MSE de las predicciones puede aumentar cuando se incluye la variable en comparación con cuando se omite. (El sesgo se reduce con su inclusión, pero la varianza aumenta).
Rob Hyndman

El primer párrafo es un muy, muy buen punto. Todavía a veces es aún peor; aquí PMID: 18052912 es un gran ejemplo de que a veces se puede hacer un mejor modelo en la parte de ruido del conjunto que en uno verdadero; es obvio que se puede hacer un buen modelo con datos aleatorios, pero esto es un poco impactante .

1
perdona mi ingorancia, pero ¿la rotación no es normalmente una parte de PCA y FA?
richiemorrisroe

3
Una estadística sig. pero el predictor débil rara vez es efectivo, ya sea para predicción o explicación. Por ejemplo, si una solución de regresión lineal tiene un RSQ de .40 sin incluir el predictor X1, y si la inclusión de X1 agrega .01 a ese RSQ, entonces X1 es "importante" ni para la predicción ni para la explicación.
rolando2

17

Aunque a algunas personas les resulta más fácil pensar en la distinción en términos del modelo / algoritmo utilizado (por ejemplo, redes neuronales = predictivo), ese es solo un aspecto particular de la distinción explicar / predecir. Aquí hay un mazo de diapositivas que uso en mi curso de minería de datos para enseñar la regresión lineal desde ambos ángulos. Incluso con la regresión lineal sola y con este pequeño ejemplo, surgen varios problemas que conducen a diferentes modelos de objetivos explicativos versus objetivos predictivos (elección de variables, selección de variables, medidas de rendimiento, etc.)

Galit


55
Por curiosidad, ¿es intencional que en su discusión sobre la regresión para la predicción (a partir de la página 33) elija predictores (paso 1) antes de dividirlos en conjuntos de datos de capacitación y validación (paso 3)? He pensado que el procedimiento más objetivo y honesto sería la partición desde el principio, incluso antes de mirar diagramas de dispersión (paso 2). Si los regresores se eligen en función de todo el conjunto de datos, ¿no aumentaría eso los niveles de significancia aparente en muchas pruebas, incluso cuando posteriormente se aplican a los datos de validación?
whuber

Creo que la pregunta más general es si realiza la visualización de datos antes de mantener una reserva. Cuando el conjunto de datos es grande, realmente no importa. Con una muestra pequeña, usar la visualización para elegir predictores es realmente peligroso. En mis diapositivas no me refiero a usar la visualización para la selección de variables. Los "predictores selectos" son más generalmente "seleccionar un conjunto potencial de predictores disponibles que sean razonables". Se trata más de incorporar conocimiento de dominio para seleccionar un conjunto razonable.
Galit Shmueli

Continuando con el tema "Para explicar o predecir", tengo una pregunta relacionada aquí . Le agradecería que eche un vistazo, ya que la pregunta se basa principalmente en su documento.
Richard Hardy

Profesor Shmueli, usted dice en la página 291 de su artículo sobre este tema que está considerando solo 'predicción no estocástica' según lo definido por Geisser, 1993. ¿Dónde iría para encontrar la definición completa de predicción no estocástica? Me alegro de comenzar una nueva publicación también, pero pensé en preguntar aquí primero.
usuario0

11

Ejemplo: Un ejemplo clásico que he visto es en el contexto de predecir el desempeño humano. La autoeficacia (es decir, el grado en que una persona piensa que puede realizar bien una tarea) es a menudo un fuerte predictor del desempeño de la tarea. Por lo tanto, si coloca la autoeficacia en una regresión múltiple junto con otras variables como la inteligencia y el grado de experiencia previa, a menudo encuentra que la autoeficacia es un fuerte predictor.

Esto ha llevado a algunos investigadores a sugerir que la autoeficacia provoca el desempeño de la tarea. Y que las intervenciones efectivas son aquellas que se enfocan en aumentar el sentido de autoeficacia de una persona.

Sin embargo, el modelo teórico alternativo considera la autoeficacia en gran medida como consecuencia del desempeño de la tarea. Es decir, si eres bueno, lo sabrás. En este marco, las intervenciones deberían centrarse en aumentar la competencia real y la competencia no percibida.

Por lo tanto, incluir una variable como la autoeficacia podría aumentar la predicción, pero suponiendo que adopte el modelo de autoeficacia como consecuencia, no debe incluirse como un predictor si el objetivo del modelo es dilucidar los procesos causales que influyen en el rendimiento.

Por supuesto, esto plantea la cuestión de cómo desarrollar y validar un modelo teórico causal. Esto se basa claramente en múltiples estudios, idealmente con alguna manipulación experimental y un argumento coherente sobre los procesos dinámicos.

Proximal versus distal : he visto problemas similares cuando los investigadores están interesados ​​en los efectos de las causas distales y proximales. Las causas proximales tienden a predecir mejor que las causas distales. Sin embargo, el interés teórico puede ser comprender las formas en que operan las causas distales y proximales.

Problema de selección variable : Finalmente, un gran problema en la investigación en ciencias sociales es el problema de selección variable. En cualquier estudio, hay un número infinito de variables que podrían haberse medido pero que no se midieron. Por lo tanto, la interpretación de los modelos debe tener en cuenta las implicaciones de esto al hacer interpretaciones teóricas.


También hay un problema en las ciencias sociales de "hipótesis débil" (por ejemplo, el efecto es positivo versus negativo). Y en ese ejemplo de "autoeficacia", podría verlo como un predictor interno del rendimiento que cada persona ha desarrollado. Por lo tanto, probablemente sea similar a usar una predicción de "recuadro negro" como una variable explicativa.
probabilityislogic

9

Modelado estadístico: dos culturas (2001) de L. Breiman es, quizás, el mejor artículo sobre este punto. Sus principales conclusiones (ver también las respuestas de otros estadísticos prominentes al final del documento) son las siguientes:

  • "Una mayor precisión predictiva se asocia con información más confiable sobre el mecanismo de datos subyacente. La precisión predictiva débil puede llevar a conclusiones cuestionables".
  • "Los modelos algorítmicos pueden ofrecer una mejor precisión predictiva que los modelos de datos y proporcionar mejor información sobre el mecanismo subyacente".

3
Solo para hacer un enlace con una pregunta anterior relacionada: Las dos culturas: ¿estadísticas vs. aprendizaje automático?
chl

3
El problema con los modelos algorítmicos es que son difíciles de entender. Esto dificulta el diagnóstico y la solución de los posibles problemas que surgen. Un modelo estructural es mucho más fácil de evaluar porque usted sabe cómo debería ser cada componente.
probabilidadislogica

8

No he leído su trabajo más allá del resumen del artículo vinculado, pero tengo la sensación de que la distinción entre "explicación" y "predicción" debe desecharse y reemplazarse por la distinción entre los objetivos del profesional, que son " causal "o" predictivo ". En general, creo que "explicación" es una palabra tan vaga que no significa casi nada. Por ejemplo, ¿la Ley de Hooke es explicativa o predictiva? En el otro extremo del espectro, ¿son los sistemas de recomendación predictivamente precisos buenos modelos causales de calificaciones explícitas de ítems? Creo que todos compartimos la intuición de que el objetivo de la ciencia es la explicación, mientras que el objetivo de la tecnología es la predicción; y esta intuición de alguna manera se pierde teniendo en cuenta las herramientas que utilizamos, como los algoritmos de aprendizaje supervisado,

Habiendo dicho todo eso, tal vez la única palabra que aplicaría a un modelo es interpretable. Las regresiones son usualmente interpretables; Las redes neuronales con muchas capas a menudo no lo son. Creo que la gente a veces asume ingenuamente que un modelo que es interpretable está proporcionando información causal, mientras que los modelos no interpretables solo proporcionan información predictiva. Esta actitud me parece simplemente confusa.


7

Todavía no estoy claro cuál es la pregunta. Dicho esto, en mi opinión, la diferencia fundamental entre los modelos predictivos y explicativos es la diferencia en su enfoque.

Modelos explicativos

Por definición, los modelos explicativos tienen como objetivo principal el objetivo de explicar algo en el mundo real. En la mayoría de los casos, buscamos ofrecer explicaciones simples y limpias. Por simple quiero decir que preferimos la parsimonia (explique los fenómenos con el menor número de parámetros posible) y por limpio quiero decir que nos gustaría hacer declaraciones de la siguiente forma: "el efecto de cambiar por una unidad cambia por manteniendo todo lo demás constante ". Dados estos objetivos de explicaciones simples y claras, los modelos explicativos buscan penalizar los modelos complejos (utilizando criterios apropiados como AIC) y prefieren obtener variables independientes ortogonales (ya sea a través de experimentos controlados o mediante transformaciones de datos adecuadas).y βxyβ

Modelos predictivos

El objetivo de los modelos predictivos es predecir algo. Por lo tanto, tienden a centrarse menos en la parsimonia o la simplicidad, pero más en su capacidad de predecir la variable dependiente.

Sin embargo, lo anterior es algo así como una distinción artificial, ya que los modelos explicativos se pueden utilizar para la predicción y, a veces, los modelos predictivos pueden explicar algo.


+1 por mencionar la complejidad que no fue mencionada directamente por las principales respuestas. Sin embargo, el desafío surge cuando se utilizan modelos explicativos para las intervenciones. ¿Cómo se asegura que los coeficientes estimados no estén sesgados, que es un problema común resultante de la parsimonia?
Thomas Speidel el

5

como ya han dicho otros, la distinción no tiene sentido, excepto en lo que respecta a los objetivos del investigador.

Brad Efron, uno de los comentaristas en el artículo The Two Cultures , hizo la siguiente observación (como se discutió en mi pregunta anterior ):

La predicción por sí sola es solo ocasionalmente suficiente. La oficina de correos está contenta con cualquier método que prediga direcciones correctas de garabatos escritos a mano. Peter Gregory realizó su estudio con fines de predicción, pero también para comprender mejor la base médica de la hepatitis. La mayoría de las encuestas estadísticas tienen la identificación de factores causales como su objetivo final.

Ciertos campos (p. Ej., Medicina) le dan un gran peso al ajuste del modelo como proceso explicativo (la distribución, etc.), como un medio para comprender el proceso subyacente que genera los datos. Otros campos están menos preocupados por esto, y estarán contentos con un modelo de "caja negra" que tiene un éxito predictivo muy alto. Esto también puede abrirse camino en el proceso de construcción del modelo.


5

Con respeto, esta pregunta podría estar mejor enfocada. ¿Alguna vez la gente usó un término cuando el otro era más apropiado? Sí, por supuesto. A veces es lo suficientemente claro por el contexto, o no quieres ser pedante. A veces las personas son simplemente descuidadas o flojas en su terminología. Esto es cierto para muchas personas, y ciertamente no estoy mejor.

Lo que tiene valor potencial aquí (discutiendo la explicación frente a la predicción en CV), es aclarar la distinción entre los dos enfoques. En resumen, la distinción se centra en el papel de la causalidad.. Si desea comprender algunas dinámicas en el mundo y explicar por qué algo sucede de la manera en que sucede, debe identificar las relaciones causales entre las variables relevantes. Para predecir, puede ignorar la causalidad. Por ejemplo, puede predecir un efecto a partir del conocimiento sobre su causa; puede predecir la existencia de la causa a partir del conocimiento de que ocurrió el efecto; y puede predecir el nivel aproximado de un efecto al conocer otro efecto que es impulsado por la misma causa. ¿Por qué alguien querría poder hacer esto? Para aumentar su conocimiento de lo que podría suceder en el futuro, para que puedan planificar en consecuencia. Por ejemplo, una junta de libertad condicional puede querer predecir la probabilidad de que un convicto reincida en caso de libertad condicional. Sin embargo, esto no es suficiente para la explicación. Por supuesto, estimar la verdadera relación causal entre dos variables puede ser extremadamente difícil. Además, los modelos que capturan (lo que se piensa que son) las relaciones causales reales a menudo son peores para hacer predicciones. Entonces, ¿por qué hacerlo? Primero, la mayor parte de esto se hace en la ciencia, donde la comprensión se persigue por sí misma. En segundo lugar, si podemos identificar de manera confiable las causas verdaderas y desarrollar la capacidad de afectarlas, podemos ejercer cierta influencia sobre los efectos.

Con respecto a la estrategia de modelado estadístico, no hay una gran diferencia. Principalmente la diferencia radica en cómo llevar a cabo el estudio. Si su objetivo es poder predecir, averigüe qué información estará disponible para los usuarios del modelo cuando necesiten hacer la predicción. La información a la que no tendrán acceso no tiene valor. Si lo más probable es que quieran poder predecir en un cierto nivel (o dentro de un rango estrecho) de los predictores, intente centrar el rango muestreado del predictor en ese nivel y muestrear allí. Por ejemplo, si una junta de libertad condicional quiere saber sobre criminales con 2 condenas mayores, puede reunir información sobre criminales con 1, 2 y 3 condenas. Por otro lado, evaluar el estado causal de una variable básicamente requiere un experimento. Es decir, las unidades experimentales deben asignarse al azar a niveles preespecificados de las variables explicativas. Si existe preocupación acerca de si la naturaleza del efecto causal depende o no de alguna otra variable, esa variable debe incluirse en el experimento. Si no es posible realizar un verdadero experimento, entonces se enfrenta a una situación mucho más difícil, una que es demasiado compleja para entrar aquí.


1
(x,y,z,v)z(x,y,v)del análisis Re su último párrafo, hay muchas cuentas en este sitio que atestiguan diferencias marcadas en la estrategia.
whuber

1
Tienes razón, esto depende del propósito del estudio. Supongo que no hice eso explícito (solo hablé sobre lo que quieres lograr). También es cierto que la explicación no tiene que ver exactamente con la causalidad, algo similar a la causalidad también encaja (por ejemplo, las dimensiones, el caso del volumen es uno de implicación lógica / matemática). Sin embargo, la mayoría de los modelos explicativos se centran en la causalidad; Creo que pensé que podría omitir ese tipo de cosas por simplicidad. Finalmente, la estrategia difiere durante el diseño del estudio y la recopilación de datos, pero retroceder y en x es más o menos lo mismo.
gung - Restablece a Monica

Gracias por la respuesta. De otros intercambios en este sitio, he aprendido a comprender declaraciones universales como "la mayoría de los centros explicativos de modelación sobre causalidad" para reflejar los antecedentes y la experiencia del escritor, en lugar de ser literalmente cierto. En las ciencias físicas y "duras", esta afirmación puede ser correcta, pero en las ciencias sociales y "blandas" dudo que los practicantes hagan una afirmación tan fuerte. A menudo, de hecho, se cree que las relaciones en estudio tienen causas ocultas comunes pero no reflejan la causalidad directa entre los regresores y las regresiones.
whuber

@whuber es cierto que mis antecedentes y mi experiencia influyen en mis ideas. Si esta respuesta no es útil (noto que no ha recibido ningún voto), puedo eliminarla. Otros han proporcionado respuestas que cubren las ideas que pretendía transmitir.
gung - Restablece a Monica

@whuber: un buen ejemplo de causabilidad blanda es "fumar causa cáncer", aunque estoy seguro de que podría encontrar un fumador en cadena que no tenga cáncer. La noción de causalidad está interrelacionada con el momento de los eventos. La causa debe suceder antes del efecto, lo que explica por qué el ejemplo del cubo no tiene sentido.
probabilidadislogica

4

La mayoría de las respuestas han ayudado a aclarar qué son los modelos de explicación y los modelos de predicción y por qué difieren. Lo que no está claro, hasta ahora, es cómo difieren. Entonces, pensé que ofrecería un ejemplo que podría ser útil.

Supongamos que estamos interesados ​​en modelar el GPA de la universidad en función de la preparación académica. Como medidas de preparación académica, tenemos:

  1. Puntajes de prueba de aptitud;
  2. HS GPA; y
  3. Número de pruebas AP aprobadas.

Estrategia para la predicción

Si el objetivo es la predicción, podría usar todas estas variables simultáneamente en un modelo lineal y mi principal preocupación sería la precisión predictiva. Cualquiera de las variables que resulte más útil para predecir el GPA universitario se incluiría en el modelo final.

Estrategia para la explicación

Si el objetivo es la explicación, podría estar más preocupado por la reducción de datos y pensar cuidadosamente sobre las correlaciones entre las variables independientes. Mi principal preocupación sería interpretar los coeficientes.

Ejemplo

En un problema multivariado típico con predictores correlacionados, no sería raro observar coeficientes de regresión que son "inesperados". Dadas las interrelaciones entre las variables independientes, no sería sorprendente ver coeficientes parciales para algunas de estas variables que no están en la misma dirección que sus relaciones de orden cero y que pueden parecer contrarias a la intuición y difíciles de explicar.

Por ejemplo, suponga que el modelo sugiere que (teniendo en cuenta los puntajes de las pruebas de aptitud y el número de pruebas AP completadas con éxito), los GPA más altos de la escuela secundaria están asociados con los GPA más bajos de la universidad. Este no es un problema para la predicción, pero plantea problemas para un modelo explicativo donde tal relación es difícil de interpretar . Este modelo podría proporcionar lo mejor de las predicciones de la muestra, pero hace poco para ayudarnos a comprender la relación entre la preparación académica y el GPA universitario.

En cambio, una estrategia explicativa podría buscar alguna forma de reducción variable, como componentes principales, análisis factorial o SEM para:

  1. enfóquese en la variable que es la mejor medida del "rendimiento académico" y modele el GPA de College en esa variable; o
  2. use puntajes de factores / variables latentes derivadas de la combinación de las tres medidas de preparación académica en lugar de las variables originales.

Estrategias como estas podrían reducir el poder predictivo del modelo, pero pueden proporcionar una mejor comprensión de cómo se relaciona la preparación académica con el GPA universitario.


Con respecto al signo contraintuitivo, me pregunto si es porque nuestra intuición está interpretando la covariable incorrecta, como un efecto principal como si estuviera anidado o un efecto de interacción.
probabilidadislogica

3

Me gustaría ofrecer una visión centrada en el modelo al respecto.

El modelado predictivo es lo que sucede en la mayoría de los análisis. Por ejemplo, un investigador establece un modelo de regresión con un grupo de predictores. Los coeficientes de regresión representan comparaciones predictivas entre grupos. El aspecto predictivo proviene del modelo de probabilidad: la inferencia se realiza con respecto a un modelo de superpoblación que puede haber producido la población o muestra observada. El propósito de este modelo es predecir nuevos resultados para las unidades que emergen de esta superpoblación. A menudo, este es un objetivo vano porque las cosas siempre están cambiando, especialmente en el mundo social. O porque su modelo trata de unidades raras como países y no puede extraer una nueva muestra. La utilidad del modelo en este caso se deja a la apreciación del analista.

Cuando intenta generalizar los resultados a otros grupos o unidades futuras, esto sigue siendo una predicción pero de un tipo diferente. Podemos llamarlo pronóstico por ejemplo. El punto clave es que el poder predictivo de los modelos estimados es, por defecto, de naturaleza descriptiva . Usted compara un resultado entre grupos e hipotetiza un modelo de probabilidad para estas comparaciones, pero no puede concluir que estas comparaciones constituyen efectos causales.

La razón es que estos grupos pueden sufrir sesgos de selección . Es decir, naturalmente pueden tener una puntuación más alta en el resultado de interés, independientemente del tratamiento (la intervención causal hipotética). O pueden estar sujetos a un tamaño de efecto de tratamiento diferente al de otros grupos. Esta es la razón por la cual, especialmente para los datos de observación, los modelos estimados son generalmente sobre comparaciones predictivas y no explicativas. La explicación trata sobre la identificación y la estimación del efecto causal y requiere experimentos bien diseñados o el uso reflexivo de variables instrumentales. En este caso, las comparaciones predictivas se cortan de cualquier sesgo de selección y representan efectos causales. Por lo tanto, el modelo puede considerarse explicativo.

Descubrí que pensar en estos términos a menudo ha aclarado lo que realmente estaba haciendo al configurar un modelo para algunos datos.


+1, hay buena información aquí. Sin embargo, sería cauteloso con respecto a la afirmación "El modelado predictivo es lo que sucede en la mayoría de los análisis". Si el modelado predictivo es o no más común variará según la disciplina, etc. Supongo que la mayoría del modelado en la academia es explicativo, y que gran parte del modelado / minería de datos se realiza en el sector privado (por ejemplo, identificar clientes potenciales repetidos) Es predictivo. Fácilmente podría estar equivocado, pero será difícil decir, a priori, lo que sucede la mayor parte del tiempo.
gung - Restablece a Monica

1
Bueno, en mi opinión, la mayoría de los modelos de datos de observación son predictivos, incluso si el objetivo es explicativo. Si no aleatoriza la atribución del tratamiento e induce un cambio en una configuración experimental, sus coeficientes de regresión solo tendrán un valor descriptivo, es decir, solo proporcionarán los medios para realizar comparaciones predictivas. Por ejemplo, puede predecir el éxito en la escuela en función de las características demográficas, pero eso no significa que estos datos demográficos sean efectos causales explicativos. La razón es que las predicciones comparativas están expuestas al sesgo de selección.
Lionel Henry

1

Podemos aprender mucho más de lo que pensamos de los modelos "predictivos" de la caja negra. La clave está en ejecutar diferentes tipos de análisis de sensibilidad y simulaciones para comprender realmente cómo la SALIDA del modelo se ve afectada por los cambios en el espacio de ENTRADA. En este sentido, incluso un modelo puramente predictivo puede proporcionar ideas explicativas. Este es un punto que a menudo es pasado por alto o mal entendido por la comunidad investigadora. El hecho de que no comprendamos por qué funciona un algoritmo no significa que el algoritmo carece de poder explicativo ...

En general, desde un punto de vista convencional, la respuesta sucinta de Probableislogic es absolutamente correcta ...


No está claro qué "ideas explicativas" se pueden obtener de esta manera, si por esa frase implicas causalidad.
gung - Restablece a Monica

1

Hay una distinción entre lo que ella llama aplicaciones explicativas y predictivas en estadística. Ella dice que debemos saber cada vez que usamos uno u otro cuál se está utilizando exactamente. Ella dice que a menudo los mezclamos, de ahí la fusión .

Estoy de acuerdo en que en las aplicaciones de las ciencias sociales , la distinción es sensata, pero en las ciencias naturales son y deberían ser las mismas. Además, los llamo inferencia vs. predicción , y estoy de acuerdo en que en las ciencias sociales no se deben mezclar.

Comenzaré con las ciencias naturales. En física estamos enfocados en explicar, estamos tratando de entender cómo funciona el mundo, qué causa qué, etc. Entonces, el enfoque está en la causalidad, la inferencia y demás. Por otro lado, el aspecto predictivo también es parte del proceso científico. De hecho, la forma de probar una teoría, que ya explicaba bien las observaciones (piense en la muestra), es predecir nuevas observaciones y luego verificar cómo funcionó la predicción. Cualquier teoría que carezca de habilidades predictivas tendrá grandes problemas para ganar aceptación en física. Es por eso que los experimentos como el de Michelson-Morley son tan importantes.

En ciencias sociales, desafortunadamente, los fenómenos subyacentes son inestables, irrepetibles, irreproducibles. Si observa la descomposición de los núcleos, obtendrá los mismos resultados cada vez que los observe, y los mismos resultados que obtuve yo o un tipo hace cien años. No en economía o finanzas. Además, la capacidad de realizar experimentos es muy limitada, casi inexistente para todos los fines prácticos, solo observamos y realizamos muestras aleatoriasde observaciones. Puedo seguir adelante, pero la idea es que los fenómenos con los que tratamos son muy inestables, por lo tanto, nuestras teorías no son de la misma calidad que en física. Por lo tanto, una de las formas en que tratamos la situación es centrarnos en la inferencia (cuando intentas comprender qué causa qué o qué impacta) o en el pronóstico (solo di lo que crees que sucederá a esto o aquello que ignora la estructura).


0

Un modelo estructural daría explicación y un modelo predictivo daría predicción. Un modelo estructural tendría variables latentes. Un modelo estructural es una culminación simultánea de regresión y análisis factorial.

Las variables latentes se manifiestan en forma de colinealidad múltiple en modelos predictivos (regresión).

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.