En el contexto de las ciencias sociales de donde vengo, el problema es si estás interesado en (a) la predicción o (b) probar una pregunta de investigación enfocada. Si el propósito es la predicción, los enfoques basados en datos son apropiados. Si el propósito es examinar una pregunta de investigación enfocada, entonces es importante considerar qué modelo de regresión prueba específicamente su pregunta.
Por ejemplo, si su tarea consistía en seleccionar un conjunto de pruebas de selección para predecir el desempeño laboral, el objetivo puede verse en cierto sentido como uno de maximizar la predicción del desempeño laboral. Por lo tanto, los enfoques basados en datos serían útiles.
Por el contrario, si desea comprender el papel relativo de las variables de personalidad y las variables de habilidad para influir en el rendimiento, entonces un enfoque de comparación de modelo específico podría ser más apropiado.
Por lo general, al explorar preguntas de investigación enfocadas, el objetivo es dilucidar algo sobre los procesos causales subyacentes que operan en lugar de desarrollar un modelo con predicción óptima.
Cuando estoy en el proceso de desarrollar modelos sobre procesos basados en datos transversales, desconfiaré de: (a) incluir predictores que teóricamente podrían considerarse como consecuencias de la variable de resultado. Por ejemplo, la creencia de una persona de que tiene un buen desempeño es un buen predictor del desempeño laboral, pero es probable que esto se deba al menos en parte al hecho de que ha observado su propio desempeño. (b) incluyendo un gran número de predictores que reflejan todos los mismos fenómenos subyacentes. Por ejemplo, incluyendo 20 ítems, todos midiendo la satisfacción con la vida de diferentes maneras.
Por lo tanto, las preguntas de investigación centradas dependen mucho más del conocimiento específico del dominio. Esto probablemente explica de alguna manera por qué los enfoques basados en datos se usan con menos frecuencia en las ciencias sociales.