Recientemente me encontré con un artículo fascinante sobre la predicción de futuros rendimientos del mercado de valores. El autor presenta el siguiente gráfico y cita un R ^ 2 de 0.913. Esto haría que el método del autor fuera muy superior a cualquier cosa que haya visto sobre el tema (la mayoría argumenta que el mercado de valores es impredecible).
El autor describe su método con gran detalle y proporciona una teoría sustancial para respaldar los resultados. Luego leí un segundo artículo crítico que hacía referencia a este artículo: El mito de la previsibilidad a largo plazo . Al parecer, la gente se ha estado enamorando de esta ilusión durante décadas. Desafortunadamente, realmente no entiendo el papel.
Esto me lleva a las siguientes preguntas:
- ¿La falsa confianza de las predicciones a largo plazo surge debido al uso del mismo conjunto de datos tanto para la capacitación como para la validación del modelo? ¿El problema desaparecería si los datos de capacitación y validación se extrajeran de períodos de tiempo separados y no superpuestos?
- Además de validar en el conjunto de entrenamiento, ¿por qué este problema se vuelve más pronunciado en horizontes más largos?
- En general, ¿cómo puedo superar este problema cuando entreno modelos que deben hacer predicciones a largo plazo?