Esta es una situación simple; vamos a mantenerlo así. La clave es concentrarse en lo que importa:
Obtención de una descripción útil de los datos.
Evaluar las desviaciones individuales de esa descripción.
Evaluar el posible papel y la influencia del azar en la interpretación.
Mantener la integridad intelectual y la transparencia.
Todavía hay muchas opciones y muchas formas de análisis serán válidas y efectivas. Vamos a ilustrar un enfoque aquí que se puede recomendar por su adherencia a estos principios clave.
Para mantener la integridad, dividamos los datos en mitades: las observaciones de 1972 a 1990 y las de 1991 a 2009 (19 años en cada una). Ajustaremos los modelos a la primera mitad y luego veremos qué tan bien funcionan los ajustes al proyectar la segunda mitad. Esto tiene la ventaja adicional de detectar cambios significativos que pueden haber ocurrido durante la segunda mitad.
Para obtener una descripción útil, necesitamos (a) encontrar una manera de medir los cambios y (b) ajustar el modelo más simple posible apropiado para esos cambios, evaluarlo y ajustar iterativamente los más complejos para acomodar las desviaciones de los modelos simples.
(a) Tiene muchas opciones: puede ver los datos sin procesar; puedes ver sus diferencias anuales; puede hacer lo mismo con los logaritmos (para evaluar los cambios relativos); puede evaluar los años de vida perdidos o la esperanza de vida relativa (RLE); o muchas otras cosas Después de pensarlo un poco, decidí considerar el RLE, definido como la proporción de la esperanza de vida en la Cohorte B en relación con la de la Cohorte A. (referencia) Afortunadamente, como muestran los gráficos, la esperanza de vida en la Cohorte A está aumentando regularmente en un período estable. moda con el tiempo, por lo que la mayor parte de la variación de aspecto aleatorio en el RLE se debe a cambios en la cohorte B.
(b) El modelo más simple posible para comenzar es una tendencia lineal. Veamos qué tan bien funciona.
Los puntos azul oscuro en este gráfico son los datos retenidos para el ajuste; Los puntos dorados claros son los datos posteriores, no se utilizan para el ajuste. La línea negra es el ajuste, con una pendiente de .009 / año. Las líneas discontinuas son intervalos de predicción para valores futuros individuales.
En general, el ajuste se ve bien: el examen de los residuos (ver más abajo) no muestra cambios importantes en sus tamaños a lo largo del tiempo (durante el período de datos 1972-1990). (Hay algunos indicios de que tendieron a ser más grandes desde el principio, cuando las expectativas de vida eran bajas. Podríamos manejar esta complicación sacrificando algo de simplicidad, pero es poco probable que los beneficios para estimar la tendencia sean grandes). Hay una pequeña pista. de correlación en serie (exhibida por algunas corridas de residuos positivos y corridas de residuos negativos), pero claramente esto no es importante. No hay valores atípicos, lo que se indicaría mediante puntos más allá de las bandas de predicción.
La única sorpresa es que en 2001 los valores cayeron repentinamente a la banda de predicción más baja y permanecieron allí: algo bastante repentino y grande sucedió y persistió.
Aquí están los residuos, que son las desviaciones de la descripción mencionada anteriormente.
Como queremos comparar los residuos con 0, las líneas verticales se dibujan al nivel cero como una ayuda visual. Nuevamente, los puntos azules muestran los datos utilizados para el ajuste. Los de oro claro son los residuos de datos que caen cerca del límite inferior de predicción, posterior a 2000.
De esta cifra podemos estimar que el efecto del cambio 2000-2001 fue de aproximadamente -0.07 . Esto refleja una caída repentina de 0.07 (7%) de una vida útil completa dentro de la Cohorte B. Después de esa caída, el patrón horizontal de residuos muestra que la tendencia anterior continuó, pero en el nuevo nivel inferior. Esta parte del análisis debe considerarse exploratoria : no se planificó específicamente, pero surgió debido a una sorprendente comparación entre los datos retenidos (1991-2009) y el ajuste al resto de los datos.
10- 7
Parece que no hay razón para ajustar un modelo más complicado a estos datos, al menos no con el propósito de estimar si hay una tendencia genuina en el RLE a lo largo del tiempo: hay una. Podríamos ir más allá y dividir los datos en valores anteriores a 2001 y posteriores a 2000 para refinar nuestras estimaciones.de las tendencias, pero no sería completamente honesto realizar pruebas de hipótesis. Los valores p serían artificialmente bajos, porque las pruebas de división no se planificaron por adelantado. Pero como ejercicio exploratorio, tal estimación está bien. ¡Aprenda todo lo que pueda de sus datos! Solo tenga cuidado de no engañarse con el sobreajuste (que es casi seguro que suceda si usa más de media docena de parámetros o usa técnicas de ajuste automatizadas), o fisgonea los datos: esté alerta a la diferencia entre la confirmación formal y la informal (pero valiosa) exploración de datos.
Resumamos:
Al seleccionar una medida adecuada de esperanza de vida (RLE), mantener la mitad de los datos, ajustar un modelo simple y probar ese modelo con los datos restantes, hemos establecido con gran confianza que : había una tendencia constante; ha estado cerca de lineal durante un largo período de tiempo; y hubo una repentina caída persistente en RLE en 2001.
Nuestro modelo es sorprendentemente parsimonioso : requiere solo dos números (una pendiente y una intersección) para describir los datos iniciales con precisión. Necesita un tercero (la fecha del receso, 2001) para describir una desviación obvia pero inesperada de esta descripción. No hay valores atípicos en relación con esta descripción de tres parámetros. El modelo no mejorará sustancialmente caracterizando la correlación en serie (el enfoque de las técnicas de series de tiempo en general), intentando describir las pequeñas desviaciones individuales (residuos) exhibidas o introduciendo ajustes más complicados (como agregar un componente de tiempo cuadrático) o cambios de modelado en los tamaños de los residuos a lo largo del tiempo).
La tendencia ha sido 0.009 RLE por año . Esto significa que con cada año que pasa, a la expectativa de vida dentro de la Cohorte B se le ha agregado 0.009 (casi 1%) de una vida normal esperada completa. En el transcurso del estudio (37 años), eso equivaldría a 37 * 0.009 = 0.34 = un tercio de una mejora total de por vida. El retroceso en 2001 redujo esa ganancia a aproximadamente 0.28 de toda una vida de 1972 a 2009 (aunque durante ese período la esperanza de vida general aumentó un 10%).
Aunque este modelo podría mejorarse, probablemente necesitaría más parámetros y es improbable que la mejora sea excelente (como lo atestigua el comportamiento casi aleatorio de los residuos). En general, deberíamos contentarnos con llegar a una descripción tan compacta, útil y simple de los datos para tan poco trabajo analítico.