Los repositorios de datos de salud pública en los Estados Unidos se están moviendo hacia una EDAD en formato de años de incrementos de cinco años debido al impacto de las regulaciones de HIPAA con respecto al cegamiento intencional y el enmascaramiento de datos por razones de privacidad personal.
Dado este desafío a lo que había sido en el pasado (antes de HIPAA), un elemento de datos de nivel de medida bastante basado en la diferencia entre la fecha de nacimiento y la fecha de fallecimiento, es posible que debamos reconsiderar la EDAD como una variable de escala que puede ser descrito paramétricamente en todos los conjuntos de datos de salud pública, a favor de los modelos que describen la EDAD de manera no paramétrica, como un nivel ordinal de medida. Sé que esto puede parecer "exagerado" para muchas facciones dentro de la comunidad de informática biomédica, pero esta idea puede tener algún mérito en términos de "interpretación" como se describe en los comentarios anteriores.
¿Qué pasa con todo el poder analítico que está disponible para los enfoques no paramétricos? Sí, es cierto que cada uno de nosotros casi universalmente intentará aplicar las técnicas GLM (modelo lineal general) a una variable que se nos presenta en distribuciones que se comportan como AGE.
Al mismo tiempo, se debe tener en cuenta la forma de esa distribución y cómo se determina esa forma mediante los efectos de interacción de múltiples dimensiones sobre los centroides multidimensionales y los centroides de subgrupos presentes en la distribución. ¿Qué hacer con estos conjuntos de datos muy complejos?
Cuando un elemento de datos no cumple con los "supuestos del modelo", escaneamos progresivamente (dije a través, no hacia abajo; deberíamos ser empleadores de método de igualdad de oportunidades, cada herramienta viene de fábrica con la forma y las reglas de función) de otros posibles modelos para encontrar los que "no fallan" las pruebas de supuestos.
En el formato actual en los conjuntos de datos de salud pública, realmente necesitamos (como comunidad de visualización de datos) crear un modelo más estándar para manejar la EDAD en incrementos de cinco años (5YI). Mi voto para la visualización de datos de AGE (dado el nuevo formato 5YI) es usar histogramas y diagramas de caja y bigotes. Sí, esto significa la mediana. (¡Sin juego de palabras!)
A veces, una imagen realmente vale más que mil palabras, y un resumen es un resumen de mil palabras. El diagrama de caja y bigotes muestra la "forma" de la distribución como una representación simbólica significativa del histograma a un nivel casi icónico de resolución. La comparación de las distribuciones de los incrementos de cinco años de edad al mostrar diagramas de cuadro y bigote "uno al lado del otro" en los que uno puede comparar visualmente instantáneamente los patrones de 75 a 50 (mediana) con 25 valores inferiores, sería un "estándar universal" elegante para comparar AGE a través de el mundo. Para aquellos de nosotros que seguimos disfrutando de la emoción de la representación de datos a través de la mecánica textual de la visualización tabular, el diagrama de "tallo y hoja" también puede ser útil cuando se emplea como un elemento gráfico visual animado en una "línea de chispa"
La edad ha alcanzado la mayoría de edad. Es necesario explorarlo más a fondo con los algoritmos computacionales más potentes que ahora están disponibles.