Análisis de línea de tiempo


10

Estoy realizando una investigación sobre la relación entre el orden de nacimiento de una persona y el riesgo posterior de obesidad utilizando datos de varias cohortes de nacimiento de 1 año (por ejemplo, http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2908417/ ).

Un desafío clave es que el orden de nacimiento está relacionado con otras características como la edad materna, el número de hermanos menores y / o mayores y el espaciamiento de los nacimientos, que también pueden influir en el resultado a través de diferentes mecanismos. Además, cualquier influencia que estas cosas tengan sobre el riesgo posterior de obesidad podría modificarse por la composición de género de los hermanos, incluido el "niño índice" (el participante en la cohorte de nacimiento).

Para cada niño índice, se podría dibujar una línea de tiempo que mostrara todos los nacimientos en la familia, con la edad materna en la variable de tiempo.

ingrese la descripción de la imagen aquí

Estoy tratando de identificar métodos para analizar este tipo de datos, donde el orden, el momento y la naturaleza de los eventos pueden ser importantes. Estoy haciendo esta pregunta aquí debido a la diversidad de aplicaciones con las que trabajan los miembros. Espero que alguien tenga algunas sugerencias inmediatas que me llevarán mucho más tiempo identificarme solo. Cualquier empujón en la dirección correcta (s) sería muy apreciado.

Pregunta (s) relacionada (s): ¿Cómo debo analizar los datos sobre los intervalos de nacimiento de las mujeres?


1
+1. La pregunta habitual: ¿tiene los datos para el IMC de los padres?
Deer Hunter

Sí, hay algunos datos antropométricos longitudinales para las madres de los niños índice. Desafortunadamente, no en los hermanos, lo que excluye cualquier análisis intra vs familiar.
DL Dahly

No hay muchas ideas útiles sobre el tema de la línea de tiempo en este momento. Es posible que desee tener la edad materna en el primer parto como otra variable independiente; Supongo que ya ha realizado análisis y visualización exploratorios ...
Deer Hunter

Claramente, es importante tener en cuenta la edad materna, razón por la cual los plazos anteriores usan la edad materna como la variable de tiempo. Supongo que lo que espero encontrar es un método alternativo que ofrezca más que simplemente arrojar todo en un modelo lineal.
DL Dahly

No estoy seguro si esto es importante, pero creo que el peso al nacer, o el peso al nacer promedio de los hijos de una mujer, podría ser una covariable interesante. Además, ¿puede proporcionar más información sobre su resultado? ¿Tienes medidas repetidas?
ReliableResearch

Respuestas:


2

Puede considerar el uso de modelos multinivel (regresión mixta) para estimar los efectos entre y dentro de la familia. Una estrategia posible es utilizar un enfoque de construcción de modelo jerárquico planificado. Por ejemplo, pruebe cada predictor potencial en un modelo univariante. Si los efectos entre familias eliminan el efecto del orden de nacimiento, sugeriría encarecidamente que el orden de nacimiento no es importante, pero que otras influencias sí lo son. Un ejemplo de cita para esto para los efectos del orden de nacimiento en el coeficiente intelectual:

Espero que esto sea útil.


+1 para una buena idea me encontré también, pero no tengo datos de resultados sobre hermanos para este análisis en particular.
DL Dahly

0

Me estoy acercando a esto como una pregunta estadística y no tengo un conocimiento especial de los problemas médicos.

Al mirar el artículo al que se refiere, veo que una cohorte contenía 970 individuos. Si tiene datos sobre varias cohortes de aproximadamente ese tamaño, entonces el tamaño general de su conjunto de datos ofrece la oportunidad de seleccionar subconjuntos razonablemente grandes en los que la línea de tiempo de cada individuo cumple con condiciones específicas. Por ejemplo, un subconjunto podría incluir, por ejemplo, todos los hombres con edad materna de 25 a 29 años. Una regresión, para tal subconjunto, de una medida adecuada de obesidad posterior contra el orden de nacimiento eliminaría cualquier posible efecto sobre la obesidad posterior de las diferencias de género del niño índice y eliminaría en gran medida cualquier posible efecto de la edad materna.

No es sencillo extender este enfoque al género de los hermanos, ya que si una condición para un subconjunto fuera, por ejemplo, que el niño índice tiene un hermano femenino mayor, eso implica que el niño índice no es en sí mismo el mayor, lo que reduce el rango de la variable independiente en la regresión. Sin embargo, una forma de evitar esto podría ser definir condiciones usando "si hay alguno". Por ejemplo, un subconjunto podría definirse para incluir a todos los hombres con edad materna de 25 a 29 años y con hermanos mayores, si los hay, todas mujeres. Tal subconjunto aún incluiría individuos con cualquier orden de nacimiento.

Si un subconjunto se definiera por un conjunto de condiciones demasiado complejo, entonces el número de individuos que contenía podría ser tan pequeño que las estimaciones resultantes de los coeficientes serían demasiado imprecisas para ser útiles. Si se adoptara este enfoque, probablemente sería necesario un compromiso decisivo, al definir subconjuntos, entre eliminar tantos efectos posibles como sea posible e incluir suficientes individuos para obtener un resultado útil.


Gracias por la respuesta Adam. En este caso, sin embargo, no creo que estratificar la muestra le diga nada más allá de un modelo ajustado de manera similar. Es muy posible que un modelo lineal correctamente especificado sea la mejor manera de hacer esto ... Solo esperaba ver si los estadísticos en otros campos abordaban problemas similares de diferentes maneras.
DL Dahly

Estoy de acuerdo, si esto es lo que está diciendo, que mi enfoque es equivalente a una regresión única en todo el conjunto de datos utilizando numerosas variables indicadoras. Tomando la edad materna como ejemplo, un problema potencial con cualquier modelo que lo trate como una variable continua es que requiere una suposición sobre la forma funcional (una relación entre la edad materna y la obesidad posterior podría ser curvilínea). Por el contrario, un modelo que utiliza un conjunto de variables indicadoras para las bandas de edad materna no necesita tal suposición y, a ese respecto, es más general.
Adam Bailey

0

Sugeriría un análisis de datos funcionales, pero sospecho que podría tener muchas familias con muy pocos hijos para obtener estimaciones razonables. Sin embargo, siga leyendo, ya que aborda sus necesidades. Quizás alguien ya lo haya usado con datos similares.

Si no desea hacer algo tan masivamente no paramétrico como eso, debe usar su experiencia clínica para reducir la dimensionalidad de los datos. Por ejemplo, una variable en su modelo podría ser la cantidad de hijos, otra podría ser la cantidad promedio de años entre niños, y así sucesivamente. Si hay algún efecto en estas variables, puede aparecer incluso si no ha especificado correctamente la forma funcional de inmediato. La construcción adicional de modelos basados ​​en el conocimiento puede permitirle construir un modelo altamente predictivo, ¡solo asegúrese de mantener un conjunto de validación!


Uso la FDA y no estoy seguro de cómo se aplica. Podría establecer x axis = 0 para cada niño índice, y tener otros hermanos trazados en +/- tiempo en ese eje; y tener la edad materna como eje y; y luego estimar un objeto de datos funcionales monótonos para cada niño índice ... pero tan pronto como hice esto, perdí toda la información sobre el número real de hermanos y dónde se ubican en la línea (porque ahora todo se resume por la función). La FDA incluye varios modos de análisis: ¿tenía en mente algo más específico?
DL Dahly
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.