Quiero combinar datos de diferentes fuentes.
Digamos que quiero estimar una propiedad química (por ejemplo, un coeficiente de partición ):
Tengo algunos datos empíricos, que varían debido al error de medición en torno a la media.
Y, en segundo lugar, tengo un modelo que predice una estimación a partir de otra información (el modelo también tiene cierta incertidumbre).
¿Cómo puedo combinar esos dos conjuntos de datos? [La estimación combinada se utilizará en otro modelo como predictor].
El metanálisis y los métodos bayesianos parecen ser adecuados. Sin embargo, no he encontrado muchas referencias e ideas sobre cómo implementarlo (estoy usando R, pero también estoy familiarizado con Python y C ++).
Gracias.
Actualizar
Ok, aquí hay un ejemplo más real:
Para estimar la toxicidad de un químico (típicamente expresado como= concentración donde muere el 50% de los animales) se realizan experimentos de laboratorio. Afortunadamente, los resultados de los experimentos se recopilan en una base de datos (EPA) .
Estos son algunos valores para el insecticida lindano :
### Toxicity of Lindane in ug/L
epa <- c(850 ,6300 ,6500 ,8000, 1990 ,516, 6442 ,1870, 1870, 2000 ,250 ,62000,
2600,1000,485,1190,1790,390,1790,750000,1000,800
)
hist(log10(epa))
# or in mol / L
# molecular weight of Lindane
mw = 290.83 # [g/mol]
hist(log10(epa/ (mw * 1000000)))
Sin embargo, también hay algunos modelos disponibles para predecir la toxicidad de las propiedades químicas ( QSAR ). Uno de estos modelos predice la toxicidad del coeficiente de partición octanol / agua ():
El coeficiente de partición de lindano es y la toxicidad prevista es .
lkow = 3.8
mod1 <- -0.94 * lkow - 1.33
mod1
¿Hay una buena manera de combinar estas dos informaciones diferentes (experimentos de laboratorio y predicciones de modelos)?
hist(log10(epa/ (mw * 1000000)))
abline(v = mod1, col = 'steelblue')
El combinado se usará más adelante en un modelo como predictor. Por lo tanto, un solo valor (combinado) sería una solución simple.
Sin embargo, una distribución también puede ser útil, si esto es posible en el modelado (¿cómo?).