Hay dos situaciones típicas diferentes para este tipo de problemas:
i) desea generar una muestra a partir de una distribución dada cuyas características de población coincidan con las especificadas (pero debido a la variación del muestreo, no tiene las características de la muestra que coincidan exactamente).
ii) desea generar una muestra cuyas características de muestra coincidan con las especificadas (pero, debido a las restricciones de hacer coincidir exactamente las cantidades de muestra con un conjunto de valores previamente especificado, en realidad no provienen de la distribución que desea).
Desea el segundo caso, pero lo obtiene siguiendo el mismo enfoque que el primer caso, con un paso de estandarización adicional.
Entonces, para las normales multivariadas, cualquiera de las dos puede hacerse de una manera bastante directa:
Con el primer caso, podría usar normales aleatorias sin la estructura de la población (como iid normal normal que tiene una expectativa 0 y una matriz de covarianza de identidad) y luego imponerla: transformar para obtener la matriz de covarianza y significar lo que desee. Si y son la media de la población y la covarianza que necesita son iid normal normal, calcule , para algunas donde (por ejemplo, se podría obtener una adecuada mediante la descomposición de Cholesky) . Entonces tiene las características de población deseadas.Σ z y = L z + μ L L L ′ = Σ L yμΣzy= L z+ μLL L′= ΣLy
Con el segundo, primero debe transformar sus normales aleatorias para eliminar incluso la variación aleatoria de la media cero y la covarianza de identidad (haciendo que la muestra signifique cero y la covarianza muestra ), luego proceda como antes. Pero ese paso inicial de eliminar la desviación de la muestra de la media exacta , la varianza interfiere con la distribución. (En muestras pequeñas puede ser bastante grave). 0 Iyonorte0 0yo
Esto se puede hacer restando la media muestral de ( ) y calculando la descomposición de Cholesky de . Si es el factor Cholesky izquierdo, entonces debe tener una media muestral 0 y una covarianza muestral de identidad. Luego puede calcular y obtener una muestra con los momentos de muestra deseados. (Dependiendo de cómo se definan las cantidades de muestra, puede haber un pequeño violín adicional involucrado con la multiplicación / división por factores como , pero es bastante fácil identificar esa necesidad).z ∗ = z - ˉ z z ∗ L ∗ z ( 0 ) = ( L ∗ ) - 1 z ∗ y = L z ( 0 ) + μ √zz∗= z- z¯z∗L∗z( 0 )= ( L∗)- 1z∗y= L z( 0 )+ μn - 1norte---√