Suponga que tiene una variable explicativa donde representa una coordenada dada. También tiene una variable de respuesta . Ahora, podemos combinar ambas variables como:
En este caso, simplemente elegimos y es una matriz de covarianza que describe el relación entre y . Esto solo describe el valor de e en . Como tenemos más puntos de otras ubicaciones para e , podemos describir más valores de de la siguiente manera:
Notarás que reorganizamos los componentes de y para obtener todas las en una columna y luego concatenar todas las juntas. Cada componente es una función de correlación y es como arriba. La razón tenemos la covarianza es porque suponemos que es posible separar la matriz de covarianza como .
Pregunta 1: Cuando calculo el , lo que realmente estoy haciendo es generar un conjunto de valores de basado en ¿correcto? Ya tengo por lo que estaría más interesado en predecir un nuevo punto . En este caso, debería tener una matriz definida como
en el que es un vector . Por lo tanto, podemos construir un vector (sin reorganización):
Y ahora solo reorganizo para obtener una distribución conjunta y obtenga el condicional .
¿Es esto correcto?
Pregunta 2: Para predecir, el documento que estoy leyendo indica que debo usar esta distribución condicional y obtener un posterior distribución , pero no estoy seguro de cómo obtener la distribución posterior de los parámetros. Tal vez podría usar la distribución que creo es exactamente lo mismo que y luego simplemente usa el teorema de Bayes para obtener
Pregunta 3: Al final del subcapítulo, el autor dice esto:
Para la predicción, no tenemos . Esto no crea ningún problema nuevo, ya que puede tratarse como una variable latente e incorporarse en Esto solo da como resultado un sorteo adicional dentro de cada iteración de Gibbs y es una adición trivial a la tarea computacional.
¿Qué significa ese párrafo?
Por cierto, este procedimiento se puede encontrar en este documento (página 8), pero como puede ver, necesito un poco más de detalles.
¡Gracias!