Antecedentes
Estoy diseñando una simulación de Monte Carlo que combina las salidas de series de modelos, y quiero estar seguro de que la simulación me permitirá hacer afirmaciones razonables sobre la probabilidad del resultado simulado y la precisión de esa estimación de probabilidad.
La simulación determinará la probabilidad de que un jurado proveniente de una comunidad específica condenará a un determinado acusado. Estos son los pasos de la simulación:
Utilizando los datos existentes, genere un modelo de probabilidad logística ( M ) haciendo retroceder el “voto de primera votación del jurado” en predictores demográficos.
Utilice los métodos de Monte Carlo para simular 1,000 versiones de M (es decir, 1000 versiones de los coeficientes para los parámetros del modelo).
Seleccione una de las 1,000 versiones del modelo ( M i ).
Empanel 1,000 jurados seleccionando al azar 1,000 conjuntos de 12 “jurados” de una “comunidad” ( C ) de individuos con distribuciones características demográficas específicas.
Calcule de manera determinista la probabilidad de una primera votación de voto culpable para cada miembro del jurado utilizando M i .
Convierta el voto probable de cada "miembro del jurado" en un voto determinado (en función de si es mayor o menor que el valor seleccionado al azar entre 0-1).
Determine el "voto final" de cada "jurado" utilizando un modelo (derivado de datos empíricos) de la probabilidad de que un jurado condenará, condicional a la proporción de miembros del jurado que votan por la condena en la primera votación.
Almacene la proporción de veredictos de culpabilidad para los 1000 jurados ( PG i ).
Repetir los pasos 3-8 para cada uno de los 1.000 versiones simuladas de M .
Calcular el valor medio de PG y el informe de que a medida que la estimación puntual de la probabilidad de convicción en C .
Identifique los valores de percentil 2.5 y 97.5 para PG e informe eso como un intervalo de confianza de 0.95.
Actualmente estoy usando 1,000 miembros del jurado y 1,000 jurados en la teoría de que 1,000 extractos al azar de una distribución de probabilidad (características demográficas de C o versiones de M) completarán esa distribución.
Preguntas
¿Esto me permitirá determinar con precisión la precisión de mi estimación? Si es así, ¿cuántos jurados necesito para cada cálculo de PG i para cubrir la distribución de probabilidad de C (así evito el sesgo de selección); ¿Puedo usar menos de 1,000?
¡Muchísimas gracias por toda ayuda!