Me encontré con un nuevo artículo del grupo Berkeley PNL sobre pruebas estadísticas, Una investigación empírica de significación estadística en PNL .
Hay un seudocódigo para calcular un valor p en el documento, básicamente, la idea es que el conjunto de muestra de se muestrean con reemplazo de datos . Entonces
, dónde Es una ganancia métrica.
Pude entender la fórmula para calcular el valor p en las pruebas de significación estadística en papel de Koehn para la evaluación de traducción automática , en la que:
, dónde y son la ganancia métrica para el sistema y respectivamente.
¿Hay alguna explicación o referencia para la fórmula? . Los autores también señalaron que si la media de es y es simétrico, entonces ambas fórmulas anteriores son equivalentes.