El G-Test es una forma de obtener estimaciones rápidas de una distribución chi cuadrado, y es recomendado por el autor de este conocido tutorial prueba A / B .
Esta herramienta asume una distribución normal y utiliza la diferencia de medios para calcular la confianza.
¿Cuál es la diferencia entre una prueba G y una prueba T? ¿Cuáles son los beneficios o las desventajas de usar cada método para medir la efectividad de nuestras pruebas A / B?
Estoy tratando de averiguar cuál debo usar para medir los resultados de mi marco de prueba A / B. Nuestro marco tiene dos casos de uso general: dividir el grupo de visitantes de manera uniforme, mostrar a cada uno una función diferente y medir su conversión en otra página (por ejemplo, la página de registro); y dividir el grupo de visitantes en el grupo de control (90%) y un grupo experimental (10%) para una prueba, y medir las conversiones en alguna otra página.
Nuestro sitio web recibe entre 1000 y 200,000 visitas por día (estoy siendo vago a propósito para ocultar el número verdadero, lo que no cambia mucho). Estas visitas se dividen con una distribución exponencial en aproximadamente 300 páginas.
Gracias Kevin