Tengo dos implementaciones de un algoritmo genético que se supone que se comportan de manera equivalente. Sin embargo, debido a restricciones técnicas que no se pueden resolver, su salida no es exactamente la misma, dada la misma entrada.
Aún así, me gustaría mostrar que no hay una diferencia de rendimiento significativa.
Tengo 20 ejecuciones con la misma configuración para cada uno de los dos algoritmos, usando diferentes semillas iniciales de números aleatorios. Para cada corrida y generación se registró el error mínimo de aptitud del mejor individuo de la población . El algoritmo emplea un mecanismo de preservación de élite, por lo que la aptitud del mejor individuo está disminuyendo monotónicamente. Una ejecución consta de 1000 generaciones, por lo que tengo 1000 valores por ejecución. No puedo obtener más datos, ya que los cálculos son muy caros.
¿Qué prueba debo emplear? Probablemente, una forma fácil sería comparar el error en las generaciones finales (de nuevo, ¿qué prueba usaría aquí)? Pero también se podría pensar en comparar el comportamiento de convergencia en general.