Sería difícil demostrar definitivamente un beneficio de rendimiento sobre el otro científicamente.
Su hipótesis es que la programación de pares aumenta el rendimiento del desarrollador y mejora la calidad. Su prueba implicará dar a un par un conjunto de requisitos restringidos a una arquitectura específica y hacer que lo implementen.
Su control en este caso es que le da los mismos requisitos a un único desarrollador de igual posición, habilidad y experiencia (según lo juzguen objetivamente sus pares) y también limitado dentro de la misma arquitectura.
Para verificar su hipótesis de rendimiento en el tiempo, los programadores de pares deben completar su trabajo en menos de la mitad del tiempo que el control. Para verificar su hipótesis sobre la calidad, debe hacer que un tercero objetivo revise el par de experimentos y el código de control, y que un grupo de control de calidad objetivo pruebe los resultados de ambos grupos sin decirles qué equipo produjo qué. El grupo de programación de pares debe tener un mejor código y menos errores.
No es un experimento perfecto, pero me encantaría saber si alguien ha intentado algo similar.
Además de esto, sin embargo, no puedo ver cómo puede demostrar de hecho que la programación de pares es superior a un solo programador en una función determinada.