Tiene razón, los defectos en el software significan que los resultados no son confiables. Sin embargo, hay una manera de solucionarlo y crear un conjunto confiable de pruebas.
La idea es construir un pequeño arnés de prueba que pruebe la funcionalidad "básica" muy básica de cada componente del sistema de prueba (por lo general, consiste en al menos un marco y un corredor). Si el marco de prueba es lo suficientemente flexible, debería poder conectar ese arnés directamente a su sistema, por ejemplo, implementando una interfaz o proporcionando un conjunto requerido de métodos en la implementación de su arnés.
El resto de la funcionalidad debe probarse basándose únicamente en la funcionalidad "central", que ya se ha probado con el arnés. Si se ocupa de usar solo la funcionalidad del "núcleo" para probar la funcionalidad no central, tendría un conjunto de pruebas en las que puede confiar.