El análisis tradicional está bien. El análisis "tradicional" es, si se explica correctamente, una aproximación; se basa en calcular el número esperado de celdas que son 0/1 cuando hash las claves en el filtro, y luego analizar como si ese fuera el número real. El punto es que el número de celdas que son 0 (o 1) están estrechamente concentradas alrededor de sus expectativas, por lo que es una buena aproximación. Esto era bien conocido y creo que se puede encontrar, incluso en mi artículo de la encuesta con Andrei Broder.
Este documento dice que realmente el rendimiento de un filtro Bloom es una variable aleatoria (correspondiente a la fracción real de entradas 0/1), y si desea calcular ese rendimiento exactamente por alguna razón, debe hacer la combinatoria. Para filtros más pequeños, verá una diferencia posiblemente no trivial.
He hablado con los autores de este artículo. Su análisis está muy bien (aunque diría que no es profundo ni nuevo); su motivación de que el "análisis tradicional está mal" fue, creo, exagerada.