Depende de la distribución de los datos.
Imagine que tengo un libro con 1000 páginas escritas a máquina, y las únicas palabras en mi libro son "sí" y "no" repetidas una y otra vez y distribuidas al azar. Si me pidieran que encierre en un círculo todas las instancias de 'sí', ¿ayudaría un índice en la parte posterior del libro? Depende.
Si hubiera una distribución aleatoria mitad y mitad de sí y no, buscar en el índice no ayudaría. El índice haría que el libro fuera mucho más grande y, de todos modos, sería más rápido comenzar desde el frente y recorrer cada página buscando todas las instancias de 'sí' y rodeándolas, en lugar de buscar cada elemento en el índice y luego tomando la referencia de la entrada del índice a la página a la que se refiere.
Pero si hubiera, digamos, solo diez casos de 'sí' en mi libro de mil páginas y todo lo demás fueran solo millones de no, entonces un índice me ahorraría mucho tiempo para encontrar esos diez casos de 'sí' y rodearlos con un círculo. .
Lo mismo ocurre con las bases de datos. Si se trata de una distribución 50:50, entonces un índice no va a ayudar: el motor de la base de datos es mejor simplemente revisando los datos de principio a fin (escaneo completo de la tabla), y el índice simplemente agrandaría la base de datos, y más lento para escribir y actualizar. Pero si es algo así como una distribución de 4000: 1 (según oucil en este hilo), entonces una búsqueda de índice puede acelerarla enormemente, si es el 1 en 4000 elementos que está buscando.