Tengo un clasificador en el que estoy haciendo validación cruzada, junto con un centenar de características en las que estoy haciendo la selección hacia adelante para encontrar combinaciones óptimas de características. También comparo esto con la ejecución de los mismos experimentos con PCA, donde tomo las características potenciales, aplico SVD, transformo las señales originales en el nuevo espacio de coordenadas y uso las principales características en mi proceso de selección hacia adelante.
Mi intuición era que PCA mejoraría los resultados, ya que las señales serían más "informativas" que las características originales. ¿Mi comprensión ingenua de PCA me está llevando a problemas? ¿Alguien puede sugerir algunas de las razones comunes por las cuales la PCA puede mejorar los resultados en algunas situaciones, pero empeorarlas en otras?