Mis datos consisten en varias mediciones continuas y algunas variables ficticias que representan los años en que se realizaron las mediciones. Ahora, quiero aprender una red neuronal con los datos. Por lo tanto, estoy normalizando zScore todas las variables, incluidas las variables ficticias. Sin embargo, me pregunto si este es un enfoque razonable, porque la normalización de las variables ficticias altera sus rangos, lo que supongo que las hace menos comparables si sus distribuciones difieren. Por otro lado, no normalizar las variables ficticias también podría ser cuestionable, porque sin normalización su influencia en la salida de la red podría ser subóptima.
¿Cuál es el mejor enfoque para tratar con variables ficticias, normalizándolas (zScore) o simplemente dejándolas como están?