No sé si esta es una práctica común / mejor, pero es otro punto de vista del asunto.
Si tiene, digamos, una fecha, puede tratar cada campo como una "variable de categoría" en lugar de una "variable continua". El día tendría un valor en el conjunto {1, 2 ..., 31}, el mes tendría un valor en {1, ..., 12} y, para el año, usted elige un valor mínimo y un valor máximo y construir un conjunto.
Luego, como los valores numéricos específicos de días, meses y años pueden no ser útiles para encontrar tendencias en los datos, use una representación binaria para codificar los valores numéricos, siendo cada bit una característica. Por ejemplo, el mes 5 sería0 0 0 0 1 0 0 0 0 0 0 0
(11 0's a a 1 en 5ta posición, cada bit es una característica)
Entonces, teniendo, por ejemplo, 10 años en el "conjunto del año", una fecha se transformaría en un vector de 43 características (= 31 + 12 + 10). Usando "vectores dispersos", la cantidad de características no debería ser un problema.
Algo similar podría hacerse para los datos de tiempo, día de la semana, día del mes ...
Todo depende de la pregunta que desee que responda su modelo de aprendizaje automático.