La respuesta depende del tipo de relaciones que desee representar entre la característica de tiempo y la variable de destino.
Si codifica el tiempo como numérico, está imponiendo ciertas restricciones al modelo. Para un modelo de regresión lineal, el efecto del tiempo ahora es monótono, ya sea que el objetivo aumente o disminuya con el tiempo. Para los árboles de decisión, los valores de tiempo cercanos entre sí se agruparán.
Codificar el tiempo como categórico le da al modelo más flexibilidad, pero en algunos casos, el modelo puede no tener suficientes datos para aprender bien. Una técnica que puede ser útil es agrupar valores de tiempo en un cierto número de conjuntos y usar el conjunto como un atributo categórico.
Algunos grupos de ejemplos:
- Por mes, agrupe en cuartos o estaciones, dependiendo del caso de uso. Por ejemplo: enero-marzo, abril-junio, etc.
- Para la hora del día, agrupe en cubos de la hora del día: mañana, tarde, etc.
- Para el día de la semana, agrupe en día laborable, fin de semana.
Cada uno de los anteriores también se puede usar directamente como un atributo categórico, dados los datos suficientes. Además, las agrupaciones también se pueden descubrir mediante análisis de datos, para complementar un enfoque basado en el conocimiento del dominio.