Las redes neuronales no son mágicas. Si los trata como son y simplemente les arroja datos sin pensar que lo pasará muy mal.
Debes detenerte y preguntarte "¿Los milisegundos desde 1970 van a predecir el evento que me interesa?" La respuesta a la que debe llegar de inmediato es no. ¿Por qué? Para cada instancia que realmente le interese (eventos en el futuro, el pasado ya sucedió), la variable de tiempo tomará un valor que es mayor que cualquier valor que la variable de tiempo tomará en sus datos de entrenamiento. Tal variable es muy poco probable que ayude. Peor aún, es probable que cause un sobreajuste (un problema grave para los modelos no lineales potentes como las redes neuronales) si no tiene cuidado.
Ahora, lo que podría tener sentido es una variable como la semana del año o el mes que podría ayudarlo a modelar efectos estacionales o anuales. He trabajado en la predicción de enfermedades agrícolas, donde el día juliano terminó siendo una variable muy importante. Basado en esta experiencia, sospecho que sería mejor codificar este tipo de variable como una variable categórica en lugar de ordinal, su experiencia puede ser muy diferente. Tenga en cuenta que el mes o la semana del año son eventos repetibles que es probable que se vean muchas veces en sus datos de capacitación y es posible explicar por qué dicha variable podría afectar un resultado financiero. Compare esto con milisegundos desde 1970, que es un valor monotónicamente creciente.
Por último, de su afirmación "¿O es que alimentar el tiempo es innecesario siempre que le proporcione el resto de los datos cronológicamente?" Parece que es posible que no entiendas muy bien cómo funcionan las redes neuronales. Con una red neuronal de alimentación directa estándar, el orden en que alimente la red con sus datos no tendrá impacto en las predicciones. El orden puede afectar el entrenamiento si está usando el descenso de gradiente estocástico o mini-lote, pero esto es solo un artefacto del método de entrenamiento iterativo (en oposición al lote). Si desea modelar la dependencia temporal con una red neuronal, deberá usar algo como una ventana deslizante o una red neuronal recurrente.