Tengo conjuntos de datos que contienen, entre muchas características, coordenadas GPS (latitud y longitud). Me gustaría utilizar estos conjuntos de datos para explorar problemas como: (1) calcular ETA para conducir entre los puntos de inicio y finalización; y (2) estimar la cantidad de delito para un punto específico.
Me gustaría usar un modelo de regresión lineal. Sin embargo, ¿puedo usar estas coordenadas GPS directamente en un modelo lineal?
La latitud y la longitud no tienen una propiedad ordinal , como la edad de una persona. Por ejemplo, los dos puntos (40.805996, -96.681473) y (41.226682, -95.986587) no parecen tener ningún orden significativo. Son solo puntos en el espacio. Estaba pensando en reemplazarlos con códigos postales categóricos de EE. UU. Y luego en hacer una codificación única , pero eso daría lugar a muchas variables.