esta pregunta comenzó como " Agrupación de datos espaciales en R " y ahora se ha movido a la pregunta DBSCAN.
Como sugirieron las respuestas a la primera pregunta, busqué información sobre DBSCAN y leí algunos documentos sobre. Han surgido nuevas preguntas.
DBSCAN requiere algunos parámetros, uno de ellos es "distancia". Como mis datos son tridimensionales, longitud, latitud y temperatura, ¿qué "distancia" debo usar? ¿Qué dimensión está relacionada con esa distancia? Supongo que debería ser la temperatura. ¿Cómo encuentro esa distancia mínima con R?
Otro parámetro es el número mínimo de puntos necesarios para formar un grupo. ¿Hay algún método para encontrar ese número? Lamentablemente no he encontrado.
Buscando en Google no pude encontrar un ejemplo de R para usar dbscan en un conjunto de datos similar al mío, ¿conoces algún sitio web con este tipo de ejemplos? Entonces puedo leer e intentar adaptarme a mi caso.
La última pregunta es que mi primer intento de R con DBSCAN (sin una respuesta adecuada a las preguntas anteriores) resultó en un problema de memoria. R dice que no puede asignar el vector. Comienzo con una cuadrícula espaciada de 4 km con 779191 puntos que termina en aproximadamente 300000 filas x 3 columnas (latitud, longitud y temperatura) al eliminar puntos SST no válidos. Cualquier sugerencia para abordar este problema de memoria. ¿Depende de mi computadora o de DBSCAN?
Gracias por la paciencia para leer un mensaje largo y probablemente aburrido y por su ayuda.