R viene con muchos conjuntos de datos, y parece que no sería un gran problema reproducir la mayoría de los ejemplos que citó con pocas líneas de código. También puede encontrar útil el paquete mlbench , en particular los conjuntos de datos sintéticos que comienzan con mlbench.*
. Algunas ilustraciones se dan a continuación.
Encontrará ejemplos adicionales mirando la Vista de tareas del clúster en CRAN. Por ejemplo, el paquete fpc tiene un generador incorporado para conjuntos de datos de referencia agrupados "en forma de cara" ( rFace
).
Consideraciones similares se aplican a Python, donde encontrará interesantes pruebas de referencia y conjuntos de datos para la agrupación con scikit-learn .
El depósito de aprendizaje automático de UCI también alberga muchos conjuntos de datos , pero es mejor que simule datos usted mismo con el idioma que elija.