Existen varios conjuntos de datos clásicos para tareas de clasificación / regresión de aprendizaje automático. Los más populares son:
- Conjunto de datos de flor de iris ;
- Conjunto de datos titánicos ;
- Automóviles de tendencia de motor ;
- etc.
¿Pero alguien conoce conjuntos de datos similares para el análisis de redes / teoría de grafos? Más concreto: estoy buscando conjuntos de datos estándar de oro para comparar / evaluar / aprender:
- medidas de centralidad;
- algoritmos de agrupamiento en red.
No necesito una gran lista de redes / gráficos disponibles públicamente, sino un par de conjuntos de datos que realmente deben conocerse.
EDITAR:
Es bastante difícil proporcionar características exactas para el "conjunto de datos estándar de oro", pero aquí hay algunas ideas. Creo que el conjunto de datos clásico real debería satisfacer estos criterios:
- Múltiples referencias en artículos y libros de texto;
- Inclusión en conocidos paquetes de software de análisis de red;
- Suficiente tiempo de existencia;
- Uso en varios cursos sobre análisis gráfico.
Con respecto a mi campo de interés, también necesito clases etiquetadas para vértices y / o "puntuaciones de autoridad" precalculadas (o predefinidas) (es decir, estimaciones de centralidad). Después de hacer esta pregunta, continué buscando, y aquí hay algunos ejemplos adecuados:
- Club de Karate de Zachary : introducido en 1977, citado más de 1.5k veces (según Google Scholar), los vértices tienen el atributo Facción (que se puede usar para la agrupación).
- Erdos Collaboration Network : desafortunadamente, no he encontrado esta red en forma de archivo de datos, pero es bastante famosa, y si alguien enriquece la red con los datos de especialización de matemáticos, también podría usarse para probar algoritmos de agrupamiento.