Aunque lo que está en juego es mayor que para el Proyecto Euler, como ha señalado, Kaggle es una excelente fuente de datos para usar en sus propios experimentos. Muchos de sus concursos requieren que inicies sesión para acceder a los conjuntos de datos (para acuerdos legales, etc.), pero si realmente no terminas una entrada, no sé de ninguna sanción.
Dicho esto, si busca conjuntos de datos que son específicos para probar procedimientos estadísticos, como los de Princeton , puede probar los datos en diferentes arquitecturas de red y compararlos con regresión simple, etc. como punto de referencia.
Consulte también aquí una lista completa, que incluye todos los datos de procesamiento del lenguaje natural de Google .
Por lo tanto, el Proyecto Euler ofrece un gran servicio con problemas específicos, pero en el caso del aprendizaje automático, puede usar los conjuntos de datos existentes con una arquitectura de su creación y comparar las "respuestas" con las conclusiones que se presentan en línea o en trabajos de investigación.