Estoy buscando información sobre cómo debe organizarse un proyecto de Python Machine Learning. Para los proyectos habituales de Python existe Cookiecutter y para R ProjectTemplate .
Esta es mi estructura de carpetas actual, pero estoy mezclando Jupyter Notebooks con el código real de Python y no parece muy claro.
.
├── cache
├── data
├── my_module
├── logs
├── notebooks
├── scripts
├── snippets
└── tools
Trabajo en la carpeta de scripts y actualmente agrego todas las funciones en los archivos en my_module, pero eso genera errores al cargar datos (rutas relativas / absolutas) y otros problemas.
No pude encontrar las mejores prácticas adecuadas o buenos ejemplos sobre este tema además de algunas soluciones de competencia de kaggle y algunos cuadernos que tienen todas las funciones condensadas al comienzo de dicho cuaderno.