Antecedentes:
Actualmente estoy ejecutando una gran cantidad de experimentos de variación de parámetros. Se están ejecutando en Python 2.6+, usando numpy. Estos experimentos demorarán aproximadamente 2 semanas en ejecutarse.
Aproximadamente estoy variando 3 parámetros (variables independientes) en un rango de valores. Estoy arreglando 6 variables independientes adicionales (por ahora) estoy informando sobre 4 variables dependientes.
Uno de los parámetros que estoy variando se está distribuyendo en varios procesos (y computadoras). Para cada uno de estos parámetros, genero csv
archivos separados con cada fila que contiene los valores de todas las variables (incluidas las independientes, fijas y dependientes). En toda la variación, se espera generar alrededor de 80,000 filas de datos.
La mayoría de las veces solo miro el valor de una de las variables dependientes, sin embargo, mantengo a los demás cerca, ya que pueden explicar lo que sucede cuando sucede algo inesperado.
En una versión anterior de este experimento, que variaba a través de solo 2 parámetros (cada uno aunque solo 2 valores) estaba copiando pegando este csv
archivo en un programa de hoja de cálculo y haciendo un montón de pegado de copias para hacer una tabla de solo la variable dependiente en la que estaba interesado Haciendo algunas cosas incómodas en MS-Excel para permitirme ordenar por fórmulas. Esto fue lo suficientemente doloroso para los 6 conjuntos de resultados de experimentos que tuve. Para cuando termine esta ejecución, tendré 2 órdenes de magnitud más resultados.
Pregunta:
Estaba pensando que una vez hecho esto, podría volcar todos los resultados de los csv
archivos en una base de datos, y consultar las partes que son interesantes. Luego tome esos resultados y póngalos en una hoja de cálculo para su análisis. Hacer gráficos, encontrar puntajes en relación con los resultados del control, etc.
¿Estoy pensando en la línea correcta? (¿Es esto lo que hace la gente?)
Mi base de datos está bastante oxidada en estos días, incluso cuando estaba bien, estaba usando MS-Access. Tenía la intención de usar MS-Access para esto también.