Contexto: en respuesta a una pregunta anterior sobre investigación reproducible, Jake escribió
Un problema que descubrimos al crear nuestro archivo JASA fue que las versiones y los valores predeterminados de los paquetes CRAN cambiaron. Entonces, en ese archivo, también incluimos las versiones de los paquetes que utilizamos. El sistema basado en viñetas probablemente se romperá cuando la gente cambie sus paquetes (no estoy seguro de cómo incluir paquetes adicionales dentro del paquete que es el Compendio).
Finalmente, me pregunto qué hacer cuando R cambia. ¿Hay formas de producir, por ejemplo, una máquina virtual que reproduzca todo el entorno computacional utilizado para un papel de modo que la máquina virtual no sea enorme?
Pregunta:
- ¿Cuáles son buenas estrategias para garantizar que el análisis de datos reproducibles sea reproducible en el futuro (por ejemplo, cinco, diez o veinte años después de la publicación)?
- Específicamente, ¿cuáles son buenas estrategias para maximizar la reproducibilidad continua al usar Sweave y R?
Esto parece estar relacionado con la cuestión de garantizar que un proyecto de análisis de datos reproducible se ejecute en la máquina de otra persona con valores predeterminados, paquetes, etc.