Incidentalmente, una pregunta sobre el uso de las hojas de cálculo de Google generó opiniones contrastantes (por lo tanto, interesantes) al respecto. ¿Algunos de ustedes usan la hoja de cálculo de Google Docs para realizar y compartir su trabajo estadístico con otros?
Tengo en mente un artículo anterior que no parecía tan pesimista, pero solo se cita marginalmente en el documento que mencionó: Keeling y Pavur, un estudio comparativo de la confiabilidad de nueve paquetes de software estadístico (CSDA 2007 51: 3811). Pero ahora, encontré el tuyo en mi disco duro. También hubo un problema especial en 2008, consulte la sección Especial en Microsoft Excel 2007 , y más recientemente en el Journal of Statistical Software: On the Numerical Accuracy of Spreadsheets .
Creo que es un debate de larga data, y encontrará diversos artículos / opiniones sobre la confiabilidad de Excel para la computación estadística. Creo que hay diferentes niveles de discusión (qué tipo de análisis planea hacer, confía en el solucionador interno, ¿hay términos no lineales que ingresan a un modelo dado, etc.) y pueden surgir fuentes de imprecisión numérica? como resultado de errores informáticos adecuados o problemas de elección de diseño ; esto está bien resumido en
M. Altman, J. Gill y MP McDonald,
Problemas numéricos en informática estadística para el científico social , Wiley, 2004.
Ahora, para el análisis exploratorio de datos, hay varias alternativas que brindan capacidades mejoradas de visualización, gráficos multivariados y dinámicos, por ejemplo, GGobi , pero vea hilos relacionados en este wiki.
Pero, claramente, el primer punto que hizo aborda otro problema (IMO), a saber, el uso de una hoja de cálculo para manejar un conjunto de datos de gran tamaño: simplemente no es posible importar un gran archivo csv a Excel (estoy pensando en datos genómicos, pero se aplica a otro tipo de datos de alta dimensión). No ha sido construido para ese propósito.
R
o SAS).