¿Qué software estadístico es adecuado para enseñar un curso introductorio de pregrado de estadística en ciencias sociales?


11

Estoy buscando un paquete de software estadístico que pueda usar en un curso introductorio de estadística para un programa de estudio de ciencias sociales. Los estudiantes no tienen conocimiento previo de estadística y tampoco tienen experiencia con lenguajes de programación. El objetivo es presentarles conceptos estadísticos básicos (como medias, varianza, suma de cuadrados, valores p, ... y finalmente regresión lineal) y permitirles realizar análisis básicos por su cuenta utilizando conjuntos de datos de ejemplo. El curso debe tratar sobre el aprendizaje de conceptos haciendo estadísticas en lugar de memorizar fórmulas (aunque creo que las fórmulas son importantes).

Por lo tanto, estoy buscando una alternativa a la sintaxis habitual (como R normal) o al software de apuntar y hacer clic (como SPSS o Rcmdr). El software debe ser fácil de aprender y debe tener una interfaz gráfica de usuario clara que visualice los conjuntos de datos y ofrezca gráficos y tablas estándar. Lo mejor sería si visualizara todos los diferentes pasos de un análisis (por ejemplo, lectura y manipulación de datos, cálculo de medidas descriptivas, elaboración de tablas y gráficos descriptivos, cálculo de medidas inferenciales, trazado de gráficos inferenciales, exportación a un informe).

¿Tiene sugerencias de software estadístico (de código abierto o gratuito) que sea adecuado para aprender y practicar primero las estadísticas?

EDITAR
Gracias por sus sugerencias. He examinado gretl y otros dos programas que he encontrado durante mi consulta en línea: RapidMiner y Statistical Lab . [1]
He descubierto que gretlla interfaz y la salida son más claras y enfocadas que, por ejemplo, Rcmdr, SPSS o Stata. Por lo tanto, es una herramienta bien calificada para comenzar a enseñar estadísticas desde mi punto de vista.
Sin embargo, la GUI del diagrama de flujo de RapidMineryStatistical Labme impresionó al visualizar los pasos individuales de un análisis estadístico (comenzando con la carga de datos). Creo que esto podría ser útil para muchos estudiantes que luchan con el enfoque habitual en las explicaciones matemáticas. Por supuesto, RapidMiner me parece demasiado sobrecargado con funciones, menús y botones para principiantes, mientras que el Laboratorio de Estadística está mucho más enfocado. La gran ventaja del Laboratorio de Estadística es la "Calculadora R" similar a una consola con un "Asistente de código R" que ayuda a producir la sintaxis real de R, ya que el Laboratorio de Estadística depende Rde sus cálculos.
Finalmente, decidí comenzar con el Laboratorio de Estadística en el primer semestre al presentar los conceptos básicos y cambiar a RStudio (y Rcmdr) en el segundo semestre.

[1]: Gnumeric, SciPy, Scilab, GNU Octave y similares me parecen menos dirigidas a las ciencias sociales.


8
@Matthias: Creo que si sus estudiantes vienen / apuntan desde / para un campo de ciencias sociales, enseñarles R como primer paso en Estadística es una exageración. La mayoría de ellos tendrá problemas con el concepto de consola, comandos, sintaxis, etc. y pasará más tiempo revisando "conceptos de programación" (lo que es "función", "bucle", etc.) que "estadísticas". Baso esto en la experiencia previa, cuando hice tutoriales para un Stats 101 en un departamento de Soc.Science; las personas no entendieron el punto de las conferencias porque se enfocaron más en hacer que R trabajara para ellos que en explorar sus datos.
usεr11852

1
@ user11852: Puede que tengas razón, pero es triste que las escuelas secundarias envíen a los estudiantes sin ninguna exposición de programación. O universidades que permiten esta brecha. No debería haber ningún estudiante que venga a una clase universitaria que no sepa qué es un bucle o función. Retrasar la exposición simplemente empuja el problema a otra parte.
curious_cat

2
@ user11852: La otra opción menos aceptable puede ser que los departamentos de Satística insistan en que las clases "Estadísticas 101 para ciencias sociales" tengan un requisito previo de alguna experiencia en programación o una clase correctiva sobre programación. En estos días, cuando casi todas las asignaturas están tan sesgadas en la computación, realmente no hay razón para que Programming-101 no sea la primera clase que todos toman.
curious_cat

66
Por lo que vale, he usado R con éxito en mi curso introductorio de estadísticas de ciencias políticas. Yo usé RStudio . También tenía "laboratorios" semanales donde permitía a los estudiantes trabajar juntos en pequeñas tareas, mientras daba vueltas y respondía preguntas. Con un código de ejemplo bien comentado, a los estudiantes les fue bien y apenas se quejaron. De hecho, se quejaron mucho menos de R que el semestre anterior cuando usé Stata. Debido a que Stata no es gratis, los estudiantes tuvieron que pasar horas de laboratorio para hacer su trabajo; lo odiaban.
Jason Morgan

66
Creo que R junto con RStudio puede ser un enfoque excelente. También prepara el escenario para la práctica de investigación reproducible, a diferencia de los sistemas de menús. Recomendaría entregar varias plantillas de código que los estudiantes pueden cargar en RStudio desde la web (RStudio lo hace fácil) y dejar que los estudiantes hagan el trabajo de cambiar nombres de variables y modelos estadísticos a lo que se necesita para el problema en cuestión.
Frank Harrell

Respuestas:


12

Tal vez Gretl? http://gretl.sourceforge.net/

Es gratis y se utiliza en nuestra Universidad para estadísticas de pregrado.


99
+1. Excelente sugerencia. Siempre he encontrado que la GUI de Gretl es intuitiva y precisa, y la retroalimentación que proporciona es precisa y sin demasiados adornos que desanimaría a algunos estudiantes menos "técnicos". Además, es gratis, está bien documentado y tiene una consola R si alguien se inclina a ver algo un poco "más profundo".
usεr11852

8

Evitaría la mayoría de las cosas "famosas", MatLab , Maple , Mathematica , JMP , SAS o Minitab , porque cuando sus estudiantes se gradúan tienen que pagar miles de dólares por año para usarlo profesionalmente. Cada compañía tiende a tener su herramienta favorita particular, y si les enseña una herramienta que su compañía no pagará, entonces su conjunto de habilidades se desperdicia. Tampoco me gustan las bibliotecas patentadas: capacitan a los usuarios para presionar botones y si el usuario quiere ir a otro lugar (JMP o lo que sea) no hay transferencia de aprendizaje.

Python inclding SciPy / NumPy es bastante bueno. Es de código abierto y está bien soportado. Tiene una gramática fácil de aprender. Todavía se interpreta para que no grite rápido, pero si no conocen ningún script o hoja de cálculo, es mucho más rápido de lo que podrían necesitar. PythonXY es una buena versión, tiene buenas bibliotecas y soporte. También me gusta que la programación GUI sea posible a través de ella. La creación de aplicaciones independientes en Windows es un poco desafiante pero probablemente muy superior al nivel de sus alumnos. (editar) Sabio y CythonMejorar sustancialmente la propuesta de valor de Python. La interfaz y la usabilidad se mejoran sustancialmente. Un código compilado que es 1000 veces más rápido que un código interpretado bastante bueno me suena genial (o sorprendente). EDITAR: Me he divertido usando las distribuciones de Anaconda (también conocida como conda), y también son muy fáciles de usar.

No soy un gran fan de Perl . Está un poco anticuado. Se trata de analizar y procesar texto más que matemáticas / ciencias. No me malinterpreten, puede hacer matemáticas / ciencias, pero si conoce VBA, entonces MSWord puede hacer matemáticas / ciencias. Ser capaz no es lo mismo que tener un trabajo en particular como enfoque principal.

Me gusta R , aunque no lo hagas, porque está siendo desarrollado agresivamente por doctores calificados en matemáticas / estadísticas. Esto significa que, a pesar de que la gramática puede ser complicada, tendrá bibliotecas actualizadas y probadas sin errores. (En general)

Excel no es un mal comienzo. Una vez que conoces una hoja de cálculo, es más fácil usar cualquier otra. En un entorno empresarial, casi todas las empresas tienen la oficina de MicroSloth , por lo que Excel no es una mala idea. No me gustan sus scripts, pero eso es solo preferencia, todavía puedo usarlo. Cuesta unos 150 dólares estadounidenses en comparación con 5000 dólares estadounidenses para algunos de los otros softwares, por lo que su costo de entrada para la gente normal es más razonable.

El lenguaje de script JMP es ajeno. No se traduce a otro software (no SAS). Mantente alejado de eso. La única característica canjeable del lenguaje es que puede (en un sentido limitado) ejecutar el código "R". Si está codificando en "R" simplemente use "R" y "RStudio".

No he usado MathCAD, así que no puedo hablar de su relevancia. Creo que es más simbólico, menos sobre la importación de datos externos. Es más barato, hasta ahora. No es gratis y abierto. Facilidad en sí no se traduce a facilidad en otro idioma. ( EDITAR ) También en esta categoría se encuentra EES , que tampoco me impresiona fuera de una ventana de uso muy estrecha.

EDITAR : LabVIEW me ha impresionado un poco . Es lo suficientemente simple de usar que unas pocas horas pueden hacer que alguien sea capaz. Funciona realmente rápido, como literalmente 1000 veces más rápido que MatLab para literalmente el mismo código ( MathScript ). Si tiene algo de trabajo pesado, vale la pena considerarlo un poco. Cuesta dinero, pero algo en el vecindario de 1/5 de hierro grande convencional.

La mejor de las suertes

EDITAR: No usaría el Laboratorio de estadísticas porque incluso cuando selecciona "inglés" para el idioma, sale en alemán, y no se desinstala en Windows 7. Ambas debilidades administrativas hacen que sea imposible. No puedo operarlo, y cuando intenté eliminarlo, falló.

Por prueba y error descubrí la configuración del menú para que se muestre en inglés. Parece ser una interfaz relativamente simple (y, por lo tanto, útil y coherente) en algunas bibliotecas R para el procesamiento y visualización de datos. Tendré que analizarlo más a fondo, así que en este punto "el jurado aún está fuera".

EDITAR más:

-> Aquí <- es un enlace divertido a otra discusión sobre herramientas y bancos de trabajo.


2
También hay RPy rpy.sourceforge.net , R como biblioteca para Python, por lo que obtienes los aspectos actualizados y probados sin errores de R con la simplicidad sintáctica de Python.
Ghillie Dhu

1
"capacitan a los usuarios para presionar botones y si el usuario quiere ir a otro lugar (JMP o lo que sea) no hay transferencia de aprendizaje". SAS, un programa propietario, no entrena particularmente bien para "presionar botones", y tener problemas para pasar entre diferentes idiomas no es una característica del software propietario solo. Diablos, estaba más en casa yendo de SysStat a JMP que de Python a R.
Fomite

@Epigrad: lo veo apagar los cerebros de los ingenieros todo el tiempo. Docenas y docenas de personas. Me alegra que haya encontrado utilidad para ello, pero espero firmemente que sea un caso atípico y que su experiencia no cambie sustancialmente la tendencia general del daño.
EngrStudent

@EngrStudent: ¡Gracias por tu esfuerzo para probar el Laboratorio de estadística! La configuración del menú para el idioma inglés no es intuitiva, pero después de configurarla una vez, no he encontrado más problemas con el idioma. Desafortunadamente, no puedo hacer que el "R-Graph Wizard" funcione, aunque el R-Graph normal funciona bien si pongo algún código R. Por lo tanto, les daré a mis alumnos algunos fragmentos de código de ejemplo para producir gráficos básicos. Tal vez cambie antes a RStudio ...
non-numeric_argument

1

Puede intentar usar Gnumeric, una hoja de cálculo altamente pensada, también hay una hoja de cálculo de Open Office. Siempre que explique las dificultades del uso de hojas de cálculo, particularmente Excel, después de la universidad en sus vidas prácticas posteriores, es posible que no tengan el lujo de algo como SPSS, pero aún podrían obtener un servicio útil de estos productos gratuitos que no son demasiado exigentes en matemáticas y habilidades de programación. . Muchos entornos de oficina contienen Excel de forma predeterminada.

Mira esto:

http://groups.google.com/group/sci.stat.math/browse_thread/thread/26fe9a9a0d91139d# - Estadísticas y Excel 2007

y busque referencias similares como

http://groups.google.com/group/comp.soft-sys.stat.spss/browse_frm/thread/3940bcd6c6266f1b/d85edd4978e53568?hl=es#d85edd4978e53568 Keeling, Kellie B. y Pavur, Robert J. (2007). Un estudio comparativo de la fiabilidad de nueve paquetes de software estadístico. Estadística computacional y análisis de datos, 51, 3811–3831.


1

He estado más calmo . La licencia es barata, como 10 dólares y proporciona tanto cálculos / gráficos como excelentes simulaciones / actividades para que los estudiantes practiquen. Además, en su sitio web, tienen algunas herramientas, principalmente en distribuciones que pueden resultarle útiles.


Esta respuesta es un poco corta. ¿Podría contarnos más sobre por qué propondrá este software y qué ventajas tiene en comparación con la competencia?
kjetil b halvorsen

1

Hemos comenzado a usar Rguroo. Este software se acaba de lanzar. Está basado en R, pero no se requiere conocimiento de codificación R. También es una aplicación web, por lo que simplemente debe iniciar sesión en un navegador. Mis alumnos pueden guardar su trabajo en cualquier etapa y volver para completar su trabajo. La interfaz gráfica de usuario es muy intuitiva y los resultados se ven geniales.


0

Hemos estado usando la versión beta de Rguroo en nuestros cursos introductorios de estadística en la Universidad Estatal de California, Fullerton, durante los últimos tres años. Ahora (agosto de 2019) han lanzado una versión oficial, consulte https://Rguroo.com. Este es un software de estadísticas de aplicaciones web que funciona en cualquier navegador. Este software está diseñado para la enseñanza y ofrece una demostración y capacitación personal para profesores; solo envíeles un correo electrónico o llámelos para organizar una demostración. El software ejecuta R en segundo plano, pero no necesita saber R, todo es apuntar y hacer clic. Tiene muchas características excelentes, que incluyen resultados detallados, excelentes herramientas gráficas, calculadora de probabilidad y herramientas de simulación. Me gustan especialmente las características de reproducibilidad donde puede guardar su trabajo en cualquier etapa y regresar y continuar donde lo dejó. También puede compartir su trabajo con los estudiantes a través de lo que llaman archivos RGR. En pocas palabras ... es genial y seguimos usándolo.


0

Yo personalmente uso el software DataMelt para la enseñanza de la estadística. Está muy bien documentado, tiene tutoriales, libros y muchos ejemplos para ver. Lo que también es importante es que uno puede buscar cualquier ejemplo, y puede obtener una respuesta razonable (en Javadoc y fragmentos de código). Los estudiantes pueden aprender no solo Python (que es el lenguaje de programación predeterminado), sino también cómo codificar métodos estadísticos en Java. En mi opinión, esta es una fortaleza importante: los estudiantes no necesitan aprender un lenguaje "estadístico" muy especializado, como R-stat. También pueden aprender Java al mismo tiempo, lo que puede abrir muchas oportunidades si deciden ir a la industria.


-1

Hay un nuevo software llamado Rguroo que es una aplicación web. Es muy conveniente de usar, ya que no requiere descargas ni instalación. Rguroo tiene un motor R, pero su uso no requiere codificación R, ya que le permite utilizar la potencia de R mediante la interfaz gráfica de apuntar y hacer clic. Cada análisis es salvable y reproducible. Hemos estado usando este software para nuestros cursos introductorios e intermedios de estadística en los últimos tres años. En este punto es gratis y puede crear una cuenta en www.Rguroo.com. Según la información que tengo, seguirá siendo gratuita para todos los profesores y tendrá un cargo de suscripción anual razonable, entre 10 y 20 dólares, para los estudiantes.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.