Estoy en el proceso de preparación para impartir un curso introductorio sobre ciencia de datos utilizando el lenguaje de programación R. Mi audiencia son estudiantes de pregrado con especialización en temas de negocios. Un estudiante universitario de negocios típico no tiene experiencia en programación de computadoras, pero ha tomado algunas clases que usan Excel.
Personalmente, me siento muy cómodo con R (u otros lenguajes de programación) porque me especialicé en informática. Sin embargo, tengo la sensación de que muchos de mis alumnos se sentirán recelosos de aprender un lenguaje de programación porque les puede parecer difícil.
Tengo cierta familiaridad con Excel, y creo que si bien Excel puede ser útil para la ciencia de datos simple, es necesario que los estudiantes aprendan un lenguaje de programación serio para la ciencia de datos (por ejemplo, R o Python). ¿Cómo puedo convencerme a mí mismo y a los estudiantes de que Excel es insuficiente para un estudiante serio de negocios que estudia ciencias de datos y que es necesario que aprendan algo de programación?
Editado en respuesta al comentario
Estos son algunos de los temas que trataré:
- Procesamiento de datos y limpieza de datos.
- Cómo manipular una tabla de datos, por ejemplo, seleccionar un subconjunto de filas (filtro), agregar nuevas variables (mutar), ordenar filas por columnas
- SQL se une con el paquete dplyr
- Cómo dibujar gráficos (gráficos de dispersión, gráficos de barras, histogramas, etc.) utilizando el paquete ggplot2
- Cómo estimar e interpretar modelos estadísticos como regresión lineal, regresión logística, árboles de clasificación y k-vecinos más cercanos
Como no conozco Excel muy bien, no sé si todas estas tareas se pueden hacer fácilmente en Excel.