Un amigo mío ha sugerido que la industria del software necesita principalmente habilidades de "big data", no habilidades de estadística per se.
Si bien estoy parcialmente de acuerdo con el comentario de su amigo, me gustaría señalar que en cualquier industria, las herramientas de Big Data se optan, solo si todas las V están satisfechas.
Trabajo como jefe de ciencia de datos en una empresa líder de atención al cliente. Aquí, hago hackeo de datos tanto para el producto como para el crecimiento de la empresa.
Principalmente utilizo técnicas de análisis de series temporales para la predicción de abandono y el análisis de ventas. Esto también incluye el análisis de comportamiento de los clientes, la competencia y la industria.
En el lado del producto, utilizamos una gama de técnicas a partir del análisis de sentimientos utilizando LSTM, algoritmos de recomendación, etc.
Pero el foco central se encuentra en el análisis de series de tiempo. El flujo de trabajo general sería:
- Limpieza y moldeo de los datos.
- Los análisis exploratorios y explicativos que implican la identificación de la estacionalidad, las tendencias y los ciclos. Por lo tanto, uno necesita explorar correlaciones, autocorrelaciones y varias estadísticas univariadas y bivariadas; junto con un amplio trazado que incluye las curvas de dispersión, AFC, PAFC.
- Ahora viene la parte de pronóstico, donde varios modelos se prueban entre sí, teniendo en cuenta el paso 2.
Herramientas que utilizo: R, Python y Excel a veces.
E incluso la combinación de ciencia de datos y piratería de crecimiento ha demostrado ser mágica en el dominio del marketing. Por lo tanto, la demanda de estadísticos y empollones matemáticos permanecería como está; y no va a declinar en ningún lugar en el futuro cercano; especialmente cuando las startups enfocadas en el cliente están floreciendo en todo el mundo.