"¿Cómo manejas recibir un conjunto de datos, pero no un objetivo claro?"
Esto sera comun.
Además del consejo anterior, comprenda que es esencial comprender los objetivos del negocio en el que se encuentra y de su cliente inmediato. Con frecuencia, deberá comprender el problema específico que los hizo recurrir a los datos mejor que ellos. Es muy común que se le presenten datos y un objetivo poco claro de su cliente interno o externo; por lo general, será su tarea proporcionar un objetivo que pueda lograrse con los datos y resolver el problema comercial real del cliente. Se requerirá una gran cantidad de pensamiento lateral para que el resultado de los datos y la solución comercial coincidan.
Resumiría lo anterior como "definir el objetivo es demasiado importante (¡y posiblemente demasiado difícil!) Para dejarlo al cliente (solo)".
En el contexto de aprendizaje automático, CRISP-DM es una metodología que intenta resolver este problema iterando a través de un bucle para que se pueda utilizar la comprensión de datos adicionales en la discusión con el cliente para comprender mejor el problema original. Entonces, por ejemplo, pueden indicar un objetivo mal definido, una segunda discusión después de haber hecho algo de EDA lo afinará un poco. Cuando más tarde produzca un modelo que funcione bien, pero no esté en el objetivo correcto, se acercará nuevamente al objetivo comercial real.
En otras palabras, no se preocupe demasiado por la confusión de la tarea. Espere encontrar una aspiradora y llénela a su favor.
Es un ligero cambio lateral, pero la metodología Six Sigma intenta resolver este problema en un contexto diferente con el sistema DMAIC (la 'D' significa 'Definir', en términos de 'voz del cliente'), por lo que es Es probable que se puedan obtener algunos consejos en recursos para el contexto Six Sigma (por ejemplo, ejercicios que puede hacer con un cliente que lo ayuden a expresar lo que quiere con mayor claridad)