A veces es útil imaginar el objetivo de dicho análisis y lo que una empresa puede hacer sin uno. Supongamos que la empresa a la que pertenecen los datos de rotación desea hacer algo en contra de una tasa de rotación (posiblemente) alta. Me imagino dos acciones posibles
- Averiguar lo que está impulsando a la gente a salir y solucionar este problema (no hay suficiente cuidado de la salud? N teamspirit?) , En general,
- Encuentre a los empleados que están considerando irse y hable con ellos, descubriendo qué los impulsa a solucionar los problemas específicamente para ellos.
Entonces, por qué es importante ?
Los gráficos de elevación son principalmente importantes para el segundo caso de uso. ¿Imagina lo que puede hacer una empresa cuando ha decidido invertir dinero hablando con los empleados 1 a 1 pero no tiene un modelo? La única opción es hablar con todos o con todos en una muestra aleatoria de un tamaño fijo. Hablar con todos, a pesar de la ganancia de identificar a todos los posibles partidarios, es demasiado costoso. Pero cuando solo se selecciona una muestra aleatoria para hablar, solo se identifica una fracción de todos los posibles partícipes mientras se sigue gastando mucho dinero. En ambos casos, la relación costo-por-licencia-prevención es bastante alta.
Pero cuando existe un buen modelo, la compañía puede decidir hablar solo con aquellos que tienen la mayor probabilidad de irse (aquellos con los puntajes más altos de acuerdo con el modelo), de modo que se identifique a más posibles partícipes, optimizando así el costo por -prevención-abandono .
Eche un vistazo nuevamente a las dos primeras tablas aquí: http://www2.cs.uregina.ca/~dbd/cs831/notes/lift_chart/lift_chart.html . Digamos que "clientes" = "empleados" y "encuestados positivos" = "posibles partícipes" (ver datos a continuación).
Si la compañía decide que solo puede gastar suficiente dinero para hablar con 10000 empleados, identificará
- 20000100000∗ 10000 = 2000 separadores se identifican sin un modelo
- 600010000∗ 10000 = 6000 separadores se identifican con el modelo (seleccionando solo los mejores 10000 según la puntuación del modelo)
lo que significa
- una mejora del factor que se representa como punto (10%, 3) en el gráfico de elevación .60002000= 3
- Se han identificado 6000 de 20000 total de partidores, es decir, 30%, que se representa como (10%, 30%) en la tabla de ganancias . La línea de base aquí es solo del 10%, porque al tomar una muestra aleatoria de 10000 empleados, solo se identifica de todos los posibles partidores .10000 * ( 20000 / 100000 )20000=10000100000= 0.1
El eje x en ambos casos muestra el porcentaje de empleados contactados, en este ejemplo específico 10%.
Apéndice
Los datos utilizados para hacer esta pregunta independiente de la pudrición del enlace.
Tasa global
Total de empleados contactados identificados
100000 20000
Efectividad del modelo cuando se contacta a los empleados en trozos de 10000
Total de empleados contactados identificados
10000 6000
20000 10000
30000 13000
40000 15800
50000 17000
60000 18000
70000 18800
80000 19400
90000 19800
100000 20000