Gracias de antemano por ayudarme, no soy un estadista de ningún tipo y no sé cómo describir lo que estoy imaginando, por lo que Google no me está ayudando aquí ...
Incluyo un sistema de calificación en una aplicación web en la que estoy trabajando. Cada usuario puede calificar cada elemento exactamente una vez.
Estaba imaginando una escala con 4 valores: "fuertemente disgusto", "disgusto", "me gusta" y "fuertemente me gusta", y había planeado asignar estos valores de -5, -2, +2 y +5 respectivamente .
Ahora, si cada ítem tuviera la misma cantidad de calificaciones, entonces me sentiría bastante cómodo con este sistema de puntuación, ya que diferenciaría claramente los ítems que más gustan y los que menos gustan. Sin embargo, los artículos no tendrán el mismo número de calificaciones, y la disparidad entre el número de votos en diferentes fotos puede ser bastante dramática.
En ese caso, comparar los puntajes acumulativos en dos ítems significa que un ítem antiguo con muchas calificaciones mediocres tendrá un puntaje mucho más alto que un ítem nuevo excepcional con muchos menos votos.
Entonces, la primera cosa obvia que pensé de nosotros es que tomamos un promedio ... pero ahora si un artículo tiene solo una calificación de "+5", tiene un promedio mejor que un artículo que tiene una calificación de 99 "+5". y 1 "+2" de calificación. Intuitivamente, esa no es una representación precisa de la popularidad de un artículo.
Me imagino que este problema es común y ustedes no necesitan que lo explique con más ejemplos, así que me detendré en este punto y elaboraré comentarios si es necesario.
Mis preguntas son:
- ¿Cómo se llama este tipo de problema, y hay un término para las técnicas utilizadas para resolverlo? Me gustaría saber esto para poder leerlo.
- Si conoce algún recurso amigable para el tema sobre el tema, le agradecería mucho un enlace.
- Finalmente, agradecería cualquier otra sugerencia sobre cómo recolectar y analizar efectivamente este tipo de datos.