Recientemente he aprendido que una de las formas de encontrar mejores soluciones para los problemas de LA es mediante la creación de funciones. Se puede hacer eso, por ejemplo, sumando dos características.
Por ejemplo, poseemos dos características: "ataque" y "defensa" de algún tipo de héroe. Luego creamos una característica adicional llamada "total" que es una suma de "ataque" y "defensa". Ahora, lo que me parece extraño es que incluso el "ataque" y la "defensa" difíciles se correlacionan casi perfectamente con el "total", aún obtenemos información útil.
¿Cuál es la matemática detrás de eso? ¿O estoy razonando mal?
Además, ¿no es un problema, para clasificadores como kNN, que "total" siempre será mayor que "ataque" o "defensa"? Por lo tanto, incluso después de la estandarización, ¿tendremos características que contengan valores de diferentes rangos?