Mi vector de características tiene componentes continuos (o de amplio alcance) y binarios. Si simplemente uso la distancia euclidiana, los componentes continuos tendrán un impacto mucho mayor:¿Cómo usar las características binarias y continuas en el algoritmo k-Nearest-Neighbor?
Representando simétrico vs. asimétrico como 0 y 1 y alguna relación menos importante que varía de 0 a 100, cambiando de simétrico a asimétrico tiene una pequeña distancia impacto en comparación con cambiar la proporción por 25.
Puedo agregar más peso a la simetría (por ejemplo, 0 o 100), pero ¿hay una mejor manera de hacerlo?