Estoy tratando de armar un modelo de regresión lineal, pero algunas de mis características no son numéricas, p. Ej. "Color del coche", mientras que otros son, por ejemplo, "Tamaño de la maquina". En casos no numéricos, no estoy seguro de cómo representar esto cuando lo agregue como una función de entrada. La única forma en que podría pensar en hacer esto sería representar cada color con un valor diferente, p. (rojo = 1, azul = 2, verde = 3 ...) sin embargo, esto no parece aceptable ya que esto implica que el verde es "mejor" que el rojo.regresión lineal utilizando categorías como características
¿Alguien puede ayudar? Estoy implementando esto en Java, así que agradecería un algoritmo expresado en este lenguaje o independiente del lenguaje.
Hasta el momento ... Solo he utilizado destacados que no fueron categóricos. – JLove