He buscado en google sobre este tema y no puedo encontrar algo que explique este algoritmo de una manera simple pero detallada.¿Por qué el algoritmo C4.5 usa la poda para reducir el árbol de decisión y cómo la poda afecta la precisión de la predicción?
Por ejemplo, sé que el algoritmo id3 no utiliza la poda en absoluto, por lo que si tiene una característica continua, las tasas de éxito de predicción serán muy bajas.
Entonces, el C4.5 para soportar características continuas usa la poda, pero ¿es esta la única razón?
También no puedo entender en la aplicación WEKA, cómo exactamente el factor de confianza afecta la eficiencia de las predicciones. Cuanto menor sea el factor de confianza, más poda hará el algoritmo, sin embargo, ¿cuál es la correlación entre la poda y la precisión de la predicción? Cuanto más podes, mejores son las predicciones o peor?
Gracias