2012-07-20 10 views

Respuesta

14

Los árboles sin podar son más grandes. Lo que sucede es que, básicamente, el árbol se crea de acuerdo con el algoritmo implementado y, si la poda está habilitada, un paso adicional analiza qué nodos/ramas se pueden eliminar sin afectar demasiado el rendimiento.

La idea detrás de la poda es que, además de facilitar la comprensión del árbol, se reduce el riesgo de sobreajustar los datos de entrenamiento. Es decir, ser capaz de clasificar los datos de entrenamiento (casi) perfectamente, pero nada más porque en lugar de aprender el concepto subyacente, el árbol ha aprendido las propiedades intrínsecas y específicas de los datos de entrenamiento.

+0

La primera frase puede estar equivocada. Los árboles sin podar son * más grandes *, ¿verdad? – stackoverflowuser2010

+0

Vaya, sí, lo siento. Cambiaré eso. –

1

Dado que Weka es una suite de aprendizaje automático, suena como lo que se están refiriendo es la siguiente:

http://en.wikipedia.org/wiki/Pruning_(decision_trees)

En resumen, la poda de un árbol de decisión parece ser la eliminación de las posibles decisiones que no presentan muchos beneficios

Sin embargo, no he usado weka y no estoy familiarizado con él. Detener a otras respuestas y ver si lo que dicen tiene sentido primero.

5

Me gustaría agregar lo siguiente a la respuesta de Lars. Tomado de siguiente link

Muchos algoritmos intentan "podar", o simplificar, sus resultados. La poda produce menos resultados, más fáciles de interpretar. Más importante aún, la poda se puede utilizar como una herramienta para corregir el sobreajuste potencial. ...

J48 emplea dos métodos de poda.

El primero se conoce como reemplazo de subárbol. Esto significa que los nodos en un árbol de decisión pueden ser reemplazados por una hoja, básicamente reduciendo el número de pruebas a lo largo de una ruta determinada. Este proceso comienza desde las hojas del árbol completamente formado, y funciona hacia atrás, hacia la raíz.

El segundo tipo de poda utilizado en J48 se denomina aumento de subárboles. En este caso, un nodo se puede mover hacia arriba hacia la raíz del árbol, reemplazando otros nodos a lo largo del camino. El aumento de subárboles a menudo tiene un efecto insignificante en los modelos de árbol de decisión. A menudo no hay una manera clara de predecir la utilidad de la opción, aunque puede ser aconsejable intentar desactivarla si el proceso de inducción lleva mucho tiempo. Esto se debe al hecho de que la elevación del subárbol puede ser un tanto computacionalmente compleja.

Cuestiones relacionadas