¿Qué es un árbol podado y no podado en Weka?

En el árbol de decisión J48 ejemplo, cuando decimos árbol podado o sin podar, ¿cuál es la diferencia?¿Qué es un árbol podado y no podado en Weka?

Fuente

2012-07-20 London guy

Los árboles sin podar son más grandes. Lo que sucede es que, básicamente, el árbol se crea de acuerdo con el algoritmo implementado y, si la poda está habilitada, un paso adicional analiza qué nodos/ramas se pueden eliminar sin afectar demasiado el rendimiento.

La idea detrás de la poda es que, además de facilitar la comprensión del árbol, se reduce el riesgo de sobreajustar los datos de entrenamiento. Es decir, ser capaz de clasificar los datos de entrenamiento (casi) perfectamente, pero nada más porque en lugar de aprender el concepto subyacente, el árbol ha aprendido las propiedades intrínsecas y específicas de los datos de entrenamiento.

Fuente

2012-07-20 19:26:21

La primera frase puede estar equivocada. Los árboles sin podar son * más grandes *, ¿verdad? – stackoverflowuser2010

Vaya, sí, lo siento. Cambiaré eso. –

Dado que Weka es una suite de aprendizaje automático, suena como lo que se están refiriendo es la siguiente:

http://en.wikipedia.org/wiki/Pruning_(decision_trees)

En resumen, la poda de un árbol de decisión parece ser la eliminación de las posibles decisiones que no presentan muchos beneficios

Sin embargo, no he usado weka y no estoy familiarizado con él. Detener a otras respuestas y ver si lo que dicen tiene sentido primero.

Fuente

2012-07-20 19:28:08

Me gustaría agregar lo siguiente a la respuesta de Lars. Tomado de siguiente link

Muchos algoritmos intentan "podar", o simplificar, sus resultados. La poda produce menos resultados, más fáciles de interpretar. Más importante aún, la poda se puede utilizar como una herramienta para corregir el sobreajuste potencial. ...

J48 emplea dos métodos de poda.

El primero se conoce como reemplazo de subárbol. Esto significa que los nodos en un árbol de decisión pueden ser reemplazados por una hoja, básicamente reduciendo el número de pruebas a lo largo de una ruta determinada. Este proceso comienza desde las hojas del árbol completamente formado, y funciona hacia atrás, hacia la raíz.

El segundo tipo de poda utilizado en J48 se denomina aumento de subárboles. En este caso, un nodo se puede mover hacia arriba hacia la raíz del árbol, reemplazando otros nodos a lo largo del camino. El aumento de subárboles a menudo tiene un efecto insignificante en los modelos de árbol de decisión. A menudo no hay una manera clara de predecir la utilidad de la opción, aunque puede ser aconsejable intentar desactivarla si el proceso de inducción lleva mucho tiempo. Esto se debe al hecho de que la elevación del subárbol puede ser un tanto computacionalmente compleja.

Fuente

2012-07-31 11:52:14

¿Qué es un árbol podado y no podado en Weka?

Respuesta

Cuestiones relacionadas