En el árbol de decisión J48 ejemplo, cuando decimos árbol podado o sin podar, ¿cuál es la diferencia?¿Qué es un árbol podado y no podado en Weka?
Respuesta
Los árboles sin podar son más grandes. Lo que sucede es que, básicamente, el árbol se crea de acuerdo con el algoritmo implementado y, si la poda está habilitada, un paso adicional analiza qué nodos/ramas se pueden eliminar sin afectar demasiado el rendimiento.
La idea detrás de la poda es que, además de facilitar la comprensión del árbol, se reduce el riesgo de sobreajustar los datos de entrenamiento. Es decir, ser capaz de clasificar los datos de entrenamiento (casi) perfectamente, pero nada más porque en lugar de aprender el concepto subyacente, el árbol ha aprendido las propiedades intrínsecas y específicas de los datos de entrenamiento.
Dado que Weka es una suite de aprendizaje automático, suena como lo que se están refiriendo es la siguiente:
http://en.wikipedia.org/wiki/Pruning_(decision_trees)
En resumen, la poda de un árbol de decisión parece ser la eliminación de las posibles decisiones que no presentan muchos beneficios
Sin embargo, no he usado weka y no estoy familiarizado con él. Detener a otras respuestas y ver si lo que dicen tiene sentido primero.
Me gustaría agregar lo siguiente a la respuesta de Lars. Tomado de siguiente link
Muchos algoritmos intentan "podar", o simplificar, sus resultados. La poda produce menos resultados, más fáciles de interpretar. Más importante aún, la poda se puede utilizar como una herramienta para corregir el sobreajuste potencial. ...
J48 emplea dos métodos de poda.
El primero se conoce como reemplazo de subárbol. Esto significa que los nodos en un árbol de decisión pueden ser reemplazados por una hoja, básicamente reduciendo el número de pruebas a lo largo de una ruta determinada. Este proceso comienza desde las hojas del árbol completamente formado, y funciona hacia atrás, hacia la raíz.
El segundo tipo de poda utilizado en J48 se denomina aumento de subárboles. En este caso, un nodo se puede mover hacia arriba hacia la raíz del árbol, reemplazando otros nodos a lo largo del camino. El aumento de subárboles a menudo tiene un efecto insignificante en los modelos de árbol de decisión. A menudo no hay una manera clara de predecir la utilidad de la opción, aunque puede ser aconsejable intentar desactivarla si el proceso de inducción lleva mucho tiempo. Esto se debe al hecho de que la elevación del subárbol puede ser un tanto computacionalmente compleja.
- 1. Visualización del árbol de clasificación de Weka
- 2. ¿Qué es la evaluación de un clúster en WEKA?
- 3. ¿Qué es un árbol B *?
- 4. ¿Qué es un árbol de vocabulario y cómo construir uno?
- 5. ¿Qué es un árbol sintáctico abstracto/¿Es necesario?
- 6. ¿Cuál es la diferencia entre un árbol de sintaxis abstracta y un árbol de sintaxis concreta?
- 7. Cómo usar pesas en Weka
- 8. ¿Cómo construir un árbol y?
- 9. ¿Cuál es la diferencia entre un árbol y un directorio?
- 10. ¿Qué es una página de árbol B
- 11. ¿Es O (logn) siempre un árbol?
- 12. WEKA K-Means Clustering
- 13. Atravesando y filtrando un árbol en haskell
- 14. Weka Atributo Selección
- 15. Weka GUI - ¿No hay suficiente memoria, no se cargará?
- 16. ¿Qué es un "nodo interno" en un árbol de búsqueda binario?
- 17. ¿Qué es y qué no es una historia de usuario?
- 18. ¿Cómo reconocer qué es y qué no es recursividad final?
- 19. Árbol binario GraphViz árbol izquierdo y derecho
- 20. Búsqueda recursiva de un nodo en un árbol no binario
- 21. crear un atributo de cadena en Java API weka
- 22. ¿Cómo agregar las características weka en un nuevo algoritmo?
- 23. ¿Cómo se utiliza un archivo JSON con weka
- 24. ¿Qué es un PDI y qué significa?
- 25. Agregar una nueva instancia en weka
- 26. NSFetchedResultsController - KVO, UITableView y un "Árbol"
- 27. ¿Por qué es el árbol avl más rápido para buscar que el árbol negro rojo?
- 28. ¿Cómo buscar un nodo en un árbol y devolverlo?
- 29. ¿Qué es un yeso no revisado y cómo lo verifico?
- 30. ¿Cómo se sobreutilizan deliberadamente los clasificadores de árboles Weka?
La primera frase puede estar equivocada. Los árboles sin podar son * más grandes *, ¿verdad? – stackoverflowuser2010
Vaya, sí, lo siento. Cambiaré eso. –