10

Tengo un conjunto de datos con información como la edad, la ciudad, la edad de los niños, ... y un resultado (confirmar, aceptar).¿Mejor algoritmo de aprendizaje para hacer un árbol de decisión en Java?

Para ayudar a modelar el "flujo de trabajo", quiero crear automáticamente un árbol de decisión basado en conjuntos de datos anteriores.

He echo un vistazo a http://en.wikipedia.org/wiki/Decision_tree_learning y sé que el problema no es evidente.

Solo quiero tener consejos sobre algún algoritmo o algunas librerías sobre este tema, lo que me puede ayudar en la construcción de un árbol de decisión basado en muestras.

+0

"modelisation of workflow" me confunde. ¿Qué es exactamente lo que quieres lograr? ¿Ordena automáticamente nuevos conjuntos de datos o comprueba si los conjuntos de datos existentes tienen el resultado correcto o qué? –

+1

Tenemos algunos conjuntos de datos con problemas legales. Algunos casos legales serán rechazados solo si una persona tiene menos de 18 años. Este es un ejemplo obvio pero queremos recrear automáticamente un árbol de decisión por juicio previo para hacer un modelo de la ley para editarlo y refinarlo después . Esta es la razón principal por la que no queremos una red neuronal porque no podemos volver atrás y proponer opciones –

Respuesta

13

Debe echar un vistazo al Weka, un conjunto de aprendizaje supervisado gratuito basado en Java.

Después de convertir sus datos en la Weka sencilla .arff format basado en texto, que debe ser capaz de utilizar la interfaz gráfica de usuario o de línea de comandos para entrenar y probar una variedad de diferentes clasificadores en esos datos, incluyendo:

  • árboles de decisión
  • redes neuronales
  • sistemas basados ​​en reglas
  • máquinas de vectores soporte
  • (SVMs)
  • diversos tipos de regresión

Experimentar con esta interfaz debería permitirle probar fácilmente diferentes clasificadores y parámetros de entrenamiento para determinar cuáles rinden mejor en sus datos.

También puede use an API to integrate Weka into your own source code.

+0

Quiero implementar dicho código en la plataforma Android, pero weka es demasiado grande (espacio de montón) para Android. ¿Hay alguna manera de ejecutarlo de otra manera? –

+0

@raqz: Bueno, podrías construir tu árbol de decisión en una máquina local, luego exportar el árbol en forma de código fuente java y ejecutarlo en Android. Pero eso no ayudará si realmente desea capacitarse en Android; probablemente tendrá que encontrar una alternativa a Weka. Tal vez algo que simplemente hace árboles de decisión? Google para "árbol de decisión java" muestra al menos algunos resultados. –

2

Si desea comparar el rendimiento de diferentes tipos de árboles de decisión de Weka, ver los resultados de referencia recogidos en TunedIT.org:

http://tunedit.org/results?d=UCI&a=Weka*tree.

Juega con listas desplegables y patrones de nombre de algoritmos/datasets para elegir qué resultados se deben presentar.

Cuestiones relacionadas