Estoy evaluando paquetes de minería de datos.
Tengo encontrar estos dos hasta el momento: Alternativas de software de fuente abierta para minería de datos
Gracias
Estoy evaluando paquetes de minería de datos.
Tengo encontrar estos dos hasta el momento: Alternativas de software de fuente abierta para minería de datos
De acuerdo con los KDnuggets Las encuestas anuales de 2007, 2008 y 2009, RapidMiner es la solución de minería de datos de código abierto más utilizado entre los expertos en minería de datos Mundiales: KDnuggets Data Mining Tool Poll 2009
RapidMiner es de código abierto y el 100% de Java , RapidMiner es mucho más flexible y ofrece muchas más funcionalidades que Weka y KNIME.
En cuanto a las implementaciones SVM: Weka viene con una implementación de este tipo (LibSVM), mientras que RapidMiner proporciona cuatro implementaciones SVM (LibSVM, MySVM, EvoSVM, SMO-SVM), algunas de ellas con características más avanzadas.
he utilizado Weka en un curso de la escuela secundaria, y tenía un buen SVM aplicación. Esto fue hace 4 o 5 años.
Pentaho es un lindo traje para Business Intelligence. Entonces quizás quieras echarle un vistazo. Tengo algo de experiencia en esto, principalmente para el almacenamiento de datos y estaba bastante contento.
Otra alternativa sería Orange. Incluye varios algoritmos y técnicas de minería de datos a las que puede acceder directamente a través de las secuencias de comandos de Python o mediante la GUI.
¡Vuelva a inventar la rueda y el código directamente en R!
+1 por pereza, impaciencia y arrogancia. –
Como dije antes, Pentaho es una poderosa suite de Business Intelligence a la que pertenece WEKA.
Así que también recomiendo Weka, solo por el hecho de que tiene una gran solución para ampliar su aplicación y una gran comunidad también.
(KNIME) es una plataforma de minería de datos bastante extensa.
De acuerdo con la KDnuggets encuesta de 2011, RapidMiner una vez más, es la solución más ampliamente utilizado la minería de datos en todo el mundo: http://www.kdnuggets.com/2011/05/tools-used-analytics-data-mining.html
Si usted está interesado en algunos Java código relacionado con patrón de la minería frecuente, asociación reglas y secuencia secuencial de minería de datos, tengo un pequeño proyecto de código abierto que tiene 42 algoritmos relacionados con estos temas: http://www.philippe-fournier-viger.com/spmf/
Sin embargo, tenga en cuenta que no proporciona ninguna interfaz de usuario. Pero proporciona algunos algoritmos muy especializados que no encontrará en otros paquetes de minería de datos.
Eche un vistazo a ELKI, que es como WEKA, excepto que es mucho más potente en clustering y detección de valores atípicos, mientras que WEKA básicamente solo hace una buena clasificación.
Parece que Pentaho es un importante patrocinador de Weka: http://weka.sf.net –
No lo sabía. Quizás deba volver a ver a Weka. –