Para mí, lo más importante sería "¿Este kit de herramientas tiene el algoritmo o la función que quiero probar?" Debido a que estos juegos de herramientas brindan un conjunto bastante diverso de características, primero debe intentar reducir lo que desea hacer.
Entonces, por ejemplo, si tiene un deseo ardiente de probar diferentes algoritmos de optimización evolutiva, entonces me gustaría ir con algo como Shark.
Por otro lado, prefiero dlib para la mayoría de mi trabajo, pero eso no significa necesariamente mucho, ya que lo escribí :) Sin embargo, si estás interesado en la clasificación binaria, déjame sugerir mi favorito actual método para eso, el svm_c_ekm_trainer. Frecuentemente uso esto para entrenar SVM no lineales en conjuntos de datos de cientos de miles de puntos. Por lo general, se ejecuta en unos minutos (o, a veces, incluso en segundos), mientras que el algoritmo SMO clásico para esto tardaría horas o días en finalizar.
También hubo algunas buenas respuestas a una pregunta similar formulada no hace mucho tiempo: Which machine learning library to use.
puede que también esté interesado en http://code.google.com/p/eureqa-api/ que hace que la ecuación de alto rendimiento encuentre – Inverse
Depende completamente de * qué tipo de modelo desea obtener. CRF? SVM? HMM? – bmargulies
Weka es ** increíblemente lento **. –