Es posible que desee echar un vistazo también al maxent classifiers (/log linear models).
Son muy populares para problemas de PNL. Las implementaciones modernas, que utilizan métodos cuasi newton para la optimización en lugar de los algoritmos de escalamiento iterativo más lentos, entrenan más rápidamente que las SVM. También parecen ser less sensitive al valor exacto del hiperparámetro de regularización. Probablemente solo deberías preferir SVM sobre maxent, si quieres usar un kernel para obtener conjunciones de características gratis.
En cuanto a las SVM frente a las redes neuronales, el uso de SVM probablemente sería mejor que usar las ANN. Al igual que los modelos de maxent, el entrenamiento de SVM es un problema de optimización convexo. Esto significa que, dado un conjunto de datos y una configuración de clasificador particular, las SVM encontrarán consistentemente la misma solución. Al entrenar redes neuronales multicapa, el sistema puede converger a varios mínimos locales. Por lo tanto, obtendrá soluciones mejores o peores según los pesos que use para inicializar el modelo.Con las RNA, deberá realizar múltiples entrenamientos para evaluar qué tan buena o mala es la configuración de un modelo dado.
¿Puede ayudarme un poco más sobre qué usar exactamente? – Arc
@ Akrid He actualizado mi comentario ... ¿eso ayuda o necesita más información? – Kiril
Muchas gracias Lirik – Arc