11

Tenemos que decidir entre las Máquinas de Vector de Soporte y la Red Neuronal Artificial Rápida para algún proyecto de procesamiento de texto.¿Admite Vector Machine o Artificial Neural Network para procesamiento de texto?

Incluye corrección ortográfica contextual y luego etiquetar el texto con ciertas frases y sus sinónimos.

¿Cuál será el enfoque correcto? ¿O hay una alternativa a estos dos ... Algo más apropiado que FANN además de SVM?

Respuesta

12

Creo que obtendrás resultados competitivos de ambos algoritmos, por lo que debes agregar los resultados ... piensa en el aprendizaje en conjunto.

Actualización:
No sé si esto es lo suficientemente específica: utilizar Bayes clasificador óptimo para combinar la predicción de cada algoritmo. Tienes que entrenar tus dos algoritmos, luego debes entrenar al clasificador óptimo de Bayes para usar tus algoritmos y hacer predicciones óptimas basadas en la entrada de los algoritmos.

separar sus datos de entrenamiento en 3:

  • primero de conjuntos de datos serán utilizados para entrenar al (artificial) de redes neuronales y las máquinas de vectores soporte.
  • El 2do conjunto de datos se usará para entrenar al clasificador óptimo de Bayes al tomar las predicciones brutas de ANN y SVM.
  • 3er conjunto de datos será su conjunto de datos de calificación en el que probará su clasificador Bayes Optimal capacitado.

Actualización 2.0:
Otra forma de crear un conjunto de los algoritmos es el uso de 10-fold (or more generally, k-fold) cross-validation:

  • datos romperse en 10 conjuntos de tamaño n/10.
  • Entrena en 9 conjuntos de datos y prueba en 1.
  • Repite 10 veces y toma una precisión media.

Recuerde que generalmente puede combinar muchos clasificadores y métodos de validación para producir mejores resultados. Solo se trata de encontrar lo que funciona mejor para su dominio.

+0

¿Puede ayudarme un poco más sobre qué usar exactamente? – Arc

+0

@ Akrid He actualizado mi comentario ... ¿eso ayuda o necesita más información? – Kiril

+0

Muchas gracias Lirik – Arc

8

Es posible que desee echar un vistazo también al maxent classifiers (/log linear models).

Son muy populares para problemas de PNL. Las implementaciones modernas, que utilizan métodos cuasi newton para la optimización en lugar de los algoritmos de escalamiento iterativo más lentos, entrenan más rápidamente que las SVM. También parecen ser less sensitive al valor exacto del hiperparámetro de regularización. Probablemente solo deberías preferir SVM sobre maxent, si quieres usar un kernel para obtener conjunciones de características gratis.

En cuanto a las SVM frente a las redes neuronales, el uso de SVM probablemente sería mejor que usar las ANN. Al igual que los modelos de maxent, el entrenamiento de SVM es un problema de optimización convexo. Esto significa que, dado un conjunto de datos y una configuración de clasificador particular, las SVM encontrarán consistentemente la misma solución. Al entrenar redes neuronales multicapa, el sistema puede converger a varios mínimos locales. Por lo tanto, obtendrá soluciones mejores o peores según los pesos que use para inicializar el modelo.Con las RNA, deberá realizar múltiples entrenamientos para evaluar qué tan buena o mala es la configuración de un modelo dado.

+1

Aunque me encanta el blog de Hal, un dibujo realizado en MS Paint no es realmente evidencia de que la regresión logística sea menos sensible a la selección de hiperparámetros que las SVM. Muy buena respuesta de lo contrario, sin embargo. – Stompchicken

0

Puede usar Convolution Neural Network (CNN) o Recurrent Neural Network (RNN) para entrenar a NLP. Creo que CNN ha logrado lo último en tecnología ahora.