Una pregunta para cualquiera que haya utilizado la biblioteca de Java clase SimpleTagger de Mallet para Condicional Random Fields (CRF). Supongamos que ya estoy usando la opción de múltiples hilos para la cantidad máxima de CPU que tengo disponible (este es el caso): ¿dónde comenzaría, y qué tipo de cosas debería probar si necesito que corra más rápido?Mallet CRF SimpleTagger Ajuste del rendimiento
Una cuestión relacionada es si hay una manera de hacer algo similar al estocástico pendiente de descenso, lo que acelerará el proceso de formación?
El tipo de formación que quiero hacer es simple:
Input:
Feature1 ... FeatureN SequenceLabel
...
Test Data:
Feature1 ... FeatureN
...
Output:
Feature1 ... FeatureN SequenceLabel
...
(. Cuando las características son el resultado del procesamiento que he hecho en los datos en mi propio código)
que he tenido problemas para conseguir que funcione cualquier clasificador CRF que no sea Mallet, pero es posible que deba retroceder nuevamente y volver a visitar una de las otras implementaciones, o probar una nueva.
La sintonización sigue siendo un problema, pero puede paralelizar bastante fácilmente a SGD, ¡como Hogwild! muestra: http://pages.cs.wisc.edu/~brecht/papers/hogwildTR.pdf. –