Estoy trabajando en un proyecto para clasificar fragmentos de texto utilizando el módulo nltk de python y el clasificador naivebayes. Puedo entrenar en datos de corpus y clasificar otro conjunto de datos, pero me gustaría proporcionar información de entrenamiento adicional en el clasificador después del entrenamiento inicial.Cómo entrenar incrementalmente un clasificador nltk
Si no me equivoco, no parece haber una manera de hacerlo, ya que el método NaiveBayesClassifier.train toma un conjunto completo de datos de entrenamiento. ¿Hay alguna manera de agregar los datos de entrenamiento sin alimentar el conjunto de características original?
Estoy abierto a sugerencias que incluyen otros clasificadores que pueden aceptar nuevos datos de entrenamiento a lo largo del tiempo.
¿Finalmente encontró una solución para este problema? – w2lame
Hackeé un poco el interior del clasificador para proporcionar nuevos datos de entrenamiento sin volver a entrenar. Fue hace mucho tiempo, así que no puedo recordar exactamente, pero creo que fue posible. No llegué lejos con el proyecto después de eso, por lo que no está en servicio activo. – Rog
Ok, gracias por responder @rog :) – w2lame