Ok, tengo el siguiente código para entrenar el Identificador de NER OpenNLP¿Cómo entreno un identificador de identificador de entidad con nombre en OpenNLP?
FileReader fileReader = new FileReader("train.txt");
ObjectStream fileStream = new PlainTextByLineStream(fileReader);
ObjectStream sampleStream = new NameSampleDataStream(fileStream);
TokenNameFinderModel model = NameFinderME.train("pt-br", "train", sampleStream, Collections.<String, Object>emptyMap());
nfm = new NameFinderME(model);
No sé si estoy haciendo algo mal si falta algo, pero la clasificación no está funcionando. Supongo que el tren.txt está mal.
El error que ocurre es que todos los tokens se clasifican en un solo tipo.
Mi información train.txt es algo así como el siguiente ejemplo, pero con mucha más variación y cantidad de entradas. Otra cosa es que estoy clasificando palabra por palabra de un texto por vez, y no todos los tokens.
<START:distance> 8000m <END>
<START:temperature> 100ºC <END>
<START:weight> 50kg <END>
<START:name> Renato <END>
¿Alguien puede mostrar lo que estoy haciendo mal?
¿Podría decirme qué versión de OpenNLP está utilizando? Porque estoy usando OpenNLP 1.5.1 y no hay ningún archivo de modelo para la temperatura, distancia y peso. –
@ raj.singh No estoy usando OpenNLP. Estoy codificando mi propio clasificador para mis propósitos ahora. –
Hola @Renato Dinhani, tengo el mismo problema, ¿me pueden ayudar, cómo lo han resuelto en su aplicación? Obtuve este error cuando voy a nosotros mi excepción train.txt: java.security.NoSuchAlgorithmException –