5

Estoy buscando una biblioteca Java que pueda hacer Reconocimiento de entidades con nombre (NER) con un vocabulario controlado personalizado, sin necesidad de etiquetar primero los datos de entrenamiento. Busqué algunos en SE, pero la mayoría de las preguntas son bastante inespecíficas.no supervisado Reconocimiento de entidades con nombre (NER) con vocabulario controlado personalizado para crosslink-suggestions en Java

Consideremos el siguiente caso de uso:

  • un editor es la introducción de artículos en un CMS (alrededor de 500 palabras).
  • el texto puede contener referencias (en texto sin formato) a las entidades de un dominio específico. por ejemplo:
    • nombres de puntos de interés, como bares, restaurantes, así como barrios, etc.
  • un vocabulario controlado de estas entidades existe (alrededor de 5.000 entidades).
    • me imagino que una entidad sea una tupla en el vocabulario
  • después de terminar el texto, el usuario debe ser capaz de guardar el documento.
  • Esto activa el flujo de trabajo para escanear la pieza de texto con el vocabulario, comparando con el nombre de la entidad. No es necesario tener una coincidencia del 100%: el 97% de Jarao-winkler o lo que sea (no estoy familiarizado con lo que utiliza el NER de algo) puede ser suficiente, necesito que esto sea configurable.
  • Los golpes se devuelven al controlador desde el servidor. A cambio, esto devuelve JSON al cliente que contiene las entidades, que se representan como enlaces cruzados sugeridos al editor.

Idealmente, estoy buscando un proyecto que use NRE para sugerir enlaces cruzados dentro de un entorno CMS para utilizarlo. (Estoy seguro de que existen complementos para wordpress, por ejemplo) no estoy tan seguro de que exista algo similar en Java.

También son bienvenidos todos los demás indicadores más generales para bibliotecas NRE que funcionan con vocabularios personalizados controlados.

Respuesta

1

No está seguro si estos podrían ser útiles: http://www-nlp.stanford.edu/software/CRF-NER.shtml http://cogcomp.cs.illinois.edu/page/software

+0

Por lo que yo puedo decir, que sólo va a hacer nombres de personas famosas/conocidas. "George Washington" aparece como persona, pero mi nombre no. – robr

Cuestiones relacionadas