Respuesta

5

Sus estados de documentation: La capacidad de relevancia detecta la importancia de cada entidad única y asigna una puntuación de relevancia en el rango 0-1 (siendo 1 el más relevante e importante).

Si bien no explican exactamente qué significa "relevancia", cabría esperar que cuantifique la centralidad de la entidad en el discurso del documento. Es probable que esté influenciado por factores tales como las entidades que mencionan la frecuencia en este documento en comparación con su frecuencia esperada en un documento aleatorio (véase TF-IDF), pero también podría implicar un análisis del discurso más sofisticado.

+0

Gracias John. ¿Crees que es un puntaje probabilístico? Como lo expresan como un porcentaje, me preguntaba si podría ser un puntaje probabilístico, pero tengo la fuerte sensación de que no lo es. ¿Cuál es su opinión sobre esto? Mi aplicación mapea los documentos de texto a entidades importantes en ellos. ¿Qué rango de puntaje crees que indicaría que es lo suficientemente importante para ser mapeado en el documento? Estaría agradecido por su respuesta. – Ninja

+0

Hola Ninja. Solo puedo especular, pero supongo que no es una verdadera probabilidad. Mi mejor consejo sería hacer algunos experimentos y ver qué te parece bien. Apuesto a que podría elegir un umbral razonable dentro de 10 o 15 minutos de análisis de datos. Te verás obligado a tomar una decisión sobre qué es más importante: perder entidades importantes o incluir preguntas cuestionables. Pero es bastante subjetivo. –

+0

Ok gracias por el consejo! – Ninja

Cuestiones relacionadas