Estoy tratando de entender cuál es la puntuación de relevancia que devuelve opencalais asociado con cada entidad? ¿Qué significa y cómo se debe interpretar? Estaría agradecido por las ideas sobre esto.Entender el puntaje de relevancia de OpenCalais
5
A
Respuesta
5
Sus estados de documentation: La capacidad de relevancia detecta la importancia de cada entidad única y asigna una puntuación de relevancia en el rango 0-1 (siendo 1 el más relevante e importante).
Si bien no explican exactamente qué significa "relevancia", cabría esperar que cuantifique la centralidad de la entidad en el discurso del documento. Es probable que esté influenciado por factores tales como las entidades que mencionan la frecuencia en este documento en comparación con su frecuencia esperada en un documento aleatorio (véase TF-IDF), pero también podría implicar un análisis del discurso más sofisticado.
Cuestiones relacionadas
- 1. ¿Puedo calcular el puntaje z con R?
- 2. Algoritmos de clasificación/relevancia de búsqueda
- 3. Entender el patrón de fábrica
- 4. Entender el despachador de Silverlight
- 5. Entender el uso de addChildViewController
- 6. Lucene: cálculo de puntaje con PrefixQuery
- 7. Clasificación por relevancia con MongoDB
- 8. Lucene: cómo obtener el puntaje de un documento
- 9. Entender el comportamiento de búfer de fwrite()
- 10. Escala de una base de datos de puntaje alto
- 11. Convertir puntaje Z (valor Z, puntaje estándar) al valor p para distribución normal en Python
- 12. Entender el iniciador de android personalizado
- 13. Cómo entender el protocolo de Kademlia (KAD)
- 14. Entender el control Uniforme de cuadrícula
- 15. ¿Cómo entender el analizador de Anorm?
- 16. cómo entender el Crash Log de iPhone
- 17. La relevancia de búsqueda de texto se mide en?
- 18. Django completo orden de búsqueda de texto por relevancia
- 19. Algoritmo/puntaje de contenido caliente con decaimiento de tiempo
- 20. ¿Qué representa un puntaje del Clasificador Bayesiano?
- 21. Entender el protocolo TLS/SSL
- 22. Entender el secreto hacia adelante
- 23. Búsqueda y visualización de resultados por relevancia en Oracle
- 24. SQL Server Conversión de texto libre: cómo ordeno por relevancia
- 25. Necesita guardar un puntaje alto para un juego de Android
- 26. ¿Cómo puedo reducir el puntaje de correo no deseado de mi mensaje de correo electrónico?
- 27. Entender Deferred.pipe()
- 28. Entender boundCenterBottom()
- 29. familias de tipos de Haskell, entender el mensaje de error
- 30. Entender las métricas de código
Gracias John. ¿Crees que es un puntaje probabilístico? Como lo expresan como un porcentaje, me preguntaba si podría ser un puntaje probabilístico, pero tengo la fuerte sensación de que no lo es. ¿Cuál es su opinión sobre esto? Mi aplicación mapea los documentos de texto a entidades importantes en ellos. ¿Qué rango de puntaje crees que indicaría que es lo suficientemente importante para ser mapeado en el documento? Estaría agradecido por su respuesta. – Ninja
Hola Ninja. Solo puedo especular, pero supongo que no es una verdadera probabilidad. Mi mejor consejo sería hacer algunos experimentos y ver qué te parece bien. Apuesto a que podría elegir un umbral razonable dentro de 10 o 15 minutos de análisis de datos. Te verás obligado a tomar una decisión sobre qué es más importante: perder entidades importantes o incluir preguntas cuestionables. Pero es bastante subjetivo. –
Ok gracias por el consejo! – Ninja