La forma en que se calcula la precisión y la recuperación (esto es lo que uso en mis documentos) es medir entidades entre sí. Suponiendo que la realidad del terreno tiene la siguiente (sin ninguna differentiaton en cuanto a qué tipo de entidades son)
[Microsoft Corp.] CEO [Steve Ballmer] announced the release of [Windows 7] today
Esto tiene 3 entidades.
Suponiendo que su extracción real tiene las siguientes
[Microsoft Corp.] [CEO] [Steve] Ballmer announced the release of Windows 7 [today]
Usted tiene una coincidencia exacta para Microsoft Corp
, los falsos positivos para CEO
y today
, un falso negativo para Windows 7
y un partido de subcadena para Steve
Calculamos la precisión y el recuerdo definiendo primero los criterios de coincidencia. Por ejemplo, ¿tienen que ser una coincidencia exacta? ¿Es un partido si se superponen en absoluto? ¿Importan los tipos de entidad? Por lo general, queremos proporcionar precisión y recuperación para varios de estos criterios.
Concordancia exacta: verdaderos positivos = 1 (Microsoft Corp.
, la única coincidencia exacta), Falsos Positivos = 3 (CEO
, today
, y Steve
, que no es una coincidencia exacta), falsos negativos = 2 (Steve Ballmer
y Windows 7
)
Precision = True Positives/(True Positives + False Positives) = 1/(1+3) = 0.25
Recall = True Positives/(True Positives + False Negatives) = 1/(1+2) = 0.33
cualquier superposición OK: verdaderos positivos = 2 (Microsoft Corp.
, y Steve
que se solapa Steve Ballmer
), falsos positivos = 2 (CEO
, y today
), falsos negativos = 1 (Windows 7
)
Precision = True Positives/(True Positives + False Positives) = 2/(2+2) = 0.55
Recall = True Positives/(True Positives + False Negatives) = 2/(2+1) = 0.66
El lector se deja inferir que el "rendimiento real" (la precisión y recordar que un humano de damas imparcial daría cuando se les permite utilizar humana el juicio para decidir qué discrepancias superpuestas son significativas, y cuáles no) se encuentra en algún lugar entre los dos.
También suele ser útil informar la medida F1, que es la media armónica de precisión y recuperación, y que da una idea de "rendimiento" cuando tiene que sacrificar la precisión contra la recuperación.
+1 por ser exhaustivo! – KillBill
Gran respuesta. Pregunta: ¿Qué significa "Verdadero Negativo" en este contexto? Es necesario para calcular la precisión, creo. –
Supongamos que evalúo según la segunda estrategia (la superposición es correcta). ¿Cómo lidiar con situaciones como [Steve] [Ballmer]? ¿Cómo se calculan los verdaderos positivos ya que ambas coincidencias (parciales) son correctas? –