¿Qué tipo de trabajo se ha realizado para determinar si una cadena específica pertenece a una ubicación geográfica? Por ejemplo:Identificación de ubicaciones geográficas en el texto
'troy, ny'
'austin, texas'
'hotels in las vegas, nv'
supongo que lo que estoy esperando es una especie de un enfoque estadístico que da un grado de confianza en que los dos primeros son ubicaciones. El último probablemente requiera una heurística que capture "% s,% s" y luego use la misma técnica. Estoy buscando específicamente enfoques que no se basen demasiado en la proposición 'en', ya que no es un indicador de ubicación completamente inequívoco o consistentemente disponible.
¿Alguien me puede indicar enfoques, documentos o utilidades existentes? ¡Gracias!
que los mapas cadenas individuales a lugares, pero no es útil para encontrar lugares dentro de texto arbitrario. – jpatokal