Me gustaría analizar cada token en un texto y saber si es un lugar geográfico o ubicación (ciudad, país, etc.).lugar o base de datos de ubicación
¿Existe una base de datos descargable de lugares y ubicaciones?
Me gustaría analizar cada token en un texto y saber si es un lugar geográfico o ubicación (ciudad, país, etc.).lugar o base de datos de ubicación
¿Existe una base de datos descargable de lugares y ubicaciones?
Debería consultar la base de datos de nombres de lugares del proyecto OpenStreetMap. Puede buscar en el llamado Nominatim para ver si cumple con sus necesidades, y si lo hace, descargue el OpenStreetMap data. La forma más común de usar OSM es cargar los datos en una base de datos PostgreSQL. Si no necesita características completas de representación geográfica y de mapas, probablemente sea posible extraer los nombres de los lugares.
El archivo de todos los datos de OSM es enorme, pero hay extractos disponibles de continentes, países y ciudades.
Quizás liar con esto:
información de posición Pedido Geonames.org, se han normalizado para todo el mundo. The whole world is a 1 GB text file, y también puede llamar al download specific parts, como ciudades, atracciones locales, etc.
Eso es lo que he usado: P Gracias, sin embargo – Ema
¡El enlace Lista de ciudades funciona! La lista de países, sin embargo, es un enlace roto. ¿Puedo sugerir http://en.wikipedia.org/wiki/ISO_3166-1_alpha-2 o http://en.wikipedia.org/wiki/ISO_3166-1_numeric – Colin