2011-02-05 19 views
7

Tengo 2 preguntas sobre el análisis de un dataset GPS.Comparación/Agrupamiento de trayectorias (datos GPS de (x, y) puntos) y Minería de datos

1) La extracción de trayectorias que tienen una enorme base de datos de coordenadas GPS grabadas de forma (latitude, longitude, date-time). De acuerdo con los valores de fecha y hora de los registros consecutivos, estoy tratando de extraer todas las trayectorias/rutas seguidas por la persona. Por ejemplo; decir desde el tiempo M, los pares (x,y) cambian continuamente hasta el momento N. Después de N, el cambio en los pares (x,y) disminuye, en cuyo punto concluyo que la ruta tomada desde el tiempo M hasta N se puede llamar trayectoria. ¿Es ese un enfoque decente a seguir al extraer trayectorias? ¿Hay algún método/algoritmo/algoritmo conocido que pueda sugerir? ¿Hay alguna estructura de datos o formatos que le gustaría sugerirme para mantener esos puntos de manera eficiente? Tal vez, para cada trayectoria, sería útil descubrir la velocidad y la aceleración.

2) Extracción de las trayectorias Una vez que he seguido todas las trayectorias/trayectorias, ¿cómo puedo compararlas/agruparlas? Me gustaría saber si los puntos de inicio y fin son similares, entonces ¿cómo se comparan los caminos intermedios?

¿Cómo comparo las 2 rutas/rutas y concluyo si son similares o no? Además; ¿Cómo puedo agrupar caminos similares?

Agradecería mucho si me puede indicar una investigación o algo similar sobre este asunto.

El desarrollo estará en Python, pero se aceptan todo tipo de sugerencias de bibliotecas.

Gracias de antemano.

+2

tus etiquetas Ninguno de ellos es muy popular. Consideraría cambiar 'gps' por' gis' y definitivamente agregar la etiqueta 'python'. –

+0

Considere la posibilidad de cruzar su pregunta en http://gis.stackexchange.com/ – radek

+1

¿Tiene ID de dispositivo GPS en esa base de datos? – yura

Respuesta

9

Eche un vistazo al trabajo realizado en el Departamento de Geografía de la Universidad de Zurich, especialmente por Patrick Laube y Somayeh Dodge.

Tenga una mirada en el papel

movimientos individuales y minería de datos geográfica. La agrupación Algoritmos para destacar puntos de acceso en las rutas de navegación personal

(link, presentation). Muestra el uso de los métodos de Estimación de la DBSCAN Kernel Density en los datos de GPS.

también papeles de Nokia de Mobile Data Challenge 2012 Workshop pueden ser útiles aquí, especialmente:

MobReduce: Reducción de Estado complejidad de la movilidad Traces (link)

por Fabian Hartmann, Christoph P. Mayer, Ingmar Baumgart y

Marco de limpieza de trayectorias para clustering de trayectoria (link)

de Agzam Idrissov, Mario A.Nascimento, Universidad de Alberta

+0

Esas personas están haciendo un trabajo de calidad de doctorado en exactamente esta área con una tesis que "se centra en el desarrollo de una metodología para revelar similitudes entre las trayectorias de diferentes tipos de objetos en movimiento en el espacio y el tiempo". –

1

1) Extracción de trayectorias Creo que está en la dirección correcta. Probablemente habrá algo de ruido en los datos de GPS, y al caminar aleatoriamente, deberías hacer algunas splines suaves para superarlo.


2) Minería las trayectorias es que hay algún sentido de los negocios en trayectorias similares? (Esto ayudará a construir la métrica de distancia y luego puede usar algunos de los algoritmos de agrupamiento de mahoot) 1. Creo que el punto donde alguna persona ha parado es más interesante para que pueda generar estadísticas de popularidad de lugares. 2. Si necesita similitud de ruta para encontrar diferentes rutas al mismo comienzo necesita agrupar primero la ubicación final y luego las curvas similares (distancia máxima entre distancia integral, algunas de las métricas funcionales conocidas)

Cuestiones relacionadas