Marcelo Guelfi, Carlos López-Vázquez Primeros resultados de la Compresión de datos de trayectorias de vehículos urbanos de transporte colectivo Marcelo Guelfi, Carlos López-Vázquez Laboratorio LatinGEO SGM+Universidad ORT del Uruguay
Agenda Datos del STM Muestreo uniforme Distancia de Fréchet Douglas-Peucker Top Down – Time Ratio Conclusiones Pasos futuros
Datos del STM Un mes: 1GB de datos comprimidos 10GB sin comprimir 139 líneas de transporte 125 millones de puntos 500 mil recorridos distintos
Definición de trayectoria Sucesión de coordenadas geográficas en el tiempo: (x,y,z,t). Su obtención se hace cada cierto intervalo (discretas). Con error debido a la (in)exactitud de los dispositivos o entorno.
Caso de la línea 121
¿Cómo determinar si la trayectoria simplificada es aún útil? Muestreo uniforme Remueve un punto cada N No tiene en cuenta ni la distancia ni el tiempo ¿Cómo determinar si la trayectoria simplificada es aún útil?
Distancia de Fréchet Medida de similitud entre curvas Tiene en cuenta el orden de los puntos
Muestreo uniforme
Douglas-Peucker (1971) Comienza con la trayectoria total. Se va dividiendo recursivamente. Considera la distancia de los puntos a la recta simplificada. Recibe un parámetro (distancia)
Douglas-Peucker (1971)
TD-TR (2004) Generalización de Douglas-Peucker. Introduce el concepto de SED (Synchronized Euclidean Distance) Recibe un parámetro (distancia)
TD-TR (2004)
Compresión vs Distancia Fréchet Resultados Compresión vs Distancia Fréchet 10-25m <30m <40m <50m DP 60-90% 30-40% 20% TR 50-90% 40-50% 35%
Conclusiones El muestro uniforme es sencillo pero introduce demasiado error Douglas-Peucker tiene buena compresión pero no tiene en cuenta el tiempo TR mejora respecto a DP sacrificando compresión Compresión del 50% con Fréchet < 30m
Pasos futuros Además de Fréchet, medir discrepancia de velocidad en las trayectorias simplificadas Implementar un mínimo de 4 algoritmos más Comparar estadísticamente su desempeño y elegir el mejor
Preguntas