La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Control de errores en Datos Geográficos Carlos López Vázquez

Presentaciones similares


Presentación del tema: "Control de errores en Datos Geográficos Carlos López Vázquez"— Transcripción de la presentación:

1 Control de errores en Datos Geográficos Carlos López Vázquez

2 Enfoque n Existen cursos de Control de Calidad ä Típicamente para Ingeniería Industrial o Química n Métodos concebidos para productos tangibles n Apuntan a: ä Cadenas de producción en serie ä Medir atributos de la Calidad ä Detectar problemas rápidamente… ä Actuar eliminando la causa n Con datos es un poco más difícil…

3 Con datos… n Muchas veces no salen de una cadena ä Ejemplos: –Mapa de una ciudad –Catastro urbano ä Contraejemplos: –Datos meteorológicos –Series o colecciones cartográficas –Imágenes satelitales n Lo normal es que ya estén recogidos o generados ä No incidiremos en su creación

4 Problemas… n Problemas principales: ä ¿Cómo saber si un dato/registro está bien ? ä ¿Nos afecta? ä Si está mal: ¿cómo asignarle un sustituto? n Problemas secundarios: ä ¿Cómo medir la Exactitud? ä ¿Cómo comunicar la Calidad? ä Una vez lograda, ¿cómo mantener la Calidad en una producción en serie? n Por cierto… ¿Qué es exactamente Calidad?

5 Anecdotario… n Ilustra algunos ejemplos de la vida real n Barbas del vecino arder… n Son ejemplos geográficos; hay muchos más en otras áreas

6 El BMW último modelo… n En Alemania, 1998 un BMW se precipitó en el río Havel en el embarcadero de un ferry n El dueño seguía fielmente las instrucciones de un sistema GPS con mapas instalado a bordo n El mapa decía puente y debió decir ferry Fuente: P. Fisher (1999)

7 Embajada china en Belgrado n Bombardeada por la OTAN en 199X por error n Los mapas decían que era una instalación serbia n Había sido… ¡antes! n Tres muertos, roces, etc.

8 Derrame de petróleo n Punta del Este, Uruguay en febrero de 1997 n Escollo de 24 mt. no figuraba en las cartas náuticas oficiales n Un petrolero se lo llevó por delante

9 Huracán Katrina

10 Más casos marítimos n 1980, Canadá. El Sea Fever pierde un marinero en una tormenta n El pronóstico decía que la tormenta no llegaría donde llegó n El error se debió a una boya meteorológica fuera de servicio n El litigio por U$S 3.2 millones fue ganado Fuente: Richard O. Mason (1986)

11 Hay casos más antiguos… n El canal de Suez existió en la época faraónica n Napoleón no lo reconstruyó porque se creía que Δh6 mts. ä Esa diferencia requería esclusas, etc. n En realidad son 80 cm La India podría haber caído en otras manos… y la historia hubiese sido diferente

12 ¿Ud. quisiera estar en esta lista?

13 Temario n Definiendo la Calidad n Comunicando la Calidad n Midiendo la Exactitud n Mejorando la Exactitud n Manteniendo la Calidad Total previsto: 30 horas Ü 4 hs Ü 6 hs Ü 12 hs Ü 4 hs ¿Por qué tanto?

14 Definiendo la Calidad (4 hs.) n Hay que comenzar por el principio n Terminología, jerga, etc. n Quizá sea familiar al público (en parte…) n Dar contexto de datos geográficos ä Estándares recientes ä Informatización pervasiva ä Revolución en varias profesiones n Lo que es de alta calidad para uno …

15 Comunicando la Calidad (4 hs.) n ¿ Alguien ha escuchado de la INDE? n ¿Alguien ha escuchado de metadatos ? n ¿Alguien ha visto algún metadato? n Veremos qué es, cómo interpretarlo y qué buscar en relación a Calidad n Revisaremos los estándares vigentes

16 Midiendo la Exactitud (6 hs.) n ¿Qué métodos o estándares se aplican? n Caso posicional: ä Los que saben son uds. ä Revisaremos algún estándar vigente n Caso temático: ä Hay métodos pero … ä Veremos criterios académicos n Servirá para saber ä Si tenemos que preocuparnos ( problem dependent! ) ä Si efectivamente mejoramos…

17 Mejorando la Exactitud (12 hs.) n Tema muy nuevo n Ámbito académico (1996, 1998,…) n Grupo pequeño n Tema demasiado técnico ä Journals estadísticos no lo publican mucho ä Journals temáticos (p.ej. Meteorológicos) lo ignoran n ¿A quién le importa? ä Productor del dato ä Usuario del dato ä (sufrido usuario debí decir…) n Constituye el núcleo duro del curso

18 Mejorando la Exactitud (cont.) n Las preguntas básicas son: 1. ¿Cómo detectar un dato malo? 2. ¿Cómo corregirlo? n La segunda es más trillada: interpolación, mínimos cuadrados, etc. n La primera… tiene cola ä ¿Existe un (único) valor correcto ? ä ¿Es accesible? ¿A qué precio? n ¿Cómo hago? n ¿Lo que dijo Juan, no será para peor?

19 Manteniendo la Calidad (4 hs.) n ¿Cómo asegurar niveles estables de error? n Importante para: ä Compradores de datos a proveedores externos ä Productores de datos ä Académicos ( of course…! ) n Tema nuevo en Agrimensura: típico y tradicional de Industriales o Químicos n Veremos estándares, métodos, etc.

20 Referencias y materiales n Ariza, 2002 n López et al., 1999 n CD con material vario ä PPT con transparencias ä PDF consultados ä Informes de proyecto ä Tesis ä Páginas y sitios web íntegros ä Quizá algo de software ä Etc….

21 Módulo 1: Definiendo la Calidad Carlos López Vázquez

22 Plan n Definiendo la Calidad n Exactitud vs. Precisión n Componentes de la Calidad

23 Algunos problemas técnicos… n Por ejemplo: ä dar coordenadas a objetos ä cómo crear representaciones digitales ä cómo procesar esas representaciones n Hay otros… ä error, incertidumbre, escala, resolución… n Complexivamente: Calidad de datos

24 n Otra definición: ISO 9000 Grado en que un conjunto de características inherentes cumple con los requisitos (necesidades o expectativas establecidas, generalmente implícitas). ¿Qué es Calidad? n RAE: Propiedad o conjunto de propiedades inherentes a una cosa que permiten apreciarla como igual, mejor o peor que las restantes de su especie No se limita a un único aspecto Inseparable, aunque no necesariamente obvio Requiere un observador Establece una relación de orden

25 Evolución histórica Artesanal Calidad del producto Calidad del proceso Calidad del diseño Control Total de Calidad Círculos de Calidad Calidad Total Certificaciones y premios

26 Exactitud vs. Precisión n Exactitud (Geodetic Glossary): Es una cercanía de los resultados, cálculos o estimaciones a los valores verdaderos o valores que se acepta son verdaderos n El idioma español… Precisión Exactitud n Hay varias Precisión ä Precisión (NCGIA Core): Se define como el número de cifras decimales o de dígitos significativos de una medida ä Precisión (Geodetic Glossary): En estadística, una medida de la tendencia de un conjunto de números aleatorios a agruparse alrededor de un número determinado por el conjunto

27 Ilustrando Exactitud vs. Precisión

28 Más sobre Exactitud… n A veces no hay valor verdadero … n E(x) no es lo mismo que E(f(x))… ä Ej.: MDE vs. Pendientes n Hay Exactitud alta y baja n No son sólo medidas. Comparar: ä Un valor exacto (α+β+γ=180) ä Una unidad convencional (metro patrón) ä Un valor que se asume más exacto (monolito)

29 Precisión (NCGIA) n Suele ser >>Exactitud n Herencia informática… ä Cifras significativas Cifras previstas ä Es fácil confundirse ä PC/ARCINFO Single Precision ä Algunos GIS Sólo Integer n Es un error relativo n Más relacionada con Resolución n Usada por Burroughs, 1986 y otros n No es la definición más moderna, ni la más apropiada

30 Precisión (Geodetic Glossary) n Tiene en cuenta la repetibilidad ä +Precisión -Varianza n Un aspecto clave: ä Precisión depende sólo del juego de datos ä En cambio la Exactitud no n Para confundir más… ä Nivelación de alta precisión n Es la definición que usaremos

31 Los problemas son… n Cómo medir la Exactitud ä ¡Repetir las medidas no ayuda! n Cómo se propaga la Exactitud n Cómo no atribuir más Exactitud de la correcta ä Es un problema del lado del usuario

32 Otro concepto: Resolución n Mezclable con Precisión (NCGIA) n Se distinguen tres casos: ä Espacial ä Temática ä Temporal n No abundaremos…

33 Plan 4 Definiendo la Calidad 4 Exactitud vs. Precisión n Componentes de la Calidad

34 Componentes de la Calidad n Recogida en varios estándares ä CEN/TC 287 ä ISO/TC 211 ä USGS 1994 ä ISO n Hay muchos elementos comunes ä Exactitud Posicional ä Exactitud Temática ä Consistencia lógica ä Completitud ä Linaje

35 Exactitud Posicional n Definida como la cercanía a la posición verdadera n Usualmente involucra coordenadas n Convención: 0.5 mm a la escala del plano ä Ej.: 0.5/(1/10000)=0.5*10 5 mm=50m ä En general: 0.5/escala ä ¿Escala? ¡Regla para el mundo en papel! n Cifras significativas… Ej.: 1:24.000; (x,y)=( , ) mts. Error=0.5/(1/24000)=12.0 mts sólo valen algunos dígitos (1.2345x10 5,9.8765x10 5 )

36 ¿Y si no hay/hubo papel? n Se debe declarar la Exactitud n ¿Cómo? ä La posición de los puntos difiere de la verdadera en menos de X mts. –Pregunta: ¿Cuáles puntos? ¿Todos? ä USGS : En el 90% de los casos, la posición difiere de la verdadera en menos de X mts. –Aparece el percentil 90% –No asume una distribución a priori ä BSI : La desviación estandar del error es menos de X mts. n ¿Cómo interpretar la declaración? n ¿Cómo verificarla?

37 Cómo interpretar… n Según USGS

38 Cómo verificarla… n Tres alternativas: ä Usar una fuente de mayor Exactitud –GPS –Mapa de mayor escala –Volver a los datos originales ä Usar evidencia interna –Tamaño de los defectos ä Calcular la Exactitud propagando… –0.5 mm por aquí, 1 mm por allá… n Será desarrollado en detalle luego

39 Exactitud de Atributos n También definida como cercanía al valor verdadero n Atención: el tiempo ahora pesa más ä Aparece la Vigencia n ¿Cómo se expresa la Exactitud? Depende del tipo de dato: ä Atributos continuos –Ej.: MDE, pluviometría, etc. –Parecido al caso posicional –Ej.: La elevación tiene un error menor a 1 mt –Podrían estar categorizados (imágenes RGB, etc.) ä Atributos categóricos

40 Para Atributos Categóricos n Definir cercanía es diferente… ä Está definido el, pero no el - ä Podría estar definido el > n Hay otras diferencias ä ¿Existe un verdadero valor ? ä ¿Cómo son las categorías? –¿Apropiadas? –¿Suficientemente detalladas? –¿Bien definidas?¿Nítidas? n También será analizado en detalle luego

41 Cómo verificarla… n Hay varias alternativas ä Construyendo una matriz de confusión –Presume una inspección binaria –Existen índices para caracterizarla ä Usando Métodos Difusos –La inspección ahora no es binaria –Aún bajo investigación ä Otros índices –Los hay, pero son algo simples… ä En cualquier caso, se hace Prueba de Hipótesis n Aún no está recogido en los estándares

42 Consistencia Lógica n ¿Es la BD consistente con sus definiciones? ä Geométricas: –Una etiqueta y sólo una por polígono –Todo polígono con etiqueta –Todo punto es de un polígono –Ningún arco que se cruza con otro sin cortarse –Tiene topología ä Temáticas: –Los atributos están dentro del rango n La Consistencia Lógica se mide en % de cumplimiento

43 Más sobre Consistencia… n ¿Fueron todas las capas obtenidas…? ä Misma escala, mismas hipótesis, mismos procesos… n ¿Fueron todas las capas editadas…? ä Mismos criterios (overshoots, tolerancias,…) n ¿Fueron todas las capas obtenidas simultáneamente? ä Hora, estación, año, etc. (lo que corresponda)

44 Completitud n Difícilmente medible n No hay una definición formal …Dado el Modelo Cartográfico, la BD y la Realidad, los objetos que deberían estar efectivamente están… n Calidad depende del Modelo Cartográfico ä Ej.: Incluir líneas de 30kV o más ä La BD está completa, aunque falten las de 6.3kV n Podría ser por Atributos ä El objeto está, pero incompleto ä Ej.: Falta la profundidad de un pozo n No hay métricas consensuadas

45 Linaje n Es un registro de historia de la BD n Responde a preguntas como: ä ¿Cómo fue digitalizada? ¿A partir de qué documentos? ä ¿Cuándo fueron recogidos los datos base? ä ¿Qué agencia u organización recolectó los datos? ä ¿Qué pasos u etapas se utilizaron para procesar los datos originales? ä ¿Con qué precisión fueron efectuados los cálculos (o qué error tenían los resultados numéricos)? n El Linaje es usualmente un indicador útil de Exactitud n No hay métricas consensuadas

46 Hay otros también relevantes… n Vigencia n Accesibilidad n Pertinencia o Relevancia n Son considerados en algunos estándares de metadatos n Veremos de qué se trata

47 Vigencia n ¿Están los datos actualizados? ä Ej.: uso de tierra con fines de agricultura Formato OK, Resolución OK, Completitud OK etc….

48 Otro ejemplo… n Población urbana, México 1990 ¿1965 vs. 1990? Puede ser mejor 1965…

49 Accesibilidad… n Que los datos existan… n Burocracia, formatos exóticos, etc.

50 Pertinencia o Relevancia n Ciertos datos pueden no aportar nada… n A veces se descubre; a veces no ä Modelos importados ä Condiciones locales n Estadística tramposa; un ejemplo: ä Idea: Búsqueda de individuos con mayor Respuesta a promociones ä Ídem con mayor propensión a pagar!!!

51 Módulo 1: Definiendo la Calidad Carlos López Vázquez


Descargar ppt "Control de errores en Datos Geográficos Carlos López Vázquez"

Presentaciones similares


Anuncios Google