Descargar la presentación
La descarga está en progreso. Por favor, espere
1
Calidad de Datos y Servicios en INSPIRE
Miguel Villalón Esquinas
2
Introducción a la calidad de los datos
Contenido Introducción a la calidad de los datos Introducción Definición de Calidad Normas relacionadas con la calidad de la IG Elementos de calidad Calidad de servicios en INSPIRE
3
Introducción a calidad de datos
La calidad de la IG ha sido un tema recurrente en todo el proceso de desarrollo de las Normas Ejecución (IR): ANTES DESPUÉS DESPUÉS PRODUCCIÓN PRODUCCIÓN Requisitos de Calidad Especificaciones del Producto de Datos Les voy a hablar del grupo de trabajo que se ha formado en INSPIRE, impulsado por la Comisión Europea, para clarificar el papel de la calidad de la IG. La calidad ha sido un tema muy recurrente en todo el proceso de desarrollo de las reglas de implementación (normas de ejecución) porque es necesario conseguir la interoperabilidad de los datos, pero como no se exige una nueva captura de la información ni se impone la escala, es complicado establecer unos requisitos de calidad. El siguiente esquema muestra el papel de la calidad a lo largo de todo el proceso de generación de IG. Antes de crear un producto, se establecen las especificaciones del producto de datos, que nos servirán para definir la información a capturar, en función de las necesidades que queramos cubrir con los datos y de los casos de uso que hayamos preestablecido. En este momento se deben establecer los requisitos de calidad que debe tener. Durante todo el proceso se realizan inspecciones para asegurar la calidad del producto y que se cumplen las especificaciones. Un vez terminado, se evalúa la calidad final y se reporta en los metadatos. Evalúa la Calidad del producto final y se informa en los Metadatos Proceso para asegurar la Calidad haciendo inspecciones para cumplir las especificaciones QMS
4
Introducción a calidad de datos
Problemas que se plantean en INSPIRE: ¿Se pueden establecer unos requisitos de calidad si: No se establece una escala No se requiere una nueva captura de la información? Si no se imponen requisitos previos ¿Los datos serán interoperables? ¿Serán comparables? ¿Se podrán aplicar a determinados usos? Si se imponen unos requisitos previos Se podría excluir información que podría servir para otros usos Pasamos a analizar los problemas que se plantean en INSPIRE, donde no hay un caso de uso específico, sino que se pretenden cubrir muchas necesidades…
5
Introducción a calidad de datos
No exigir requisitos previos No exigir requisitos previos No exigir requisitos previos Imponer requisitos exigentes Gran variedad de datos disponibles Problemas de interoperabilidad Usuarios insatisfechos con la calidad Un conjunto reducido de datos disponibles Sin obstáculos para la interoperabilidad Un pequeño grupo de usuarios, pero satisfechos con la calidad Por lo tanto nos encontramos en un dilema que se encuentra entre dos puntos extremos: - No exigir ningún requisito previo o imponer unos requisitos exigientes. Imponer sólo aquellos requisitos que estén justificados por el ámbito de aplicación o por los casos de uso
6
Introducción Las Especificaciones de Datos ya han establecido algunos elementos de calidad (capítulo 7)
7
Introducción Ejemplo: Especificaciones de Datos Nombre Geográficos (capítulo 7)
8
¿Qué mapa de los siguientes tiene mayor calidad?
Definición de Calidad ¿Qué mapa de los siguientes tiene mayor calidad? Grado en que un conjunto de características inherentes cumple con los requerimientos (necesidades o expectativas establecidas, generalmente implícitas) ISO9000. La calidad está ligada al uso
9
Representación del Mundo Real
Definición de Calidad En el ámbito de la Información Geográfica: Trabajamos con unos datos que son un modelo de la realidad Mundo Real Representación del Mundo Real es la descripción de los errores que tienen o pueden tener los datos. permite saber hasta qué punto se ha representado adecuadamente el mundo real. pero está limitada por los costes (función exponencial)
10
ISO: International Organization for Standarization ISO/TC 211:
Normas de Calidad de IG ISO: International Organization for Standarization ISO/TC 211: Comité para la Normalización de la Información Geográfica/Geomática. Familia de normas ISO19000. Normas de calidad: Calidad de Proceso ISO 9000 v2000: QMS Sistemas de Gestión de la Calidad Calidad de Producto ISO 19157: “Calidad de los datos”(Sustituye a 19113,19114 y 19138): Define los componentes para describir la calidad de los datos; Especifica componentes y estructura de contenido de un registro de medidas de la calidad; Describe los procedimientos generales para evaluar la calidad de los datos geográficos; Establece principios para informar sobre la calidad de los datos
11
Proceso de evaluación de la calidad
ISO 19157 ISO 19157 19157 ISO 19157 3951 ISO 19157 © 2006 Francisco Javier Ariza López - Universidad de Jaén (España)
12
Normas relacionadas con la Calidad de IG
Marco de trabajo: Universo de discurso: visión del mundo real que incluye todo aquello que es de interés. USUARIO DE LOS DATOS PRODUCTOR DE DATOS MUNDO REAL Universo de discurso A Especificación de producto Requerimientos del usuario Calidad describe producción Universo de discurso B Universo de discurso selección Conjunto de datos Para un Productor la especificación de producto describe el universo de discurso y contiene los parámetros para construir el conjunto de datos. Para el Usuario los requerimientos describen un universo de discurso que puede coincidir, o no, con el universo de discurso del conjunto de datos. La verdadera calidad de un conjunto de datos es la medida en que dicho conjunto representa un universo de discurso.
13
Normas relacionadas con la Calidad de IG
ESPECIFICACIÓN DEL PRODUCTO Tipos de fenómenos Edificio industrial Casa Nombre de la familia: [cadena de caracteres] Número de ocupantes : [entero] Árbol Altura clasificada en 4 grupos : [1 carácter] {A : de 1 a 2.9 m, B : de 3 a 4.9 m , C: de 5 a 9.9 m, D : más de 10 m} Camino Carretera Estado : [cadena de caracteres] {asfaltado, sin asfaltar} Reglas de la especificación de producto Los árboles con una altura menor de 1 m no deben ser representados El atributo “estado” de una carretera puede estar vacío (“valor indeterminado”) Los atributos “nombre” y “número de ocupantes” de una casa pueden no presentar valor alguno (“valor indeterminado”) -
14
Normas relacionadas con la Calidad de IG
Universo de discurso:
15
Normas relacionadas con la Calidad de IG
Conjunto de datos:
16
Normas relacionadas con la Calidad de IG
Comparar Universo Discurso y Datos:
17
Elementos de la calidad
Información cuantitativa sobre calidad de los datos Elementos Subelementos Exactitud posicional Exactitud temática Exactitud temporal Compleción Consistencia lógica Absoluta o externa Datos malla Relativa o interna Corrección clasificación Exactitud atributos cuantitativos Corrección atributos cualitativos Exactitud tiempo Validez temporal Consistencia temporal Comisión Omisión Conceptual Formato Dominio Topológica Usabilidad Información sobre la calidad de la calidad Elementos Metacalidad Confianza Homogeneidad Representatividad
18
Elementos de calidad
19
Elementos de calidad Elementos generales de la calidad Propósito
Descripción cualitativa y textual acerca de la finalidad y objetivos con los que ha sido producido un conjunto de datos. Uso al que se pretende destinar la BDG (uso teórico) Ejemplo: BCN25 (Cartografía digital 1: IGN) “Dotar al país de una infraestructura en cuanto a datos geográficos digitales de referencia a escala 1:25.000, que sirvan de base para todo tipo de aplicaciones”
20
Elementos de calidad Uso Elementos generales de la calidad
Descripción de las aplicaciones y proyectos en los que se ha utilizado realmente un conjunto de datos Usos reales Tanto por parte del productor, como de los usuarios. Ejemplo: BCN25 “Todo tipo de aplicaciones geográficas, como planificación, gestión de redes de servicios, tráfico y transporte y geomarketing”.
21
Linaje o genealogía (LI_Lineage)
Elementos de calidad Elementos generales de la calidad Linaje o genealogía (LI_Lineage) Descripción de la historia del conjunto de datos (ciclo de vida: captura, compilación, derivación…): Fuentes de datos (LI_Source) Procesos ejecutados: Tratamiento geométrico, semántico y topológico (LI_ProcessStep) En tantas etapas como sea razonable Dando todo lujo de detalles: Algoritmos, software empleado, métodos, ... Lenguaje conciso, técnico y objetivo
22
Ejemplo del Linaje: BCN25 (hoja 539-4)
Elementos de calidad Elementos generales de la calidad Ejemplo del Linaje: BCN25 (hoja 539-4) Fuente: Vuelo fotogramétrico 1: del año 2002 Proceso 1: Restitución digital en PC con comandos de usuario desarrollados sobre Microstation SE Proceso 2: Formación de campo durante 2 semanas por hoja, recogiendo toponimia de mapas oficiales Proceso 3: Formación interactiva de la minuta digital en Microstation Proceso 4: Simbolización y rotulación Proceso 5: Edición de la hoja Proceso 6: Control de calidad
23
Información cuantitativa sobre calidad
Elementos de calidad Elementos cuantitativos Pueden medirse pueden describirse con parámetros Se determinan por comparación de una muestra representativa del conjunto de datos, con otro conjunto de datos de mayor fiabilidad: datos de mayor escala, datos de campo, bajo la hipótesis de que tales datos constituyen la realidad Información cuantitativa sobre calidad Elementos Subelementos Exactitud posicional Exactitud temática Exactitud temporal Compleción Consistencia lógica Absoluta o externa Datos malla Relativa o interna Corrección clasificación Exactitud atributos cuantitativos Corrección atributos cualitativos Exactitud tiempo Validez temporal Consistencia temporal Comisión Omisión Semántica Formato Dominio Topológica
24
Precisión (precision)
Elementos de calidad Precisión ≠ Exactitud Exactitud (accuracy) Grado de acercamiento (del dato) entre le resultado de una medida y el valor verdadero (o tomado como verdadero) emc (Error Medio Cuadrático) Precisión (precision) Grado de dispersión de un conjunto de medidas (Desviación estándar)
25
Elementos de calidad Preciso Impreciso Exacto Inexacto
26
Elementos de calidad Exactitud posicional Exactitud posicional Exactitud posicional Absoluta o externa Absoluta o externa Absoluta o externa Relativa o interna Relativa o interna Datos malla Exactitud posicional o geométrica (DQ_PositionalAccuracy) exactitud alcanzada en la componente posicional de los datos: planimétrica o altimétrica.
27
Elementos de calidad Elementos Exactitud posicional absoluta o externa
Relativa o interna Relativa o interna Datos malla Elementos Exactitud posicional absoluta o externa (DQ_AbsoluteExternalPositionalAccuracy) proximidad entre los valores de coordenadas de la BDG y los verdaderos N puntos (xi-xr, yi-yr) emc Exactitud posicional relativa o interna (DQ_RelativeInternalPositionalAccuracy) proximidad entre posiciones relativas de los fenómenos y sus respectivas posiciones relativas verdaderas N puntos (Dxi-Dxr, Dyi-Dyr) emc Exactitud posicional de datos en malla (ráster) (DQ_GriddedDataPositionalAccuracy) proximidad de los valores de la malla a los verdaderos N puntos de control di emc
28
Exactitud posicional o geométrica
Elementos de calidad Exactitud posicional o geométrica Acercamiento al valor tomado como real o verdadero Coordenadas medidas en el mapa: X= Y= Z= 910 Coordenadas medidas en la red: X= Y= Z= xd - xr= yd - yr=- 2.80 zd - zr=- 1.02
29
Calidad de datos en INSPIRE
Las Especificaciones de Datos ya han establecido algunos elementos de calidad
30
Exactitud temática o semántica
Elementos de calidad Corrección clasificación Corrección atributos cualitativos Exactitud atributos cuantitativos Exactitud temática Exactitud temática o semántica (DQ_ThematicAccuracy) Exactitud de los atributos cuantitativos o no cuantitativos y de la corrección de las clasificaciones de los elementos y sus relaciones. Ejemplos: atributo cualitativo: topónimos, nombre familia atributo cuantitativo: altitudes, número de ocupantes clasificaciones: tipos de carreteras, altura de los árboles mediante muestreo de datos con valores fiables
31
Elementos de la exactitud temática o semántica:
Elementos de calidad Corrección clasificación Corrección atributos cualitativos Exactitud atributos cuantitativos Exactitud temática Elementos de la exactitud temática o semántica: Corrección de la clasificación (DQ_ThematicClassificationCorrectness) comparación de las clases asignadas a fenómenos o sus atributos, con respecto a las que corresponden al universo de discurso. % de elementos clasificados correctamente Corrección atributos cualitativos (DQ_NonQuantitativeAttributeAccuracy) medida de cuando un atributo no cuantitativo es correcto o incorrecto % de concordancia de atributo, % ortografía correcta Exactitud de atributos cuantitativos (DQ_QuantitativeAttributeAccuracy) proximidad entre el valor del atributo cuantitativo y los verdaderos emc: longitud, temperatura, etc.
32
Exactitud temática: Elementos de calidad
Comparar Universo Discurso y Datos: Corrección clasificación Corrección atributos cualitativos Exactitud atributos cuantitativos Corrección atributos cualitativos Corrección clasificación Exactitud atributos cuantitativos
33
Elementos de calidad Corrección en la clasificación
34
Elementos de calidad Corrección en atributos cualitativos: error en ortografía Embalse de El Villar Embalse del Villar Arroyo de la Dehesa Arroyo la de Dehesa Almenara del Guadalix Almenara de Guadalix Cerro del Regañao Cerro del Regañado Soto de Viñuela Soto de Viñuelas La Garnacha El Garnacho Cerro Portillo Cerro del Portillo Arroyo de Sacedilla Arroyo de la Sacedilla Casa Quemada Casaquemada Clínica de la Zarzuela Clínica la Zarzuela Solana del Médico La Solana del Médico
35
Calidad de datos en INSPIRE
Las Especificaciones de Datos ya han establecido algunos elementos de calidad
36
Compleción (DQ_Completeness)
Elementos de calidad Compleción Comisión Omisión Compleción (DQ_Completeness) Compara el nº de entes: BDG/realidad Presencia y ausencia de fenómenos, sus atributos y relaciones. Proporciona información acerca de si el conjunto de datos representa todos los fenómenos del mundo abstracto, siendo este un subconjunto del mundo real. Elementos Comisión (por exceso) (DQ_CompletenessCommission) Exceso de entidades incluidas en el conjunto de datos Entidades incluidas / Entidades en la realidad Omisión (por ausencia) (DQ_CompletenessOmmission) Entidades que faltan en el conjunto de datos Entidades omitidas / Entidades en la realidad
37
Compleción: Elementos de calidad Comparar Universo Discurso y Datos:
Comisión Omisión Omisión Comisión
38
Calidad de datos en INSPIRE
Las Especificaciones de Datos ya han establecido algunos elementos de calidad
39
Consistencia temporal
Elementos de calidad Consistencia temporal Exactitud temporal Exactitud tiempo Validez temporal Exactitud Temporal (DQ_TemporalAccuracy) Calidad de los atributos temporales y de las relaciones temporales entre fenómenos Elementos Exactitud de una medida de tiempo (DQ_AccuracyofTimeMeasurement) Si el tiempo es 4ª dim. (x, y, z, t) emc Consistencia temporal (DQ_TemporalConsistency) Corrección de eventos ordenados o secuencias % Validez temporal (DQ_TemporalValidity) Período de validez de datos respecto al tiempo (hasta prox. versión)
40
Calidad de datos en INSPIRE
Las Especificaciones de Datos ya han establecido algunos elementos de calidad
41
Elementos de calidad Consistencia Lógica (DQ_LogicalConsistency)
Conceptual Dominio Formato Topológica Consistencia Lógica (DQ_LogicalConsistency) Grado de adherencia a las reglas lógicas de la estructura de datos, atributos y relaciones (la estructura de datos puede ser conceptual, lógica o física) Elementos Consistencia conceptual o semántica (DQ_ConceptualConsistency) Adherencia a las reglas del modelo conceptual Consistencia de dominio (DQ_DomainConsistency) Adherencia de los valores a los dominios Consistencia de formato (DQ_FormatConsistency) Grado en que los datos se almacenan de acuerdo con la estructura física Consistencia topológica (DQ_TopologicalConsistency) Corrección de las características topológicas codificadas explícitamente.
42
Consistencia lógica. Ejemplos:
Elementos de calidad Consistencia lógica. Ejemplos: Conceptual o Semántica Por los puentes pasa una vía de comunicación No hay ciudades incomunicadas por carretera Dominio Atributo altitud debe estar entre 0 y 8500 metros. Formato Mismo software, correcta cabecera, etc. Topológica Cada tramo comienza y acaba en un nodo (conectividad) Las superficies están cerradas (cierre de recintos) Subtrazos, sobretrazos, solapes, etc.
43
Calidad de datos en INSPIRE
Las Especificaciones de Datos ya han establecido algunos elementos de calidad
44
Elementos de calidad Usabilidad(DQ_UsabilityElement)
Se basa en los requerimientos de los usuarios Para evaluar la usabilidad se deben usar todos los elementos de calidad Se debe utilizar para describir información de calidad específica sobre la idoneidad de un conjunto de datos para satisfacer una aplicación en particular o la conformidad con un conjunto de requisitos.
45
Elementos de calidad Metacalidad(DQ_Metaquality) Elementos
Confianza Representatividad Homogeneidad Metacalidad(DQ_Metaquality) Conjunto de declaraciones cuantitativas y cualitativas sobre una evaluación de la calidad y su resultado. Elementos Confianza Fiabilidad de un resultado de la calidad de datos. Representatividad Grado en que la muestra utilizada ha producido un resultado que es representativo de los datos pertenecientes al ámbito. Homogeneidad uniformidad esperada o comprobada de los resultados obtenidos para una evaluación de la calidad.
46
Acuerdos del grupo de trabajo de INSPIRE
Unificar la terminología de calidad de IG, basándose en las normas existentes (ISO/ CD19157) y añadir los términos al glosario de INSPIRE Se apoyará a los TWG en el desarrollo Anexos II y III No se exigirá ningún requisito de calidad previo extra Se debe de ligar la calidad a los usos y se harán recomendaciones El proceso de transformación de los datos para que sean conformes con INSPIRE se debe indicar en el linaje Si se evalúan parámetros de calidad utilizar los ítems de metadatos adecuados Cuando se establezca una exactitud posicional debe ligarse a la escala
47
Medidas de la Calidad: ejemplos
Ejemplo de medida de conteo aplicada
48
Medidas de la Calidad: ejemplos
49
Calidad de servicios (QOS)
Para evaluar la calidad no se tendrán en cuenta los servicios de terceros Se deben de cumplir criterios de rendimiento, capacidad y disponibilidad. RENDIMIENTO: Definición de rendimiento: nivel mínimo a partir del cuál se considera alcanzado un objetivo y la rapidez con que puede atenderse una petición dentro de un servicio de red Inspire Servicio de Localización: el tiempo para enviar la respuesta inicial a una petición será de 3 sg como máximo en una situación normal*. Al menos un 90% de respuestas t < 3sg Servicio de Visualización: el tiempo para enviar la respuesta inicial a una petición Get Map, para una imagen de 470 Kb (800 x 600 px a 8 bits de color) será de 5 sg como máximo en una situación normal*. Al menos un 90% de respuestas t < 5sg * Situación normal: dentro del periodo de tiempo que no es de máxima demanda (90% del tiempo normal)
50
Calidad de servicios (QOS)
CAPACIDAD: Definición de capacidad: número máximo de peticiones simultáneas de servicio atendidas con un rendimiento garantizado. Se mide con paquetes de peticiones Servicio de Localización: el número mínimo de peticiones a atender es de 30 por segundo durante 1 minuto Servicio de Visualización: el número mínimo de peticiones a atender es de 20 por segundo durante 1 minuto
51
Calidad de servicios (QOS)
DISPONIBILIDAD: La probabilidad de que el servicio de red esté disponible será del 99% del tiempo total. Al menos 10 peticiones/h continuadamente Puede estar caído únicamente: Se permiten tiempos de mantenimiento avisando con una semana de antelación y < 10 horas/mes
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.