La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.

Presentaciones similares


Presentación del tema: "Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio."— Transcripción de la presentación:

1 Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio de 2009 Alicante, España Grupo de Investigación Lucentia Departamento de Lenguajes y Sistemas Informáticos Director: Juan Carlos Trujillo Mondéjar

2 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Contribuciones de esta tesis »Trabajos futuros

3 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Contribuciones de esta tesis »Trabajos futuros

4 Introducción Proceso de “descubrimiento” de conocimiento (KDD Knowledge Discovery in Databases) Solución actual en la minería de datos El problema actual en el desarrollo de modelos de minería de datos Errores comunes en la aplicación de la minería de datos El rol de los almacenes de datos

5 Introducción Minería de datos: el núcleo del descubrimiento de conocimiento Preprocesado Integración Fuentes de datos Datos para minería Selección Minería de datos Evaluación de patrones Almacén de datos Proceso KDD

6 Introducción Proceso de “descubrimiento” de conocimiento (KDD Knowledge Discovery in Databases) Solución actual en la minería de datos El problema actual en el desarrollo de modelos de minería de datos Errores comunes en la aplicación de la minería de datos El rol de los almacenes de datos

7 Introducción Solución actual en la minería de datos Datos inicialmente recolectados con distinta finalidad Requiere de tareas de preprocesado e integración de datos Esta ampliamente difundido el uso de ficheros planos como repositorio de datos Se llevan a cabo sesiones aisladas de minería de datos

8 Introducción Proceso de “descubrimiento” de conocimiento (KDD Knowledge Discovery in Databases) Solución actual en la minería de datos El problema actual en el desarrollo de modelos de minería de datos Errores comunes en la aplicación de la minería de datos El rol de los almacenes de datos

9 Introducción El problema actual en el desarrollo de modelos de minería de datos Actualmente, “la minería de datos se lleva a cabo más como un arte que como una ciencia” (Marbán, Segovia, Menasalvas and Fernández-Baizán 2009) Esto se debe principalmente a: Datos poco estructurados Ausencia de propuestas de modelos conceptuales para todas las etapas del proceso KDD

10 Introducción El problema actual en el desarrollo de modelos de minería de datos Desventajas relacionadas con esta perspectiva Incapacidad para garantizar la calidad de los datos Duplicidad de tareas de preprocesado Imposibilidad de reutilización de modelos de minería de datos

11 Introducción Proceso de “descubrimiento” de conocimiento (KDD Knowledge Discovery in Databases) Solución actual en la minería de datos El problema actual en el desarrollo de modelos de minería de datos Errores comunes en la aplicación de la minería de datos El rol de los almacenes de datos

12 Introducción Errores comunes en la aplicación de la minería de datos Deficiencia en la calidad de los datos Uso inadecuado de los datos Incapacidad para evaluar los resultados Insuficiente comunicación los resultados obtenidos.

13 Introducción Proceso de “descubrimiento” de conocimiento (KDD Knowledge Discovery in Databases) Solución actual en la minería de datos El problema actual en el desarrollo de modelos de minería de datos Errores comunes en la aplicación de la minería de datos El rol de los almacenes de datos

14 Introducción El rol de los almacenes de datos Un almacén de datos es “ una colección de datos orientada a un dominio, variables en el tiempo, integrados y no volátiles que da soporte a la toma de decisiones ” (Inmon 1996). Facilita la minería de datos en los siguientes aspectos: El preprocesado de los datos El acceso a los mismos y si existe un modelo del almacén de datos, facilita además: La comprensión de la estructura y relaciones en los datos

15 El rol de los almacenes de datos El preprocesado de los datos Introducción Fuentes de datos OLTP Ficheros … Extracción Limpieza Transformación Agregación Filtrado Unión … Almacén de datos Facilita el acceso a datos preparados para el análisis Facilita el acceso a datos preparados para el análisis

16 Introducción El rol de los almacenes de datos Un modelo conceptual facilita la comprensión de los datos

17 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Contribuciones de esta tesis »Trabajos futuros

18 Introducción Hipótesis Es factible modelar conceptualmente las técnicas de minería de datos de una manera integrada con el modelado del almacén de datos en el marco del proceso de descubrimiento de conocimiento.

19 Introducción Objetivos Objetivo principal: Proponer perfiles UML para el modelado conceptual de técnicas de minería de datos sobre almacenes de datos en el marco de un proceso de descubrimiento de conocimiento Objetivos específicos »Objetivo 1: Analizar las propuestas existentes en el campo del modelado conceptual de minería de datos en el contexto de descubrimiento de conocimiento »Objetivo 2: Proponer los modelos conceptuales para las técnicas de minería de datos sobre almacenes de datos

20 Introducción Objetivos »Objetivo 3: Proponer los perfiles UML para modelar conceptualmente las técnicas de minería de datos sobre modelos multidimensionales de almacenes de datos »Objetivo 4: Diseñar e implementar los modelos conceptuales para las técnicas de minería de datos en una herramienta que pueda integrar el diseño de todo el proceso de descubrimiento de conocimiento »Objetivo 5: Contrastar la viabilidad de la propuesta en un caso de estudio

21 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Contribuciones de esta tesis »Trabajos futuros

22 Introducción Trabajos relacionados Fuentes de datos OLTP Ficheros … Extracción Limpieza Transformació n Agregación Filtrado Unión … Almacén de datos

23 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Contribuciones de esta tesis »Trabajos futuros


Descargar ppt "Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio."

Presentaciones similares


Anuncios Google