La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.

Presentaciones similares


Presentación del tema: "Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio."— Transcripción de la presentación:

1 Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio de 2009 Alicante, España Grupo de Investigación Lucentia Departamento de Lenguajes y Sistemas Informáticos Director: Juan Carlos Trujillo Mondéjar

2 2 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Extensión de UML con perfiles »Modelo conceptual para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Producción científica »Trabajos futuros

3 3 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Extensión de UML con perfiles »Modelo conceptual para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Producción científica »Trabajos futuros

4 4 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Contexto Actualmente las empresas recogen grandes cantidades de datos Necesidad de “extraer” o “descubrir” conocimiento útil a partir de ellos El proceso seguido para descubrir conocimiento se denomina: KDD (Knowledge Discovery in Databases) “es el proceso no trivial de identificación de patrones válidos, noveles, potencialmente útiles y comprensibles en los datos.” (Fayyad, Piatetsky- Shapiro and Smyth 1996) Parte I: Introducción

5 5 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte I: Introducción Minería de datos: el núcleo del descubrimiento de conocimiento Preprocesado Integración Fuentes de datos Datos para minería Selección Minería de datos Evaluación de patrones Almacén de datos Proceso KDD Entre un 70% y un 90% del tiempo total (Gartner Group 2005) Iterativo

6 6 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte I: Introducción El problema actual en el modelado de minería de datos “la minería de datos se lleva a cabo más como un arte que como una ciencia” (González-Aranda, P., Menasalvas, E., Millán, S., Ruiz, C. y Segovia, J.: 2008; Riquelme, J., Ruiz, R., Gilbert, K., 2006.) Esto se debe principalmente a: Ausencia de propuestas de modelado conceptual para “todas” las etapas del proceso KDD Desventajas relacionadas con esta perspectiva Incapacidad para garantizar la calidad de los datos Duplicidad de tareas de preprocesado Imposibilidad de reutilización de modelos de minería de datos Mantenibilidad e implementación a bajo nivel

7 7 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte I: Introducción Proceso KDD Un modelo conceptual facilita la comprensión de los datos

8 8 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte I: Introducción Proceso KDD Fuentes de datos OLTP Ficheros … Extracción Limpieza Transformació n Agregación Filtrado Unión … Almacén de datos Minería de datos Conocimiento Existen propuestas para el modelado conceptual de las primeras fases de KDD No así para el proceso de minería de datos en el marco KDD

9 9 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Extensión de UML con perfiles »Modelo conceptual para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Producción científica »Trabajos futuros

10 10 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte I: Introducción Hipótesis Es factible modelar conceptualmente las técnicas de minería de datos de una manera integrada con el modelado del almacén de datos en el marco del proceso de descubrimiento de conocimiento.

11 11 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte I: Introducción Objetivos Objetivo principal: Proponer “mecanismos” para el modelado conceptual de técnicas de minería de datos en el marco de KDD Objetivos específicos »Objetivo 1: Analizar las propuestas existentes »Objetivo 2: Proponer los modelos conceptuales »Objetivo 3: Proponer los perfiles UML »Objetivo 4: Diseñar e implementar los modelos conceptuales en una herramienta que integre todo el proceso KDD  Objetivo 5: Contrastar la viabilidad de la propuesta en un caso de estudio

12 12 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Extensión de UML con perfiles »Modelo conceptual para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Producción científica »Trabajos futuros

13 13 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 ? Parte I: Introducción Trabajos relacionados Fuentes de datos OLTP Ficheros … Extracción Limpieza Transformació n Agregación Filtrado Unión … Almacén de datos Minería de datos Conocimiento Conceptual Lógico Físico DMX JDM SQL/MM LUCENTIA (Luján-Mora et al.) CWM LUCENTIA (Luján-Mora et al.) LUCENTIA (Luján-Mora et al.) LUCENTIA (Trujillo et al.) (Tziovara et al.) LUCENTIA (Muñoz et al.) CWM PBMS PMML DKE’07 INFSOF’09 DaWaK’05-06-07-08 ECDM’07-08 La presente tesis doctoral

14 14 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte I: Introducción Trabajos relacionados: CWM Metamodelo para los metadatos usados en almacenes de datos Enfocado al intercambio de metadatos a bajo nivel entre herramientas de almacenes de datos Dado que esta dirigido al modelado lógico de estos sistemas es demasiado complejo para los analistas PMML Facilita el intercambio de modelos con XML Su objetivo principal es el intercambio de modelos (y resultados) de minería Solo considera una única tabla como fuente de datos PBMS Propone modelar el repositorio para patrones de conocimiento Permite modelar los patrones resultantes de distintas técnicas de minería de datos No tiene en cuenta las fuentes de datos

15 15 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte I: Introducción Trabajos relacionados: Reglas de Asociación Algoritmo A priori (Agrawal et al., 1993) R.A. multidimensionales (Han y Fu,1995) R. A. restricciones (Bayardo et al., 1999) R.A. Interesantes/inesperadas (Zhang et al., 2005) R.A. Reducción del conjunto de reglas (Liu et al., 2000) Clasificación Algoritmo C4.5 (Breiman et al., 1984) Algoritmo ID3 (Quinlan, 1986) Métodos de partición n-arios del árbol (Murthy, 1998) Clasificación con consultas SQL (Güntzel et al., 1999; Shang y Sattler, 2005) Clustering Algoritmos particionales (Kauffman y Rousseew, 1990) Clustering categorías (Jain et al., 1999) Clustering jerárquico (Guha et al., 2000) Clustering basado en densidad (Ester et al., 1996) Max. Homogeneidad (Han y Kamber, 2000) Análisis de series temporales Técnicas de suavizado exponencial (Yar y Chatfield,, 1990) Autoregresión vectorial (Johansen, 1991) Algoritmos autorregresivos (Bowerman y O’Connel, 1993) Formalización de modelos ARIMA (Box y Jenkins, 1994) Árbol autorregresivo (Meek et al., 2002)

16 16 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Extensión de UML con perfiles »Modelo conceptual para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Producción científica »Trabajos futuros

17 17 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte II: Perfiles UML para minería de datos Extensión de UML con perfiles UML: lenguaje de propósito general Mecanismos de extensión permiten adaptarlo a dominios específicos La extensión de UML con Perfiles  “mecanismo de extensión ligera” ( lightweight ) Perfiles UML contienen: » Stereotypes  nuevos elementos » Tagged values  nuevas propiedades » Constraints  nueva semántica Ejemplo: Modelado Multidimensional UMLDominio Multidimensional ClassFact, Dimension, Base PropertyFactAttribute, OID,Descriptor, DimensionAttribute, DegenerateDimension AssociationRolls-upTo, Completeness

18 18 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte II: Perfiles UML para minería de datos Extensión de UML con perfiles Para la definición de un nuevo perfil: »Descripción »Requisitos previos »Estereotipos »Reglas bien formadas »Comentarios Perfil UML para el modelado Multidimensional (Luján-Mora, Trujillo and Song, DKE 2007) [+60 citas]

19 19 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Extensión de UML con perfiles »Modelo conceptual para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Producción científica »Trabajos futuros

20 20 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte II: Perfiles UML para minería de datos Modelo conceptual para minería de datos en el marco de KDD

21 21 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Extensión de UML con perfiles »Modelo conceptual para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Producción científica »Trabajos futuros

22 22 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte I: Introducción Técnicas de minería de datos: Reglas de asociación Sirve para ver la relaciones de asociación existentes en los datos Ejemplo: Análisis de la cesta de la compra

23 23 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte II: Perfiles UML para minería de datos Reglas de asociación Sirve para ver la relaciones de asociación existentes en los datos Conjunto de ítems frecuentes

24 24 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte II: Perfiles UML para minería de datos Reglas de asociación FALTA actualizar la figura sin ROJOs

25 Parte II: Perfiles UML para minería de datos Reglas de asociación Análisis de la cesta de la compra Caso EntradaPredicción

26 26 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Extensión de UML con perfiles »Modelo conceptual para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Producción científica »Trabajos futuros

27 27 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte I: Introducción Técnicas de minería de datos: Clasificación Permite conocer cuales son los factores más influyentes en una variable Ejemplo: Análisis del riesgo de muerte por infarto Presión sistólica < 91 Presión sistólica > 91 Edad > 62 años Síntoma “Taquicardia” Síntoma “Indigestión” Colesterol < 200 Triglicéridos < 200 Factor de 1º nivel Factores de 2º nivel Factores de 3º nivel

28 28 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte II: Perfiles UML para minería de datos Clasificación Permite conocer cuales son los factores más influyentes en una variable

29 29 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte II: Perfiles UML para minería de datos Clasificación

30 30 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte II: Perfiles UML para minería de datos Clasificación Ejemplo: Análisis del riesgo de infarto Entrada Predicción Caso

31 31 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Extensión de UML con perfiles »Modelo conceptual para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Producción científica »Trabajos futuros

32 32 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte I: Introducción Técnicas de minería de datos: Clustering Descubre “grupos” de comportamiento común Ejemplo: Segmentación de mercado según datos de tarjetas de crédito Nº de coches = 2 Nº de hijos = 2 Viajes anuales > 2 Tarjeta tipo = “Oro” Nº de coches = 2 Nº de hijos = 2 Viajes anuales > 2 Tarjeta tipo = “Oro” Nº de coches = 0 Nº de hijos = 0 Viajes anuales > 3 Tarjeta tipo = “Platinum” Nº de coches = 0 Nº de hijos = 0 Viajes anuales > 3 Tarjeta tipo = “Platinum”

33 33 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte II: Perfiles UML para minería de datos Clustering Descubre “grupos” de comportamiento común

34 34 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte II: Perfiles UML para minería de datos Clustering

35 Parte II: Perfiles UML para minería de datos Clustering Ejemplo: Análisis del compras con tarjeta Entrada Caso Entrada

36 36 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Extensión de UML con perfiles »Modelo conceptual para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Producción científica »Trabajos futuros

37 37 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte I: Introducción Técnicas de minería de datos: Análisis de series temporales Permite conocer una variable temporal, describir sus parámetros y predecir valores futuros Ejemplo: Estudio de cobertura de algas en el litoral Mediterráneo de Alicante

38 38 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte II: Perfiles UML para minería de datos Análisis de series temporales Permite conocer una variable temporal, describir y predecir valores futuros

39 39 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte II: Perfiles UML para minería de datos Análisis de series temporales

40 40 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte II: Perfiles UML para minería de datos Análisis de series temporales Entrada Pronóstico Caso Análisis de la cobertura algal

41 41 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Extensión de UML con perfiles »Modelo conceptual para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Producción científica »Trabajos futuros

42 42 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte III: Aspectos prácticos Implementación: Plataforma Eclipse

43 43 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte III: Aspectos prácticos Implementación

44 44 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte III: Aspectos prácticos Implementación: Reglas de Asociación

45 45 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte III: Aspectos prácticos Implementación: Clasificación

46 46 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte III: Aspectos prácticos Implementación: Clustering

47 47 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte III: Aspectos prácticos Implementación: Series Temporales

48 Parte III: Aspectos prácticos Implementación: Series Temporales

49 Parte III: Aspectos prácticos Implementación: Series Temporales

50 Parte III: Aspectos prácticos Implementación: Series Temporales

51 Parte III: Aspectos prácticos Implementación: Series Temporales

52 Parte III: Aspectos prácticos Implementación: Series Temporales

53 53 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte III: Aspectos prácticos Implementación: Series Temporales Capturas de Merl por mes: AnalisisST

54 54 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Extensión de UML con perfiles »Modelo conceptual para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Producción científica »Trabajos futuros

55 55 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte III: Aspectos prácticos Caso de estudio: Proyecto EMPAFISH European Marine Protected Areas as tools for the Fishery management and conservation Financiado por VI Programa Marco de I+D+I de la Unión Europea Participan catorce instituciones europeas

56 56 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte III: Aspectos prácticos Caso de estudio: Proyecto EMPAFISH Objetivos principales Investigar el potencial de los diferentes tipos de Áreas Marinas Protegidas en Europa para la protección de especies, hábitats o ecosistemas sensibles al efecto de la pesca Desarrollar métodos cuantitativos para evaluar el efecto de las Áreas Marinas Protegidas Proporcionar a la Unión Europea una serie de medidas integradas y propuestas de gestión para la implementación de las Áreas Marinas Protegidas como herramienta de gestión de pesquerías.

57 57 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Caso de estudio: Proyecto EMPAFISH Preguntas que guían la búsqueda de conocimiento ¿Es importante el tamaño de la zona protegida? ¿La cercanía de las áreas marinas protegidas puede afectar en alguna medida? ¿Mejora el comportamiento de las áreas marinas protegidas a lo largo del tiempo? ¿Cómo afecta a la movilidad de las especies marinas? ¿Afecta a la biodiversidad? Parte III: Aspectos prácticos

58 58 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte III: Aspectos prácticos Caso de estudio Modelo multidimensional del almacén de datos

59 59 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Caso de estudio Modelo conceptual para Minería de datos con Clasificación Aspectos prácticos Predicción Entrada Caso Ajustes

60 60 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Aspectos prácticos Caso de estudio

61 61 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Extensión de UML con perfiles »Modelo conceptual para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Producción científica »Trabajos futuros

62 62 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte IV: Aspectos finales Conclusiones El diseño de modelos de minería con la herramienta propuesta permite integrar el diseño de modelos conceptuales de minería de datos en un proceso global de búsqueda de conocimiento KDD Aprovecha datos preprocesados del almacén de datos dentro del proceso KDD (evitando duplicidades de tareas costosas) Mejora la comprensibilidad usando modelos cercanos al analista Facilita la mantenibilidad y reutilización de modelos Provee un mecanismo de documentación para la minería de datos

63 63 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte IV: Aspectos finales Conclusiones Principales aportaciones de esta tesis Una revisión del estado del arte para el modelado de minería de datos La propuesta de modelos conceptuales que describen el dominio de las diversas técnicas de minería de datos La extensión de UML con perfiles específicos para el dominio de las técnicas de minería de datos La creación de un entorno de modelado de las técnicas de minería de datos El desarrollo de un prototipo en forma de plug-in de Eclipse para el desarrollo de proyectos de descubrimiento de conocimiento

64 64 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte IV: Aspectos finales Conclusiones Podemos verificar que se cumple la Hipótesis inicial: Es factible modelar conceptualmente las técnicas de minería de datos de una manera integrada con el modelado del almacén de datos en el marco del proceso de descubrimiento de conocimiento.

65 65 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Extensión de UML con perfiles »Modelo conceptual para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Producción científica »Trabajos futuros

66 66 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte IV: Aspectos finales Producción científica 19 trabajos publicados como producción científica de esta tesis 2 en revistas JCR 11 en congresos internacionales (DAWAK, ECDM, GEOINFORMATICS,..) 6 en congresos o talleres nacionales (JISBD, ADIS, IDEAS,…)

67 67 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Contenido Parte I: Introducción »Conceptos básicos »Hipótesis de trabajo y objetivos »Trabajos relacionados Parte II: Perfiles UML para minería de datos »Extensión de UML con perfiles »Modelo conceptual para minería de datos »Reglas de asociación »Clasificación »Clustering »Análisis de series temporales Parte III: Aspectos prácticos »Implementación »Caso de estudio Parte IV: Aspectos finales »Conclusiones »Producción científica »Trabajos futuros

68 68 José Jacobo Zubcoff Vallejo Lucentia Research Group Junio 2009 Parte IV: Aspectos finales Trabajos futuros Propuestas para el diseño de técnicas de minería de datos aplicando el paradigma del desarrollo dirigido por modelos Estudio y posible incorporación de herramientas de modelado conceptual para de técnicas de aprendizaje automático (machine learning ) y reconocimiento de patrones (pattern recognition/matching) Marco de medición de la calidad de los modelos Validación empírica de la comprensibilidad de los modelos propuestos Incorporación de aspectos de seguridad en minería de datos Estudio e incorporación del modelado conceptual para la minería de datos geográficos Concienciación en la comunidad científica de la necesidad de abordar la minería de datos desde etapas aún más tempranas en el diseño de un proyecto de descubrimiento de conocimiento

69 Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio de 2009 Alicante, España Grupo de Investigación Lucentia Departamento de Lenguajes y Sistemas Informáticos Director: Juan Carlos Trujillo Mondéjar


Descargar ppt "Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio."

Presentaciones similares


Anuncios Google