Universidad Tecnológica Metropolitana Escuela de Informática

Slides:



Advertisements
Presentaciones similares
Inteligencia artificial y sus aplicaciones
Advertisements

Data Mining Minería de Datos Universidad Tecnológica Metropolitana
Complejidad Computacional
Maestria en Docencia Universitaria
Introducción a la minería de datos
LOGICA DIFUSA Lógica bivaluada: cada proposición debe ser verdadera o falsa. Lógica multivaluada: infinitos valores. En 1965 Lotfi A. Zadeh publicó su.
DATA MINING MINERIA DE DATOS Gersom Costas.
ESTADISTICA APLICADA A LAS COMUNICACIONES: CONCEPTOS EN LA INVESTIGACION POR MUESTREO Docente : Fernando Camones SESION 01 Lima, 26 de Octubre 2010.
Investigación de Operaciones
Tecnologías.
Trascendencia de este curso Curso Introducción a la Computación 1
Razonamiento Explícito y Experimentación en la Algoritmia
Computacion Inteligente
Computacion Inteligente
Técnico en programación de Software
INSTITUTO TECNOLÓGICO SUPERIOR DE CALKINI EN EL ESTADO DE CAMPECHE
PROYECTO DE GRADO CARLOS STALIN ALVARADO SANCHEZ
Metodología – Procesos Psicológicos Básicos Prof: Julio Santiago
Teorema de Representación – Funciones de Membrecía
Fundamentos de Lógica Difusa (Fuzzy)
Fundamentos de Lógica Difusa (Fuzzy)
Fundamentos de Lógica Difusa (Fuzzy)
ANTECEDENTES DE ESTADÍSTICA PARA LA INVESTIGACIÓN: 3
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
1 APRENDIZAJE ELECTRÓNICO BASADO EN SERVICIOS WEB.
DEPARTAMENTO DE CIENCIAS E INGENIERÍA DE LA COMPUTACIÓN UNIVERSIDAD NACIONAL DEL SUR Año 1º 2º 3º 4º 5º Programación Matemática Software Sistemas de Hardware.
Sistemas fuzzy tipo Mamdani
Daniel Pizarro Manuel Mazo y Marta Marrón. Departamento de Electrónica 1 Daniel Pizarro Manuel Mazo y Marta Marrón Departamento de Electrónica. Universidad.
Razonamiento inexacto La imprecisión, como así también la incertidumbre, pueden ser tratadas dentro del razonamiento aproximado utilizando la lógica difusa.
1 LOS PROBLEMAS DE DISEÑO EN INGENIERÍA: CONCEPTO Y FORMULACIÓN NELSON VÍLCHEZ UNIVERSIDAD TECNOLÓGICA DEL CENTRO COORDINACIÓN DE INGENIERÍA.
PROGRAMACIÓN LÓGICA.
UNIVERSIDAD CATÓLICA DEL MAULE FACULTAD DE CIENCIAS DE LA INGENIERÍA ESCUELA DE INGENIERÍA CIVIL INFORMÁTICA PROFESOR GUÍA: HUGO ARAYA CARRASCO. ALUMNO.
INTELIGENCIA DE NEGOCIOS
SEMANA Introducción.
Diplomado "Gestión de Negocios con Data Warehouse y Data Mining".
GESTIÓN DE LA PRODUCCIÓN DE BIENES Y SERVICIOS. Objetivo: Facilitar a los participantes la comprensión de las operaciones de producción como un área fundamental.
Análisis y Diseño de Algoritmos. Propiedades : f ( n )  O ( f ( n ) ) a ) O ( f ( n ) )  O ( g ( n ) )  f ( n )  g ( n )
Tema 6 Razonamiento aproximado
Importancia de las aplicaciones de estadística en el control de procesos Guatemala 2010.
Página 1 20/03/2005 Materia: Tecnología de la Información Curso: Profesora Ariana Rosenthal Tecnología de la Información Profesora Ariana Rosenthal Administración.
UNIDAD 2. ALGORITMOS Y ESTRUCTURAS DE DATOS.
INVESTIGACION DE OPERACIONES
Proceso KDD MSc. Carlos Alberto Cobos Lozada
Enfoque cuantitativo y Enfoque cualitativo
EL MÉTODO CIENTÍFICO.
Minería de Dato(Datamining). Minería de Datos Datamining (Minería de datos)  El datamining (minería de datos), es el conjunto de técnicas y tecnologías.
INTRODUCCIÓN A LA INTELIGENCIA ARTIFICIAL Y LOS SISTEMAS EXPERTOS
SOFTWARE WITNESS Alumna: Lucia Pantoja Obando. ¿Qué es el software Witness? Es una herramienta de simulación que permite modelar el entorno de trabajo,
La mecatrónica de por sí no apunta a ser precisamente una tecnología y/o ingeniería, es la síntesis de tecnologías, usando no solamente tecnología mecánica.
SISTEMAS EXPERTOS (SE) Coronel Jaramillo Ricardo
Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.
DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS.
Lógica Difusa Estefania Avendaño Edward Yanquen Cindy Cardenas Jorge Prieto Daniel Lacouture David Contreras Daniela Pérez Juan Vega.
Introducción a los Sistemas Inteligentes
KDD y Técnicas de Minería de Datos en Weka
Diagrama de Flujo Diagrama de flujo sencillo con los pasos a seguir si una lámpara no funciona. El diagrama de flujo o diagrama de actividades es la representación.
Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.
Taller de Inteligencia de Negocios SQL Server Analysis Services Data Mining Semana 11.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Minería de Datos MC BEATRIZ BELTRÁN MARTÍNEZ FACULTAD DE CIENCIAS DE LA COMPUTACIÓN. Primavera 2016.
1.2 CONCEPTOS Y TÉCNICAS (Estado del Arte)

NOMBRE: Paula Andrea Bedoya Rojas. GRADO: 7.3. Institución Educativa Debora Arango P.
Unidad de aprendizaje: Lógica Difusa Dra. Dora María Calderón Nepamuceno Universidad Autónoma del Estado de México Unidad Académica Profesional Nezahualcóyotl.
08/06/20161 DOCENTE: MIGUEL ANGEL RAMOS RIOS. 08/06/20162 Método: Etimología La palabra método deriva etimológicamente de las raíces griegas metas que.
Rafael Zamora Garrido Julio Ejemplos de objetivos de Minería de Datos Reducir las bajas de clientes actuales en un 5%. Aumentar las contrataciones.
Conclusiones: En este trabajo se ha demostrado que se pueden aplicar los algoritmos OCH al ajuste de los parámetros de un modelo borroso mediante la discretización.
Transcripción de la presentación:

Universidad Tecnológica Metropolitana Escuela de Informática Minería de Datos y Lógica Difusa, una aproximación a la predicción de la Contaminación por MP10 Trabajo de Titulación para optar al título de Ingeniero Civil en Computación, mención Informática Profesor Guía: Santiago Zapata Cáceres Alumnos: Jhons Cortez Torres Carlos Reyes Pastore

Índice Introducción Objetivos Estado del Arte Contaminación Ambiental La Información El Conocimiento Minería de Datos Lógica Difusa Contaminación Ambiental Análisis Experimental Modelo de Minería de Datos Modelo Difuso Resultados Obtenidos Conclusiones

Introducción El volumen de la información que manejan las empresas crece día a día. Se hace necesario el transformar la Información en Conocimiento que sea útil para la toma de decisiones. Surgen campos de investigación relacionados con la búsqueda de patrones ocultos en grandes volúmenes de datos y el modelado de datos imprecisos (Minería de Datos y Lógica Difusa).

Objetivos Generales: Específicos: Proceso de KDD. Lógica Difusa. Minería de Datos tradicional. Modelo Difuso. Controlador Difuso. Análisis de resultados. Comparación de enfoques.

Estado del Arte

Estado del Arte Información. Conocimiento. Shannon (1948), Teoría de la Información. Davenport y Prusak (1999), Diferencias entre Datos e Información. Empresa SAS, Propone modelo de evolución de la Información. Brown (2006) Open Group CEO, Nueva revolución de la Información. Conocimiento. Davenport y Prusak (1999), Definición de conocimiento en base a Teoría de Recursos y Capacidades

Estado del Arte Minería de Datos. Raíces de Minería de Datos. Tiene por objetivo, el encontrar patrones ocultos en grandes volúmenes de información acumulada (Histórica). Raíces de Minería de Datos. Estadística Clásica. Inteligencia Artificial. Machine Learning. Principales exponentes: Fayyad, Piatetsky-Shapiro y Smyth (1996).

Proceso de KDD (Knowledge Discovery in Databases) Estado del Arte Proceso de KDD (Knowledge Discovery in Databases) Métodos de Minería de Datos: Métodos Descriptivos: Reglas de Asociación Métodos Predictivos: Árboles de Decisión

Estado del Arte Software de Minería de Datos: Clementine. WEKA. SQL Server (Analysis Services). IBM Intelligent Miner. Áreas relacionadas con Minería de Datos OLAP CRM Minería de Datos Web Mining Text Mining Data Warehousing Lógica Difusa

Estado del Arte Lógica Difusa. Manejo de Información Imprecisa. Aristóteles, precursor de teorías de lógica y matemáticas. Jan Lukasievicz (Siglo XX), Propone Lógica Triple-Evaluada como primer acercamiento. Zadeh (1965), Teoría de Conjuntos Difusos.

Estado del Arte Controladores Difusos. Principal aplicación en Electrónica y Control. Algoritmos de Generación de Reglas Difusas: Wang & Mendel y Cordón y Herrera. Componentes de un Controlador Difuso. Primer Controlador Difuso creado por Mamdani y Assilian (1975) Caso mas conocido Metro de Sendai, Japón (1987)

Estado del Arte Aplicaciones de Lógica Difusa: Medina (1994), Modelo GEFRED. Fuzzy C-Means, Bezdek (1973), Miyamoto y Mikaidono (1997). Reglas de Asociación Difusa, Kuok (1998).

Contaminación Ambiental Factores que inciden en la contaminación en Santiago de Chile: Fuentes emisoras de contaminantes. Condiciones Geográficas. Condiciones Meteorológicas. Consecuencia: Efectos negativos sobre la salud de las personas.

Contaminación Ambiental Red MACAM Índice ICAP Providencia La Paz La Florida Las Condes Parque O’Higgins Pudahuel Cerrillos El Bosque Los episodios de Alerta, Preemergencia y Emergencia se detallan en el PDDA Modelo Predictivo actual: Cassmassi Utiliza Regresiones Lineales Múltiples Acierto Total de 71% Monitoreo de Contaminantes

Análisis Experimental

Análisis Experimental Se utilizaron datos relativos a la contaminación ambiental, medidos por la red MACAM (Fuente SESMA). Mediante Minería de Datos Tradicional se obtuvo un modelo basado en Árboles de Decisión y otro en Reglas de Asociación. Mediante Lógica Difusa se obtuvo un modelo de inferencia difusa basado en Reglas de Comportamiento (Reglas difusas). Se Consideró solamente el MP10 y variables meteorológicas en los modelos (Temperatura, Humedad, Velocidad del Viento, Dirección del Viento).

Modelos obtenidos (Minería de Datos tradicional) Árbol Estación B Reglas de Asociación Estación B Consecuente”Regular” Soporte 30% Software Utilizado: Clementine

Generación de Reglas Difusas Algoritmo de Wang y Mendel Datos Paso 1: Generar Particiones Difusas Paso 2: Generar Reglas Difusas μ3(57) = 0.6 μ4(57) = 0.4 MAX(μ3, μ4) = 0.6 = μH  “Humedad Media”

Generación de Reglas Difusas Algoritmo de Wang y Mendel Regla Generada IF H=Media AND T=Media AND D=Suroeste AND V=MBaja AND MP10=Bueno THEN MP10=Bueno Paso 3: Asignar Grado a cada Regla μH * μT * μD * μV * μMP * μMP = 0.6 -> Grado de la Regla Para Reglas con mismo antecedente y distinto consecuente se conserva la de mayor grado Paso 4: Crear una base de Reglas Difusas Paso 5: Determinar un valor numérico de salida (Método de Desfuzificación)

Generación de Reglas Difusas Ejemplo de Reglas Generadas (Wang y Mendel)

Generación de Reglas Difusas Algoritmo de Cordón y Herrera Paso 1: Generar Particiones Difusas Paso 2: Se genera un subespacio de Reglas Difusas para cada ejemplo numérico.

Generación de Reglas Difusas Algoritmo de Cordón y Herrera Reglas obtenidas por algoritmo Paso 3: Se determina la regla más representativa mediante la “Función de Valoración de la Regla” (FVR). Paso 4: La regla elegida es la que posea mayor FVR. Wang y Mendel Cordón y Herrera

Modelo de Lógica Difusa Sistema de Inferencia Software Utilizado: XFUZZY Modelo

Resultados obtenidos Algoritmo de Wang y Mendel Algoritmo de Cordón y Herrera Aciertos Fallos Porcentaje de acierto Caso Cordón y Herrera 155 345 31 %

Conclusiones Los modelos presentados presentan una interesante alternativa a los existentes, debido a la reducción de la complejidad en el diseño. La Lógica Difusa, resulta de gran utilidad en problemas que no poseen una solución de tipo lineal pues se basan en Heurísticas. La precisión del Modelo Difuso puede mejorarse aumentando los conjuntos difusos por variable o incorporando alguna medida de valoración de Reglas Difusas. Las reglas obtenidas por Wang & Mendel y Cordón & Herrera, son mucho más útiles cuando se cuenta con un número menor de datos en comparación con la Minería Tradicional.

Líneas Futuras de Investigación Considerar variables referidas a la medición de gases como por ejemplo, el O3 o el CO. Realizar una redefinición de los conjuntos difusos de cada variable. Agregar alguna medida de valoración de Reglas de Asociación Difusa, como la Confianza, Soporte o Factor de Certeza (Algoritmo de Kuok).

Fin de la Presentación

Particiones Difusas Sea X un grupo de elementos, y sea x un elemento de ese grupo, un conjunto difuso A en X se define como un conjunto de pares ordenados como sigue: A = {(x, μA(x)) / x  X}, μA(x) función de pertenencia. Ejemplo: sea X = {4, 8, 15….. 32} las mediciones de las temperaturas para la ciudad de Santiago de Chile (x en grados Celsius). Y sea “A” el conjunto “Temperatura Alta” :

Notación por Comprensión Notación por Extensión Representación Gráfica Particiones Difusas 0 si x < 22 μA(x) = (x-22)/4 si 22 ≤ x < 26 1 si x ≤ 26 A = {(22,0), (24,0.5), (25,0.75)…… (30,1)}, en general A = {(x, μA(x))} Notación por Comprensión Notación por Extensión Representación Gráfica Volver

Funciones de Pertenencia Volver

Operaciones Intersección: μA∩B(x) = min {μA(x), μB(x)} x  X. Unión μA(x) U μB(x)) = max {μA(x), μB(x)} x  X. Complemento: μCA(x) = 1 - μA(x) x  X

Operador T – normas: Una T-norma es un operador de conjuntos difusos que satisface las propiedades: x * y = y * x (x * y) * z = (x *(y * z)) si x < y y z < w entonces x * z < y * w x * 1 = x Las T-normas se utilizan para definir los conectivos AND en las reglas difusas, la función Min(A,B) es una T-norma. También existen las S-normas, utilizadas en los conectivos OR de las reglas difusas los cuales también satisfacen una serie de propiedades

Ejemplos de operaciones Conjuntos Unión Intersección Complemento Volver

Variables lingüísticas 1 Variable lingüística: Palabras u oraciones en lenguaje natural, por ejemplo, para la variable Temperatura: <X, L, x, M> X: nombre de la variable, por ejemplo Temperatura. L: valores lingüísticos que puede tomar la variable lingüística, {Baja, media, alta) x : es el dominio numérico donde está definida la variable lingüística X llamado universo de discurso por ejemplo [-5, 35]. M: es la función de pertenencia o bien la función que asigna el valor numérico.

Variables lingüísticas 2 X = Temperatura. L = {Baja, Normal, Alta, Muy alta} x = [0,42] M = grupo de funciones de pertenencia. Volver

Determinación del valor numérico de salida Una vez obtenido el conjunto de salida es necesario determinar un valor en concreto de tipo numérico. Para ello se utiliza algún método de Defuzzyficación. Por ejemplo: Método del Centro de Gravedad. Volver