La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

1 3. Introducción a la Lógica Difusa Jorge Cabrera Gámez Departamento de Informática y Sistemas Universidad de Las Palmas de Gran Canaria © Todos los derechos.

Presentaciones similares


Presentación del tema: "1 3. Introducción a la Lógica Difusa Jorge Cabrera Gámez Departamento de Informática y Sistemas Universidad de Las Palmas de Gran Canaria © Todos los derechos."— Transcripción de la presentación:

1 1 3. Introducción a la Lógica Difusa Jorge Cabrera Gámez Departamento de Informática y Sistemas Universidad de Las Palmas de Gran Canaria © Todos los derechos reservados

2 2 Contenidos 3.Introducción a la Lógica Difusa 3.1Teoría de conjuntos difusos 3.2Inferencia en lógica difusa 3.3Un caso de estudio 3.4Bibliografía básica: [Cox-94], [Bend-96].

3 3 Introducción a la Lógica Borrosa Teoría de conjuntos difusos / borrosos (Fuzzy set theory) L. Zadeh, 1965 Modelos difusos de representación y tratamiento de la incertidumbre Definición. Conjunto: La reunión de todos los elementos que verifican una condición El conjunto de todos los elementos de Y que verifican A(x)

4 4 Introducción a la Lógica Borrosa Definición. Conjunto: La reunión de todos los elementos que verifican una condición El conjunto de todos los elementos de Y que verifican A(x) Teoría clásica de conjuntos (Crisp set theory) No pertenece Sí pertenece pertenencia de x al conjunto A Teoría de conjuntos difusos (Fuzzy set theory) Existe un rango de grados de pertenencia entre las posibilidades extremas

5 5 Introducción a la Lógica Borrosa Idea Un conjunto difuso es un conjunto cuya fronteras no están bien definidas (subjetividad, vaguedad, imprecisión,...) y, por tanto, la pertenencia o no de un elemento al mismo contiene una cierta incertidumbre Bayes Aleatoriedad de eventos definidos de manera precisa Conjuntos Difusos Subjetividad en la calificación de eventos no aleatorios

6 6 Ejemplo: Sea el conjunto de las personas consideradas altas definido sobre el conjunto de la población española, y consideremos un elemento del mismo denominado pepe. La cuestión de si pepe pertenece o no al conjunto de las personas altas puede resolverse atendiendo a la medida altura(pepe) y una función que mide la posibilidad de ser considerado alto en base a la altura alto (altura) altura (m)

7 7 Definición de la Función de posibilidad (Función de pertenencia) 1. Como una función de cualquier conjunto de parámetros p k (x) del elemento x. 2. Por enumeración de pares definidos sobre elementos discretos del conjunto donde – no representa una suma, sino una agregación de pares. – a(x)/x no representa ningún cociente, sino un par (posibilidad/elemento) Ejemplo: Sea el ejemplo anterior donde se definía el conjunto de personas altas. Si el conjunto de posibles alturas se representa por un conjunto de alturas discretas, U, tal que, U= { 1.30, 1.50, 1.70, 1.90, 2.10 } podemos definir la distribución de posibilidad de ser alto sobre el conjunto U como: ALTO = 0.0/ / / / /2.10

8 8 Algunas funciones de pertenencia muy utilizadas

9 9 Algunas funciones de pertenencia muy utilizadas

10 10 Algunas funciones de pertenencia muy utilizadas

11 11 Algunas funciones de pertenencia muy utilizadas

12 12 Algunas funciones de pertenencia muy utilizadas

13 13 Modificadores (Hedges) Es posible introducir conjuntos difusos por transformación lingüística de uno dado. Algunos de los más frecuentes son: muy Amás_o_menos A no A En general, pueden introducirse nuevas clases de cualificadores o modificadores en la forma:

14 14 Extensión cilíndrica En el caso de que se quiera realizar la composición de dos conjuntos cuyas bases de parámetros sean diferentes, será necesario definir una base de parámetros comunes. A este proceso se le denomina Extensión Cilíndrica. Sea una distribución posibilista del conjunto A sobre el parámetro definido por U 1, dada por: U 1 = { 1, 2, 5 } Y sea otra distribución posibilista del conjunto B sobre el parámetro definido por U 2, tal que: U 2 = { 8, 10, 15 }

15 15 Extensión cilíndrica Se define la extensión cilíndrica de A sobre el producto cartesiano de los parámetros U 1 y U 2, dado por U 3 = U 1 xU 2 como: U (1,8)(1,10)(1,15) U 1 2(2,8)(2,10)(2,15) 5(5,8)(5,10)(5,15)

16 16 Proyección Es el proceso inverso al de Extensión cilíndrica. De él se obtiene una distribución posibilista sobre un conjunto de parámetros inferior de acuerdo con: donde sup es el valor supremo sobre el parámetro x n. Ejemplo: Sea la distribución posibilista A (x,y) dada por: A =1.0/(1, 3) + 0.9/(1, 6) + 0.8/(1, 9) 0.7/(5, 3) + 0.6/(5, 6) + 0.5/(5, 9) 0.4/(8, 3) + 0.3/(8, 6) + 0.2/(8, 9) tiene una proyección sobre Y, A´ (x), dada por: A´= 1.0/ / /8

17 17 Reglas de Composición Dados los conjuntos A y B, cuyas distribuciones de posibilidad son conocidas se define la distribución de posibilidad de una composición de ambas como: A*B (x) = F * ( A (x), B (x)) Unión: A B (x) = F ( A (x), B (x)) Intersección: A B (x) = F ( A (x), B (x)) Complemento: ¬A (x) = F ¬ ( A (x)) F ( A (x), B (x)) S-norma F ( A (x), B (x)) T-norma Normalmente las funciones A B (x), A B (x) y ¬A (x) serán dependientes de la semántica del conjunto. Sin embargo, se pueden simplificar tales funciones suponiendo que dependen solamente de las distribuciones de los conjuntos A y B por separado.

18 18 Simplificación 1: Comportamiento monótono Por ejemplo: coches_veloces coches Dado que se verifica:A A B B A B A B A A B B entonces por la simplificación anterior deben verificarse también: A (x) A B (x) B (x) A B (x) A B (x) A (x) A B (x) B (x) A B (x) max( A (x), B (x)) A B (x) min( A (x), B (x)) Esto implica que deben cumplirse las siguienes restricciones sobre las operaciones de unión e intersección

19 19 Simplificación 2: Definición del complementario Para definir la distribución del conjunto complementario se asume la siguiente simplificación: Lo que equivale a:

20 20 Operadores de Zadeh: Zadeh estableció como definición de las leyes de pertenencia a los conjuntos intersección y unión las cotas máximas y mínimas respectivamente de dichos conjuntos: A B (x) max( A (x), B (x)) A B (x) min( A (x), B (x)) A B (x) = max( A (x), B (x)) A B (x) = min( A (x), B (x)) ¬A (x) = 1 - A (x) Estas definiciones no están exentas de paradojas, por ejemplo: A ¬A (x) = max( A (x), 1 - A (x)) 1 Un elemento puede no pertenecer del todo a un conjunto y su complementario A ¬A (x) = min( A (x), 1 - A (x)) 0 Un elemento puede pertenecer a un conjunto y su complementario

21 21 Uniones difusas Intersecciones difusasRango

22 22 Lógica Difusa Se construye a partir de la teoría de conjuntos difusos El grado de verdad o certeza de una proposición p es un valor en el contínuo [0,1] proposiciónp: X es A p (x) = A (x) Para completar el cálculo de proposiciones se definen los conectores AND, OR y NOT p q : (X es A) (Y es B) p: (X es A)

23 23 Lógica Difusa Para completar el cálculo de proposiciones se definen los conectores AND, OR y NOT p q : (X es A) (Y es B) p: (X es A) Puede ocurrir que las distribuciones posibilistas p y q no estén definidas sobre la misma base de parámetros. En ese caso es necesario extender cilíndricamente dichas distribuciones. Por otro lado debe recordarse que : p q (x) max( p (x), q (x)) p q (x) min( p (x), q (x))

24 24 Lógica Difusa En general, definiremos las funciones and(), or() y not() como: p q (x) = or( p (x), q (x)) p q (x) = and( p (x), q (x)) ¬p (x) = not( p (x)) En el caso más general: p q (x,y) = or( p (x), q (y)) p q (x,y) = and( p (x), q (y)) Las funciones and(), or() y not() son dependientes de la semántica de las proposiciones o Universo del Discurso. Deben verificar en cualquier caso las siguientes relaciones para ser compatibles con los valores booleanos en el límite de no borrosidad:

25 25 Lógica Difusa Las funciones and(), or() y not() son dependientes de la semántica de las proposiciones o Universo del Discurso. Deben verificar en cualquier caso las siguientes relaciones para ser compatibles con los valores booleanos en el límite de no borrosidad: or(1, u) = 1 or(0, u) = u and(1, u) = u and(0, u) = 0 not(1) = 0 not(0) = 1 Un conjunto muy amplio de funciones cumplen estas restricciones. Dos modelos muy empleados son los siguientes Modelo de Zadeh: or1(u, v) = max(u, v) and1(u, v) = min(u, v) not(u) = 1 - u Modelo Pseudoprobabilístico: or2(u, v) = u + v - u·v and2(u, v) = u·v not(u) = 1 - u

26 26 Lógica Booleana A) p p 1 B) p p 0 C) p (q r) (p q) r D) p (q r) (p q) r E) p (q r) (p q) (p r) F) p (q r) (p q) (p r) G) (p q) p q H) (p q) p q Modelo de Zadeh or1(u, v) = max(u, v) and1(u, v) = min(u, v) not(u) = 1 - u A) max(u, 1- u) 1 B) min(u, 1 - u) 0 C) D) E) F) G) H)

27 27 Lógica Booleana A) p p 1 B) p p 0 C) p (q r) (p q) r D) p (q r) (p q) r E) p (q r) (p q) (p r) F) p (q r) (p q) (p r) G) (p q) p q H) (p q) p q Modelo Pseudoprobabilístico or2(u, v) = u + v -u·v and2(u, v) = u·v not(u) = 1 - u A) u + (1- u) - u·(1-u) 1 B) u·(1 - u) 0 C) D) E) F) G) H)

28 28 Demostración de la primera ley de Morgan p q=max(p,q) p q p1 - p 1 - p p < q q1 - q 1 - q (p q)=1-max(p,q) p q = min(1-p,1-q) (p q) p q p q p+ q - p·q 1 - p - q + p·q (1 - p)(1 - q) = 1 - p - q + p·q (p q) p q

29 29 Inferencia Difusa La operación de implicación se puede expresar en la forma: p q : si (X es A) entonces (Y es B) donde A y B son variables lingüísticas definidas como conjuntos difusos sobre los universos de discurso de X e Y respectivamente. Ejemplos: Si la presión es baja entonces el volumen es grande Si el tomate es rojo entonces está maduro Si la velocidad es alta entonces frenar ligeramente

30 30 Inferencia Difusa El principal problema para establecer un valor de certeza a este operador estriba en definir una interpretación del mismo. Sea imp() una función que proporciona la certeza en una fórmula con implicación. Veamos posibles interpretaciones:

31 31 A) Basada en la equivalencia siguiente, válida en el límite booleano p q ¬ p q p q p q ¬ p ¬p q ¬ q p ¬q ¬(p ¬q) T T T F T F F T T F F F F T T F F T T T T F F T F F T T T T F T De acuerdo con esta interpretación y según los operadores ya definidos: imp1(u, v) = max(1 - u, v) imp2(u, v) = (1 - u) + v - (1 - u)·v

32 32 B) Basada en la idea: La certeza del consecuente es superior o igual a la conjunción del antecedente e implicación p (p q) q (modus ponens) B1) min(u, imp(u, v)) v B2) u * imp(u, v)) v C) Implicación de Lukasiewicz imp5(u, v) = min(1 - u + v, 1)

33 33 Modus Ponens Empleando alguna de las definiciones anteriores de implicación es posible definir el proceso de inferencia difusa empleando modus ponens. p (p q) q Dadas las certezas de un antecedente y la de la implicación, la determinación de la certeza del consecuente se realiza en base a una función generadora del modus ponens que denominaremos mod() La función mod() debe verificar una serie de propiedades, algunas de las cuales son las siguientes: a) mod(u, imp(u, v)) v b) mod(1, 1) = 1 c) mod(0, u) = v d) u v mod(u, w) mod(v, w) a) La función mod() tiene como cota superior la certeza del consecuente b) Este es el límite booleano del modus ponens c) De un antecedente completamente falso puede concluirse cualquier cosa d) La función mod() debe ser monótona creciente con la certeza del antecedente

34 34 Funciones generadoras del modus ponens que resultan de las definiciones de la función implicación presentadas anteriormente:

35 35 Todas estas expresiones son válidas para la realización de inferencia en casos análogos al siguiente: regla:si (x es A) entonces (y es B) premisa:(x es A) (y es B) Y también en casos como el siguiente, donde A y A poseen la misma base de parámetros: regla:si (x es A) entonces (y es B) premisa:(x es A ) (y es B) regla:si (el coche es viejo) entonces (el coche es ruidoso) premisa: (el coche es bastante viejo) (el coche es bastante ruidoso)

36 36 Razonamiento difuso basado en la composición Max-Min Sean A y A conjuntos difusos en X y sea B otro conjunto difuso en Y. Supongamos que la implicación difusa (A B) definida sobre X x Y se expresa como: Nótese que esta definición de la implicación no es sino una expresión equivalente a imp3(u, v). Consideremos la regla, si (x es A) entonces (y es B) y la premisa (x es A ) El conjunto difuso inducido B, se define según hemos visto como

37 37 1. Una regla con un único antecedente Para este caso la ecuación anterior se transforma en: donde w representa un índice de compatibilidad entre la premisa y el antecedente de la regla. x AA x w B B

38 38 si (x es A) y (y es B) entonces (z es C) (x es A ) y (y es B ) (z es C ) 2. Una regla con dos antecedentes Una regla de este tipo puede representarse por una implicación A x B C de manera que:

39 39 donde w 1 w 2 se puede asociar con el grado de satisfacción o intensidad de disparo de la regla

40 40 x AA x w1w1 C C 2. Una regla con dos antecedentes x BB w2w2 min

41 41 3. Múltiples reglas con múltiples antecedentes La interpretación de múltiples reglas se toma usualmente como la unión de las inferencias difusas obtenidas de cada una de las reglas. hecho:(x es A ) y (y es B ) regla 1:si (x es A 1 ) y (y es B 1 ) entonces (z es C 1 ) regla 2:si (x es A 2 ) y (y es B 2 ) entonces (z es C 2 ) consecuencia: (Z es C ) Resulta intuitivo observar que del caso anterior C = C 1 C 2

42 42 x A1A1 A x w 11 C1C1 C1C1 x B1B1 B w 12 min x A2A2 A x w 21 C2C2 C2C2 x B2B2 B w 22 x C max

43 43 Cuando una regla difusa asume la forma si (x es A) o (y es B) entonces (z es C) la intensidad de disparo de la regla (w) viene dada por el máximo de los grados de correspondencia de los antecedentes. Esto es: donde:

44 44 Métodos de concentración (Defuzzification) La utilización de reglas de inferencia difusas produce, tras la evaluación, un conjunto difuso para cada variable del modelo: Ejemplo: si (x es X) entonces (D es A) si (y es Y) entonces (D es B) si (z es Z) entonces (D es C) El conjunto resultante D es un conjunto difuso que representa a una cierta variable D a la que normalmente es necesario asignar un valor escalar. x A y B y C y D Valor escalar

45 45 Métodos de concentración (Defuzzification) x menor de maximos media de maximos mayor de maximos centroide Posibles medidas Todos son métodos heurísticos para encontrar el valor que mejor representa o sintetiza la información contenida en el conjunto difuso. Uno de los más empleados: Centroide:

46 46 Un caso de estudio: Control Difuso de una turbina de vapor Introducción: Se pretende controlar la inyección de combustible en una turbina de vapor al objeto de mantener constante la velocidad. La cantidad de combustible que se consume por unidad de tiempo (tasa de consumo) se incrementa o disminuye mediante la apertura o cierre, repectivamente, de la válvula de inyección en función de la temperatura y la presión en la caldera.

47 47 Se pretende controlar la inyección de combustible en una turbina de vapor al objeto de mantener constante la velocidad. La cantidad de combustible que se consume por unidad de tiempo (tasa de consumo) se incrementa o disminuye mediante la apertura o cierre, repectivamente, de la válvula de inyección en función de la temperatura y la presión en la caldera. Sensor de temperatura Sensor de presión Controlador de la válvula de inyección Planta de la turbina P(t) T(t) Sensores Sensor RPM RPM(t) I(t) Sensor RPM RPM(t)

48 48 1. Descomponer cada variable del modelo en un conjunto de regiones difusas (vocabulario de cada variable) ºC 1 MUY_BAJA BAJA OPTIMA ALTA MUY_ALTA TEMPERATURA

49 Kg/m2 1 MUY_BAJA BAJA OPTIMA ALTA MUY_ALTA PRESIÓN

50 cm/sg 1 CERRAR_MUCHO (CM) CERRAR (C) DEJAR_IGUAL (OK) ABRIR (A) ABRIR_MUCHO (AM) ACCIONES SOBRE LA VÁLVULA CERRAR_UN_POCO (CP) ABRIR_UN_POCO (AP)

51 51 2. Sintetizar las reglas de control (base de conocimiento) Por ejemplo: [R1]Si la temperatura es baja y la presión es muy_baja entonces la acción sobre la válvula es abrir_mucho [R2]Si la temperatura es baja y la presión es baja entonces la acción sobre la válvula es abrir [R3]Si la temperatura es baja y la presión es óptima entonces la acción sobre la válvula es dejar_igual [R4]Si la temperatura es baja y la presión es alta entonces la acción sobre la válvula es cerrar

52 52 3. El Algoritmo A. Leer los sensores de presión y temperatura B. Hacer solución (x) = 0 C. Para todas la reglas cuyos antecedentes no sean nulos C.1 Obtener el mínimo de todos los predicados conectados por operadores conjuntivos (AND) en el antecedente de la regla. P certeza = min(E 1, E 2,..., E n ) C.2 Obtener la certeza de la regla control (x) = min( regla (x), P certeza ) C.3 Asignar el conjunto difuso obtenido en control (x) al conjunto solución mediante una operación de máximo (OR) solución (x) = max( solución (x), control (x) ) D. Concentrar solución (x) (p.e. obteniendo el centroide) para obtener el valor escalar que requiere la acción de control.

53 53 Veamos como funciona Supongamos que tras leer los sensores, la presión cae dentro del dominio de los conjuntos difusos OPTIMA y BAJA; y la temperatura se incluye dentro del conjunto difuso BAJA. Las reglas cuyos antecedentes no son nulos son: [R2]Si la temperatura es baja y la presión es baja entonces la acción sobre la válvula es abrir [R3]Si la temperatura es baja y la presión es óptima entonces la acción sobre la válvula es dejar_igual

54 ºC 1 MUY_BAJA BAJA OPTIMA ALTA MUY_ALTA Kg/m2 1 MUY_BAJABAJAOPTIMAALTA MUY_ALTA cm/sg 1 CERRAR_MUCHO (CM) CERRAR (C) DEJAR_IGUAL (OK) ABRIR (A) ABRIR_MUCHO (AM) CERRAR_UN_POCO (CP) ABRIR_UN_POCO (AP)

55 ºC 1 BAJA Kg/m2 1 BAJA cm/sg 1 ABRIR (A) ºC 1 BAJA Kg/m2 1 OPTIMA cm/sg 1 DEJAR_IGUAL (OK) TemperaturaPresión Acciones de control sobre la vávula cm/sg 1 DEJAR_IGUAL (OK) Centroide= 23 cm/sg

56 56 Bibliografía. [Cox-94]E. Cox The Fuzzy Systems Handbook Academic Press, 1994 [Bend-96]E. Bender Mathematical Methods in Artificial Intelligence IEEE Computer Society Press, 1996.


Descargar ppt "1 3. Introducción a la Lógica Difusa Jorge Cabrera Gámez Departamento de Informática y Sistemas Universidad de Las Palmas de Gran Canaria © Todos los derechos."

Presentaciones similares


Anuncios Google