La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Sesión 7: Redes Bayesianas – Inferencia

Presentaciones similares


Presentación del tema: "Sesión 7: Redes Bayesianas – Inferencia"— Transcripción de la presentación:

1 Sesión 7: Redes Bayesianas – Inferencia
Modelos Gráficos Probabilistas L. Enrique Sucar INAOE Sesión 7: Redes Bayesianas – Inferencia [Neapolitan 90]

2 Inferencia en Redes Bayesianas
Introducción Propagación en árboles (y poliárboles) Algoritmo de eliminación Propagación en redes multi-conectadas Condicionamiento Simulación Agrupamiento Abducción © L.E. Sucar: MGP - Inferencia RB

3 © L.E. Sucar: MGP - Inferencia RB
Propagación de Probabilidades El razonamiento probabilístico o propagación de probabilidades consiste en propagar de los efectos de la evidencia a través de la red para conocer la probabilidad a posteriori de las variables. © L.E. Sucar: MGP - Inferencia RB

4 © L.E. Sucar: MGP - Inferencia RB
La propagación consiste en darle valores a ciertas variables (evidencia), y obtener la probabilidad posterior de las demás variables dadas las variables conocidas (instanciadas). © L.E. Sucar: MGP - Inferencia RB

5 © L.E. Sucar: MGP - Inferencia RB
Inferencia bayesiana C Causal: C -> H Evidencial: E -> H Mixta: C,E -> H P(H|C) H P(E|H) E © L.E. Sucar: MGP - Inferencia RB

6 © L.E. Sucar: MGP - Inferencia RB
Tipos de Técnicas Calcular probabilidades posteriores: Una variable, cualquier estructura: algoritmo de eliminación (variable elimination) Cualquier variable, estructuras sencillamente conectadas (árboles, poliárboles): propagación Cualquier variable, cualquier estructura: Agrupamiento (junction tree) Simulación estocástica Condicionamiento © L.E. Sucar: MGP - Inferencia RB

7 © L.E. Sucar: MGP - Inferencia RB
Tipos de Técnicas Obtener variable(s) de mayor probabilidad dada cierta evidencia – abducción: Abducción total Abducción parcial © L.E. Sucar: MGP - Inferencia RB

8 © L.E. Sucar: MGP - Inferencia RB
Tipos de Estructuras Redes conectadas en forma sencilla: Árboles Poliárboles Redes multiconectadas: © L.E. Sucar: MGP - Inferencia RB

9 © L.E. Sucar: MGP - Inferencia RB
Propagación en Árboles Cada nodo corresponde a una variable discreta, B (B 1, B 2,…, B m) con su respectiva matriz de probabilidad condicional, P(B|A)=P(Bj| Ai) © L.E. Sucar: MGP - Inferencia RB

10 Propagación en Árboles
H A I B C D E F G © L.E. Sucar: MGP - Inferencia RB

11 © L.E. Sucar: MGP - Inferencia RB
Dada cierta evidencia E --representada por la instanciación de ciertas variables-- la probabilidad posterior de cualquier variable B, por el teorema de Bayes: P( Bi | E)=P( Bi ) P(E | Bi) / P( E ) B © L.E. Sucar: MGP - Inferencia RB

12 © L.E. Sucar: MGP - Inferencia RB
Evidencia H A I B C D E F G E = {I,F,E} © L.E. Sucar: MGP - Inferencia RB

13 © L.E. Sucar: MGP - Inferencia RB
Evidencia Ya que la estructura de la red es un árbol, el Nodo B la separa en dos subárboles, por lo que podemos dividir la evidencia en dos grupos: E-: Datos en el árbol que cuya raíz es B E+: Datos en el resto del árbol © L.E. Sucar: MGP - Inferencia RB

14 © L.E. Sucar: MGP - Inferencia RB
Evidencia H E+ A I B C D E F G E- © L.E. Sucar: MGP - Inferencia RB

15 © L.E. Sucar: MGP - Inferencia RB
Entonces: P( Bi | E ) = P ( Bi ) P ( E-,E+ | Bi ) / P(E) Pero dado que ambos son independientes y aplicando nuevamente Bayes: P( Bi | E ) = a P ( Bi | E+ ) P(E- | Bi ) Donde a es una constante de normalización © L.E. Sucar: MGP - Inferencia RB

16 © L.E. Sucar: MGP - Inferencia RB
Definiciones: Si definimos los siguientes términos: l (Bi)= P ( E- | Bi) p (Bi)= P (Bi | E+ ) Entonces: P(Bi | E ) = a p (B i) l (B i) © L.E. Sucar: MGP - Inferencia RB

17 © L.E. Sucar: MGP - Inferencia RB
Desarrollo En base a la ecuación anterior, se puede integrar un algoritmo distribuido para obtener la probabilidad de un nodo dada cierta evidencia Para ello se descompone el cálculo de cada parte: Evidencia de los hijos (l) Evidencia de los demás nodos (p) © L.E. Sucar: MGP - Inferencia RB

18 Evidencia de los hijos (l)
Dado que los hijos son condicionalmente independientes dado el padre: l (Bi) = P ( E- | Bi) = Pk P ( Ek- | Bi) Donde Ek- corresponde a la evidencia del subárbol del hijo k © L.E. Sucar: MGP - Inferencia RB

19 © L.E. Sucar: MGP - Inferencia RB
Evidencia hijos H A I B C D E-(D) E E-(E) F G J © L.E. Sucar: MGP - Inferencia RB

20 Evidencia de los hijos (l)
Condicionando respecto a los posibles valores de los hijos de B: l (Bi)= Pk [ Sj P ( Ek- | Bi, Sjk) P(Sjk | Bi) ] Donde Sk es el hijo k de B, y la sumatoria es sobre los valores de dicho nodo (teorema de probabilidad total) © L.E. Sucar: MGP - Inferencia RB

21 Evidencia de los hijos (l)
Dado que B es condicionalmente independiente de la evidencia dados sus hijos: l (Bi) = Pk [ Sj P ( Ek- | Sjk) P(Sjk | Bi) ] Substituyendo la definción de l: l (Bi)= Pk [ Sj P(Sjk | Bi) l (Sjk)] © L.E. Sucar: MGP - Inferencia RB

22 © L.E. Sucar: MGP - Inferencia RB
Evidencia hijos H A I B C D l(D) E l(E) F G © L.E. Sucar: MGP - Inferencia RB

23 Evidencia de los hijos (l)
Recordando que l es un vector (un valor por cada posible valor de B), lo podemos ver en forma matricial: l = l P (S | B) © L.E. Sucar: MGP - Inferencia RB

24 Evidencia de los demás nodos (p)
Condicionando sobre los diferentes valores del nodo padre (A): p (Bi) = P (Bi | E+ ) = Sj P (Bi | E+ , Aj) P(Aj | E+ ) Donde Aj corresponde a los diferentes valores del nodo padre de B © L.E. Sucar: MGP - Inferencia RB

25 © L.E. Sucar: MGP - Inferencia RB
Evidencia padre H A E+ I B C D E F G © L.E. Sucar: MGP - Inferencia RB

26 Evidencia de los demás nodos (p)
Dado que B es independiente de la evidencia “arriba” de A dado A: p (Bi) = Sj P (Bi | Aj) P(Aj | E+ ) La P(Aj | E+ ) corresponde a la P posterior de A dada toda la evidencia excepto B y sus hijos, por lo que se puede escribir como: P(Aj | E+ ) = a p (A i) Pk¹B lk (A i) © L.E. Sucar: MGP - Inferencia RB

27 © L.E. Sucar: MGP - Inferencia RB
Evidencia padre p(A) H A I B C l(C) D l(B) E F G © L.E. Sucar: MGP - Inferencia RB

28 Evidencia de los demás nodos (p)
Substituyendo P(Aj | E+ ) en la ecuación de p : p (Bi) = Sj P (Bi | Aj) [ a p (A i) Pk¹B lk (A i) ] De forma que se obtiene combinando la p de del nodo padre con la l de los demás hijos © L.E. Sucar: MGP - Inferencia RB

29 Evidencia de los demás nodos (p)
Dado que también p es un vector, lo podemos ver en forma matricial (donde PA es el producto de la evidencia de padre y otros hijos): p = P (B | A) PA © L.E. Sucar: MGP - Inferencia RB

30 © L.E. Sucar: MGP - Inferencia RB
Algoritmo Mediante estas ecuaciones se integra un algoritmo de propagación de probabilidades en árboles. Cada nodo guarda los valores de los vectores p y l, así como las matrices de probabilidad P. La propagación se hace por un mecanismo de paso de mensajes, en donde cada nodo envía los mensajes correspondientes a su padre e hijos: © L.E. Sucar: MGP - Inferencia RB

31 Mensaje a los hijos (hacia abajo) - nodo B a su hijo Sk :
Mensaje al padre (hacia arriba) – nodo B a su padre A: Mensaje a los hijos (hacia abajo) - nodo B a su hijo Sk : © L.E. Sucar: MGP - Inferencia RB

32 © L.E. Sucar: MGP - Inferencia RB
Al instanciarse ciertos nodos, éstos envían mensajes a sus padres e hijos, y se propagan hasta a llegar a la raíz u hojas, o hasta encontrar un nodo instanciado. Así que la propagación se hace en un solo paso en un tiempo proporcional al diámetro de la red. © L.E. Sucar: MGP - Inferencia RB

33 © L.E. Sucar: MGP - Inferencia RB
Propagación l H lI(H) lA(H) A lB(A) I lC(A) B C lD(B) lE(B) D E lF(D) lG(D) F G © L.E. Sucar: MGP - Inferencia RB

34 © L.E. Sucar: MGP - Inferencia RB
Propagación p H pH(I) pH(A) A pA(B) I pA(C) B C pB(D) pB(E) D E pD(F) pD(G) F G © L.E. Sucar: MGP - Inferencia RB

35 Condiciones Iniciales
Nodos hoja no conocidos: l (Bi) = [1,1, …] Nodos asignados (conocidos): l (Bi) = [0,0, ..1, 0, …, 0] (1 para valor asignado) p (Bi) = [0,0, ..1, 0, …, 0] (1 para valor asignado) Nodo raíz: p (A) = P(A), (probabilidad marginal inicial) © L.E. Sucar: MGP - Inferencia RB

36 © L.E. Sucar: MGP - Inferencia RB
Ejemplo P(C) Comida P(E|C) Enf. P(F|E) P(D|E) Fiebre Dolor © L.E. Sucar: MGP - Inferencia RB

37 © L.E. Sucar: MGP - Inferencia RB
Ejemplo Comida Enf. F=si l=[1,0] l=[1,1] Fiebre Dolor © L.E. Sucar: MGP - Inferencia RB

38 © L.E. Sucar: MGP - Inferencia RB
Ejemplo Comida lF= [1,0] * [.9 .5 | .1 .5] = [.9 .5] lD= [1,1] * [.7 .4 | .3 .6] = [1 1] Enf. Fiebre Dolor P(F|E) P(D|E) © L.E. Sucar: MGP - Inferencia RB

39 © L.E. Sucar: MGP - Inferencia RB
Ejemplo l(C) = [.9 .5] * [.9 .7| .1 .3] = [ ] Comida P(E|C) l(E) = [.9 .5] * [1 1] = [.9 .5] Enf. Fiebre Dolor P(F|E) P(D|E) © L.E. Sucar: MGP - Inferencia RB

40 © L.E. Sucar: MGP - Inferencia RB
Ejemplo p(C) = [.8 .2] Comida p(E) = [.8 .2] * [.9 .7| .1 .3] = [ ] P(E|C) Enf. Fiebre Dolor P(F|E) P(D|E) © L.E. Sucar: MGP - Inferencia RB

41 © L.E. Sucar: MGP - Inferencia RB
Ejemplo p(C) = [.8 .2] Comida p(D) = [ ] * [.9 .5] [.7 .4| .3 .6] = [ ] p(E) = [ ] Enf. Fiebre Dolor P(D|E) © L.E. Sucar: MGP - Inferencia RB

42 © L.E. Sucar: MGP - Inferencia RB
Ejemplo p(C) = [.8 .2] Comida p(E) = [ ] l(C) = [ ] P(C)=a[ ] P(C)= [ ] l(E) = [.9 .5] P(E)=a[ ] P(E)= [ ] Enf. p(D) = [ ] Fiebre Dolor l(D)=[1,1] P(D)=a[ ] P(D)= [ ] © L.E. Sucar: MGP - Inferencia RB

43 © L.E. Sucar: MGP - Inferencia RB
Demo 1 Ejemplo en HUGIN © L.E. Sucar: MGP - Inferencia RB

44 © L.E. Sucar: MGP - Inferencia RB
Propagación en Poliárboles . Un poliárbol es una red conectada en forma sencilla, pero en la que un nodo puede tener varios padres: P(B | A1, A2, …, An) © L.E. Sucar: MGP - Inferencia RB

45 Propagación en Poliárboles
H I A B C D E F G © L.E. Sucar: MGP - Inferencia RB

46 © L.E. Sucar: MGP - Inferencia RB
Algoritmo El método es muy similar al de árboles, con algunas consideraciones adicionales: Considerar la probabilidad condicional del nodo dados todos sus padres para el cálculo de p y l Enviar los mensajes l a cada uno de los padres de un nodo © L.E. Sucar: MGP - Inferencia RB

47 © L.E. Sucar: MGP - Inferencia RB
Propagación en Redes Multiconectadas Una red multiconectada es un grafo no conectado en forma sencilla, es decir, en el que hay múltiples trayectorias entre nodos (MCG). En este tipo de RP los métodos anteriores ya no aplican, pero existen otras técnicas alternativas: Condicionamiento Simulación estocástica Agrupamiento © L.E. Sucar: MGP - Inferencia RB

48 © L.E. Sucar: MGP - Inferencia RB
Abducción La “abducción” se define como encontrar la mejor “explicación” (valores de un cierto conjunto de variables) dada cierta evidencia Normalmente se buscan los valores del conjunto “explicación” que tiene mayor probabilidad En general, el conjunto de mayor probabilidad NO es igual a los valores individuales de mayor probabilidad © L.E. Sucar: MGP - Inferencia RB

49 © L.E. Sucar: MGP - Inferencia RB
Abducción H A I B C D E Ejemplo: Max P(A,B,F|G,I) F G © L.E. Sucar: MGP - Inferencia RB

50 © L.E. Sucar: MGP - Inferencia RB
Referencias Pearl 88 – Cap. 4,5 Neapolitan 90 – Cap. 6,7,8 Notas Jordan – Cap. 4 © L.E. Sucar: MGP - Inferencia RB


Descargar ppt "Sesión 7: Redes Bayesianas – Inferencia"

Presentaciones similares


Anuncios Google