Sesión 12: Redes Bayesianas: extensiones y aplicaciones Modelos Gráficos Probabilistas L. Enrique Sucar INAOE.

Slides:



Advertisements
Presentaciones similares
Introducción a las Redes neuronales
Advertisements

Contraste de Hipótesis
KRIGING.
NECESIDAD DE LA SIMULACIÓN POR ORDENADOR
CARACTERÍSTICAS ESTADÍSTICAS
Especialista en Business Intelligence Analysis Services SSAS (Sesión 14) Microsoft SQL Server 2008 R2 Suscribase a o escríbanos a
Estimación por Intervalos de confianza
Sesión 12: Procesos de Decisión de Markov
Curso de Estadística Básica
Maracaibo, 5 de Noviembre de 2007 Universidad del Zulia Facultad de Ingeniería Instituto de Cálculo Aplicado Universidad del Zulia Facultad de Ingeniería.
Representación del Conocimiento
FUNCIONES DE DENSIDAD DE PROBABILIDAD
REDES BAYESIANAS Y DECISIÓN ESTADÍSTICA
Modelos Gráficos Probabilistas
Licenciatura en Administración Pública
Prueba de hipótesis Equivalencia entre la prueba de hipótesis y los intervalos de confianza Valor de probabilidad Valor de probabilidad unilateral Prueba.
Sesión 2: Métodos Probabilísticos Básicos
Sesión 13: Lógica y Probabilidad. Incertidumbre - LD y LP, L.E. Sucar2 Contenido Lógica probabilista Redes bayesianas con nodos lógico Modelos relacionales.
Sesión 4: Métodos Probabilísticos Básicos “... tenemos razones para creer que hay en la constutución de las cosas leyes de acuerdo a las cuales suceden.
L. Enrique Sucar M. López Robótica Inteligente Los robots del futuro: Robots de Servicio.
Sesión 2: Teoría de Probabilidad “Considero que la probabilidad representa el estado de la mente con respecto a una afirmación, evento u otra cosa para.
Modelado matemático de sistemas de control
Importancia de las aplicaciones de estadística en el control de procesos Guatemala 2010.
Pronósticos, Series de Tiempo y Regresión
Pronósticos, Series de Tiempo y Regresión
Eduardo Morales / L. Enrique Sucar
Sesión 6: Campos de Markov
Sesión 12: Procesos de Decisión de Markov. Incertidumbre - MDP, L.E. Sucar2 Procesos de Decisión de Markov Procesos de Decisión Secuenciales Procesos.
INTERVALO DE CONFIANZA
Manejo de Incertidumbre Sesión 13 Eduardo Morales / L. Enrique Sucar Sesión 13 Eduardo Morales / L. Enrique Sucar.
Sesión 5: Modelos Ocultos de Markov
Sesión 5: Modelos Ocultos de Markov
Unidad V: Estimación de
Pasos de un estudio de simulacion (repaso).
Razonamiento con Incertidumbre
INVESTIGACION DE OPERACIONES
LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
Simular: Representar una cosa, fingiendo o imitando lo que no es.
Sesión 10: Redes Bayesianas – Aprendizaje “Preferiría descubrir una ley causal que ser rey de Persia” [Democritus] Modelos Gráficos Probabilistas L. Enrique.
Sesión 2: Teoría de Probabilidad
Introducción a la Robótica mecanismos avanzados Coordinación de Ciencias Computacionales, INAOE Dra Angélica Muñoz Dr Eduardo Morales
Herramientas básicas.
Sesión 7: Redes Bayesianas – Inferencia
Integración de Redes Bayesianas con Programas Lógicos para Música Eduardo Morales L.Enrique Sucar Roberto Morales.
Tendencias Actuales Eduardo Morales / L. Enrique Sucar Fundamentos de Inteligencia Artificial.
Límites y Continuidad.
Modelos Gráficos Probabilistas
Sesión 12: Procesos de Decisión de Markov
Introducción a la Robótica mecanismos avanzados Coordinación de Ciencias Computacionales, INAOE Dra Angélica Muñoz Dr Eduardo Morales
Modelos Gráficos Probabilistas: Principios y Aplicaciones L. Enrique Sucar INAOE.
Sesión 12: Redes Bayesianas: extensiones y aplicaciones Modelos Gráficos Probabilistas L. Enrique Sucar INAOE.
Sesión 6: Campos de Markov. © L.E. Sucar: PGM - CAM2 Campos de Markov Introducción –Modelo de Ising Representación –Tipos de Modelos –Redes de Markov.
Combinación de Programas Lógicos y Redes Bayesianas y su Aplicación a Música Eduardo Morales Enrique Sucar Roberto Morales.
Sesión 2: Teoría de Probabilidad “Considero que la probabilidad representa el estado de la mente con respecto a una afirmación, evento u otra cosa para.
Sesión 7: Redes Bayesianas – Inferencia: 2da Parte Modelos Gráficos Probabilistas L. Enrique Sucar INAOE [Neapolitan 90]
Modelos ocultos de Markov (HMM)
Estimación y contraste de hipótesis
Sesión 6: Redes Bayesianas - Inferencia
Aplicaciones Estadísticas a las Finanzas Clase 1
Alicia De Gyves López Licenciatura Tecnologías de la Información y Comunicación 3º. Cuatrimestre Estadística Descriptiva Distribuciones de Probabilidad.
MEDIDAS DE TENDENCIA CENTRAL
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
CONTRASTE DE HIPÓTESIS Dimensiones Largo275mm. 169 mm 2 Ancho175mm.49 mm 2 Alto175mm.49 mm 2 Peso16 Kg.1 Kg 2. SITUACIÓN PROBLEMA.
Razonamiento con Incertidumbre
Distribuciones de Probabilidad Discretas Las distribuciones discretas que se tratarán son: 1.Binomial 2.Multinomial 3.Hipergeométrica 4.Hipergeométrica.

Aplicaciones Estadísticas a las Finanzas Clase 1
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
4. Métodos psicofísicos de medida en clínica
Transcripción de la presentación:

Sesión 12: Redes Bayesianas: extensiones y aplicaciones Modelos Gráficos Probabilistas L. Enrique Sucar INAOE

© L.E. Sucar: MGP - RB Ext y Apli2 RB – Extensiones y Aplicaciones Extensiones - Redes dinámicas - Redes temporales - Variables continuas Ejemplos de aplicaciones - Diagnóstico en plantas eléctricas - Endoscopía - Reconocimiento de actividades y gestos

© L.E. Sucar: MGP - RB Ext y Apli3 Redes Bayesianas Dinámicas (RBD) Representan procesos dinámicos Consisten en una representación de los estados del proceso en un tiempo (red estática) y las relaciones temporales entre dichos procesos (red de transición) Se pueden ver como una generalización de las cadenas (ocultas) de Markov

© L.E. Sucar: MGP - RB Ext y Apli4 Redes Bayesianas Dinámicas (RBD) Representan procesos dinámicos Consisten en una representación de los estados del proceso en un tiempo (red base) y las relaciones temporales entre dichos procesos (red de transición) Se pueden ver como una generalización de las cadenas (ocultas) de Markov

© L.E. Sucar: MGP - RB Ext y Apli5 Red base S X T E StSt XtXt X t+1 S t+1 TT + 1 EtEt E t+1 Red de Transición

© L.E. Sucar: MGP - RB Ext y Apli6 Modelo expandido (4 etapas temporales) StSt X t+3 S t+3 XtXt X t+1 X t+2 S t+2 S t+1 TT + 1T + 2T + 3 EEEE

© L.E. Sucar: MGP - RB Ext y Apli7 Ejemplo de RBD (equiv. HMM) E EEE TT + 1T + 2T + 3 StSt S t+3 S t+2 S t+1 Parámetros: Probabilidades iniciales: P(S t ) Probabilidades de transición: P(S t+1 |S t ) Probabilidades de observación: P(E|S t )

© L.E. Sucar: MGP - RB Ext y Apli8 Suposiciones Básicas Proceso markoviano - el estado actual sólo depende del estado anterior (sólo hay arcos entre tiempos consecutivos) Proceso estacionario en el tiempo - las probabilidades de transición, P(S t+1 | S t ), no cambian en el tiempo

© L.E. Sucar: MGP - RB Ext y Apli9 Algoritmos Propagación - Aplican los mismos algoritmos de propagación de redes estáticas - Se incremento el problema de complejidad computacional, utilizándose técnicas de simulación como los filtros de partículas Aprendizaje - Existen extensiones de las técnicas de aprendizaje paramétrico y estructural para RBD

© L.E. Sucar: MGP - RB Ext y Apli10 RBD – Aprendizaje El aprendizaje se divide en 2 partes: –Aprender la estructura “estática” –Aprender la estructura de “transición” T StSt E XtXt S t+1 E T+1 X t+1 StSt E T XtXt

© L.E. Sucar: MGP - RB Ext y Apli11 Redes Temporales Representaciones alternativas a RBD que incorporan aspectos temporales Se orientan a representar intervalos de tiempo o eventos en el tiempo vs estados Existen diferentes propuestas, dos ejemplos representativos son: - Redes de tiempo (time net) [Kanazawa] - Redes de nodos temporales (TNBN) [Arroyo]

© L.E. Sucar: MGP - RB Ext y Apli12 Red de tiempo La representación se basa en 2 tipos de eventos (nodos): - Eventos: un hecho que ocurre de manera instantánea - Hechos: una situación que es verdadera durante cierto intervalo de tiempo Cada hecho tiene asociado un evento de inicio y un evento de terminación

© L.E. Sucar: MGP - RB Ext y Apli13 Ejemplo de redes de tiempo Arrive (Sally)LoadLeave (Sally) Beg(here(Sally))End(here(Sally)) Here (Sally)

© L.E. Sucar: MGP - RB Ext y Apli14 Redes de tiempo Para poder representar alternativas se utilizan nodos virtuales (potencial events) Cada nodo tiene asociados como valores "tiempos" de ocurrencia, por ejemplo: Arrive(sally): [2 - 6] Se asocian a cada nodo una tabla de probabilidades dados sus padres Las propagación se realiza mediante técnicas de simulación estocástica

© L.E. Sucar: MGP - RB Ext y Apli15 Ejemplo de redes de tiempo Load beg (load) End (load) Po-load Leave (Sally) Leave/load (Sally)Po-leave/load (Sally) Arrive (Sally) beg(here(Sally))and(here(Sally)) Here (Sally)

© L.E. Sucar: MGP - RB Ext y Apli16 Redes de Nodos Temporales Representan cambios de estado (eventos) de las variables Tienen dos tipos de nodos: - Nodos de estado - representan variables de estado como en las RBD - Nodos temporales - representan cambios de estado de una variable

© L.E. Sucar: MGP - RB Ext y Apli17 Nodo Temporal Nodo que representa un "evento" o cambio de estado de una variable de estado Sus valores corresponden a diferentes intervalos de tiempo en que ocurre el cambio Ejemplo: incremento de nivel - Valores (3): * Cambio * Cambio * No Cambio

© L.E. Sucar: MGP - RB Ext y Apli18 Redes con Nodos Temporales Permiten una representación más compacta de ciertos dominios que las redes dinámicas Ejemplo (accidente automovilístico): Pupils dilated (PD) Head injury (HI) Vital signs unstable (VS) Internal bleeding (IB) gross Internal bleeding (IB) slight (0-10) (10-30) (30-60)

© L.E. Sucar: MGP - RB Ext y Apli19 RB temporal para el ejemplo HI VS IB PD C HI1=true HI2=false C1=severe C2=moderate C3=mild IB1=gross IB2=salight IB3=false VS1 =unstables, [0-10] VS2 =unstables, [10-30] VS3=unstable, [30-60] VS4=normal, [0-60] PD1 =dilated, [0-3] PD2 = dilated, [3-5] PD3=normal, [0-5]

© L.E. Sucar: MGP - RB Ext y Apli20 TNBN Para cada nodo temporal se definen un conjunto de valores que corresponden a intervalos de tiempo y las probabilidades asociadas La propagación se hace de la misma manera que en redes estáticas

© L.E. Sucar: MGP - RB Ext y Apli21 Variables Continuas Las redes bayesianas normalmente manejan variables multivaluadas discretas. Cuando se presentan variables continuas (temperatura, estatura, etc.), éstas se discretizan en un número de intervalos y se manejan como si fueran discretas. Este enfoque presenta desventajas: - Si el número de intervalos es pequeño, se pierde precisión. - Si el número de intervalos es grande, el modelo se vuelve demasiado complejo y se requiere gran cantidad de datos para estimar las probabilidades

© L.E. Sucar: MGP - RB Ext y Apli22 Variables Continuas Otra alternativa es manejar directamente distribuciones continuas. Se han realizado pocos desarrollos en este sentido y la mayoría están limitados al manejo de distribuciones gaussianas: Donde  es el promedio y  2 es la varianza (  es la desviación estándar). Esta se representa como N( ,  )

© L.E. Sucar: MGP - RB Ext y Apli23 Propagación con variables gaussianas Suposiciones: 1. La estructura de la red es un poliárbol. 2. Todas las fuentes de incertidumbre no están correlacionadas y siguen el modelo gaussiano. 3. Existe una relación lineal entre variables (entre un nodo y sus padres): X=b 1 U 1 + b 2 U b n U n + W x Donde X es una variable, las U¡ son los padres de X, las b son coeficientes constantes y w representa el "ruido" (gaussiano con media 0)

© L.E. Sucar: MGP - RB Ext y Apli24 RB con variables continuas X U1 U2 U3 W

© L.E. Sucar: MGP - RB Ext y Apli25 Propagación con variables gaussianas El método de propagación es análogo al de poliárboles con variables discretas. Se establece que en este caso las distribuciones marginales de todas las variables son también gaussianas: El producto de gaussianas es una gaussiana (esto no aplica a otras distribuciones)

© L.E. Sucar: MGP - RB Ext y Apli26 Propagación con variables gaussianas Los parámetros,  y , se obtienen de los parámetros que envían los nodos padre e hijos con las siguientes expresiones:

© L.E. Sucar: MGP - RB Ext y Apli27 Los mensajes que envían los nodos a sus padres e hijos se calculan de la siguiente manera: Mensaje que envía el nodo X a su padre i: Mensaje que envía el nodo X a su hijo j:

© L.E. Sucar: MGP - RB Ext y Apli28 Aplicaciones Diagnóstico plantas eléctricas –Red temporal Endoscopía –RB (mejora estructural) Reconocimiento actividades –RB (simulación estocástica) Reconocimiento de gestos –RBD (clasificador bayesiano dinámico)

Red Temporal para Diagnóstico de Plantas Eléctricas

Subsistema de una Planta Eléctrica

© L.E. Sucar: MGP - RB Ext y Apli31 Diagnóstico y Predicción Se desea encontrar las posibles causas de una falla (diagnóstico) o predecir cuando podría presentarse una situación anormal o falla (diagnóstico) El tiempo que transcurre entre los diferentes eventos en el proceso es crucial para la predicción y diagnóstico Parte del proceso de modela como una red temporal de eventos (nodos temporales)

Red bayesiana con nodos temporales Variables LI=Load increment FWPF=FW pump failure FWVF=FW valve failure SWVF=SW valve failure STV=Steam valve FWP=FW pump FWV=FW valve SWV=SW valve STF=Steam flow FWF=FW flow SWF=SW flow DRL=Drum level DRP=Drum pressure STT=Steam temperature

© L.E. Sucar: MGP - RB Ext y Apli33 Resultados Experimentales Prueba  Predicción %RBS %Exactitud Diagnóstico %RBS %Exactitud Diagnóstico y Predicción %RBS % Exactitud

© L.E. Sucar: MGP - RB Ext y Apli34 Endoscopía Herramienta para la observación directa del tubo digestivo El objetivo es ayudar al endoscopista a guiar el endoscopio en el colón (navegación semiautomática) Para ello se requieren reconocer los principales “objetos”, como son: –Lumen – el “centro” del tubo –Divertículos – “bolsas” en las paredes que se pueden confundir con el colón

© L.E. Sucar: MGP - RB Ext y Apli35 Ejemplo de imagen

© L.E. Sucar: MGP - RB Ext y Apli36 Segmentatción – “región obscura”

© L.E. Sucar: MGP - RB Ext y Apli37 Información de 3D – histograma pq

© L.E. Sucar: MGP - RB Ext y Apli38 RB para endoscopía (parcial)

© L.E. Sucar: MGP - RB Ext y Apli39 Metodología La estructura de la RB se construyó con la ayuda de un experto Los parámetros de obtuvieron de datos (videos de endoscopías) Posteriormente se mejoró la estructura utilizando pruebas de independencia

© L.E. Sucar: MGP - RB Ext y Apli40 Endoscopio semi-automático

© L.E. Sucar: MGP - RB Ext y Apli41 Sistema de ayuda

© L.E. Sucar: MGP - RB Ext y Apli42 Sistema de ayuda

© L.E. Sucar: MGP - RB Ext y Apli43 Reconocimiento de actividades humanas Reconocer diversas actividades (caminar, correr, brincar,...) en base a información visual Considerar los movimientos de brazos y piernas Varias actividades se pueden realizar al mismo tiempo Actividades continuas

© L.E. Sucar: MGP - RB Ext y Apli44 Actividades Adiós Derecha Atención Caminar Brincar Aerobics

© L.E. Sucar: MGP - RB Ext y Apli45 Adiós – derecha – atención

© L.E. Sucar: MGP - RB Ext y Apli46 Actividades simultáneas: brincar y atención

© L.E. Sucar: MGP - RB Ext y Apli47 Extracción de caratcterísticas Segmentación (marcas de colores) Seguimiento Parámetros de movimiento

© L.E. Sucar: MGP - RB Ext y Apli48 Segmentación

© L.E. Sucar: MGP - RB Ext y Apli49 Tracking

© L.E. Sucar: MGP - RB Ext y Apli50 Parámetros Información de movimiento para cada extremidad (marcas): –Centroide (x,y) –Dirección de cambio entre frames (8 rangos) –Usar de 5 a 7 cambios en la secuencia (encontrado experimentalmente)

© L.E. Sucar: MGP - RB Ext y Apli51 Modelo para reconocimiento Basado en una red bayesiana: –Un nodo para cada actividad –Un nodo por extremidad –5 nodos que representan las direcciones de movimiento en el tiempo Puede reconocer actividades simultáneas y continuas

© L.E. Sucar: MGP - RB Ext y Apli52 Reconocimiento continuo 15 frames tiempo Cambios dirección A la red de reconocimiento

© L.E. Sucar: MGP - RB Ext y Apli53 Modelo General Act-1 R-footL-footL-handR-hand Act-2Act-3 p1p2p3p1p2p3p1p2p3p1p2p3

© L.E. Sucar: MGP - RB Ext y Apli54 RB para reconocimiento

© L.E. Sucar: MGP - RB Ext y Apli55 Resultados El modelo se entrenó con 150 ejemplos de las 6 actividades Se probó con 50 secuencias: 39 correctas 9 indeciso 2 incorrectas

© L.E. Sucar: MGP - RB Ext y Apli56 Matriz de Confusión Good bye Rig ht Wa lk Attent ion Ju mp Aerob ics Oth er Indecis ive Goodbye31 21 Right Walk 7 11 Attention 4 Jump 6 Aerobics 7 Other 1 Walk and Attention 45 1 Jump and Attention 22

© L.E. Sucar: MGP - RB Ext y Apli57 Reconocimiento de gestos Reconocimiento de gestos orientados a comandar robots Inicialmente 5 gestos Reconocimiento con RBD

© L.E. Sucar: MGP - RB Ext y Apli58 Come attention go-right go-left stop

© L.E. Sucar: MGP - RB Ext y Apli59 Extracción de características Detección de piel Segmentación de cara y mano Seguimiento de la mano Características de movimiento

© L.E. Sucar: MGP - RB Ext y Apli60 Segmentación Agrupamiento de pixels de piel en muestreo radial

© L.E. Sucar: MGP - RB Ext y Apli61 Seguimiento

© L.E. Sucar: MGP - RB Ext y Apli62 Seguimiento

© L.E. Sucar: MGP - RB Ext y Apli63 Entrenamiento y Reconocimiento Los parámetros para la RBD se obtienen de ejemplos de casa gesto usando el algoritmo EM Para reconocimiento, se obtiene la probabilidad de cada modelo mediante propagación

© L.E. Sucar: MGP - RB Ext y Apli64 Atributos de Movimiento (0,0) x y Image t.. y'y' x'x'  a = 0  x = +  y = – form = + Image t+1

© L.E. Sucar: MGP - RB Ext y Apli65 Relaciones espaciales (binarias) entre la mano y otras partes del cuerpo: –Derecha –Arriba –Torso Above Right Torso Atributos de postura

© L.E. Sucar: MGP - RB Ext y Apli66 Clasificador bayesiano dinámico StSt  x,  y aa form t aboverighttorso …

© L.E. Sucar: MGP - RB Ext y Apli muestras de cada gesto Ambiente de laboratorio con condiciones variables de iluminación Distancia entre 3.0 m y 5.0 m Se varía el número de muestras para entrenamiento Experimentos

© L.E. Sucar: MGP - RB Ext y Apli68 Resultados: DNBCs sin información de postura Promedio % comeattentiongo-rightgo-leftstop come98 %2 % attention3 %87 %10 % go-right100 % go-left100 % stop4 %39 %1 %56 %

© L.E. Sucar: MGP - RB Ext y Apli69 Resultados: DNBCs con información de postura Promedio % comeattentiongo-rightgo-leftstop come100 % attention100 % go-right100 % go-left100 % stop11 %6 %83 %

© L.E. Sucar: MGP - RB Ext y Apli70 comeattentiongo-rightgo-leftstop come100 % attention100 % go-right100 % go-left100 % stop8 %92 % Resultados: HMMs con información de postura Promedio %

© L.E. Sucar: MGP - RB Ext y Apli71 Exactitud vs tamaño de la muestra

© L.E. Sucar: MGP - RB Ext y Apli72 Otras aplicaciones Predicción del precio del petróleo Modelado de riesgo en accidentes de automóviles Diagnóstico médico Validación de sensores Modelado de usuarios (ayudantes Microsoft Office) Modelado del estudiante (tutores inteligentes) Diagnóstico de turbinas (General Electric) Reconocimiento de objetos en imágenes Reconocimiento de voz...

© L.E. Sucar: MGP - RB Ext y Apli73 Referencias Variables continuas - Pearl cap. 7 - G. Torres Toledano, E. Sucar, Iberamia 1998 RB dinámicas - U. Kjaerulff, A computational scheme for reasoning in dynamic belief networks, UAI´92 RB temporales - K. Kanazawa, A logic and time nets for probabilistic inference, AAAI´91 - G. Arroyo, E Sucar, A temporal bayesian networks for diagnisis and predictatión, UAI´99