Robust parameter estimation for mixture model

Slides:



Advertisements
Presentaciones similares
Imagenes hiperespectrales: introducción
Advertisements

Propiedades curiosas de los espacios de alta dimensión
Determinacion de endmembers CCA1 Determinación de endmembers mediante una transformacion cónica.
Maracaibo, 5 de Noviembre de 2007 Universidad del Zulia Facultad de Ingeniería Instituto de Cálculo Aplicado Universidad del Zulia Facultad de Ingeniería.
Trabajo De Investigación (9 Créditos) Realizado Por: Raúl Montoliu
Mario Francisco, Pastora Vega
Combinación de Clasificadores
Redes Asociativas.
 Sus características son cuatro: a) El experimento consta de un número fijo (n) de pruebas idénticas. b) Cada prueba puede tener uno de dos resultados.
Cluster by mixtures. The Trace criteria (K-means)
Inferencia Multivariante Cap 10 y 11
Analisis de datos en imagenes hiperespectrales: intro 1 Analisis de datos hiperespectrales: otra revisión Hyperespectral image data analysis, D. Landgrebe,
Maestría en Transporte Estadística
Reconocimiento de cara basado en “espectrocara”
RELACIÓN ENTRE UNA VARIABLE DEPENDIENTE Y UNA O MAS INDEPENDIENTES.
Unsupervised visual learning of three-dimensional objects using a modular network architecture Ando, Suzuki, Fujita Neural Networks 12 (1999)
Tema 3: Un modelo muy discreto La distribución binomial Imagen de Comodoro Deportes bajo licencia Creative CommonsComodoro Deportes.
REGRESIÓN LINEAL MÚLTIPLE TEMA INTRODUCCIÓN 2 x1x1 Y x2x2 x3x3 xKxK.
LEONARDO LÓPEZ C. ECONOMIA ESTADISTICA COMPUTARIZADA PARALELO: 261.
TEMA 3. ESTADÍSTICA BIDIMENSIONAL. INDICE 1.- Relación estadística: correlación 2.- Diagramas de dispersión o nube de puntos 3.- Tablas de frecuencia.
Curso de posgrado: ANÁLISIS DE REGRESIÓN Universidad Nacional del Sur Nélida Winzer y Ricardo Camina 2012.
Distribuciones estadísticas 1.- Variable aleatoria discreta. 2.- Función de probabilidad de variable discreta. Propiedades 3.- Parámetros en distribuciones.
MEDIDAS DE DISPERSIÓN Y DATOS AGRUPADOS.. MEDIDAS DE DISPERSIÓN Y DATOS AGRUPADOS  ¿Qué son las medidas de dispersión?  Parámetros estadísticos que.
DISTRIBUCIÓN NORMAL.
PPTCEG049EM32-A16V1 Distribución normal EM-32. Recordemos… -¿Cómo se calcula el valor esperado para una determinada variable aleatoria? -¿Cómo es posible.
PPTCES047MT22-A16V1 Clase Medidas de dispersión y muestreo MT-22.
REGRESIÓN Y CORRELACIÓN  REGRESIÓN Es un Proceso estadístico que consiste en predecir una variable a partir de otra utilizando datos anteriores. INGA.
Recordatorio Estadística Paramétrica Se basa en el conocimiento que los datos presentan una distribución estadística conocida y cada distribución tiene.
1 Ejemplo Consideremos los datos de un estudio donde se les mide la talla en centímetros a 20 jugadores del equipo Nacional de Handbol de EE. UU. seleccionados.
Valor que toma la variable aleatoria
Lorenzo Bruzzone IEEE Geoscience and remote sensing 38,1pp429
Grado en Ingeniería Mecánica
INFERENCIA ESTADÍSTICA
CHI CUADRADO  2 OBJETIVOS –Describir situaciones donde es adecuado la utilización de la prueba de Chi Cuadrado (  2 ) –Formular Hipótesis para diferentes.
METODOS DE DESAGREGACION TEMPORAL: CHOW-LIN, FERNANDEZ Y LITTERMAN
RELACIÓN ENTRE UNA VARIABLE DEPENDIENTE Y UNA O MAS INDEPENDIENTES.
Robust parameter estimation for mixture model
PREDICCIÓN Y ESTIMACIÓN
REGRESÍON LINEAL SIMPLE
MUESTREO ESTRATIFICADO
Estimación de volatilidades
UNIDAD CURRICULAR: ESTADÍSTICA II
Instituto Tecnológico Superior Luis Arboleda Martínez Alumna: Mantuano Delgado Joselyne Andreina. Carrera: Acuicultura Alumna: Mantuano Delgado Joselyne.
FILOSOFÍA DE LA CALIDAD GENICHI TAGUCHI ALCALÁ VILLANUEVA ERIC ALEJANDRO CUELLAR COLLAZO THALIA ANAHID DE LARA RAMOS YESENIA PUENTES JAUREGUI JASSIEL ANAHI.
Tamaño de muestra Ecología Marina. Una población se define como un conjunto de individuos de una especie que habita un área determinada. Los métodos disponibles.
GEOESTADISTICA 04/07/2018 A. Vásquez A.. Limitación de Estadística Clásica 04/07/2018 A. Vásquez A.
Ensayo de Rendimiento DISTRIBUCIÓN DE ESTADÍSTICOS MUESTRALES.
ANALISIS DE VARIANZA
CAUDALES. ESTADÍSTICA HIDROLÓGICA ESTADÍSTICA E N LA HIDROLOGÍA ESTADÍSTICA HIDROLÓGICA Los procesos hidrológicos varían en el espacio y en el tiempo.
Identificación de los efectos de los diseños experimentales.
Inferencia Estadística
Dr. Alejandro Salazar – El Colegio de Sonora
Redes Auto-organizadas
UNIVERSIDAD DE LOS ANDES CENTRO DE INVESTIGACIONES PSICOLÓGICAS
MEDIDAS DE DISPERSION absolutas y relativas. INTRODUCCION La estadística es la ciencia que se encarga de recolectar, organizar, resumir y analizar datos.
CONCEPTO DE ESTIMADOR ES UNA REGLA O MÉTODO QUE DICE COMO CALCULAR LA ESTIMACIÓN DE UN PARÁMETRO BASÁNDOSE EN LA INFORMACIÓN DE UNA MUESTRA, GENERALMENTE.
MEDIDAS DE DISPERSIÓN. MEDIDAS DE DISPERSION La Dispersión hace referencia a la forma en que se dispersan o alejan las puntuaciones de una distribución.
DISTRIBUCION NORMAL. Una de las distribuciones de frecuencia más importantes en la estadística es la distribución normal La distribución de probabilidad.
¿Por qué se emplea el supuesto de normalidad? Se derivan con facilidad las distribuciones de probabilidad de los estimadores de MCO. Los estimadores de.
LEYES DE COULOMB Miércoles 22 de Mayo 2019 Objetivo de la clase: Aplicar ejemplos leyes de coulomb.
PLN hmm1 Modelos ocultos de Markov (HMM) Introducción Cálculo de la probabilidad de una observación Algoritmo Forward Algoritmo Backward Algoritmo de Viterbi.
Tema 5: Distribuciones continuas. Recordamos que una variable aleatoria continua es una variable cuyo valor no puede predecirse con exactitud (aunque.
MODELOS CUANTITATIVO PARA LA TOMA DE DECISIONES.
TRATAMIENTO Y EVALUACION DE RESULTADOS ANALITICOS 1.Conceptos generales sobre la medida. Tipos de errores, concepto, componentes, corrección. Distribución.
1 Afectados de cierto grado de INCERTIDUMBRE SIEMPRE HAY UN ERROR EN SU MEDIDA ESTABLECER LA FIABILIDAD DE LOS DATOS ¿Podemos evaluar la magnitud del error.
ESTADÍSTICA APLICADA  ZEUS DE JESÚS RODRÍGUEZ BUDA  GABRIELA MÁRQUEZ TORRES  MARÍA ENRIQUETA GIL CÓRDOVA  ELIÁN ANTONIO GONZALEZ GARCÍA  CRISTELL.
¿Qué es y para qué sirve el Ajuste de Observaciones?¿Por que es necesario buscar métodos alternativos? Ana Mª Domingo Preciado Profesora Titular de Ajuste.
Transcripción de la presentación:

Robust parameter estimation for mixture model Sladju Tadjudin, David A Landgrebe IEEE Geos. Rem. Sens. 38,1, p.439

Resumen Modelo: mezcla de gausianas Estimación : Expectación/maximización Inconveniente: influencia de los outliers Solución: rechazar los outliers en función d e un umbral de distancia. Peligro: rechazar pixels válidos

Expectación/Maximización Método iterativo para aproximar los estimadores Maximo Verosimiles de los parametros en un modelo de mezcla de densidades

EM En la formulación incompleta, cada muestra no etiquetada se considera como una mustra etiquetada cuya etiqueta se ha perdido

EM g(x|F) es la pdf de los datos incompletos f(y|F) es la pdf de los datos completos La estimación ML involucra maximizar L(F)=log g(x|F) EM itera una fase de estimación de las asignaciones de etiquetas con otra de estimación de los parámetros

F es el vector de parametros Expectation/ Maximization “+” denota proximo “c” denota actual F es el vector de parametros -prior prob -Medias -varianzas y muestras etiquetadas x muestras no etiq.

EM EM converge localmente al estimador ML del vector de parámetros Suelen realizarse varios intentos con condiciones iniciales distintas. Los elementos de la muestra (etiquetados) son buenas condiciones iniciales

EM Los outliers pueden tener probabilidades a posteriori significativas para algunos de los componentes Identificación de los outliers: umbral ji-cuadrado antes de comenzar

EM Problemas Pixels válidos pueden ser declarados outliers Conforme crecen las dimensiones, todos tienden a ser outliers Solución: asignar a cada pixel una medida de su tipicidad.

Estimación robusta La medida de la tipicidad se basa en que todas las densidades componente son elipticamente simétricas y exponenciales

w función peso Estimador de la covarianza modificado

Robust estimation La constante de ajuste está escogida de forma que Las muestras de entrenamiento tienen peso unitario Las muestras no etiquetadas tienen pesos inversamente proporicionales a la distancia respecto de la media

Experimentos Compara ML, EM y REM ML solo utiliza datos etiquetados exp 1 a 4 AVIRIS Cuatro clases 20 canales extraidos, 200 canales se usan Las reducciones del numero de canales se hace muestreando uniformemente

Exp 1 Compara EM y REM sin outliers (generando los datos) 5 repeticiones de los experimentos

EXP 2 Reduce el numero de muestras de entrenamiento No outliers

Exp 3 Reduce el numero de muestras test (no etiquetadas) No outliers EM y REM comparables

Exp 4 Datos reales 200 muestras de entrenamiento REM mejora a EM, indica la existencia de outliers

Exp 5 Datos multiespectrales 12 bandas Se tiene ground truth EM con dos valores de umbral 1% y 5%

Conclusiones REM funciona mejor que ML y EM en presencia de outliers Cuando hay pocas muestras EM y REM mitigan el fenomeno Hughes Limitaciones de REM Función de peso dependiente de las estadisticas de las clases Con un numero de muestras cercano a la dimensionalidad el estimador de covarianza es inestable