Técnicas numéricas para el procesamiento de datos reales Antonio Turiel Instituto de Ciencias del Mar de Barcelona.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

Capitulo 9: Modelos unívariados de series temporales
Variable Aleatoria Continua. Principales Distribuciones
Bivariadas y Multivariadas
KRIGING.
La transformada de Fourier.
INFERENCIA ESTADISTICA
PROPIEDADES ESTADÍSTICAS DE LOS ESTIMADORES
MODELO DE REGRESIÓN MÚLTIPLE
MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I MULTICOLINEALIDAD
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Econometria 2. Modelo de Regresión Lineal Simple
Mario Bidegain (FC) – Alvaro Diaz (FI) – Marcelo Barreiro (FC)
Capitulo 10: La metodología Box-Jenkins
Introducción Los fenómenos biológicos no suelen ser constantes, por lo que será necesario que junto a una medida que indique el valor alrededor del cual.
1. FUNCIONES. LÍMITES. Depto. Matemáticas – IES Elaios
Nombre: Israel Espinosa Jiménez Matricula: Carrera: TIC Cuatrimestre: 4 Página 1 de 5.
Tema 2: Métodos de ajuste
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
DETERMINANTES Autora: Mª Soledad Vega Fernández
FUNCIONES DE DENSIDAD DE PROBABILIDAD
Población y Muestra.
Programación Lineal Unidad 1 Parte 3.
TIPOS DE MODELOS DE REGRESIÓN Y SUPUESTOS PARA EL MODELO A
Distribución Normal.
Análisis de series de tiempo Cuarta semana Abril Julio 2009.
Vectores Aleatorios 1 Distribución conjunta de un vector aleatorio
Elementos Básicos de Probabilidad y Estadística Javier Aparicio División de Estudios Políticos, CIDE Julio 2009
EXTRACCIÓN DE CARACTERISTICAS
DISTRIBUCIONES DE MUESTREO
Valor que toma la variable aleatoria
Tema 2: Parámetros Estadísticos
Estimación Sea una característica, un parámetro poblacional cuyo valor se desea conocer a partir de una muestra. Sea un estadístico ( función.
DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005.
Elaboración de gráficas
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
PREPARATORIA FEDERAL POR COOPERACION “LUZAC”
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
Capítulo 7 Estimación de Parámetros Estadística Computacional
Titular: Agustín Salvia
La transformada de Fourier.
Maestría en Transporte Estadística Capítulo 1. Objetivos ¿Cómo se determinan las magnitudes para planificación de transporte, operación de transporte,
Inferencia Estadística
Informática Médica: Procesamiento de imágenes
Herramientas básicas.
Unidad II: Variables Aleatorias Concepto Discreta y Continua Fun. de densidad Fun. de probabilidad F. de distribución Esperanza y Varianza Propiedades.
Capítulo 1. Conceptos básicos de la Estadística
Índice: Introducción Conceptos básicos Procesos elementales
TEMA 2 CARACTERIZACIÓN FRECUENCIAL DE SEÑALES Y SISTEMAS
Procesamiento Digital de Imágenes
LA ESTADÍSTICA PROF.: EDMUNDO C.PARDO H. CARACAS,OCTUBRE DE 2014
Teoría de Probabilidad Dr. Salvador García Lumbreras
Probabilidad y Estadística X = x Unidad de muestreo Mediremos un atributo Variable aleatoria Valor que toma la variable aleatoria.
coeficientes de correlación de
PRUEBAS ESTADISTICAS NO PARAMETRICAS
RESOLUCIÓN DE SISTEMAS DE ECUACIONES LINEALES MEDIANTE DETERMINANTES
Elementos Básicos de Probabilidad y Estadística
SESION 5: MEDIDAS DE FORMA. Hasta el momento nos hemos enfocado en el análisis de datos a partir de los valores centrales y la variabilidad de las observaciones.
Estimación y contraste de hipótesis
ESTIMACIÓN DE PARÁMETROS
Análisis de Fourier.
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
P y E 2012 Clase 15Gonzalo Perera1 Repaso de la clase anterior. Métodos de estimación.
Cálculo Diferencial.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
BIOESTADÍSTICA Y ESTADÍSTICA BÁSICA CHILLÁN, SEGUNDO SEMESTRE PROF. SOC. M© KEVIN VILLEGAS.
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
Medidas de tendencia central
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
Transcripción de la presentación:

Técnicas numéricas para el procesamiento de datos reales Antonio Turiel Instituto de Ciencias del Mar de Barcelona

Sumario Introducción Caracterización probabilística básica: el histograma Cálculo de los momentos de una distribución Estudio de las correlaciones a dos puntos Análisis espectral Análisis en componentes principales (PCA) Inferencia Markoviana Wavelets

Introducción Requisitos básicos para este taller: Sólida formación de Matemáticas y Probabilidad Nociones de programación Todos los ejemplos mostrados en este taller han sido obtenidos usando programas C cuyo código fuente está a la disposición de los estudiantes. ¿Por qué se necesita programación en el análisis de datos? El análisis de datos se basa en la aplicación repetitiva de reglas de cálculo (generales o deducidas de modelos)

1.- Desempaquetarlos ¿Cómo usar los programas?

2.- Cambiamos de directorio y compilamos

¿Cómo usar los programas? 3.- Ejecutamos el programa y verificamos el resultado

¿Por qué se hacen análisis de tipo estadístico? Porque se pretende inferir principios universales, no dependientes de realizaciones particulares ¿Determinista o aleatorio?

Caracterización probabilística básica: el histograma Aproximación empírica a la función de densidad de probabilidad Muestreo: Buscamos el máximo y mínimo empíricos de esa variable Dividimos el rango total en B cajas, de ancho:

Los lados de las cajas son de la forma: Los puntos centrales de cada caja son de la forma: o sea,

Eventos por caja: Probabilidad estimada: Si N, N i son suficientemente grandes:

Ejemplo

Histograma B = 100

Problemas típicos: Si la distribución es muy curtótica Histograma de la derivada

Solución: Truncar el rango estudiado Criterio k  : con

33 11 … aunque se ha de tener cuidado de no cortar demasiado

Otro problema es el muestreo limitado de las colas Criterio de significación sencillo:

Cálculo de los momentos de una distribución Los momentos determinan propiedades de la distribución Media: Varianza: Sesgo: Curtosis: Si los momentos enteros positivos no divergen demasiado rápido, el conjunto de todos los define

Estimación empírica: En la práctica, es imposible obtener estimaciones precisas para p≥3 Teorema: Análogamente, Pero, obviamente:

Realmente, ¿es tan grave este problema? Densidad de momento p: Densidad empírica de momento p:

Densidades empíricas p=1p=2p=3p=4 Estimar p=3 requiere millones de datos; p=4 miles de millones

Estudio de las correlaciones a dos puntos Estadística de orden 2, pero distribuida espacialmente. Correlación a dos puntos: Si hay estacionariedad espacial (invariancia de traslación) En este caso, la correlación coincide con la autocorrelación

Se puede simplificar el cálculo usando transformadas de Fourier donde la transformada de Fourier se calcula: Sobre datos numéricos, se puede usar la FFT La inversa es igual, cambiando el signo

Inconveniente: la transformada de Fourier numérica es, en realidad, una serie de Fourier donde la unidad de frecuencia es: Las series son periódicas (aliasing).

La segunda mitad de los índices representan frecuencias negativas: si entonces con La transformada de Fourier discreta de la autocorrelación discreta es el cuadrado del módulo de la transformada. El aliasing ha de ser tratado correctamente Función de autocorrelación discreta:

1.- Se extiende la secuencia x n con igual número de ceros: 2.- Se define la máscara de los datos:

3.- Se calculan las autocorrelaciones vía FFT: 4.- Se estima la autocorrelación contínua:

Correlación a dos puntos de la señal de ejemplo

Correlación a dos puntos de las derivadas

Correlación de los valores absolutos de las derivadas

Análisis espectral Generalmente el análisis de la autocorrelación se aborda directa en el espacio de Fourier:

Análisis de componentes principales (PCA) Varias series temporales:

Modelo lineal: Existen M causas independientes, que se combinan linealmente para formar las series observadas. ¿Cómo se extraen las causas? Decorrelando. Fijamos Matriz de correlación:

Diagonalizando: Se aplica a los datos para extraer las componentes principales

Datos originales:

Derivadas:

Inferencia Markoviana Sólo estudiaremos el grado de dependencia mutua. Cantidad de información compartida o información mutua: Entropía o cantidad de información:

Datos originales:

Derivadas: Extremos empíricos Criterio 3 

Wavelets ¿Qué es una wavelet? Una wavelet (wave particle) es una función oscilatoria elemental y localizada.

¿Para qué sirve una wavelet? Las wavelet tienen dos aplicaciones principales: Análisis Representación Las wavelets están muy bien adaptadas para estudiar sistemas sin escala definida, aunque también son útiles en otras situaciones.

¿Cómo se usan las wavelets? Las proyecciones de wavelet corren sobre todas las posiciones y escalas de observación E s c a l a  Posición  Por medio de proyecciones de wavelet

Se pueden reconstruir las señales a partir de sus proyecciones de wavelet Pero tal representaci ó n en wavelets es extremadamente redundante (una serie 1D se vuelve una funci ó n 2D, una imagen 2D se convierte 3D, etc) … si la wavelet es admisible Por ello se buscan subselecciones de escalas y posiciones más eficientes. Paradigma: caso diádico Representación:

Análisis: Caracterización de propiedades locales de una señal A cada punto de la señal q se le asigna un exponente h invariante de escala: el exponente de singularidad Donde  es una wavelet sobre la que se proyecta la señal Paradigma: Análisis de singularidades

Imagen SST Pathfinder (Cabo Hatteras, 8 de Mayo, 2000) Exponentes de singularidad asociados El análisis de singularidades sirve para detectar estructuras, independientemente de la escala y la amplitud

¡GRACIAS POR SU ATENCIÓN!