Tema 2: Métodos de ajuste

Slides:



Advertisements
Presentaciones similares
Resolución aproximada de ecuaciones Ejemplos
Advertisements

Tema 6: Regresión lineal.
ESTADISTICA INFERENCIAL
Modelos de Variable Dependiente Binaria -Logit y Probit-
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
DERIVADA DE UNA FUNCION REAL
Bivariadas y Multivariadas
Definiciones y conceptos básicos
KRIGING.
Tema 3 Revisión de diversos métodos robustos aplicados en algunos problemas fotogramétricos.
Modelado y simulación en Ingeniería Química. Manuel Rodríguez
REGRESION & CORRELACION
REGRESIÓN POR MÍNIMOS CUADRADOS
Introducción a la Estadística. Modelos de regresión
Regresión Lineal y Regresión Polinomial
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Ecuaciones diferenciales de 1er orden :
Regresión y correlación
Aplicaciones de la derivada Resuelve problemas de optimización aplicando las ideas básicas relacionadas con extremos de funciones de una variable Bloque.
Estadística Descriptiva: 4. Correlación y Regresión Lineal
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión Lineal Simple
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
MEDIDAS DE CORRELACIÓN
Facultad: Turismo Y Hotelería
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Análisis de supervivencia Tema 5 Itziar Aretxaga.
Calcular el cero del polinomio de orden 3 que pasa por los puntos
Prueba para la Bondad de ajuste Validación de Modelo
CONTRASTE Y VALIDACIÓN DE UN MODELO
BIOMETRIA II TEMA 2 El Modelo de Regresión.
TEMA 4 TRANSFORMADA DE LAPLACE
Pronósticos, Series de Tiempo y Regresión
Descomposición Factorial Unidad 5
Distribuciones derivadas del muestreo
Estadística Descriptiva continuación
Tema 7: Regresión Simple y Múltiple. EJEMPLO: Aproxima bien el número de préstamos que efectúa una biblioteca a lo largo de su primer año de vida. Nos.
Unidad V: Estimación de
Estimación Sea una característica, un parámetro poblacional cuyo valor se desea conocer a partir de una muestra. Sea un estadístico ( función.
PREPARATORIA FEDERAL POR COOPERACION “LUZAC”
Capítulo 7 Estimación de Parámetros Estadística Computacional
Titular: Agustín Salvia
Inferencia Estadística
Repaso de clase anterior
Sabemos reconocerlas, y calcularlas como soluciones de sistemas de ecuaciones, o de desigualdades Buscamos métodos de cálculo generales y eficientes Problemas.
Cálculo de extremos de funciones de R n –> R : Supongamos que queremos calcular un extremo de una función f de R n –> R: donde.
1 Condiciones de extremo Proceso para derivar las condiciones De problema más simple a más complejo Progresión de problemas: Problema sin restricciones.
Pruebas de hipótesis.
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
Estimación y contraste de hipótesis
Estadística II Regresión Lineal.
ESTIMACIÓN DE PARÁMETROS
Método de mínimos cuadrados
RIESGO, RENDIMIENTO Y VALOR
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
ECUACIONES DE PRIMER GRADO INSTITUTO TECNICO AGROPECUARIO
ANÁLISIS DE LA INFORMACIÓN La relación entre variables.
Aspectos generales de la investigación educativa en el SNIT
INFERENCIA ESTADÍSTICA
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE CIENCIAS ECONOMICAS INFERENCIA ESTADISTICA TEMA: ESTIMACION PUNTUAL, PROPIEDADES DE LAS ESTIMACIONES;
REGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
Teoría de la Generalizabilidad
Estimación estadística
1 REGRESIÓN CON VARIABLES DICOTÓMICAS TEMA 1 (CONTINUACIÓN)
Free and Quick translation of Prof. Anderson's slides1 Analisis de Regresion Multiple y =  0 +  1 x 1 +  2 x  k x k + u 1. Estimacion.
Transcripción de la presentación:

Tema 2: Métodos de ajuste

1. El ajuste por mínimos cuadrados ¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes (x e y), con frecuencia se pretende condensar y resumir los datos en un ‘modelo’ que depende de parámetros ajustables. A veces, un modelo es simplemente una clase de funciones convenientes, como polinomios o gaussianas, y el ajuste da los coeficientes apropiados. Otras veces, los parámetros vienen dados por una teoría subyacente, y se trata de comprobar si los datos siguen la teoría.

El procedimiento estándar es normalmente el mismo: se diseña una ‘figura de mérito’, que mide el acuerdo entre los datos y el modelo para una determinada elección de los parámetros. Los parámetros que dan un mínimo en la función de mérito son los parámetros óptimos de ajuste. La obtención de los parámetros de ajuste no es suficiente. Un ajuste bien hecho debe tener tres resultados Parámetros de ajuste. Error en la estimación de los parámetros Una medida estadística de la bondad del ajuste.

El modelo será de la forma: Consideremos que disponemos de un conjunto de N datos del tipo donde x es la variable independiente. Supongamos que queremos ajustarlos a un modelo con M parámetros ajustables El modelo será de la forma:

¿Cuál es la ‘función de mérito’? Consideremos los conocidos ‘mínimos cuadrados’: Esta idea intuitiva se fundamenta en los estimadores de máxima similitud En realidad, la función de mérito rigurosa es la Chi-cuadrado:

2. Ajuste lineal por mínimos cuadrados 2.1 Ajuste a una recta Modelo: Función de mérito:

Minimizamos la función de mérito: Es decir, se trata de resolver un sistema de dos ecuaciones LINEALES con dos incógnitas, a y b

Tenemos el objetivo 1). Faltan el 2) y el 3). 2) Error en los parámetros SI SE CONOCEN los si 3) Bondad de ajuste con

¿Y SI NO SE CONOCEN los si ? La estimación de errores en los parámetros es más sutil La bondad de ajuste NO es independiente de los valores de a y b Nos falta un viejo amigo, el coeficiente de correlación lineal (también llamado chi-a-ojo) r YA SUPONE QUE HAY BUENA CORRELACIÓN, y lo que hace es medir su fortaleza, no te dice la significación estadística de dicha correlación. Bajo ciertas condiciones (muchos datos, y distribuciones de x e y razonables), se puede estimar la probabilidad de que el valor de r se deba al azar:

2.2 Ajuste lineal generalizado ¡La palabra lineal en realidad se refiere a la dependencia del modelo con los parámetros del mismo! Si la dependencia es lineal, entonces existe una solución exacta para encontrar los parámetros de ajuste!!! Ejemplos: En el caso general, se tendrá un modelo con M parámetros, cada uno de ellos acompañando linealmente a una función cualquiera.

La función de mérito es la misma de siempre: Si se hace se tiene un sistema de M ecuaciones lineales con M incógnitas (los M parámetros ak ), que se resuelve (analítica o numéricamente), pero cuya solución es EXACTA, es decir, encontramos el mínimo absoluto.

Ejemplo: Entonces: Solución:

En algunos softwares comerciales, a este procedimiento también se le llama regresión lineal múltiple, porque a cada función de x del modelo se le puede hacer corresponder una variable nueva. Antes de pasar al ajuste no lineal, veamos algunos casos en los que no es necesario usarlo, porque en realidad se puede usar el lineal. ¡También hay que ser cuidadoso con el modelo, porque hay que definirlo bien!

2.2 Ajuste no lineal En este caso, el modelo tiene una dependencia no lineal con los parámetros inevitable La función de mérito es la misma de siempre, Chi-cuadrado. PERO ahora no se puede encontrar de forma exacta el mínimo, sino que se procede iterativamente a partir de una ESTIMACIÓN INICIAL de los parámetros.

2.3 Método de Levenberg-Marquardt Consiste en una estrategia inteligente para buscar el mínimo de Chi-cuadrado. Necesita calcular el gradiente y el hessiano de Chi-cuadrado con respecto a los parámetros, que dependen de las derivadas del modelo con respecto a los parámetros. Usa esa información para acercarse al mínimo. No está garantizado que se encuentre el mínimo absoluto, puede haber una convergencia a un mínimo relativo. Ello depende de forma fundamental de la elección de parámetros iniciales. La estrategia usual consiste en variar los parámetros iniciales, y probar a ver si se converge al mismo sitio. También se puede hacer ‘a ojo’, si se ve que el modelo ajusta razonablemente bien. El software comercial bueno lo tiene implementado.

Ahora es más complicado medir los errores en los parámetros y la bondad del ajuste, aunque en el software comercial ambos datos están disponibles. En concreto, para la bondad del ajuste, se suele usar el llamado coeficiente de determinación, que mide la fracción de la variabilidad de los datos que es explicada por el modelo. Cuanto más cercano sea este coeficiente a la unidad, mejor es el modelo.

Ejemplo: series de radiación solar normalizada Modelo: Otro ejemplo: desviación estándar de distribuciones correspondientes a energías de sólidos desordenados. Modelo:

2.4 Criterios de creación y selección de modelos No hay ninguna regla mágica, sólo algunas directrices generales: Si hay una teoría subyacente, usar el modelo correspondiente, a no ser que se pretenda demostrar que la teoría no es válida. A igualdad de ajuste, optar siempre por el modelo más sencillo, es decir, con menor número de parámetros. Es muy importante la INTUICIÓN, que es otra manera de llamar al conocimiento del comportamiento de las funciones elementales (polinomios, exponenciales, logaritmos, leyes de potencia, funciones usuales de probabilidad, etc). Ello ayudará al diseño del modelo adecuado para los datos disponibles.