Píldora de evaluación estadística de ajuste de curvas Files con las tablas: T_tables.pdf F_tables.pdf Descargadas desde

Slides:



Advertisements
Presentaciones similares
Pruebas de significancia para datos cualitativos
Advertisements

Correlación ©1997-Sep-06 Pedro Juan Rodríguez Esquerdo Departamento de Matemáticas UPR Río Piedras.
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Pronósticos, Series de Tiempo y Regresión
MÉTODO CIENTÍFICO.
REGRESION Y CORRELACION LINEALES. REGRESION LINEAL SIMPLE Finalidad Estimar los valores de y (variable dependiente) a partir de los valores de x (variable.
Covarianza muestral Sean x1, x2, ..., xn e y1, y2, ..., yn dos muestras aleatorias independientes de observaciones de X e Y respectivamente. La covarianza.
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Regresión y correlación
Correlación 1.
Estadística Descriptiva: 4. Correlación y Regresión Lineal
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Regresión Lineal Simple
9 Regresión Lineal Simple
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
Análisis de Correlación y de Regresión lineal simple
REGRESION LINEAL En la búsqueda de mejoras o en la solución de problemas es necesario, frecuentemente, investigar la relación entre factores (o variables).
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Clase 5 Hipótesis de diferencias de grupos
Principios de Bioestadística: «PRUEBA t»
PROYECCIONES DE LA DEMANDA
Clases 3 Pruebas de Hipótesis
Clases 4 Pruebas de Hipótesis
REGRESION Y CORRELACION
DISEÑOS DE EXPERIMENTOS FACTORIALES
Diseño en bloques completamente aleatorizados
ANOVA (Analysis of Variation)
CO 3321/22 Modelos Lineales Práctica 3 Consideraremos modelos de la forma: Observación=señal + ruido Estos modelos pueden escribirse en la forma: Y=X 
Pronósticos, Series de Tiempo y Regresión
Pronósticos, Series de Tiempo y Regresión
ESTADÍSTICA BÁSICA EN ECOLOGÍA EVOLUTIVA Juan J. Soler Cruz Estación Experimental de Zonas Áridas Almería.
Modelo de regresión con dos variables: Estimación
Métodos de calibración: regresión y correlación
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
LA PRUEBA F DE BONDAD DE AJUSTE 2 Vamos a considerar el caso general donde hay k – 1 variables explicativas. Para la prueba F de bondad de ajuste de la.
Herramientas básicas.
Variables estadísticas bidimensionales
Modelo Lineal Simple con Statgraphics para Windows.
Ramón Giraldo H MSc. Estadística. Profesor Universidad Nacional
CO-2124 Análisis de Varianza con Un Criterio de Clasificación En clases anteriores se deseaba determinar si existían diferencias entre las medias de dos.
INTRODUCCION En esta base de datos, la variable “estrés ” es categórica (tiene estrés / no tiene estrés ) y querríamos saber si está relacionada.
Pruebas de hipótesis.
1 Y MODELO DE REGRESIÓN SIMPLE Suponemos que una variable Y es una función lineal de otra variable X, con parámetros desconocidos  1 y  2 que queremos.
Construcción de la tabla del ANOVA
Estimación Diferencia de dos medias
PARA LA REGRESIÓN LINEAL SIMPLE
Estadística II Regresión Lineal.
Análisis de los Datos Cuantitativos
Regresión Lineal Simple
La chispa de las funciones
CONTRASTES NO PARAMÉTRICOS
Construcción de modelos con regresión y correlación
Regresión lineal simple Nazira Calleja
TEMA : ANALISIS DE REGRESION
Introducción a la Inferencia Estadistica Dept. of Marine Science and Applied Biology Jose Jacobo Zubcoff.
DISEÑOS DE EXPERIMENTOS FACTORIALES
Supuestos en el análisis de regresión Miles, J. & Shervin, M. (2011). Applyng regression & correlation. A guide for students and researchers. London: Sage.
InfoStat. Software estadístico
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
DISEÑOS POR BLOQUES ALEATORIZADOS
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
1 REGRESIÓN CON VARIABLES DICOTÓMICAS TEMA 1 (CONTINUACIÓN)
PRUEBA CHI-CUADRADO UNIDAD 2: ESTADÍSTICA.
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
ANALISIS DE VARIANZA.
Transcripción de la presentación:

Píldora de evaluación estadística de ajuste de curvas Files con las tablas: T_tables.pdf F_tables.pdf Descargadas desde Ver también “A complete guide to nonlinear regression”

Tenemos una tabla con los resultados experimentales de una variable dependiente y en función de varias variables independientes x 1, x 2, x 3 … La tabla contiene NOBS filas en que las primeras columnas son las variables independientes y la última los valores observados de la variable dependiente y(obs) Producimos una función que suponemos que describe bien los datos experimentales. Esta función depende de las variables independientes (x 1, x 2, x 3 ) y un conjunto de NPAR parámetros a 1, a 2, a 3 ….a NPAR Usamos un programa de ajuste no lineal para encontrar los NPAR parámetros. Por ejemplo Solver de Excel. Solver nos entrega los parámetros encontrados más una lista de NOBS filas con valores calculados para la función para cada conjunto de variables independientes. Esto son los y(cal). Un gráfico en que se muestren los valores y(obs) e y(cal) de una impresión visual de la calidad del ajuste. Ver archivo AjusteExcel.xls Coeficiente de correlación r 2

r 2 = r 2 = Con el coeficiente de correlación se evalúa el significado estadístico del ajuste usando el Student’s test.

Se compara el valor calculado de t con el de la tabla de t tabla, para comprobar la hipótesis que dice que la función describe los datos por azar. Si t t tabla la hipótesis es falsa. El ajuste sí es significativo. La tabla del Student’s test. Tablas estadisticas

r2r df37 t r2r df37 t

To index t = < t.05,37 La hipótesis es verdad. No hay correlación t = 28.8 > t.05,37 La hipótesis es falsa. Hay correlación Table of t-statistics df P = 0.05 P = 0.01 P =

Evaluación de un ajuste al mismo set de datos usando dos modelos diferentes. Un modelo con más parámetros que el otro Ejemplos de Fabián López Modelo 1 : una curva de Gauss vs Modelo 2 suma de dos curvas de Gauss

r2r df395 t t = 54 > t.05,395 La hipótesis es falsa. Hay correlación

r2r df392 t ¿Es estadísticamente mejor este ajuste?

Al poner más parámetros la curva va a pasar más cerca de los puntos experimentales por lo tanto la suma de cuadrados de los residuos, SS, va a disminuir. El ajuste mejora si el cambio relativo de SS es mayor que el cambio relativo del número de grados de libertad. El modelo 1 (simple) tiene menos parámetros que el modelo 2 (complicado). Por lo tanto df1 > df2 y SS1 > SS2.. La razón F da una estimación cuantitativa de la mejora del ajuste Si el modelo 2 (complicado) es mejor que el modelo 1 (simple) se espera F >1 ¿Qué tanto mayor que 1 tiene que ser F para que la mejora sea significativa y no debida al azar?

Para responder esta pregunta se usa el F test. Ajuste2Ajuste1 nobs 399 npar 63 df SS F calculado F Tabla 2.62 La razón F se compara con el valor de F de la tabla en que los grados de libertad de numerador son df 1 -df 2 y los del denominador df 2. El ajusten mejora si Hoja de calculo para F Ftest.xls Tablas estadísticas:

df numerador df denominadorr Se cumple que F calculado > F tabla por lo que el ajuste es estadísticamente mejor,

Evaluación de un ajuste al mismo set de datos usando dos modelos diferentes. Dos modelos con el mismo número de parámetros. Ejemplo usando Solver de Excel

Ver archivo Recta_Exponencial.xls

Recta SS 1 = Exponencial SS 2 = Grados de libertaddf 1 = df2 = 8 F test para evaluar si el ajuste es mejor. F calculado es menor que el F de tabla. El ajuste exponencial no es significativamente mejor que el lineal. df numerador df denominador

Evaluación del cambio de los parámetros al ajustar dos set de datos usando el mismo modelo.

r 2 = a  a  b  b  x  x  r2 = a  a  b  b  X  x  Valor del parámetro  SE, standard error Ajuste hecho con Sigmaplot) ¿Qué parámetros son diferentes en los dos set de datos?

Para responder esta pregunta se usa el t test. Por ejemplo para el parámetro x 02 a 1 = SE 1 = a 1 = SD 2 = : t = Cada ajuste tiene df grados de libertad Los grados de libertad del t test son df 1 + df 2. En estos casos NOBS = 399 NPAR = 6 df 1 = df 2 = 393, df = 786 Table of t-statistics dfP = 0.05P = 0.01 P = t calculado < t tabla, la diferencia no es significativa.

a1se1 a1se1 t a a b b x x Todos los t calculados < t tabla.Ningún cambio es significativo.

a1se1 a1se1 t a a b b x x t tabla = p0.05, df = 786 El único parámetro que cambia significativamente es x 02.

Evauación de la independencia del los parámetros Ejemplo una curva normal Ajuste hecho con LabFit. Wilton Pereira da Silva (Brasil)

THE CONVERGENCE HAPPENED IN THE ITERATION 5 C_Normal.txt N. 29: Y = A*EXP(((X-B)**2)/C) <--- Gaussian PARAMETERS: Mean UNCERTAINTIES: SD t P(t) A = E+01 SIGMAA = E E B = E+01 SIGMAB = E E C = E-01 SIGMAC = E E Correlation Coeficient: = E+00 Average Absolute Residual: Sum of Absolute Residuals / Number of points => Res_av = E+02 / 201 => Res_av = E-01

COVARIANCE MATRIX E E E E E E E E E Raíz cuadrada de los elementos de la diagonal SIGMAA = E-01 SIGMAB = E-02 SIGMAC = E-02

COVARIANCE MATRIX A B C A E E E-05 B E E E-10 C E E E-05 Los elementos fuera de la diagonal muestran la interacción entre los parámetros. Tienen que ser menores que los elementos de la diagonal Diagnóstico: Hay interacción entre A y C. A y C no son independientes. Efectivamente, la curva normal es así : Si conoces , ya sabes el factor pre-exponencial,

Y=(1/(A*(2*3.1416)**0.5))*exp(-0.5*((x-B)/A)**2) PARAMETERS: Mean UNCERTAINTIES: SD t P(t) A = E+00 SIGMAA = E E B = E+01 SIGMAB = E E Correlation Coeficient: R²yy(x) = E+00 adjR²yy(x) = E+00 Ryy(x) = E+00 => P(NP,|R|) = 0.300E-07 Average Absolute Residual: Res_av = Sum of Absolute Residuals / Number of points => Res_av = E+02 / 201 => Res_av = E-01 COVARIANCE MATRIX E E E E-05

¿Cuál de los dos ajuste es mejor? Ajuste2Ajuste1 nobs 201 npar 32 df SS E E+02 F calculado F Tabla ? La razón F se compara con el valor de F de la tabla en que los grados de libertad de numerador son df 1 -df 2 y los del denominador df 2. El ajusten mejora si Tablas estadísticas:

df numerador df denominadorr Se cumple que F calculado > F tabla por lo que el ajuste es estadísticamente mejor,

¿Cuál de los dos ajuste es mejor? Ajuste2Ajuste1 nobs 201 npar 32 df SS E E+02 F calculado F Tabla 3.89 La razón F se compara con el valor de F de la tabla en que los grados de libertad de numerador son df 1 -df 2 y los del denominador df 2. El ajusten mejora si El ajuste de 3 parámetros no es mejor que el de 2 parámetros