Ajuste de curvas Métodos de ajuste de curvas: regresión lineal y no lineal Fco. Javier Burguillo Universidad de Salamanca Tema 8.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

ANOVA DE UN FACTOR.
Regresión mínimo cuadrada (II)
Regresión Lineal Verificación de Supuestos
Clase No. 1.
Tema 10. VALORACIÓN DE RESULTADOS.
Regresión lineal simple
Regresión mínimo cuadrada (I)
Modelos de Variable Dependiente Binaria -Logit y Probit-
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Variable Aleatoria Continua. Principales Distribuciones
Pronósticos, Series de Tiempo y Regresión
Fco. Javier Burguillo Universidad de Salamanca
Selección del modelo adecuado
Ingeniería Industrial II CicloEducativo 2011
León Darío Bello Parias
KRIGING.
Modelado y simulación en Ingeniería Química. Manuel Rodríguez
TEMA VII.
Introducción a la Estadística. Modelos de regresión
Regresión Lineal y Regresión Polinomial
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Capitulo 10: La metodología Box-Jenkins
Estimación por Intervalos de confianza
Regresión y correlación
Diseño de experimentos
Tema 5 Protocolos para obtención de datos, calibrados, uso de hojas de cálculo.
Estadística Descriptiva: 4. Correlación y Regresión Lineal
Tema 1- Regresión lineal simple.
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión Lineal Simple
9 Regresión Lineal Simple
Tema 2: Métodos de ajuste
Maracaibo, 5 de Noviembre de 2007 Universidad del Zulia Facultad de Ingeniería Instituto de Cálculo Aplicado Universidad del Zulia Facultad de Ingeniería.
Análisis de supervivencia Tema 5 Itziar Aretxaga.
3er Encuentro de Usuarios de Stata en México
Técnicas estadísticas paramétricas univariantes: regresión
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
MODELOS GENERALIZADOS
BIOMETRIA II TEMA 2 El Modelo de Regresión.
Este procedimiento mide la relación entre la intensidad de un estímulo y la proporción de casos que presentan una cierta respuesta a dicho estímulo. Es.
Pronósticos, Series de Tiempo y Regresión
Pronósticos, Series de Tiempo y Regresión
GRUPO DE INVESTIGACION EN CONTROL INDUSTRIAL
ESTADÍSTICA BÁSICA EN ECOLOGÍA EVOLUTIVA Juan J. Soler Cruz Estación Experimental de Zonas Áridas Almería.
Regresión logística.
Métodos de calibración: regresión y correlación
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
Regresión No- lineal y Múltiple
CORRELACION Y REGRESION LINEAL: Introducción
Inferencia Estadística
Concepto Según la estrategia de medidas repetidas, las unidades son observadas a lo largo de una serie reducida de intervalos de tiempo u ocasiones.
Regresión lineal simple
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
Planificación de transporte UNIDAD V: GENERACION DEL MOVIMIENTO DE PASAJEROS EL EMPLEO DE ANALISIS DE REGRESION Múltiple EN LA PREDICCION DE FUTURA.
Regresión Lineal Simple
ESTIMACIÓN DE PARÁMETROS
Construcción de modelos con regresión y correlación
Regresión lineal simple Nazira Calleja
Unidad 4 Análisis de los Datos.
Clase 17 Introducción a la Estadística Universidad de la República Centro Universitario Regional del Este Pablo Inchausti Licenciatura en Gestión Ambiental.
7. Distribución normal Sin duda la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones.
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
Licenciatura en Psicopedagogía: Métodos, Diseños y Técnicas de Investigación Psicológica Tema 9 Fiabilidad de las puntuaciones.
1 REGRESIÓN CON VARIABLES DICOTÓMICAS TEMA 1 (CONTINUACIÓN)
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
ANALISIS DE VARIANZA.
Caso práctico 5.
Ajuste de curvas v v = f[S] Modelo Teórico Modelo Empírico
Transcripción de la presentación:

Ajuste de curvas Métodos de ajuste de curvas: regresión lineal y no lineal Fco. Javier Burguillo Universidad de Salamanca Tema 8

Ajuste de curvas Antecedentes Bibliográficos Diseño de experimentos Obtención datos, calibrados, etc. Exploración de datos Análisis : tests estadísticos, ajuste de curvas Etapas de una investigación

Ajuste de curvas [S] : v : Ajuste de curvas v [S] v = f[S] Modelo Empírico Modelo Teórico En matemáticas: y = f(x)

Ajuste de curvas Datos sin mucho ruido, curvas suaves Cuidado porque son demasiado flexibles (hiperajuste) Adecuados para datos con ruido en calibración Subjetividad al elegir el nº de nudos (hiperajuste) Modelos empíricos (y = f(x)) Nudo 1 Nudo 2 Nudo 3

Ajuste de curvas Ejemplo de ajustes por cubic splines (para comparación de curvas: áreas, pendientes...) Área bajo la curva 1 (B1) = 2.69E+00 Área bajo la curva 2 (B2) = 2.63E+00 Integral |curva1 - curva2| (AA) = 2.62E-01 Porcentaje de diferencias entre las curvas: 100*AA/(B1 + B2) = 4.92 %

Ajuste de curvas En ecuaciones algebraicas + L K1K1 K2K2 fracción de sitios ocupados En ecuaciones diferenciales E* + S E*S E P E Modelos teóricos Lipasa Binding

Ajuste de curvas Ecuaciones de interés en Biomedicina Decaimientos exponenciales: Suma de Michaelis-Menten: Unión de Ligandos a macromoléculas: Curvas de crecimiento y curvas dosis-respuesta (modelo Logístico):

Ajuste de curvas Otras ecuaciones algebraicas Ejemplos : De dos variables y varios parámetros :

Ajuste de curvas Ejemplos (Lineal en variables, lineal en parámetros) (No lineal en variables, lineal en parámetros) (No lineal en variables, no lineal en parámetros) x Linealidad en las variables Ecuación linealEcuación no lineal y y x Linealidad en los parámetros Ecuación linealEcuación no lineal Concepto de linealidad

Ajuste de curvas Previo: Comparación cualitativa entre la forma de los datos y el tipo de curva a ajustar 1) Ordenada en el origen (0,0) C Y=f(x)+C Y=f(x) (Corrección por línea base) (bien) (0,0) (mal) a (bien) 2) Maximos, mínimos, puntos de inflexión y asíntotas Asíntota (Máximos, mínimos…)

Ajuste de curvas Estimación de los parámetros Optimizar los parámetros que mejor ajustan la ecuación a los datos: Ecuación no linealDatos y = K 1 [L] +2 K 1 K 2 [L] 2 n ( 1+K 1 [L] +2 K 1 K 2 [L] 2 y [L] y Regresión no lineal Ecuación linealDatos y = a + b x + c x 2 x y y x Encontrar los valores de los parámetros que mejor ajustan la ecuación a los datos Regresión lineal

Ajuste de curvas Criterio de ajuste (de una ecuación a unos datos) residual Curva suave debida a la ecuación con los parámetros optimizados y x Minimizar los residuales al cuadrado (Mínimos Cuadrados) residual

Ajuste de curvas Regresión lineal múltiple (Ecuaciones no lineales en parámetros, por ej. y =Ae -kx ) Regresión no lineal No se pueden explicitar los parámetros, solución aproximada. Métodos iterativos tipo: “Búsqueda” (Random Search) “Gradiente” (Gauss-Newton) Objetivos Encontrar las mejores estimas de los parámetros Cuantificar precisión parámetros usando límites de confianza Regresión por mínimos cuadrados Regresión lineal simple (Ecuaciones lineales en los parámetros, por ej. y= a+bx, polinomios en x, ….) Se puede explicitar cada parámetro, solución única, método exacto

Ajuste de curvas Cálculos en regresión lineal (simple y múltiple) usando notación matricial

Ajuste de curvas Regresión lineal simple p< 0.05, luego los dos parámetros son significativamente distintos de cero

Ajuste de curvas Regresión lineal múltiple

Ajuste de curvas Representación de los residuales: Test de las rachas Test de los signos Residual (R 2 = 0.95 significaría que el modelo explica el 95% de la variabilidad) Bondad de un ajuste en regresión lineal (Respecto a los residuales) y (Debe de ser pequeño) (del orden error relativo experimental)

Ajuste de curvas Bondad de un ajuste en regresión lineal (Respecto a los parámetros) (1/2) Matriz de correlación

Ajuste de curvas 1.No existe una solución única, no son métodos exactos 2.Ningún algoritmo garantiza el encontrar el mínimo global. Se puede caer en mínimos locales 3.Lo recomendable es alcanzar un mismo mínimo a partir de diferentes estimas iniciales de los parámetros Parámetro 1 Parámetro 2 SSQ Mínimo local Mínimo global Regresión no lineal: Métodos iterativos, mínimo global y mínimos locales Ecuación no lineal

Ajuste de curvas Algoritmos iterativos en regresión no lineal “De búsqueda (Random Search)” Importancia de las estimas iniciales de los parámetros: límite inferior, valor inicial, límite superior (1, 100, 10000) “Gradiente” (Gauss-Newton, Marquardt) 

Ajuste de curvas Los parámetros se obtienen por métodos aproximados (iterativos) No obstante se toma como válida la estadística de la regresión lineal ( sólo cierto en condiciones asintóticas de Hincapié: la estadística asociada a la regresión no lineal se suele interpretar de una manera más flexible que en la regresión lineal ( por ejemplo se admiten coeficientes de variación de los parámetros de hasta el 50%) Bondad de un ajuste en regresión no-lineal

Ajuste de curvas Estadística asociada a la regresión no lineal En resumen, lo mismo que en lineal pero con mayor flexibilidad : (n = nº puntos, m = nº parámetros)

Ajuste de curvas 1) Es necesario comparar la bondad de los 2 ajustes rivales: SSQ, R 2, distribución residuales, test de las rachas, límites de confianza de los parámetros..etc 2) Se debe aplicar el test “F”: En Ciencias Experimentales lo habitual es que se dude entre modelos alternativos dentro de una secuencia: Discriminación entre modelos Análisis de datos (Ajuste de curvas) Estadístico

Ajuste de curvas Discriminación por superposición de ajustes (Basado en Bardsley 2011, SIMFIT statistical package)

Ajuste de curvas Superposición de ajustes en otros espacios

Ajuste de curvas Regresión con pesos estadísticos (estas varianzas se determinan a partir de réplicas) El criterio de optimización es ahora : (weighted sum of squares) La última suposición no se suele cumplir y hay que “normalizar” los residuales con un factor llamado “peso estadístico”: (weight) El error en la respuesta es aditivo : y i = f ( p, x i ) + u  i Todos los errores (u i, u j,... ) siguen una distribución normal de media cero y varianza constante (todas las medidas tienen la misma precisión ) El criterio de mínimos cuadrados asume que: La variable x no tiene error Los errores u i y u j son independientes

Ajuste de curvas Ajustar siempre ecuaciones directas y nunca transformaciones lineales Conclusión: Lo ortodoxo para determinar parámetros es la regresión no lineal con pesos estadísticos a la ecuación directa Ecuación Michaelis-MentenLinealización Lineweaver -Burk

Ajuste de curvas Ejemplo de regresión no lineal con SIMFIT Con una preparación enzimática de dos isoenzimas se realizó el siguiente estudio: 8 puntos experimentales, en el margen de concentraciones de 0.05 a 50 mM, espaciados logarítmicamente y realizándose 5 réplicas por punto (40 datos en total). [S] vs … ¿Tienen las 2 isoenzimas la misma Vmax y Km?

Ajuste de curvas Algoritmo Búsqueda al azar Algoritmo Cuasi-Newton (p<0.05)

Ajuste de curvas sisi y exp. y ajus. y exp. - y ajus.

Ajuste de curvas Tabla de análisis global de los residuales (importante) Test  2 (p < 0.01) weighted sum of squares Test rachas (p < 0.01) cualitativo (poco valor)

Ajuste de curvas Hay 7 rachas (pocas para 40 residuales), eso significa un ajuste “sesgado” (los residuales debieran estar al azar y no en “racimos”)

Ajuste de curvas

Entra automáticamente el ajuste a 2 Michaelis-Menten Algoritmo búsqueda al azar Algoritmo Cuasi-Newton Las 4 “p” son < 0.05, parámetros distintos “0”

Ajuste de curvas Residuales

Ajuste de curvas Análisis global de los residuales para 2 Michaelis-Menten (disminuyó (antes 2.43E+02)) Test  2 (buen ajuste p > 0.05) (disminuyó (antes 5.66 %)) (aumentó (antes 7 )) (test rachas (buen ajuste ( p > 0.05 ))

Ajuste de curvas Los residuales están más al azar (18 rachas frente a 7 de antes). El ajuste no está sesgado (es mejor ajuste)

Ajuste de curvas

(disminuye, pero hay que probar que es significativo ) (p < 0.05, la disminución en WSSQ es significativa ) (Cp/M 1 > 1 rechazar modelo previo ) (disminuye AIC, rechazar modelo previo) Discriminación estadística entre los 2 modelos rivales

Ajuste de curvas (Basado en Bardsley 2011, SIMFIT statistical package)

Ajuste de curvas Ejemplo: Curvas Dosis-Respuesta Análisis de datos (Ajuste de curvas) Parámetro Valor Error est...95% conf. lim... A 9.989E E E E+00 B 9.890E E E E+01 k 9.881E E E E+00 Parámetro Valor Error est...95% conf. lim... C(50%) 2.319E E E E+00 (Basado en Bardsley 2011, SIMFIT statistical package)

Ajuste de curvas Diferencia entre curvas de 2 tratamientos Test t con varianzas distintas para H0: CE50_1 = CE50_2 ================================================================== estimado err.est....95% lim.conf.... npts npar 2.319E E E E E E E E C (test t corregido) = 7.422E+00 Grados de libertad = 38 P(t= =|C|) = Reject H0 at 1% sig.level Test Mahalanobis Ji-cuadrado ===================================================== Q = (A-B)^T(Ca+Cb)^(-1)(A-B) = 2.806E+03 Nº grados de libertad = 3 Prob.(Ji-cuadr. >= Q) = Test t entre parámetros para 2 tratamientos(A,B) con covarianzas (Ca,Cb). ====================================================== Param. A B A - B p E E E E E E ***** E E E (A) (B) (k) Ojo: aquí A y B significan los tratamientos

Ajuste de curvas Ecuación: Ajuste a ecuaciones de 2 variables Datos: Inhibidor : Sustrato : velocidad :

Ajuste de curvas Superficie ajustada

Ajuste de curvas No es válido el criterio de los mínimos cuadrados. Los ajustes se harán ahora por el método de “máxima verosimilitud”. Los errores en “y” no siguen una distribución normal sino una distribución binomial, de Poisson etc. Existe una función predictora que es función lineal de las variables: Distribución de Poisson: Logaritmo Recíproco Regr. Lineal generalizada Análisis de datos (Ajuste de curvas) Distribución Binomial: f. Logística f. probit

Ajuste de curvas y(i) 1=vivo 0=muerto variables: X 1, X 2, X 3, p(1) = probabilidad de que y = 1 La aplicación importante es estimar p(1) para un caso nuevo del que se conocen X 1,, X 2,, X 3, …. (ej: p(1) = 0.73 de sobrevivir) Ej: Regr. logística binaria Análisis de datos (Ajuste de curvas)

Ajuste de curvas N(i) = nº animales, y(i) =nº muertos, p i = y(i)/N(i), X(i) = concentración de tóxico Ejemplo. : DL50 porregresión logística, probit o log-log complementario Ejemplo. : DL50 por regresión logística, probit o log-log complementario Se ajustan:Función Logística, función probit o log-log complementario DL50 = 4.66 (IC95%: ) Función logística

Ajuste de curvas Modelos en ecuaciones diferenciales Ecuaciones diferenciales simultáneas (varias variables dependientes) Susceptibles Ejemplo : Epidemia Infectados Recuperados k1k1 k2k2 d S dt = k 1. S. I d I dt = k 1. S. I – k 2. I d R dt = k 2. I Integran numéricamente (Adams, Gear) S I R

Ajuste de curvas Ejemplo: Modelos en ecuaciones diferenciales Suscept. d S dt = k 1. S. I Infect. Recup. k1k1 k2k2 d I dt = k 1. S. I – k 2. I d R dt = k 2. I Ejemplo : Epidemia (Basado en Bardsley 2011, SIMFIT statistical package)

Ajuste de curvas Suscept. d S dt = k 1. S. I Infect. Recup. k1k1 k2k2 d I dt = k 1. S. I – k 2. I d R dt = k 2. I Ejemplo : Epidemia Ejemplo de modelos en ecuaciones diferenciales Condiciones iniciales: S 0, I 0 y R 0 k 1 y k 2

Ajuste de curvas Curvas de supervivencia de Kaplan-Meier: Probabilidad de que un sujeto viva más allá de un tiempo “t” (KMS(t)). Análisis de supervivencia Técnicas especiales Censurado significa que a ese tiempo el sujeto se ha perdido o estaba vivo, se denota con +. S(t) en KMS(t) significa función de supervivencia y es la probabilidad de que un sujeto sobreviva más allá de un tiempo determinado.

Ajuste de curvas Cálculos curvas supervivencia Kaplan-Meier Fármaco: tiempo, muere o vivePlacebo: tiempo, muere o vive EnsayoTiempo (meses) Nº sobreviven (intervalo) Nº mueren S(t) (Superv. Acumulada) Fármaco01001 Fármaco51011x(9/10) = 0.90 Fármaco x(8/9)=0.8 Fármaco x(7/8)=0.70 Fármaco x(7/7)=0.70 Placebo01001 Placebo31011x(9/10) = 0.9 Placebo5910.9x(8/9)=0.8 Placebo x(7/8)=0.70 Placebo x(7/7)=0.70

Ajuste de curvas Formato curvas Kaplan Meier en SIMFIT Códigos : 0 = muere 1= censurado (perdido o sobrevive) EnsayoTiempo (meses) Código (0 ó 1) Frecuencia Fármaco Fármaco1501 Fármaco2017 Placebo

Ajuste de curvas Curvas de supervivencia de Kaplan-Meier: Probabilidad de que un sujeto viva más allá de un tiempo “t” (KMS(t)). Curvas del ejemplo sencillo anterior

Ajuste de curvas Curvas de supervivencia de Kaplan-Meier: Probabilidad de que un sujeto viva más allá de un tiempo “t” (KMS(t)). En la práctica las curvas son con más datos Fármaco Placebo

Ajuste de curvas Test Mantel-Haenszel (log-Rank test) QMH=16.79 (p<0.01) (supervivencia diferente) Comparación de curvas de supervivencia Fármaco Placebo