Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porRosa Agüero Martín Modificado hace 8 años
1
Curso de posgrado: ANÁLISIS DE REGRESIÓN Universidad Nacional del Sur Nélida Winzer y Ricardo Camina 2012
2
EJEMPLO: Cladophora X = Velocidad de la corriente (m/seg) en el lugar de extracción Y = Nro. de ramificaciones por mm 2 del alga filamentosa Cladophora sp. n = 20 ; N = 80 - Levene = 0.99 ( p = 0.40 ) - Homocedasticidad U = Raíz de X =
3
Residuales vs Predichos q-q plot
4
F. de V.SCg.l.CMFp Reg. Lineal en X 33497,325 1 33497,3250 1608,000,0000 Desv. Mod. Lineal en X 1034,375 2 517,1875 66,560,0000 Reg. Lineal en raíz de X 34522,756 1 34522,7557 4492,120,0000 Desv. Modelo en raíz(X) 8,944 2 4,4721 0,580,5648 Dentro 590,500 76 7,7697 Total 35122,200 79 Mal ajuste del Modelo Lineal en X (p < 0.001) No hay evidencias en contra del Modelo Lineal en U (p>0.50) EJEMPLO 8 X = Velocidad de la corriente (m/seg) en el lugar de extracción U = Raíz cuadrada de X Y = Nro. de ramificaciones por mm 2 del alga filamentosa Cladophora sp.
5
Residuales del Modelo en X Residuales del Modelo en U
6
Ecuación del Modelo en X : Y = 3.05 + 39.75 X Ecuación del Modelo en U : Y = -16.3874 + 61.8143 U R 2 (Modelo X) = 0.954 R 2 (Modelo U) = 0.983
7
q-q plot del Modelo en X q-q plot del Modelo en raiz(X)
8
EJEMPLO: Peisos X: Edad (días) Y:Largo de Antenas (micras) de larvas Elaphocaris del Crustáceo Peisos petrunkevitchi F. de V.SCg.l.CMFp Regresión 147674,39 1 347,30,0000 Desviac. 4605,61 3 1535,20 5,260,0060 Dentro 7300,00 25 292,00 Total 159580,00 29 Conclusiones??? R 2 = 0.925 Resumen de la información
9
Peisos El gráfico muestra una ligera falta de ajuste. El q-q plot no muestra fallas evidentes!!! Exploremos un poco más....
10
EJEMPLO 6 El gráfico muestra una evidente falta de ajuste y una ligera falta de homocedasticidad. Sigamos explorando....
11
Y ahora.... Qué hacemos??? Aceptamos??? Rechazamos??? EJEMPLO 6 Veamos cómo andan los supuestos. Transformación sugerida : W=ln (Y)
12
EJEMPLO 6 bis X: Edad (días) W: Ln(Largo de Antenas) Ecuación: W = 4.9625 + 0.038 X Levene = 0,35 (p =0.84).
13
EJEMPLO 6 bis X: Edad (días) W: Ln(Largo de Antenas) F. de V.SCg.l.CMFp Regresión2,051981 497,80,0000 Desviac.0,0133730,004461,090,3709 Dentro0,10205250,00408 Total2,1673929 R 2 = 0.947 CMresi = 0.0041 g.l.(resi) = 28 No hay evidencia de falta de ajuste (p > 0.30). La regresión es altamente significativa.
14
X: Edad (días) W: Ln(Largo de Antenas) q-q plot e i vs predichos Homocedasticidad Los residuales muestran una ligera falta de ajuste. Hay homocedasticidad
15
EJEMPLO 6 bis X: Edad (días) W: Ln(Largo de Antenas) - Ecuación: W = 4.9625 + 0.038 X Bandas de Predicción del 95% para el Largo de Antenas Ecuación: W = 4.9625 + 0.038 X Ecuación retransformada: Y = e 4.9625 e 0.038 X = 142.96 e 0.038 X
16
ES(b) =0.00171 ES(a) =0.02726 Int.Conf. 95% [k] retr : (135.195 ; 151.169) Int.Conf. 95% [ ] : (0.03463 ; 0.04163) -Int.Conf. 95% [ ] : (4.90672 ; 5.0184) EJEMPLO 6 bis X: Edad (días) W: Ln(Largo de Antenas)
17
EJEMPLO 7 X: Peso total (g) de un ejemplar de una especie de pez marino. Y: Peso del hígado (g) Heterocedasticidad R 2 = 0.8205 Ecuación: Y = -4.922 + 0.0609 X
18
Gráfico de Residuales Probemos con una transformación logarítmica
19
EJEMPLO 7 X: Peso total (g) del pez. W: ln(Peso del hígado (g) ). Ajuste a un Modelo Exponencial R 2 = 0.8667 F. de V.SCg.l.CMF Regresión19,633 119,6331182,1* Residual3,019 280,1078 Total22,652 29 Ecuación: W = 1.358 + 0.003 X
20
W: Ln[Peso del hígado] U: Ln[Peso total del pez] Ecuación sin Retransformar W = -4.646 + 1.2544 U Int. de Conf. del 95% : (1,1086, 1,4002) : (-5,4990, -3,7928) K: ( 0,0041, 0,0225) F. de V.SCg.l.CMF Regresión 20,779120,7790310,7 ** Residual 1,873280,0669 Total 22,62529 R 2 = 0.9173 Ecuación Retransformada Y = 0.0096 X 1.2544 Modelo Potencial
21
W: Ln[Peso del hígado] U: Ln[Peso total del pez ]
22
Pocos residuales cercanos a 0!! Razón: DATOS CORREGIDOS!!
23
EJEMPLO 7 bis W: Ln[Peso del hígado] U: Ln[Peso total del pez] Bandas de Predicción del 95% sin Retransformar Bandas de Predicción del 95% Retransformadas
24
Más Medidas de diagnóstico Puntos Influyentes y su detección Un punto se dice Influyente si su eliminación modifica fuertemente los parámetros del modelo. Distancia de Cook: Es la distancia estadística entre el punto (a, b) y (a (i), b (i) ), parámetros calculados eliminando el punto (x i, y i ).
25
Distancia de Cook: Elipsoide de confianza Cuándo es grande? Poner atención cuando la confianza supera el 60%
26
Outliers y su detección Estadísticamente un outlier es un punto con un residual excesivamente grande. Dificultad en la detección: Se necesita una “buena” estimación de la varianza: Un residual alto se enmascara a sí mismo!!!
27
Prueba de Outliers Residual externamente estudentizado: Estadístico: Valor crítico: se elimina el punto “i” y se calcula el CM Res. El residual e i y el leverage v i son del modelo completo.
28
EJEMPLO VARIABLE INDEPENDIENTE (X) : Tiempo (hs) a partir de la ingesta de una determinada dieta. VARIABLE DEPENDIENTE (Y) : N-NH3 Ruminal (%) Ecuación: Y = 20.35 + 3 X
29
EJEMPLO 9 N= 8 Ecuación: Y =20.35 +3 X R 2 = 0.63095
30
EJEMPLO 9 - El primer dato influye mucho en la estimación de la pendiente El Modelo Lineal no ajusta bien los datos
31
EJEMPLO X: % de Materia Orgánica en el suelo (fracción 100 - 2000) Y:Umbral Hídrico a la compactación (% de humedad del suelo a la cual se obtiene la mayor compactación) zona semiáridaYX 13,20,49 14,20,52 15,10,57 Campos que15,70,70 desarrollan14,50,76 Actividad16,71,10 Agrícola11,51,12 13,01,18 18,11,38 14,21,76 19,03,68 18,64,05 Campos21,54,40 Vírgenes21,24,48 22,14,60 29,06,33 Medias:17,352,32 Ecuación: Y = 12.4346 + 2.1187 X
32
N = 16 R 2 = 0.82195 Ecuación: Y = 12.4346 + 2.1187 X F. de V.SCg.l.CMF Regresión248,00 1248,064,63 ** Residual53,72 143,837 Total301,72 15 EJEMPLO 10 X: % de Materia Orgánica en el suelo (fracción 100 - 2000) Y:Umbral Hídrico a la compactación (% de humedad del suelo a la cual se obtiene la mayor compactación)
33
Ecuación: Y = 12.43 + 2.119 X - Mal diseño. Hay un leverage muy alto. - Es muy riesgoso opinar sobre el ajuste lineal - Hay un dato relativamente influyente. EJEMPLO X: % de Materia Orgánica en el suelo (fracción 100 - 2000) Y:Umbral Hídrico a la compactación (% de humedad del suelo a la cual se obtiene la mayor compactación)
34
X = Profundidad (cm) en muestras de suelo de una región. Y = pH de la muestra.
35
Y éste de dónde salió??!!
36
Dato sospechoso!!!
37
Resultados sin Dato nº 7 N = 24 R 2 = 0.5643 Ecuación: Y = 8.36 + 0.028 X YX Medias:9,37536,25 F. de V.SCg.l.CMF Regresión6,8534481 28,49** Residual5,291552220,240525 Total12,14500023
38
Resultados sin Dato nº 7 Máximo Vi : 0,157 Dato nº : 24 Límite = 0,1667 Máximo qi : -1,745 Dato nº : 14 q(i): -1,836 Outlier : p = > 0.50 Máximo i : 0,1356 Dato nº : 5 elipsoide % 12,61 b(i) = 0,026 a(i) = 8,47
39
Resultados sin Dato nº 7 - No se encuentran problemas de diseño. - Se puede considerar un buen ajuste al Modelo Lineal. - La pendiente es estadísticamente distinta de CERO (p < 0.01). - Para esta población, se ha estimado un aumento promedio de 0.028 en el pH porc/cm de aumento en la profundidad. -El pH está explicado en un 56% por la profundidad. - No se hallaron en este Modelo datos anómalos o influyentes.
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.