La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Curso de posgrado: ANÁLISIS DE REGRESIÓN Universidad Nacional del Sur Nélida Winzer y Ricardo Camina 2012.

Presentaciones similares


Presentación del tema: "Curso de posgrado: ANÁLISIS DE REGRESIÓN Universidad Nacional del Sur Nélida Winzer y Ricardo Camina 2012."— Transcripción de la presentación:

1 Curso de posgrado: ANÁLISIS DE REGRESIÓN Universidad Nacional del Sur Nélida Winzer y Ricardo Camina 2012

2 EJEMPLO: Cladophora X = Velocidad de la corriente (m/seg) en el lugar de extracción Y = Nro. de ramificaciones por mm 2 del alga filamentosa Cladophora sp. n = 20 ; N = 80 - Levene = 0.99 ( p = 0.40 ) - Homocedasticidad U = Raíz de X =

3 Residuales vs Predichos q-q plot

4 F. de V.SCg.l.CMFp Reg. Lineal en X 33497,325 1 33497,3250 1608,000,0000 Desv. Mod. Lineal en X 1034,375 2 517,1875 66,560,0000 Reg. Lineal en raíz de X 34522,756 1 34522,7557 4492,120,0000 Desv. Modelo en raíz(X) 8,944 2 4,4721 0,580,5648 Dentro 590,500 76 7,7697 Total 35122,200 79 Mal ajuste del Modelo Lineal en X (p < 0.001) No hay evidencias en contra del Modelo Lineal en U (p>0.50) EJEMPLO 8 X = Velocidad de la corriente (m/seg) en el lugar de extracción U = Raíz cuadrada de X Y = Nro. de ramificaciones por mm 2 del alga filamentosa Cladophora sp.

5 Residuales del Modelo en X Residuales del Modelo en U

6 Ecuación del Modelo en X : Y = 3.05 + 39.75 X Ecuación del Modelo en U : Y = -16.3874 + 61.8143 U R 2 (Modelo X) = 0.954 R 2 (Modelo U) = 0.983

7 q-q plot del Modelo en X q-q plot del Modelo en raiz(X)

8 EJEMPLO: Peisos X: Edad (días) Y:Largo de Antenas (micras) de larvas Elaphocaris del Crustáceo Peisos petrunkevitchi F. de V.SCg.l.CMFp Regresión 147674,39 1 347,30,0000 Desviac. 4605,61 3 1535,20 5,260,0060 Dentro 7300,00 25 292,00 Total 159580,00 29 Conclusiones??? R 2 = 0.925 Resumen de la información

9 Peisos El gráfico muestra una ligera falta de ajuste. El q-q plot no muestra fallas evidentes!!! Exploremos un poco más....

10 EJEMPLO 6 El gráfico muestra una evidente falta de ajuste y una ligera falta de homocedasticidad. Sigamos explorando....

11 Y ahora.... Qué hacemos??? Aceptamos??? Rechazamos??? EJEMPLO 6 Veamos cómo andan los supuestos. Transformación sugerida : W=ln (Y)

12 EJEMPLO 6 bis X: Edad (días) W: Ln(Largo de Antenas) Ecuación: W = 4.9625 + 0.038 X Levene = 0,35 (p =0.84).

13 EJEMPLO 6 bis X: Edad (días) W: Ln(Largo de Antenas) F. de V.SCg.l.CMFp Regresión2,051981 497,80,0000 Desviac.0,0133730,004461,090,3709 Dentro0,10205250,00408 Total2,1673929 R 2 = 0.947 CMresi = 0.0041 g.l.(resi) = 28 No hay evidencia de falta de ajuste (p > 0.30). La regresión es altamente significativa.

14 X: Edad (días) W: Ln(Largo de Antenas) q-q plot e i vs predichos Homocedasticidad Los residuales muestran una ligera falta de ajuste. Hay homocedasticidad

15 EJEMPLO 6 bis X: Edad (días) W: Ln(Largo de Antenas) - Ecuación: W = 4.9625 + 0.038 X Bandas de Predicción del 95% para el Largo de Antenas Ecuación: W = 4.9625 + 0.038 X Ecuación retransformada: Y = e 4.9625 e 0.038 X = 142.96 e 0.038 X

16 ES(b) =0.00171 ES(a) =0.02726 Int.Conf. 95% [k] retr : (135.195 ; 151.169) Int.Conf. 95% [  ] : (0.03463 ; 0.04163) -Int.Conf. 95% [  ] : (4.90672 ; 5.0184) EJEMPLO 6 bis X: Edad (días) W: Ln(Largo de Antenas)

17 EJEMPLO 7 X: Peso total (g) de un ejemplar de una especie de pez marino. Y: Peso del hígado (g) Heterocedasticidad R 2 = 0.8205 Ecuación: Y = -4.922 + 0.0609 X

18 Gráfico de Residuales Probemos con una transformación logarítmica

19 EJEMPLO 7 X: Peso total (g) del pez. W: ln(Peso del hígado (g) ). Ajuste a un Modelo Exponencial R 2 = 0.8667 F. de V.SCg.l.CMF Regresión19,633 119,6331182,1* Residual3,019 280,1078 Total22,652 29 Ecuación: W = 1.358 + 0.003 X

20 W: Ln[Peso del hígado] U: Ln[Peso total del pez] Ecuación sin Retransformar W = -4.646 + 1.2544 U Int. de Conf. del 95%  : (1,1086, 1,4002)  : (-5,4990, -3,7928) K: ( 0,0041, 0,0225) F. de V.SCg.l.CMF Regresión 20,779120,7790310,7 ** Residual 1,873280,0669 Total 22,62529 R 2 = 0.9173 Ecuación Retransformada Y = 0.0096 X 1.2544 Modelo Potencial

21 W: Ln[Peso del hígado] U: Ln[Peso total del pez ]

22 Pocos residuales cercanos a 0!! Razón: DATOS CORREGIDOS!!

23 EJEMPLO 7 bis W: Ln[Peso del hígado] U: Ln[Peso total del pez] Bandas de Predicción del 95% sin Retransformar Bandas de Predicción del 95% Retransformadas

24 Más Medidas de diagnóstico Puntos Influyentes y su detección Un punto se dice Influyente si su eliminación modifica fuertemente los parámetros del modelo. Distancia de Cook: Es la distancia estadística entre el punto (a, b) y (a (i), b (i) ), parámetros calculados eliminando el punto (x i, y i ).

25 Distancia de Cook: Elipsoide de confianza Cuándo es grande? Poner atención cuando la confianza supera el 60%

26 Outliers y su detección Estadísticamente un outlier es un punto con un residual excesivamente grande. Dificultad en la detección: Se necesita una “buena” estimación de la varianza: Un residual alto se enmascara a sí mismo!!!

27 Prueba de Outliers Residual externamente estudentizado: Estadístico: Valor crítico: se elimina el punto “i” y se calcula el CM Res. El residual e i y el leverage v i son del modelo completo.

28 EJEMPLO VARIABLE INDEPENDIENTE (X) : Tiempo (hs) a partir de la ingesta de una determinada dieta. VARIABLE DEPENDIENTE (Y) : N-NH3 Ruminal (%) Ecuación: Y = 20.35 + 3 X

29 EJEMPLO 9 N= 8 Ecuación: Y =20.35 +3 X R 2 = 0.63095

30 EJEMPLO 9 - El primer dato influye mucho en la estimación de la pendiente El Modelo Lineal no ajusta bien los datos

31 EJEMPLO X: % de Materia Orgánica en el suelo (fracción 100 - 2000) Y:Umbral Hídrico a la compactación (% de humedad del suelo a la cual se obtiene la mayor compactación) zona semiáridaYX 13,20,49 14,20,52 15,10,57 Campos que15,70,70 desarrollan14,50,76 Actividad16,71,10 Agrícola11,51,12 13,01,18 18,11,38 14,21,76 19,03,68 18,64,05 Campos21,54,40 Vírgenes21,24,48 22,14,60 29,06,33 Medias:17,352,32 Ecuación: Y = 12.4346 + 2.1187 X

32 N = 16 R 2 = 0.82195 Ecuación: Y = 12.4346 + 2.1187 X F. de V.SCg.l.CMF Regresión248,00 1248,064,63 ** Residual53,72 143,837 Total301,72 15 EJEMPLO 10 X: % de Materia Orgánica en el suelo (fracción 100 - 2000) Y:Umbral Hídrico a la compactación (% de humedad del suelo a la cual se obtiene la mayor compactación)

33 Ecuación: Y = 12.43 + 2.119 X - Mal diseño. Hay un leverage muy alto. - Es muy riesgoso opinar sobre el ajuste lineal - Hay un dato relativamente influyente. EJEMPLO X: % de Materia Orgánica en el suelo (fracción 100 - 2000) Y:Umbral Hídrico a la compactación (% de humedad del suelo a la cual se obtiene la mayor compactación)

34 X = Profundidad (cm) en muestras de suelo de una región. Y = pH de la muestra.

35 Y éste de dónde salió??!!

36 Dato sospechoso!!!

37 Resultados sin Dato nº 7 N = 24 R 2 = 0.5643 Ecuación: Y = 8.36 + 0.028 X YX Medias:9,37536,25 F. de V.SCg.l.CMF Regresión6,8534481 28,49** Residual5,291552220,240525 Total12,14500023

38 Resultados sin Dato nº 7 Máximo Vi : 0,157 Dato nº : 24 Límite = 0,1667 Máximo qi : -1,745 Dato nº : 14 q(i): -1,836 Outlier : p = > 0.50 Máximo  i : 0,1356 Dato nº : 5 elipsoide % 12,61 b(i) = 0,026 a(i) = 8,47

39 Resultados sin Dato nº 7 - No se encuentran problemas de diseño. - Se puede considerar un buen ajuste al Modelo Lineal. - La pendiente es estadísticamente distinta de CERO (p < 0.01). - Para esta población, se ha estimado un aumento promedio de 0.028 en el pH porc/cm de aumento en la profundidad. -El pH está explicado en un 56% por la profundidad. - No se hallaron en este Modelo datos anómalos o influyentes.


Descargar ppt "Curso de posgrado: ANÁLISIS DE REGRESIÓN Universidad Nacional del Sur Nélida Winzer y Ricardo Camina 2012."

Presentaciones similares


Anuncios Google