Modelo de Clasificación Análisis de la Varianza
Ejemplo 1:Modelo de Clasificación unifactorial Comparación del porcentaje de semillas germinadas en función del color de las semillas ClaroOscuroRojizo
Ejemplo 1: Continuación Análisis de la varianza VariableN R² R² Aj CV PG Cuadro de Análisis de la Varianza (SC tipo III) F.V. SC gl CM F valor p Modelo < Episperma < Error Total
Ejemplo 2:Modelo de Clasificación bifactorial – sin interacciones Efecto de la temperatura sobre la longitud de la cola en hembras y machos de un nemátodo del género Pratylenchus.
Ejemplo 2 (continuación) Variable N R^2 R^2ajust LargoCola Cuadro de Análisis de la Varianza F.V. SC gl CM F p Modelo < Temperatura < Sexo < Tempe*Sexo Error Total
Ejemplo 2 (continuación-contrastes) Contrastes Temperatura SC gl CM F p Temperatura < C. Lineal < Coeficientes de los contrastes Temperatura Contraste
Modelo de Clasificación Unifactorial Consideremos un experimento unifactorial balanceado con 3 niveles y 2 repeticiones X= y= 33 22 11 b=b= y=Xb+
Existen dos criterios que conducen a las ecuaciones normales a. La maximización de la función de verosimilitud suponiendo y~N(Xb, 2 I ) b. La minimización de la suma de cuadrados residual (método de mínimos cuadrados) Ecuaciones Normales
Ecuaciones Normales Maximización de la función de verosimilitud Este principio requiere la especificación de las propiedades estadísticas del vector y. Bajo la teoría clásica y ~N n (Xb, 2 I )
derivando ln(L) con respecto a b y 2 e igualando a cero se tiene
Ecuaciones Normales Minimización de la SC del error Este principio no requiere supuestos distribucionales sobre los errores, excepto que su esperanza sea cero y su matriz de covarianzas sea 2 I. Esta robustez permite utilizar el principio de estimación por mínimos cuadrados aún cuando los errores no son normales. Las propiedades asintóticas de las funciones estimables obtenidas a partir de las soluciones por mínimos cuadrados son idénticas a las que se obtienen bajo normalidad y por lo tanto la inferencia clásica basada en modelo normal es válida si n es suficientemente grande (ver teorema de Gauss Markov, pag 219, Graybill F.).
Ecuaciones Normales Minimización de la SC del error
Tres formas de resolver el sistema de ecuaciones normales Usando inversa generalizada Imponiendo restricciones a las soluciones Reparametrizando el modelo
Solución de las ecuaciones normales Se propone como solución a b 0 =GX´Y, donde G es una inversa generalizada de X´X.
Modelo de clasificación unifactorial-continuación G es una inversa generalizada de X’X ½00 00½0 000½ = X’X G X’XG
Modelo de clasificación unifactorial -continuación- una solución b 0 =G X´y G=G= X´y= ½00 00½0 000½ b0=b0= 0 5 / 2 11/ 2 14 / X’X=
¿Es b 0 =G X´Y la única solución? No, existen infinitas soluciones La forma general de la solución al sistema de ecuaciones normales está dada por b 0 =GX’y+(G 1 X’X - I)z Donde G y G 1 son g-inversas de X’X y z un vector px1 arbitrario.
Solución imponiendo restricciones
Restricción Searle, pag 212
Solución reparametrizando
Reparametrización Forma particular de introducir restricciones Fijar en cero los parámetros que “sobran” El número total de parámetros a estimar es menor La complicación es la interpretación de los resultados
Ejemplo de reparametrización
Modelo de Clasificación Unifactorial Consideremos un experimento unifactorial balanceado con 3 niveles y 2 repeticiones X= y= 33 22 11 b=b= y=Xb+
¿Como reconstruimos los valores medios?
Veamos un ejemplo sencillo ParémetrosEstEE (Intercept) tratB tratC4.51.0
Un ejemplo con interacciones
Sumas de Cuadrados
SC paraTipo ITipo IITipo III y IV A R( | )R( | , ) R( | , , ) B R( | , ) R( | , , ) AB R( | , , ) Fuente: SAS Institute (1996). Advanced General Linear Models with an emphasis on mixed model. Course Notes. Chapter 5. Tipo de Sumas de Cuadrado para un Modelo Bifactorial
Como calcular las reducciones X U ABC X=U|A|B|C R( | )= y ’(P(UA) -P(U)) y R( | , )= y ’(P(UAB) -P(UA))y R( | , , )= y ’(P(X) -P(UAB))y R( | , )= y ’(P(UAB) -P(UB))y R( | , , )= y ’(P(X) -P(UBC))y R( | , , )= y ’(P(X) -P(UAC))y
EfectoIgualesProporcionales No proporcionales Celdas vacias A I=II=III=IVI=II, III=IVIII=IV B I=II=III=IVI=II, III=IV I=II AB I=II=III=IV Numero de observaciones por celda Cuando los tipos se omiten implica que difieren de cualquier otro tipo Fuente: SAS Institute (1996). Advanced General Linear Models with an enphasis on mixed model. Course Notes. Chapter 5. Relaciones entre tipos de sumas de cuadrados para un modelo bifactorial
¿Que prueban las sumas de cuadrados? ABTotal Aspartame336 Saccharin123 Azucar336 Total7815 Fuente:Advanced General Linear Models With an Emphasis on Mixed Models.Course Notes (1996). SAS, SAS Institute. Cap 5, pag SC Dietagl Tipo I Tipo II Tipo III,IV
¿Que prueban las sumas de cuadrados?.. Para el efecto dieta según el tipo de sc. Tipo I H 01 : 0.5 32 =0 H 02 : 1/3 /6 32 =0 Tipo II H 01 : 0.5 32 =0 H 02 : 31 =0 Tipo III y IV H 01 : 0.5 32 =0 H 02 : 0.5 31 =0 AB Aspartame 11 12 Saccharin 21 22 Azucar 31 32
ABTotal Aspartame336 Saccharin123 Azucar033 Total4812 Fuente:Advanced General Linear Models With an Emphasis on Mixed Models.Course Notes (1996). SAS, SAS Institute. Cap 5, pag SC Dietagl Tipo III Tipo IV Sumas de cuadrados, celdas vacias
¿Que prueban las sumas de cuadrados?.. Para el efecto dieta según el tipo de sc. Tipo III H 01 : 0.25 22 - 32 =0 H 01 : 22 - 32 =0 Tipo IV H 01 : 12 - 22 =0 H 02 : 22 - 32 =0 AB Aspartame 11 12 Saccharin 21 22 Sugar 32