CO-2124 Análisis de Varianza con Un Criterio de Clasificación En clases anteriores se deseaba determinar si existían diferencias entre las medias de dos.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

ANOVA DE UN FACTOR.
DISEÑO DE EXPERIMENTOS
BUENAS TARDES.
DISEÑO DE EXPERIMENTOS
DISEÑO DE EXPERIMENTOS
REGRESION LINEAL SIMPLE
Estadísticas Inferenciales Capítulo 10
Pronósticos, Series de Tiempo y Regresión
Experimentos con un solo factor: el análisis de varianza
La prueba U DE MANN-WHITNEY
Regresión Lineal y Regresión Polinomial
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Econometria 2. Modelo de Regresión Lineal Simple
Regresión y correlación
ANOVA Modelo I: Comparación entre medias
Estadística Descriptiva: 4. Correlación y Regresión Lineal
Tema 1- Regresión lineal simple.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
9 Regresión Lineal Simple
Regresión y Correlación
SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES
LEAN SIGMA – FASE DE ANÁLISIS Propósito y herramientas 1.
REGRESION LINEAL En la búsqueda de mejoras o en la solución de problemas es necesario, frecuentemente, investigar la relación entre factores (o variables).
Regresión Lineal Múltiple
Prueba para la Bondad de ajuste Validación de Modelo
ANOVA (Analysis of Variation)
CO 3321/22 Modelos Lineales Práctica 3 Consideraremos modelos de la forma: Observación=señal + ruido Estos modelos pueden escribirse en la forma: Y=X 
con Dos Criterios de Clasificación
Curso de Bioestadística. ANOVA
Pronósticos, Series de Tiempo y Regresión
Pronósticos, Series de Tiempo y Regresión
Mt. Martín Moreyra Navarrete.
Caso de regresión lineal simple: Relación entre población y número de nacimientos. Jorge Galbiati.
DERIVADO DE LOS COEFICIENTES DE REGRESIÓN LINEAL Y X Esta sequencia muestra cómo los coeficientes de regresión para un modelo de regresión lineal simple.
ESTADÍSTICA BÁSICA EN ECOLOGÍA EVOLUTIVA Juan J. Soler Cruz Estación Experimental de Zonas Áridas Almería.
Unidad V: Estimación de
ANALISIS DE FRECUENCIA EN HIDROLOGIA (2)
Análisis de Varianza (I)
Métodos de calibración: regresión y correlación
Titular: Agustín Salvia
Normalidad, Variabilidad y estimación del Modelo de Regresión
CO2124 CRÍTICA DEL MODELO Práctica 5 1 El ajuste y el análisis de un modelo lineal se sustenta en cuatro suposiciones básicas: La relación entre las variables.
Análisis de Covarianza
Modelos Lineales CO Práctica 4 Comparación de Modelos Lineales Se desea comparar dos modelos de la forma: (1) y i =  0 +  1 x 1i  l x li.
Diseño Completamente Aleatorizado: ejemplo
U de Mann Whitney.
Regresión lineal simple
COMPARACION DE MEDIAS Para comparar media utilizando la prueba T hay Ttres opciones diferentes utilizando contrastes de hipotesis sobre : PARA UNA MUESTRA.
ANÁLISIS DE REGRESIÓN SIMPLE
PARA LA REGRESIÓN LINEAL SIMPLE
Análisis de los Datos Cuantitativos
Regresión Lineal Simple
Regresión lineal simple Nazira Calleja
Unidad 4 Análisis de los Datos.
InfoStat. Software estadístico
Análisis de Varianza ANOVA Capitulo 10. Multiples grupos Ha: Por lo menos uno de los grupos no es igual a lo demás.
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
Clase 17 Introducción a la Estadística Universidad de la República Centro Universitario Regional del Este Pablo Inchausti Licenciatura en Gestión Ambiental.
DISEÑOS POR BLOQUES ALEATORIZADOS
(niveles o categorías)
REGRESIÓN LINEAL SIMPLE
Bioestadística Inferencia estadística y tamaño de muestra
1 REGRESIÓN CON VARIABLES DICOTÓMICAS TEMA 1 (CONTINUACIÓN)
METODO DE MAXIMA PENDIENTE
ANALISIS DE VARIANZA.
Evaluando los promedios de grupos distintos UNIDAD 7 1.
MEP- II.
MEP- II.
Transcripción de la presentación:

CO-2124 Análisis de Varianza con Un Criterio de Clasificación En clases anteriores se deseaba determinar si existían diferencias entre las medias de dos conjuntos de datos, en el ANÁLISIS DE VARIANZA se considera como una generalización de esa idea. Si se tiene un “FACTOR” se desea determinar si es influyente. y 11 y y k1 y 12 y y k2 y 1n1 y 1n2... y knk Se desea saber si hay diferencias entre los grupos. El modelo para el análisis es: y ij =  i +  ij i = 1,...,k; j = 1,..., n i. Se supone que los errores tienen distribución normal con media cero, varianza común  2 y son independientes.  ~N(0,  2 I)

CO-2124 Análisis de Varianza con Un Criterio de Clasificación Para determinar si existen diferencia entre los grupos, puede probarse la hipótesis: Ho:  1 =  2 =... =  k vs. H1: algún  i distinto Esta prueba equivale a comparar los modelos Modelo 1 y ij =  +  ij Modelo 2 y ij =  i +  ij Los modelos están anidados, y la comparación se realiza a través de la tabla de análisis de varianza correspondiente a la prueba de significancia del modelo. Se rechaza Ho si F > F k-1,N-k

CO-2124 Análisis de Varianza con Un Criterio de Clasificación Ejemplo: Un ingeniero que desarrolla productos está interesado en maximizar la resistencia a la tensión de una nueva fibra sintética que se empleará en la manufactura de tela para camisas de hombre. La resistencia es influida por el porcentaje de algodón presente en la fibra. El ingeniero decide probar muestras a cinco niveles de porcentaje de algodón: 15,20,25,30,35%. Los resultados son los siguientes: porcentaje = (15, 15, 15, 15, 20, 20, 20, 20, 20, 20, 25, 25, 25, 25, 25, 30, 30, 30, 35, 35, 35, 35, 35, 35, 35) contenido = (3, 3, 5, 2, 9, 12, 17,12, 18, 18, 14, 18, 18, 19, 19, 19, 25, 22, 19, 23, 7, 10, 11, 15, 11) Una herramienta para conocer la resistencia para cada nivel de algodón el a través del diagrama de caja. Para ello utilizamos la instrucción: Stat>ANOVA>One- way... Como variable respuesta se coloca el contenido o resistencia y en el factor el porcentaje de algodón utilizado. Adicional, se pide el gráfico de caja para visualizar si existen diferencia por cada nivel del factor. Los resultado son los siguientes:

CO-2124 Análisis de Varianza con Un Criterio de Clasificación Current worksheet: Worksheet 1 One-way Analysis of Variance Analysis of Variance for contenid Source DF SS MS F P porcenta 4 720,2 180,1 11,90 0,000 Error ,7 15,1 Total ,0 Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ,250 1,258 (----*----) ,333 3,830 (---*---) ,600 2,074 (----*----) ,000 3,000 (-----*----) ,714 5,619 (---*---) Pooled StDev = 3,890 0,0 8,0 16,0 24,0

CO-2124 Análisis de Varianza con Un Criterio de Clasificación A partir de los resultados de la tabla de Análisis de varianza, existen diferencias entre el nivel de algodón presente en la fibra y la resistencia. Frecuentemente se emplea la siguiente reparametrización: y ij =  +  i +  ij i = 1,...,k; j = 1,..., n i. Este modelo es equivalente al anterior (  i =  +  i ), tiene un parámetro adicional, y las ecuaciones normales correspondientes a esta reparametrización van a tener infinitas soluciones (los parámetros del modelo no son identificables). Para resolver este problema, es necesario imponer una restricción sobre los  i. Algunos de los más usados son: La suma de los n i  i son iguales a cero. Los  i representan las desviaciones de la media de cada grupo con respecto de la media general.  1 = 0  i i = 2,..., k representan las desviaciones respecto al primer grupo. Por defecto MINITAB utiliza la condición de que  1 = 0.

CO-2124 Análisis de Varianza con Un Criterio de Clasificación Los coeficientes del modelo, los genera MINITAB al realizar el análisis de varianza: (Intercept) porcentaje20 porcentaje25 porcentaje30 porcentaje Por defecto, MINITAB toma la restricción  1 = 0. Si se rechaza Ho:  1 =  2 =... =  k las hipótesis de interés son: Ho :  i =  j vs H1:  i   j Para identificar cuáles promedios son diferentes utilizamos la Mínima Diferencia Significativa. Para ello se utiliza en la la instrucción para la tabla ANOVA la herramienta comparaciones:

CO-2124 Análisis de Varianza con Un Criterio de Clasificación Fisher's pairwise comparisons Family error rate = 0,264 Individual error rate = 0,0500 Critical value = 2,086 Intervals for (column level mean) - (row level mean) ,322 -5, ,794 -8,181 -8,906 1, , , , ,552 -1,928 1, ,551 -3,896 -0,866 2,686 -5,378 5,134 8,638 13,886

Al igual que cualquier modelo, es necesario analizar los residuos para verificar que cumple con las hipótesis. De nuevo utilizamos los gráficos de residuos como en el caso de regresión. Ya que el modelo es desbalanceado, es decir, cada tratamiento difiere del número de observaciones y la varianza no es constante (forma de embudo) se realiza una transformación de las observaciones para tratar de resolver el posible problema de heterocedasticidad. CO-2124 Análisis de Varianza con Un Criterio de Clasificación

CO-2124 Análisis de Varianza con Un Criterio de Clasificación Suposición e Normalidad Suposición de Independencia de los residuos Si se conoce el orden en que se recopilaron los datos se puede utilizar para detectar alguna correlación entre ellos. Si esto ocurre la suposición de independencia ha sido violada.

CO-2124 Análisis de Varianza Estabilizar la Varianza Cuando los residuos no presentan estabilidad en la varianza puede ser debido a que son muy pocas observaciones por nivel o que realmente las varianzas no son constantes (Heterocedasticidad). En presencia de inestabilidad de varianza utilizamos la transformación: Log(  ) = log  +  log(  ) Deben existir réplicas para cada nivel, de lo contrario no se podría determinar la transformación por este método. Para ello determinamos los promedios y desviaciones para cada nivel, en nuestro caso tomamos la información de la tabla ANOVA:: Current worksheet: Worksheet 1 One-way Analysis of Variance Analysis of Variance for contenid Source DF SS MS F P porcenta 4 720,2 180,1 11,90 0,000 Error ,7 15,1 Total ,0 Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ,250 1,258 (----*----) ,333 3,830 (---*---) ,600 2,074 (----*----) ,000 3,000 (-----*----) ,714 5,619 (---*---) Pooled StDev = 3,890 0,0 8,0 16,0 24,0

CO-2124 Análisis de Varianza con Un Criterio de Clasificación Se estima una recta de regresión con estos datos: mediadesviacion log(des) log(media) 3,25 1, , , ,33 3, , , ,60 2, , , ,00 3, , , ,71 5, , ,61844 Realizamos la estimación del modelo de regresión con el modelo planteado: Stat >Regression >Regression... La variable predictora es log de los promedios y la respuesta log de las desviaciones, el resultado es el siguiente: Regression Analysis The regression equation is log(des) = - 0, ,494 log(media) Predictor Coef StDev T P Constant -0,2005 0, ,23 0,831 log(medi 0,4935 0,3352 1,47 0,237 S = 0,5050 R-Sq = 42,0% R-Sq(adj) = 22,6% El coeficiente del logaritmo de las medias para cada nivel es:  =  0.5 La transformación que le corresponde a las observaciones es: = 1 -  = = 0.5 Luego, la transformación para los datos es la raíz cuadrada.

CO-2124 Análisis de Varianza con Un Criterio de Clasificación Calc > Calculator...> resultado: raiz(contenido) expresion: sqrt(contenido) Una vez aplicad ala transformación a la variable Contenido, se estima nuevamente el modelo inicial para analizar si el problema de los residuos se modificó. La transformación no modificó los residuos, esto indica que la variabilidad en la varianza se debe al tamaño de la muestra en cada nivel.