La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

UNIVERSIDAD INCA GARCILASO DE LA VEGA

Presentaciones similares


Presentación del tema: "UNIVERSIDAD INCA GARCILASO DE LA VEGA"— Transcripción de la presentación:

1 UNIVERSIDAD INCA GARCILASO DE LA VEGA
Vicerrectorado Académico Instituto de Capacitación Docente DIPLOMADO INVESTIGACIÓN CIENTÍFICA Y CÁTEDRA UNIVERSITARIA MUESTREO E INSTRUMENTOS DE MEDICIÓN, TABULACIÓN, ANÁLISIS E INTERPRETACIÓN DE RESULTADOS Mag. Renán Quispe Ll. Lima, enero 2005

2 ANALISIS DE VARIANZA Y OTROS TEST COEFICIENTES DE CORRELACION OD RATIO
UNIVERSIDAD INCA GARCILASO DE LA VEGA Vicerrectorado Académico Instituto de Capacitación Docente DIPLOMADO INVESTIGACIÓN CIENTÍFICA Y CÁTEDRA UNIVERSITARIA ANALISIS DE VARIANZA Y OTROS TEST COEFICIENTES DE CORRELACION OD RATIO Mag. Renán Quispe Ll. Lima, FEBRERO 2005

3

4

5 Hipótesis estadística según Número de grupo y tipo de variable

6 Análisis de Varianza de un factor
Hipótesis: H0: 1 = 2 = .... = k H1 : 1  2  ....  k i   k Estadística de la prueba F F(k-1, N-k) R.C.

7 Análisis de Varianza de un factor
SCT = SCG + SCE ANOVA DE UN FACTOR Fuente de variación Suma de Cuadrados Grados de libertad Cuadrado Medio Razón F Probab p Tratamientos SCG K-1 A= SCG/K-1 F=A/E p* Error SCE N-k E= SCE/N-K Total SCT N-1

8 Análisis de Varianza de un factor
Pesos de recién nacidos en 4 hospitales Total Hospital 1 Hospital 2 Hospital 3 Hospital 4 = 3.500 S2 = 0.200 N = 40 3.000 3.500 3.400 3.350 5.050 4.760 3.650 3.260 3.625 3.430 3.150 3.360 3.230 3.950 3.800 3.250 4.100 3.900 4.00 3.670 3.600 3.050 2.800 3.200 2.900 3.100 Promedio 3.677 3.440 3.707 3.175 Varianza 0.451 0.077 0.0795 0.0546 Muestra n1 = 10 n2 = 10 n3 = 10 n4 = 10

9 Análisis de Varianza de un factor
SCG = ( )2 x 10 + ( )2 x 10 +( )2 x 10 + ( )2 x 10 = 1.835 SCE = x x x x 9 = 5.959 SCT = ANOVA DE PESO DE RECIEN NACIDOS EN 4 HOSPITALES Fuente de variación Suma de Cuadrados Grados de libertad Cuadrado medio Razón F Probab. P Entre hospitales 1.835 3 0.612 3.695 0.0204 Error 5.959 36 0.166 Total 7.793 39

10 Prueba de Bartlet para Comparación de Varianzas

11 PRUEBA DE BARTLET HIPOTESIS
Las k muestras son elegidas aleatoriamente de sus respectivas poblaciones Las k poblaciones son independientes y tienen distribución normal HIPOTESIS H0: Las k poblaciones tienen varianzas semejantes H0: σ21= σ22=…= σ2k H1: Alguna de las poblaciones tiene varianza que difiere de las otras poblaciones H1: σ2i≠ σ2j ; para algún i≠j

12 EJEMPLO Del ejemplo de los pesos de los recién nacidos en 4 hospitales, para que los resultados del análisis de varianza sea valido, se comprobará que se cumpla la condición de que las varianzas de los grupos sean iguales: H0: Las varianzas de los pesos de los recién nacidos en los 4 hospitales son semejantes H0: σ21= σ22=…= σ2k H1: En alguno de los hospitales la varianza de los pesos de los recién nacidos difiere de la varianza de alguno de los otros hospitales H1: σ2i≠ σ2j ; para algún i≠j Hospital Suma 1 2 3 4 ni-1 9 36 (ni-1)S2i 9*0.451 9*0.077 9*0.0795 9*0.0546 5.959 (ni-1)logS2i -3.112 -9.897

13 0.005 12.838 14.452 Se concluye que se rechaza la H0, es decir hay diferencia muy significativa entre las varianzas de los recién nacidos en los 4 hospitales. Ello se debe a que los pesos de los nacidos en el hospital 1 tienen una variabilidad mucho mayor que lo de los otros hospitales

14 Prueba de Correlación de Rango de SPEARMAN

15 PRUEBA DE CORRELACION DE RANGO DE SPEARMAN
El coeficiente de correlación por rango se define como: Donde: N: # de observaciones, # de individuos o fenómenos clasificados por rango. di: Diferencia en los rangos atribuida a dos características diferentes del i-ésimo individuo o fenómeno. La correlación por rangos de Spearman mide la relación entre dos variables que han sido clasificadas por orden de menos a mayor (o de mayor a menor)

16 Puntuación en el examen Clasificación por rendimiento
EJEMPLO Una empresa contrató a 7 técnicos en informática, que fueron sometidos a un examen de conocimientos básicos. Luego de un año de servicio, se calificó su rendimiento en el trabajo. A continuación, se muestran los resultados: Técnico Puntuación en el examen Clasificación por rendimiento J. Manzo 82 4 M. Contreras 73 7 C. Gutarra 60 6 F. Olaechea 80 3 D. Barrientos 67 5 F. Estombelo 94 1 J. Cordova 89 2

17 1º Se elabora la clasificación de las puntuaciones del examen
Se utiliza la correlación por rangos de Spearman para determinar, si hay relación entre las calificaciones del examen y el rendimiento en el trabajo 1º Se elabora la clasificación de las puntuaciones del examen Técnico Puntuación en el examen Clasificación por el examen (X) Clasificación por rendimiento (Y) J. Manzo 82 3 4 -1 1 M. Contreras 73 5 7 -2 C. Gutarra 60 6 F. Olaechea 80 D. Barrientos 67 F. Estombelo 94 J. Cordova 89 2

18 2º Se calcula del coeficiente de correlación por rangos de Spearman rs:
Un coeficiente de correlación oscila entre -1 y 1; los resultados muestran una fuerte relación positiva entre las puntuaciones de examen de cada técnico y su rendimiento en le trabajo

19 Contrastando la hipotes:
H0: ρs = 0, no hay relación entre las dos variables H1: ρs ≠ 0, hay relación entre las dos variables Tabla N, con α=0.10, n=7; los valores críticos serían: ± Se acepta Se Rechaza Se Rechaza 0.05 0.05 0.857 Valor critico Valor critico Como rs está fuera de la región de aceptación, rechazamos la H0. Se concluye, al 90% de confianza, existe relación entre las puntuaciones del examen y el orden de rendimiento en el trabajo

20 Riesgo Relativo – ODDS Ratio

21 APLICATIVO: Medida de Asociación entre el Factor de Riesgo y la Mortalidad Infantil
ODDS Ratios, que es una medida del grado de asociación entre dos variables categóricas. Dentro de un modelo de regresión logística indica el factor de riesgo siempre que su valor sea mayor que 1. Se mide a través de:

22 ANÁLISIS DE UN FACTOR DE RIESGO
Del departamento de Huancavelica se tomó una muestra hipotética de individuos estudiada analiza el Factor de Riesgo, nivel de educación de la madre y su efecto en la Mortalidad Infantil. Factor de Riesgo (F) Mortalidad Infantil (M) SI NO 75 305 380 14 606 620 89 911 1000 Factor de riesgo (F): Madre analfabeta

23 ANÁLISIS DE UN FACTOR DE RIESGO
Del departamento de Huancavelica se tomó una muestra hipotética de individuos estudiada analiza el Factor de Riesgo, nivel de educación de la madre y su efecto en la Mortalidad Infantil. Factor de Riesgo (F) Mortalidad Infantil (M) SI NO 75 305 380 14 606 620 89 911 1000 Factor de riesgo (F): Madre analfabeta

24 Mientras que la probabilidad de serlo, no presentando el factor, será:
La probabilidad de morir de un niño menor de un año en un hogar, presentando el factor “madre analfabeta”, será: = Mientras que la probabilidad de serlo, no presentando el factor, será:

25 Por consiguiente, habrá más de ocho veces el número de casos de mortalidad infantil cuando existe el factor de riesgo, que cuando no. A esta relación se denomina Riesgo relativo:

26 APLICANDO EL ODDS RATIO EN EL EJEMPLO DE HUANCAVELICA
Con riesgo, existen 75 casos de mortalidad infantil por cada 305 niños que no fallecen (75/305=0,245 mortalidad / no mortalidad). Sin riesgo, existen 14 casos de mortalidad infantil por cada 606 niños que no fallecen (14/606=0,023) mortalidad/ no mortalidad). Por tanto, con el factor riesgo, habrá (75/305)/(14/606) = veces más niños muertos menores de un año, que sin el factor de riesgo. ODDS Ratio es una “razón de proporciones” de presencia de mortalidad infantil por no mortalidad infantil, entre los que presentan el factor y los que no lo presentan.

27 APLICANDO EL ODDS RATIO EN EL EJEMPLO DE HUANCAVELICA
Otra forma: Casos Mortalidad Infantil de No Mortalidad Infantil Personas- año Riesgo Tasa x 1000 Personas-Año Riesgo Relativo ODDS RATIO ANALFABETISMO (Presenta factor de riesgo) ALFABETISMO (No presenta factor de riesgo) Total 75 14 89 305 606 911 380 620 1000 0.197 (75/ 380) 0.022 (14 / 620) 8.95 Referente 10.64 0.197 representa los casos de mortalidad infantil con respecto al analfabetismo. 0.022 representa los casos de mortalidad infantil con respecto al alfabetismo.

28 COEFICIENTE DE CORRELACION DE PEARSON

29 Prueba T para la significancia de r
Hipótesis: H0:  = No existe asociación entre x e y H1:   Existe asociación entre x e y Estadística de la prueba -t1- t t(n-2) Requisitos R.C R.C. - Las variables tienen distribución normal

30 EJEMPLO Se tienen los siguientes datos experimentales, correspondientes a 12 individuos de los que se ha recogido información de dos variables Var1 (salario del padre) y Var2 (salario del hijo): Var1 Var2 1 760 720 2 800 700 3 920 680 4 670 860 5 690 890 6 850 7 750 8 9 870 10 1020 11 980 12

31 A partir de los datos se obtiene lo siguiente:
Sx =121.7 Sy=79.6 Sxy=

32 Análisis de la significancia de la correlación
H0: No existe asociación entre las dos variables ( = 0) H1: Existe asociación entre las variables (  0) n = 12 ; r =-0.769 Sigue una distribución t-Student con n-2 = 10 grados de libertad y que tiene asociado un p-valor de <0.05. El valor , se encuentra fuera de la región de aceptación  se rechaza la H0. Existe asociación entre losa salarios de los padres y los salarios de los hijos 0.025 0.025 t(14) -2.228 2.228

33 Prueba de Mann-Whitney
La prueba U de Mann-Whitney se usa para probar si dos grupos independientes han sido tomados de la misma población. Ejemplo: Tenemos un grupo experimental de 3 casos y un grupo de control de 4 casos. Así y Estos han sido sus puntajes: Las hipótesis a probar son: H0: No existe diferencias en los puntajes de los grupos experimental y de control. H1: Los puntajes del grupos experimental es mayor al del grupo de control. Para encontrar valor de U (el estadístico de prueba), en primer lugar debemos ordenar los puntajes de menor a mayor cuidando siempre su identidad como es E y C. Puntajes E 9 11 15 Puntajes C 6 8 10 13 6 8 9 10 11 13 15 C E

34 Luego considérese como grupo de referencia al grupo de control (C), y contemos el numero de puntajes E que preceden a cada uno de sus puntajes. El puntaje C de 6 no esta precedido de un puntaje E, y lo mismo pasa para el puntaje C de 8. Pero el siguiente puntaje, C(10), esta precedido por un puntaje E. Y al puntaje final, C(13), se anteponen dos puntajes E. Así Estando en la tabla de Mann-Whitney con los datos: vemos que la probabilidad de ocurrencia de es La conclusión es que los datos no apoyan a que el grupo experimental tenga mayor puntaje que el grupo de control. 6 8 9 10 11 13 15 C E

35 Tabla de Mac whitney U 1 2 3 4 .200 .067 .028 .014 .400 .133 .057 .029 .600 .267 .114 .100 .314 .171 5 .429 .243 6 .571 .343 7 .443 8 .557

36 Prueba de Wilcoxon La prueba de Wilcoxon se usa para probar si entre dos muestras relacionadas existen condiciones diferentes. Ejemplo: Un psicólogo infantil desea probar si la asistencia al jardín de niños tiene algún efecto o capacidad social de percepción social de los niños. Para ello eligió a 8 gemelos. Al azar, asigna un gemelo, de cada par, al jardín de niños por un tiempo y el otro permanece en su casa. Las hipótesis a probar son: H0: La capacidad de percepción social de los niños “de casa” y “de jardín de niños” no difieren. H1: La capacidad de percepción social de los niños difieren.

37 La suma de los rangos señalados es 1+3=4=T
La suma de los rangos señalados es 1+3=4=T. La tabla de la derecha muestra que para N=8, una T de 4 nos permite rechazar H0 en α=0.05 para una prueba de dos colas, es decir, que la capacidad de percepción social de los niños difieren.

38 Prueba de Kruskal-Wallis
La prueba de Kruskal-Wallis se usa para decidir si tres o mas muestras independientes son de poblaciones diferentes. Ejemplo: Un investigador educativo desea probar la hipótesis que supone que los administradores escolares son característicamente mas autoritarios que los maestros de clase. Sin embargo existen profesores que toman como referencia a los administradores, y para evitar la contaminación de los datos decide dividir sus 14 sujetos en 3 grupos. - Profesores orientados a la enseñanza. - Profesores orientados a la administración. - Administradores. Se aplica la escala F (medida de autoritarismo) a los 14 sujetos. Las hipótesis a probar son: H0: No hay diferencia entre los promedios de puntajes F de los profesores orientados a la enseñanza, los profesores orientados a la administración y los administradores. H1: Los tres grupos de educadores no tienen el mismo promedio de puntajes F.

39 Método: Todos los puntajes de las k muestras combinadas se ordenan en una sola serie. El puntaje mas pequeño es reemplazado por el rango 1, el siguiente en tamaño por el rango 2 y el mas grande por el rango N. N es el numero total de observaciones independientes en las k muestras. En seguida se halla H, el estadístico de prueba de Kruskal Wallis, que esta distribuida como una Ji-Cuadrado con gl=k-1, que viene determinada de la siguiente manera: Donde: k = número de muestras. nj= número de casos en la muestra de orden j. N= número de casos de todas las muestras combinadas. Rj= suma de rangos en la muestra de orden j. Si el valor observado de H es igual o mayor que el valor de Ji-cuadrado dado en la tabla en el nivel de significancia fijado previamente y con gl=k-1, entonces de rechaza H0.

40 Para nuestro estudio, los 14 puntajes F para los tres grupos son ordenamos del mas bajo al mas alto, según muestran las tablas a continuación: La estadística de Kruskal-Wallis es: La tabla señala que cuando los tamaños de las muestras son 5, 5 y 4, tiene probabilidad p menor a y por tanto para un α=0.05, se rechaza H0.


Descargar ppt "UNIVERSIDAD INCA GARCILASO DE LA VEGA"

Presentaciones similares


Anuncios Google