La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006.

Presentaciones similares


Presentación del tema: "ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006."— Transcripción de la presentación:

1 ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

2 PRUEBAS ESTADISTICAS PARAMETRICAS Prueba t de Student

3 ¿QUE ES LA PRUEBA t ? ES UNA PRUEBA ESTADISTICA PARA EVALUAR SI DOS GRUPOS DIFIEREN ENTRE SI DE MANERA SIGNIFICATIVA RESPECTO DE SUS MEDIAS.

4 SIMBOLO t

5 SE CALCULA PARA MUESTRAS PEQUEÑAS DE DISTRIBUCION NORMAL

6 SE CALCULA PARA MUESTRAS GRANDES DE DISTRIBUCION NORMAL

7 HIPOTESIS A PROBAR Se trata de comparar dos grupos: La hipótesis alternativa plantea que los grupos difieren significativamente entre si y la hipótesis nula propone que los grupos no difieren significativamente entre si.

8 VARIABLE INVOLUCRADA LA COMPARACION SE REALIZA SOBRE LA VARIABLE INDEPENDIENTE, SI EXISTEN OTRAS SE DEBE EFECTUAR VARIAS PRUEBAS t UNA POR CADA VARIABLE. EL NIVEL DE MEDICION DE LAS VARIABLES ES EL DE INTERVALO O RAZON

9 INTERPRETACION PARA GRUPOS PEQUEÑOS (n < 30) X la media del grupo. µ la media poblacional S la Desv. Estandar n = tamaño de muestra

10 INTERPRETACION Para saber si el valor t es significativo, se aplica la formula y se calculan los grados de libertad. La prueba t se basa en una distribución muestral o poblacional de diferencia de medias conocidas como la t de Student, Esta distribución es identificada por los grados de libertad, los cuales constituyen el numero de maneras como los datos pueden variar libremente.

11 RECOMENDACION Mientras mayor sea el numero de grados de libertad la distribución t de Student se acerca mas a ser una distribución normal. Si los grados de libertad exceden los 120 la Distribución Normal es utilizada como una aproximación adecuada de la t de Student. Calculado t y los gl (grados de libertad) SE ELIGE el nivel de significancia y se compara el valor obtenido con el mostrado en la Tabla

12 Distribución t-Student 0 t 1- t (v) Para muestras pequeñas de población normal PRUEBA t

13 CALCULO DE LOS GRADOS DE LIBERTAD gl = (N 1 + N 2 ) – 2 N1 y N2 representan al tamaño de cada grupo comparado.

14 EVALUACION DE RESULTADOS Si nuestro valor calculado es igual o mayor que el de la Tabla, se acepta la hipótesis alternativa. Pero si el valor es menor se acepta la hipótesis nula. USO DE LA TABLA……..

15 EJERCICIOS Tomar la Tabla t y calcular: Media Muestral= Media Poblacional= α= n= gl. (t-1) =

16 DESCANSO

17 HIPOTESIS A CONTRASTAR datos de la muestra Se definen: Las hipótesis nula y alternativa con una distribución de probabilidad conocida Regla de decisión(nivel de significación ) Valor crítico o tabulado Se calcula una medida asociada a la hipótesis que se desea docimar Se comparan los valores calculado con tabulado ¿se rechaza Ho? NO SI H1H1 Se extraen conclusiones

18 Utilizar prueba de Z Si No Si Utilizar prueba de Z No ¿Se conoce ? Utilizar prueba de Z Utilizar prueba de t ¿Se conoce? Si No Es n 30? No Si Utilizar prueba de Z (por el teorema central del límite) ¿Se conoce? Utilizar prueba de Z (por el teorema central del límite) Si ¿Se sabe q la población es normal? No Si Es n 30? Utilizar una prueba no paramétrica

19 Se acepta la hipótesis nula si el estadístico de la prueba cae dentro de esta región. Se rechaza la hipótesis nula Area A = área B y (A+B) = el nivel deseado de significancia Valor critico Valor teórico de la diferencia + Valor critico Area AArea B Esquema cuando se comprar la diferencia entre dos medias o proporciones muéstrales

20

21

22 Hipótesis estadística según Número de grupo y tipo de variable

23 Prueba de Correlación de Rango de SPEARMAN

24 El coeficiente de correlación por rango se define como: Donde: N: # de observaciones, # de individuos o fenómenos clasificados por rango. di: Diferencia en los rangos atribuida a dos características diferentes del i-ésimo individuo o fenómeno. PRUEBA DE CORRELACION DE RANGO DE SPEARMAN La correlación por rangos de Spearman mide la relación entre dos variables que han sido clasificadas por orden de menos a mayor (o de mayor a menor)

25 Una empresa contrató a 7 técnicos en informática, que fueron sometidos a un examen de conocimientos básicos. Luego de un año de servicio, se calificó su rendimiento en el trabajo. A continuación, se muestran los resultados: EJEMPLO Técnico Puntuación en el examen Clasificación por rendimiento J. Manzo824 M. Contreras737 C. Gutarra606 F. Olaechea803 D. Barrientos675 F. Estombelo941 J. Cordova892

26 Se utiliza la correlación por rangos de Spearman para determinar, si hay relación entre las calificaciones del examen y el rendimiento en el trabajo 1º Se elabora la clasificación de las puntuaciones del examen TécnicoPuntuación en el examen Clasificación por el examen (X) Clasificación por rendimiento (Y) J. Manzo82341 M. Contreras C. Gutarra F. Olaechea D. Barrientos F. Estombelo J. Cordova892200

27 2º Se calcula del coeficiente de correlación por rangos de Spearman r s : Un coeficiente de correlación oscila entre -1 y 1; los resultados muestran una fuerte relación positiva entre las puntuaciones de examen de cada técnico y su rendimiento en le trabajo

28 Contrastando la hipotes: H 0: ρ s = 0, no hay relación entre las dos variables H 1: ρ s 0, hay relación entre las dos variables H 0: ρ s = 0, no hay relación entre las dos variables H 1: ρ s 0, hay relación entre las dos variables Tabla N, con α=0.10, n=7; los valores críticos serían: ± Como r s está fuera de la región de aceptación, rechazamos la H 0. Se concluye, al 90% de confianza, existe relación entre las puntuaciones del examen y el orden de rendimiento en el trabajo Valor critico Valor critico Se Rechaza Se acepta

29 Intervalo de confianza para la diferencia de medias b) Si las varianzas 1 2 y 2 2 son desconocidas Para muestras grandes donde

30 Cambiar de tema

31 ANALISIS NO PARAMETRICO

32 CONSIDERACIONES La mayoría no de estos análisis no requiere de presupuestos acerca de la forma de la Distribución Poblacional. Las Variables no necesariamente deben estar medidas en un nivel de intervalo (orden y categoría cero no real) o de razón ( el cero es real). Pueden analizarse datos nominales (sin orden ni categoría -Sexo) u ordinales (orden de mayor a menor- primero, segundo). En todo caso la variables deben ser categóricas. ( en días, meses, años, etc.)

33 METODOS O PRUEBAS NO PARAMETRICAS MAS EMPLEADAS 1)LA Ji CUADRADA – CHI-CUADRADA 2) COEFICIENTES DE CORRELACION E INDEPENDNENCIA PARA TABULACIONES CRUZADAS. 3) LOS COEFICIENTES DE CORRELACION PARA RANGOS ORDENADOS DE SPERMAN Y KENDALL

34 Ji - CUADRADA Es una prueba estadística para evaluar hipótesis acerca de la relación entre dos variables. Se simboliza por : א² Prueba hipotesis Correlacionales Variables involucradas : dos ( no considera relaciones causales) Nivel de medicion de variables: Nominal y Ordinal.

35 Ji - CUADRADA La Chi – Cuadrada se calcula a traves de una Tabla de contingencia o Tabulacion cruzada, que constituye una Tabla de dos dimensiones o matriz de dos x dos. Cada dimension contiene una variable. Cada variable se subdivide en dos o mas categorias.

36 La Prueba Ji-Cuadrado Distribución Ji-Cuadrado Supóngase que se tiene una serie de variables aleatorias independientes con distribución normal estándar,, entonces la variable aleatoria, sigue una distribución Ji-Cuadrado.

37 La Prueba Ji-Cuadrado FUNCIÓN DE DENSIDADMEDIA Y VARIANZA.

38 Hipótesis nula: Las variables son independientes Se construye o se obtiene una tabla de tabulación cruzada para las frecuencias reales observadas (O ij ) Procedimientos para usar el análisis de ji cuadrada y probar la independencia de dos variables nominales Suponiendo que las variables son independientes, se construye una tabla de tabulación cruzada para las frecuencias teóricas ( E ij ) Se determina el nivel de significado deseado en la prueba. Se determina el valor calculado del estadístico ji cuadrada

39 Tabla 4. Distribución de ji-cuadrado Probabilidad de un valor superior Grados de libertad0,10,050,0250,010,005 12,713,845,026,637,88 24,615,997,389,2110,60 36,257,819,3511,3412,84 47,789,4911,1413,2814,86 59,2411,0712,8315,0916,75 610,6412,5914,4516,8118,55 712,0214,0716,0118,4820,28 813,3615,5117,5320,0921,95 914,6816,9219,0221,6723, ,9918,3120,4823,2125,19 USO DE LA TABLA El área sombreada de naranja representa la probabilidad que se determinada por, donde: es el valor critico del margen superior de la tabla, y son los grados de libertad del margen izquierdo de la tabla.

40 Tabla 4. Distribución de ji-cuadrado Probabilidad de un valor superior Grados de libertad0,10,050,0250,010,005 12,713,845,026,637,88 24,615,997,389,2110,60 36,257,819,3511,3412,84 47,789,4911,1413,2814,86 59,2411,0712,8315,0916,75 610,6412,5914,4516,8118,55 712,0214,0716,0118,4820,28 813,3615,5117,5320,0921,95 914,6816,9219,0221,6723, ,9918,3120,4823,2125,19 Uso de la tabla Ji- Cuadrado

41 Martha Revilla, directora de mantenimiento de la calidad en MEGA, elige 29 bicicletas y halla una varianza en la distancia entre ejes de 32.7 pulgadas cuadradas. Si la señora Revilla tienen que garantizar que la variación no supere 27 pulgadas cuadradas ¿indica esto que se cumplen las normas de producción? (α=0.05) EJEMPLO HipótesisHipótesis Prueba de una cola a la derecha

42 Como X 2 =33.91< la señora Revilla no rechazará la H 0 y confiará al 95% en que se cumplen las normas de producción

43 ¿Que pasaría, si las instrucciones de la señora Revilla fueran que la variación se mantuviera inferior a 27 pulgadas cuadradas? Prueba de una cola a la izquierda X 2 =33.91, la señora Revilla no rechazará la H 0 y confiará al 95% en que se cumplen las normas de producción

44 La señora Revilla, ahora elabora un intervalo de confianza del 90% para la varianza de la distancia entre ejes Revilla puede confiar al 90% en que la varianza de la distancia entre ejes se encuentra entre y pulgadas cuadradas

45 Prueba Ji-Cuadrado de Independencia Y XCateg Categ. sTotal Cat. 1O O 1s R1R Cat. rO r O rs RrRr TotalC1C CsCs n H 0 : Las variables X e Y son independientes H 1 : Existe asociación entre X e Y

46 Prueba Ji-Cuadrado de Independencia Estadística

47 Ejemplo de Prueba Ji-Cuadrado de independencia Para verificar la suposición de que la fabricación de cierto producto está asociado con enfermedades respiratorias, a 450 trabajadores de una empresa que fabrica el producto se evaluó respecto a la presencia de síntomas de alteraciones respiratorias y se los clasificó a su vez de acuerdo al nivel de exposición al producto. Los resultados se presentan en la tabla siguiente: Presencia de Síntoma Nivel de Exposición Total AltoMedioBajo Si No Total

48 H 1 : Las alteraciones respiratorias están asociadas a la exposición al producto H 0 : Las alteraciones respiratorias son independientes de la exposición al producto. Frecuencias Esperadas: Por ejemplo: Presencia de Síntoma Nivel de Exposición Total AltoMedioBajo Si No Total

49 Estadística

50 Que sigue una distribución Ji-cuadrado con (n-1)*(C-1)=( 2-1)*(3-1)=2 grados de libertad Que sigue una distribución Ji-cuadrado con (n-1)*(C-1)=( 2-1)*(3-1)=2 grados de libertad En conclusión, se rechaza la H 0 (p < 0.05), es decir las alteraciones respiratorias están asociadas a la exposición al producto

51 Distribución F de Snedecor Si y son variables Ji-cuadrado distribuidas en forma independiente con y grados de libertad, respectivamente, la variable sigue la distribución F con y grados de libertad.

52 Tabla F de Fisher α=0.05 con letra normal. α=0.01 con letra negrita

53 Ejemplo de uso de la tabla F de Fisher

54 Ejemplo de Aplicación De dos aulas de 5ª año de secundaria se tomaron muestras de tamaños 10 y 15 de las notas promedios de alumnos para probar si la dispersión de las notas es la misma para las dos aulas. Los resultados obtenidos son los siguientes: Aula 1: 15, 16, 12, 14, 14, 15, 16, 13, 14, 15. Aula 2: 12, 14, 15, 16, 16, 17, 15, 16, 18, 14, 12, 15, 16, 14, 13. Deseamos probar las hipótesis:

55 Luego Si, entonces para las cuantilas y Luego concluimos que la dispersión de las notas entre los alumnos para las dos aulas de 5ª año son las mismas, pues no se encuentra diferencia significativa.

56 La compañía llantera Good Year del Perú, ha efectuado un estudio sobre los hábitos de manejo de varios grupos ocupacionales. En una muestra de 35 profesores universitarios, el número promedio de kilómetros recorridos al año fue de 14,500 con una desviación standart de 3,200 km. En una muestra de 40 dentistas, el kilometraje fue de 13,400, con una desviación standart de 1,950 km. EJEMPLO Se tiene

57 Primero se verificará la condición siguiente: 1 2 Planteamos las Hipótesis:

58 Para α= Se rechaza la H 0, es decir que

59 Valores críticos Y los valores críticos son: -1,220.3 y +1,220.3 Diferencia de las medias muestrales Luego, se prueba la hipótesis:

60 Valor critico Valor critico = diferencia observada entre las medias muestrales. Z= -1.96Z= Área =0.025 Se Rechaza Se acepta la hipótesis nula

61 Ejercicio Como la diferencia entre las medias muestrales es de 1050 millas y se acepta un margen de error de 1220 millas, en consecuencia, no hay diferencias significativas entre los dos grupos

62 Freddy Lopez, operador de la cadena de restaurantes Las Tejas, ha hecho una encuesta entre los clientes en dos ciudades, pues desea averiguar si les gustaría que en el menú se incluyeran sandwiches de jamón y queso. De las 500 personas encuestadas en la capital, 200 contestaron afirmativamente, mientras que 150 de las 300 encuestadas en una ciudad cercana también contestaron afirmativamente. Freddy quiere saber si, en un nivel de 0.05 esos resultados son significativamente diferente. EJEMPLO En resumen

63 Primero se determinará si se cumple lo siguiente: 1 2 Se tiene Planteamos las Hipótesis:

64 Para α= Se rechaza la H 0, es decir que

65 Valores críticos Y los valores críticos son: y Diferencia de las proporciones muestrales Luego, se prueba la hipótesis:

66 Se acepta la hipótesis nula Se rechaza Z= -1.96Z= Área = Valor critico Valor critico Diferencia observada entre las proporciones muestrales = ( ) =-0.10

67 Ejercicio Como la diferencia entre las proporciones muestrales es de y se acepta un margen de error de 0.071, en consecuencia, si hay diferencias significativas entre los dos grupos

68 FIN MUCHAS GRACIAS


Descargar ppt "ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006."

Presentaciones similares


Anuncios Google