UNIVERSIDAD INCA GARCILASO DE LA VEGA

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

FRANCISCO MARÍN HERRADA
Test de Hipótesis.
ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS
Contraste de Hipótesis
KRUSKAL WALLIS Jorge Iván Betancur Marta Isabel Naranjo García
PRUEBA DE HIPOTESIS LUIS FERNANDO TRUJILLO LEYDER JULIAN GOMEZ
Hipótesis para dos Muestras
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
puede o no ser verdadero, relativo a una o más poblaciones.
PRUEBAS DE HIPOTESIS HIPOTESIS
Estimación por intervalos de confianza.
Uso de pruebas estadísticas paramétricas y no paramétricas
COMPARACIONES PAREADAS
Análisis de varianza Análisis de varianza de un factor
Prueba de hipótesis Equivalencia entre la prueba de hipótesis y los intervalos de confianza Valor de probabilidad Valor de probabilidad unilateral Prueba.
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Clase 5 Hipótesis de diferencias de grupos
UNIVERSIDAD INCA GARCILASO DE LA VEGA
Clases 3 Pruebas de Hipótesis
Unidad VI: PRUEBAS DE HIPOTESIS
CHI-CUADRADO Y DISTRIBUCION NORMAL
Clases 4 Pruebas de Hipótesis
1 Planteamiento del problema ¿Tenemos los humanos la capacidad de percibir si nos miran desde atrás? O, más exactamente: ¿Es defendible que existen otras.
Diseño Estadístico y Herramientas para la Calidad
HAWKES LEARNING SYSTEMS math courseware specialists Copyright © 2010 by Hawkes Learning Systems/Quant Systems, Inc. All rights reserved. Capítulo 12 Más.
ANALISIS DE DATOS CATEGORICOS
Pronósticos, Series de Tiempo y Regresión
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Estadística Administrativa II
ESTADISTICA I CSH M. en C. Gal Vargas Neri.
AÑO DE PROMOCIÓN DE LA INDÚSTRIA RESPONZABLE Y COMPROMISO CLIMÁTICO
Inferencias con datos categóricos
Curso de Bioestadística. ANOVA
Normalidad, Variabilidad y estimación del Modelo de Regresión
Capacidad de Proceso.
Clase 4a Significancia Estadística y Prueba Z
Inferencia Estadística
UNIVERSIDAD INCA GARCILASO DE LA VEGA
U de Mann Whitney.
ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS
Pruebas de hipótesis.
PRUEBAS ESTADISTICAS NO PARAMETRICAS
COMPROBACION DE HIPOTESIS SOBRE DOS PROMEDIOS Mario Briones L. MV, MSc 2005.
Pruebas de hipótesis.
“Año de la consolidación económica social del perú” UNIVERSIDAD NACIONAL DE HUANCAVELICA (CREADA POR LEY N° 25265) FACULTAD DE EDUCACIÓN ESCUELA ACADÉMICA.
@ Angel Prieto BenitoMatemáticas 2º Bachillerato CS1 TEMA 15 * CONTRASTES DE HIPÓTESIS MATEMÁTICAS A. CS II.
Análisis de los Datos Cuantitativos
Capitulo 4 Análisis descriptivo inferencial: comparaciones múltiples
Regresión Lineal Simple
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
ESTIMACIÓN DE PARÁMETROS
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
CONTRASTE DE HIPÓTESIS Dimensiones Largo275mm. 169 mm 2 Ancho175mm.49 mm 2 Alto175mm.49 mm 2 Peso16 Kg.1 Kg 2. SITUACIÓN PROBLEMA.
DISEÑOS POR BLOQUES ALEATORIZADOS
UNIDAD I.- Analisis 3.4 Prueba de Hipotesis.
INTRODUCCIÓN AL ANÁLISIS DE DATOS CATEGÓRICOS. Temas Carácterísticas de la distribución Chi-cuadrada Prueba de bondad de ajustes Prueba de homogeneidad.
CAPACITACIÓN, INVESTIGACIÓN, ESTADÍSTICA Y MERCADEO
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
DISTRIBUCIÓN “t” DE STUDENT
RESUMEN DE LA DISTRIBUCION MUESTRAL PARA LA MEDIA MUESTRAL X INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL  TIPO DE PROBLEMA ESPERANZA Y VARIANZA.
PRUEBA DE SIGNIFICANCIA
Tarea # 4 PRUEBAS DE HIPÓTESIS ESTADÍSTICAS. PRUEBA DE HIPÓTESIS Hipótesis es una aseveración de una población elaborado con el propósito de poner a prueba,
Bioestadística Inferencia estadística y tamaño de muestra
PRUEBA CHI-CUADRADO UNIDAD 2: ESTADÍSTICA.
TAMAÑO DE LA MUESTRA Alvaro Alfredo Bravo Dpto. de Matemáticas y Estadística Universidad de Nariño - Colombia.
PRUEBA DE SIGNIFICANCIA
7.2 P ROCEDIMIENTOS PARAMÉTRICOS PARA DATOS CUANTITATIVOS Dos muestras Intervalos de confianza.
ANALISIS DE VARIANZA.
Transcripción de la presentación:

UNIVERSIDAD INCA GARCILASO DE LA VEGA Vicerrectorado Académico Instituto de Capacitación Docente DIPLOMADO INVESTIGACIÓN CIENTÍFICA Y CÁTEDRA UNIVERSITARIA MUESTREO E INSTRUMENTOS DE MEDICIÓN, TABULACIÓN, ANÁLISIS E INTERPRETACIÓN DE RESULTADOS Mag. Renán Quispe Ll. Lima, enero 2005

Sintesis con que se comparan las medias o proporciones de dos muestras probabílasticas independientes Comparación Dos medias Dos proporciones

Dos medias ¿Es cada n> 30? Sí No Se usa Z tomada de la tabla de distribución normal para el nivel de significancia deseado Se usa t tomado de l tabla de distribución t para el nivel de significancia deseado Los valores criticos de son El número de grados de libertad (g.l.) Los valores críticos de son

Dos proporciones Se usa Z tomada de la tabla de distribución normal para el nivel de significancia deseado Los valores críticos de son donde

El Nivel Critico de la prueba estadística (p) El significado de p: Es el valor de la probabilidad de rechazar la hipótesis nula cuando se supone es verdadera obtenida con los resultados de la muestra. Si p > α No hay evidencia para rechazar Ho Si p < α Se rechaza Ho.

Nivel crítico de la prueba Nivel crítico p = P[rechazar H0 con los resultados obtenidos en la muestra observada, bajo el supuesto de que H0 es verdadera] Nivel crítico Indica que la diferencia encontrada Conclusión p > 0.05 Es no significativa y puede deberse No rechazar H0 al azar del muestreo 0.01< p 0.05 Es significativa y probablemente ya Rechazar H0 no se deba al azar del muestreo p  0.01 Es muy significativa y probablemente Rechazar H0 se deba a que hay diferencias en la po- blación

Prueba T para la media de las diferencias (datos apareados) El objetivo en las pruebas de comparaciones apareadas es eliminar un número máximo de fuentes de variación externa, haciendo a las parejas semejantes con respecto a las demás variables inherentes a los elementos de estudio, que podrían hacer variar el resultado esperado al margen del efecto del tratamiento. En lugar de llevar a cabo el análisis con observaciones individuales, se utiliza como variable de interés la diferencia entre pares individuales de observaciones. Hipótesis: H0: d = d0 H1: d  d0 H0: d  d0 H1: d > d0 H0: d  d0 H1: d < d0 Estadística de la prueba

Prueba T para la media de las diferencias (datos apareados) Se realizó un experimento para estudiar la efectividad de cierta dieta, combinada con un programa de ejercicio, en la reducción de los niveles de colesterol en suero en al menos 10 unidades. En el experimento participaron 12 personas. A continuación, se muestra los niveles de colesterol en suero, al principio del programa (Antes) y al final del mismo (Después). N° Persona 1 2 3 4 5 6 7 8 9 10 11 12 Colesterol antes 181 210 201 237 207 216 297 214 218 243 258 190 Colesterol después 175 195 211 194 268 176 187 224 235 182 Diferencia di -4 26 13 21 29 38 31 19 23

Prueba T para la media de las diferencias (datos apareados) H0: d  10 H0: d > 10 La dieta es efectiva para reducir los niveles de colesterol en suero en al menos 10 unidades La dieta no es efectiva para reducir los niveles de colesterol en suero en al menos 10 unidades p=0.0234 t(11) 2.24 La dieta combinada con un programa de ejercicios es efectiva para reducir los niveles de colesterol en suero en al menos 10 unidades (p < 0.05)

T<-t1-/2 o T> t1-/2 PRUEBA DE DOS COLAS =o  o T<-t1-/2 o T> t1-/2 Región de rechazo 0.025 Región de rechazo 0.025 Región de aceptación H0 0.95 Escala de t -1.96 Valor crítico -1.96 Valor crítico Cuando n es mayor a 200

Distribución Ji-Cuadrado La Prueba Ji-Cuadrado Distribución Ji-Cuadrado Supóngase que se tiene una serie de variables aleatorias independientes con distribución normal estándar, , entonces la variable aleatoria , sigue una distribución Ji-Cuadrado. FUNCIÓN DE DENSIDAD MEDIA Y VARIANZA.

Procedimientos para usar el análisis de ji cuadrada y probar la independencia de dos variables nominales Hipótesis nula: Las variables son independientes Se construye o se obtiene una tabla de tabulación cruzada para las frecuencias reales observadas (Oij ) Suponiendo que las variables son independientes, se construye una tabla de tabulación cruzada para las frecuencias teóricas ( Eij) Se determina el nivel de significado deseado en la prueba. Se determina el valor calculado del estadístico ji cuadrada

Tabla 4. Distribución de ji-cuadrado Probabilidad de un valor superior   Probabilidad de un valor superior Grados de libertad 0,1 0,05 0,025 0,01 0,005 1 2,71 3,84 5,02 6,63 7,88 2 4,61 5,99 7,38 9,21 10,60 3 6,25 7,81 9,35 11,34 12,84 4 7,78 9,49 11,14 13,28 14,86 5 9,24 11,07 12,83 15,09 16,75 6 10,64 12,59 14,45 16,81 18,55 7 12,02 14,07 16,01 18,48 20,28 8 13,36 15,51 17,53 20,09 21,95 9 14,68 16,92 19,02 21,67 23,59 10 15,99 18,31 20,48 23,21 25,19 Uso de la tabla El área sombreada de naranja representa la probabilidad que se determinada por , donde: es el valor critico del margen superior de la tabla, y son los grados de libertad del margen izquierdo de la tabla.

Tabla 4. Distribución de ji-cuadrado Probabilidad de un valor superior   Probabilidad de un valor superior Grados de libertad 0,1 0,05 0,025 0,01 0,005 1 2,71 3,84 5,02 6,63 7,88 2 4,61 5,99 7,38 9,21 10,60 3 6,25 7,81 9,35 11,34 12,84 4 7,78 9,49 11,14 13,28 14,86 5 9,24 11,07 12,83 15,09 16,75 6 10,64 12,59 14,45 16,81 18,55 7 12,02 14,07 16,01 18,48 20,28 8 13,36 15,51 17,53 20,09 21,95 9 14,68 16,92 19,02 21,67 23,59 10 15,99 18,31 20,48 23,21 25,19 Uso de la tabla Ji-Cuadrado

EJEMPLO Martha Revilla, directora de mantenimiento de la calidad en MEGA, elige 29 bicicletas y halla una varianza en la distancia entre ejes de 32.7 pulgadas cuadradas. Si la señora Revilla tienen que garantizar que la variación no supere 27 pulgadas cuadradas ¿indica esto que se cumplen las normas de producción? (α=0.05) Hipótesis Prueba de una cola a la derecha

0.05 41.337 33.91 Como X2=33.91<41.337 la señora Revilla no rechazará la H0 y confiará al 95% en que se cumplen las normas de producción

Prueba de una cola a la izquierda ¿Que pasaría, si las instrucciones de la señora Revilla fueran que la variación se mantuviera inferior a 27 pulgadas cuadradas? Prueba de una cola a la izquierda 0.05 16.928 33.91 X2 =33.91, la señora Revilla no rechazará la H0 y confiará al 95% en que se cumplen las normas de producción

La señora Revilla, ahora elabora un intervalo de confianza del 90% para la varianza de la distancia entre ejes. 0.90 0.05 0.05 16.928 41.337 0.95 Revilla puede confiar al 90% en que la varianza de la distancia entre ejes se encuentra entre 22.15 y 54.09 pulgadas cuadradas

Prueba Ji-Cuadrado para comparación de proporciones H0: La proporción de elementos en cada categoría es la misma para todos los grupos (los grupos son homogéneos). Grupo Categ. 1 ...... Categ. s Muestra Grupo 1 O11 O1s n1 ......... ....... ..... Grupo r Or1 Ors nr Total C1 Cs n

Prueba Ji-Cuadrado para comparación de proporciones Estadística

Ejemplo de Prueba Ji-Cuadrado para comparación de proporciones Se supone que se tienen datos experimentales correspondientes a 300 individuos de los que se ha recogido el valor que presentan en dos variables cualitativas Var1 (de 2 niveles: Cat1 / Cat2) y Var2 (de 4 niveles: Grupo 1 / Grupo 2 / Grupo 3 / Grupo 4), para comparar la distribución por grupos entre las categorías. Los datos se presentan en la Tabla: Var1 / Var2 Cat1 Cat2 Total Grupo 1 62 88 150 Grupo 2 46 64 110 Grupo 3 12 20 32 Grupo 4 6 2 8 126 174 300

Frecuencias Esperadas: H0: No hay diferencia, en la distribución por grupos, entre las categorías. H1: Hay diferencia, en la distribución por grupos, entre las categorías. Frecuencias Esperadas: Por ejemplo: Var1 / Var2 Cat1 Cat2 Total Grupo 1 63.0 87.0 150 Grupo 2 46.2 63.8 110 Grupo 3 13.4 18.6 32 Grupo 4 3.4 4.6 8 126 174 300

Estadística

Que sigue una distribución Ji-cuadrado con (n-1)*(C-1)=( 4-1)*(2-1)=3 grados de libertad En conclusión, no se ha encontrado diferencia significativa, en la distribución por grupo, para cada categoría (p  0.05)

Prueba Ji-Cuadrado de Independencia H0: Las variables X e Y son independientes H1: Existe asociación entre X e Y Y X Categ. 1 ...... Categ. s Total Cat. 1 O11 O1s R1 ......... ....... ..... Cat. r Or1 Ors Rr C1 Cs n

Prueba Ji-Cuadrado de Independencia Estadística

Ejemplo de Prueba Ji-Cuadrado de independencia Para verificar la suposición de que la fabricación de cierto producto está asociado con enfermedades respiratorias, a 450 trabajadores de una empresa que fabrica el producto se evaluó respecto a la presencia de síntomas de alteraciones respiratorias y se los clasificó a su vez de acuerdo al nivel de exposición al producto. Los resultados se presentan en la tabla siguiente: Presencia de Síntoma Nivel de Exposición Total Alto Medio Bajo Si 175 43 27 245 No 90 60 55 205 265 103 82 450

Frecuencias Esperadas: H0: Las alteraciones respiratorias son independientes de la exposición al producto. H1: Las alteraciones respiratorias están asociadas a la exposición al producto Frecuencias Esperadas: Por ejemplo: Presencia de Síntoma Nivel de Exposición Total Alto Medio Bajo Si 144.3 56.1 44.6 245 No 120.7 46.9 37.4 205 265 103 82 450

Estadística

Que sigue una distribución Ji-cuadrado con (n-1)*(C-1)=( 2-1)*(3-1)=2 grados de libertad En conclusión, se rechaza la H0 (p < 0.05), es decir las alteraciones respiratorias están asociadas a la exposición al producto

Distribución F de Snedecor Si y son variables Ji-cuadrado distribuidas en forma independiente con y grados de libertad, respectivamente, la variable sigue la distribución F con y grados de libertad.

Tabla F de Fisher α=0.05 con letra normal. α=0.01 con letra negrita

Ejemplo de uso de la tabla F de Fisher

Ejemplo de Aplicación De dos aulas de 5ª año de secundaria se tomaron muestras de tamaños 10 y 15 de las notas promedios de alumnos para probar si la dispersión de las notas es la misma para las dos aulas. Los resultados obtenidos son los siguientes: Aula 1: 15, 16, 12, 14, 14, 15, 16, 13, 14, 15. Aula 2: 12, 14, 15, 16, 16, 17, 15, 16, 18, 14, 12, 15, 16, 14, 13. Deseamos probar las hipótesis:

Luego Si , entonces para las cuantilas y Luego concluimos que la dispersión de las notas entre los alumnos para las dos aulas de 5ª año son las mismas, pues no se encuentra diferencia significativa.

EJEMPLO La compañía llantera Good Year del Perú, ha efectuado un estudio sobre los hábitos de manejo de varios grupos ocupacionales. En una muestra de 35 profesores universitarios, el número promedio de kilómetros recorridos al año fue de 14,500 con una desviación standart de 3,200 km. En una muestra de 40 dentistas, el kilometraje fue de 13,400, con una desviación standart de 1,950 km. Se tiene

Primero se verificará la condición siguiente: 1  2 Planteamos las Hipótesis:

Se rechaza la H0, es decir que 1  2 Para α=0.05 0.025 0.95 0.025 0.515 1.9 2.693 Se rechaza la H0, es decir que 1  2

Y los valores críticos son: -1,220.3 y +1,220.3 Luego, se prueba la hipótesis: Diferencia de las medias muestrales Valores críticos Y los valores críticos son: -1,220.3 y +1,220.3

+1050 = diferencia observada entre las medias muestrales. Se acepta la hipótesis nula Se Rechaza Se Rechaza Área =0.025 Área =0.025 Z= -1.96 Z= +1.96 -1220.3 Valor critico +1220.3 Valor critico +1050 = diferencia observada entre las medias muestrales.

Ejercicio Como la diferencia entre las medias muestrales es de 1050 millas y se acepta un margen de error de 1220 millas, en consecuencia, no hay diferencias significativas entre los dos grupos

EJEMPLO Freddy Lopez, operador de la cadena de restaurantes “Las Tejas””, ha hecho una encuesta entre los clientes en dos ciudades, pues desea averiguar si les gustaría que en el menú se incluyeran sandwiches de jamón y queso. De las 500 personas encuestadas en la capital, 200 contestaron afirmativamente, mientras que 150 de las 300 encuestadas en una ciudad cercana también contestaron afirmativamente. Freddy quiere saber si, en un nivel de 0.05 esos resultados son significativamente diferente. En resumen

Se tiene Primero se determinará si se cumple lo siguiente: 1 ≠ 2 Planteamos las Hipótesis:

Se rechaza la H0, es decir que 1 ≠ 2 Para α=0.05 0.025 0.95 0.025 0.8184 1.228 0.576 Se rechaza la H0, es decir que 1 ≠ 2

Y los valores críticos son: -0.071 y +0.071 Luego, se prueba la hipótesis: Diferencia de las proporciones muestrales Valores críticos Y los valores críticos son: -0.071 y +0.071

Se acepta la hipótesis nula Se rechaza Se rechaza Área =0.025 Área =0.025 Z= -1.96 Z= +1.96 Diferencia observada entre las proporciones muestrales = (0.40-.050) =-0.10 -0.071 Valor critico +0.071 Valor critico

Ejercicio Como la diferencia entre las proporciones muestrales es de -0.10 y se acepta un margen de error de 0.071, en consecuencia, si hay diferencias significativas entre los dos grupos