La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

UNIVERSIDAD INCA GARCILASO DE LA VEGA

Presentaciones similares


Presentación del tema: "UNIVERSIDAD INCA GARCILASO DE LA VEGA"— Transcripción de la presentación:

1 UNIVERSIDAD INCA GARCILASO DE LA VEGA
Vicerrectorado Académico Instituto de Capacitación Docente DIPLOMADO INVESTIGACIÓN CIENTÍFICA Y CÁTEDRA UNIVERSITARIA MUESTREO E INSTRUMENTOS DE MEDICIÓN, TABULACIÓN, ANÁLISIS E INTERPRETACIÓN DE RESULTADOS Mag. Renán Quispe Ll. Lima, enero 2005

2 EJEMPLO Se desea estimar, con 95% de confianza, el tiempo promedio para la fabricación de cierto producto. En un estudio piloto se encontró que S=1.2 horas. El investigador asume una precisión de 0.25 horas. Entonces, se tiene que: Confianza 1-α=  Z=1.96 S=1.2 horas, E=0.25 horas Si se desea mejorar la precisión, asumiendo a E=0.2

3 Deducción del tamaño de la muestra utilizando los errores de muestreo relativo

4 EJEMPLO Resolviendo, tenemos lo siguiente:
Se desea conocer tamaño de la muestra para estimar el porcentaje de hogares pobres en una provincia, si se sabe que la desviación standart de la población es cerca del 20% de la proporción de hogares pobres y se desea estar seguro en un 95% que la proporción muestral se halle dentro del 5% de la proporción poblacional (Z2 = 1.96) Resolviendo, tenemos lo siguiente: Si se escoge el tamaño de la muestra igual a 62, tenemos la seguridad al 95% de confianza que la proporción muestral se halle dentro del 5% de la proporción poblacional

5 EJEMPLO ¿Que pasaría, si la desviación standart de la población aumenta al 40% de la proporción de hogares pobres? El tamaño de la muestra debe ser 246 para tener la seguridad al 95% de confianza que la proporción muestral se halle dentro del 5% de la proporción poblacional ¿Que pasaría, si se desea estar seguro en un 95% que la proporción muestral se halle dentro del 10% de la proporción poblacional ? El tamaño de la muestra debe ser 15 para tener la seguridad al 95% de confianza que la proporción muestral se halle dentro del 5% de la proporción poblacional

6 PRUEBAS DE HIPOTESIS HIPOTESIS Son supuestos o enunciados que pueden o no ser verdaderas, relativas a una o más poblaciones y pueden ser: Contrastar una Hipótesis Estadísticamente Es juzgar si cierta propiedad supuesta para una población es compatible con lo observado en una muestra de ella.

7 PRUEBAS DE HIPOTESIS HIPOTESIS ALTERNATIVAS Pueden ser:
Hipótesis nula : HO, Determina supuestos o conjeturas de la población o poblaciones bajo estudio, con el propósito de rechazar. Hipótesis alternativa : H1, Determina supuestos o conjeturas de la población o poblaciones bajo estudio con el propósito de no rechazarla.

8 Tipos de Hipótesis: Alternativas: Hipótesis A v/s Hipótesis B, donde A y B no pueden cumplirse simultáneamente. Anidadas: Hipótesis A y B, donde A es un caso especial de B.

9  Valor crítico o tabulado
HIPOTESIS A CONTRASTAR Se definen:  Las hipótesis nula y alternativa con una distribución de probabilidad conocida  Regla de decisión(nivel de significación a)  Valor crítico o tabulado datos de la muestra Se calcula una medida asociada a la hipótesis que se desea docimar Se comparan los valores calculado con tabulado ¿se rechaza Ho? H1 SI NO Se extraen conclusiones

10 Utilizar prueba de Z Si ¿Se conoce ? No Si Utilizar prueba de Z Es n ≥ 30? No Utilizar prueba de Z Si Si ¿Se conoce? No ¿Se sabe q la población es normal? Utilizar prueba de t Utilizar prueba de Z (por el teorema central del límite) Si No ¿Se conoce? No Utilizar prueba de Z (por el teorema central del límite) Si Utilizar una prueba no paramétrica Es n ≥ 30?

11 CLASES DE HIPOTESIS Hipótesis simples:
Da valores exactos para todos los parámetros desconocidos de la ley de probabilidad asumida. Hipótesis compuesta: Es la hipótesis que no da valores exactos, sino tiene un conjunto de valores para todos los parámetros desconocidos de la ley de probabilidad asumida. Se refiere a regiones de valores. Prueba de hipótesis: Es un procedimiento basado en la evidencia muestral y en la teoría de probabilidad que se emplea para determinar si la hipótesis es un enunciado razonable y no debe ser rechazada, o si es irrazonable y debe ser rechazada.

12 PROCEDIMIENTO DE CINCO PASOS PARA PROBAR UNA HIPOTESIS
Paso 1: Plantear Hipótesis nula y Alternativa Paso 2: Seleccionar un Nivel de significación Paso 3: Identificar el Valor estadístico de prueba Paso 4: Formular una regla de decisión Paso 5: Tomar una muestra y llegar a una decisión Finalmente: Aceptar H0, o bien rechazar H0 y aceptar H1 Nivel de significación: El riesgo que se asume acerca de rechazar la hipótesis nula cuando en realidad debe aceptarse por ser verdadera.

13 TIPOS DE ERROR Error Tipo I: Se refiere a la probabilidad de rechazar la hipótesis nula, H0, cuando en realidad es verdadera. Se busca minimizar este tipo de error. 1- : Se refiere a la probabilidad de no rechazar la hipótesis nula, H0, cuando en realidad es verdadera. Se busca maximizar este tipo de error. Error tipo II: Se refiere a la probabilidad de aceptar la hipótesis nula, H0 cuando en realidad es falsa. Este tipo de error busca aceptar lo que espero que no se acepte. 1- : Se refiere a la probabilidad de rechazar la hipótesis nula, H0, cuando en realidad es falsa. No se busca maximizarlo por que nunca se va aceptar la H0.

14 Hipótesis Nula El investigador No Rechazar HO Rechaza Si HO es verdadera Decisión Correcta = (1-) Error Tipo I =  NIVEL DE SIGNIFIC. Si HO es falsa Error Tipo II =  Correcta = 1-  POTENCIA

15 Valor estadístico de prueba:
Un valor, determinado a partir de la información muestral, que se utiliza para aceptar o rechazar la hipótesis nula. La regla de decisión Una regla de decisión es simplemente la condiciones bajo las que se acepta o rechaza la hipótesis nula. El área de rechazo define la ubicación de todos los valores que son demasiado grandes o demasiado pequeños, por lo que la probabilidad de que se rechace la hipótesis nula es alta.

16 PRUEBA DE UNA COLA Distribución muestral del valor estadístico z, regiones de aceptación y de rechazo para una prueba de una cola, nivel de significación de 0.05. Región de rechazo Escala de Z 1.645 Probabilidad 0.95 Probabilidad 0.05 Valor Crítico Toma de una decisión: Es la de afirmar que no hay evidencias suficientes para rechazar o no la hipótesis nula.

17 PRUEBAS DE SIGNIFICACION DE UNA COLA Y DOS COLAS
PRUEBA DE UNA COLA Región de rechazo Escala de Z -1.645 Valor crítico Región de aceptación H0

18 Valor critico del estadístico de la prueba
Se acepta la hipótesis nula si el estadístico de la prueba cae dentro de esta región Se rechaza la hipótesis nula Área = nivel deseado de significancia Valor critico del estadístico de la prueba

19 PRUEBAS PARA LA MEDIA DE LA POBLACION
MUESTRA GRANDE Y SE CONOCE LA DESVIACION ESTANDAR DE LA POBLACION Se utiliza la siguiente estadística de prueba:

20 Z<-z1-/2 ó Z> z1-/2
Las pruebas de hipótesis que se desean probar son: H0 H1 Rc =o =1 ( <o) Z<-z1-   1 (>o) Z> z1-  o Z<-z1-/2 ó Z> z1-/2 | Z|< z1- o <o o >o

21 PRUEBA DE DOS COLAS Región de rechazo 0.025 Región de rechazo 0.025
Región de aceptación H0 0.95 Escala de Z -1.96 Valor crítico -1.96 Valor crítico

22 MUESTRA GRANDE Y SE DESCONOCE LA DESVIACION ESTANDAR DE LA POBLACION
Se utiliza la siguiente estadística de prueba:

23 T<-t1-/2 o T> t1-/2
Las pruebas de hipótesis que se desean probar son: H0 H1 Rc =o =1 ( <o) T<-t1- =1 (>o) T> t1- o T<-t1-/2 o T> t1-/2 o <o  o >o

24 PRUEBA DE DOS COLAS Región de rechazo 0.025 Región de rechazo 0.025
Región de aceptación H0 0.95 Escala de t -1.96 Valor crítico -1.96 Valor crítico

25 PRUEBAS DE HIPOTESIS SOBRE LA DIFERENCIA DE MEDIAS
PRUEBA DE DIFERENCIA DE MEDIAS CON 21 = 22 PERO DESCONOCIDAS, EN MUESTRAS PEQUEÑAS Se utiliza la siguiente estadística de prueba: Donde:

26 Las pruebas de hipótesis que se desean probar son:

27 PRUEBA DE DIFERENCIA DE MEDIAS CON 21  22 PERO DESCONOCIDAS, EN MUESTRAS PEQUEÑAS
Si se quiere probar la hipótesis sobre la diferencia de medias, cuando los tamaños de las muestras son pequeños y las poblaciones tienen distribuciones normales, con varianzas diferentes, se utiliza la siguiente estadística de prueba: Que tiene una distribución t con K grados de libertad.

28 Intervalo para la diferencia de medias cuando se conoce la varianza poblacional

29 +1050 = diferencia observada entre las medias muestrales.
Se acepta la hipótesis nula Se Rechaza Se Rechaza Área =.025 Área =.025 Z= -1.96 Z= +1.96 Valor critico Valor critico +1050 = diferencia observada entre las medias muestrales.

30 Ejemplo 3 Se desea medir la diferencia entre dos categorías de empleados en la actividad de seguros. Una está formada por personas con título superior y la otra por personas que sólo tienen estudios secundarios. Tomamos una muestra de 45 empleados entre los primeros y la media de venta resulta ser 32. Tomamos 60 empleados del segundo grupo y la media es 25. Suponga que las ventas de los dos grupos se distribuyen normalmente con varianzas de 48 para los titulados y 56 para los de estudios secundarios. Calcule e interprete un intervalo del 90% de confianza para la verdadera diferencia de las medias. De acuerdo con el intervalo hallado, ¿hay evidencia de que las medias sean iguales?.

31 Solución: Intervalo: (x – y) + z α/2 √ σ 2x/nx + σ 2y /ny ) Reemplazando datos: (32-25) + (1.645) √ 48/ /60 ) [ 4.67, 9.33] b. Interpretación: La verdadera diferencia de medias se halla entre 4.67 y 9.33 con una certeza del 90%. b. Si las dos medias son iguales, la diferencia entre ambas es cero. Por lo tanto, para que la igualdad entre las medias no pueda descartarse el cero debe estar en el intervalo calculado. Como en este caso no sucede, no hay evidencia de la igualdad entre las medias.

32 PRUEBA DE HIPOTESIS PARA UNA PROPORCION
Las pruebas de hipótesis con relación a proporciones son básicamente iguales a las relativas con medias. Para probar la hipótesis de la proporción se usa la siguiente estadística de prueba:

33 Z<-z1-/2 o Z> z1-/2
Las pruebas de hipótesis que se desean probar son: H0 H1 Rc p = p0 p  po p  p p=p1 ( <pO) p=p1 (>po ) p  po p<po p>po Z<-z1- Z> z1- Z<-z1-/2 o Z> z1-/2

34 Intervalo de confianza para una proporción
Intervalo de confianza para la diferencia de 2 proporciones P ∊ ( p + Z α/2 √ pq/n) P1 – P2 ∊ ( (p1 – p2) + Z α/2 √ p1q1/n1 + p2q2/n2 ) Consultoría Virgen del Carmen S.A.

35 Esquema cuando se comprar la diferencia entre dos medias o proporciones muéstrales
Se acepta la hipótesis nula si el estadístico de la prueba cae dentro de esta región. Se rechaza la hipótesis nula Se rechaza la hipótesis nula Area A = área B y (A+B) = el nivel deseado de significancia Area A Area B Valor teórico de la diferencia + Valor critico Valor critico

36 Se acepta la hipótesis nula
Se rechaza Se rechaza Área =.025 Área =.025 Z= -1.96 Z= +1.96 Diferencia observada entre las proporciones muestrales = ( ) =-.10 -.071 Valor critico +.071 Valor critico

37 Ejemplo 4 Una fábrica desea saber la proporción de amas de casa que preferirían una aspiradora de su marca. Se toma al azar una muestra de 100 amas de casa y 20 dicen que les gustaría la máquina. Calcule e interprete un intervalo del 95% de confianza para la verdadera proporción de amas de casa que preferirían dicha aspiradora. Solución: Intervalo: p + Z α/2 √ pq/n Reemplazando datos: [0.2 + √ (0.2)(0.8)/100 ] [0.122, ] Interpretación: Tenemos una certeza del 95% de que la verdadera proporción de amas de casa que preferirían la aspiradora está entre 12.2% y 27.8%. Consultoría Virgen del Carmen S.A.

38 Ejemplo 5 Se está considerando cambiar el procedimiento de manufactura de partes. Se toman muestras del procedimiento actual así como del nuevo para determinar si este último resulta mejor. Si 75 de 1000 artículos del procedimiento actual presentaron defectos y lo mismo sucedió con 80 de 2500 partes del nuevo, determine un intervalo de confianza del 90% para la verdadera diferencia de proporciones de partes defectuosas. Solución: Intervalo: [(p1 – p2) + Z α/2 √ p1q1/n1 + p2q2/n2 ] Reemplazando datos: (0.075 – 0.032) + (1.645) √ (0.075)(0.925)/ (0.032)(0.968)/2500 [ , ] Interpretación: Tenemos una certeza del 90% de que la diferencia de proporciones está entre y Consultoría Virgen del Carmen S.A.

39 Se hizo una encuesta a 212 altos ejecutivos de grandes compañías de un país, para estudiar problemas de comunicación y moral en las grandes compañías de ese país. Uno de los problemas que se estudiaron fue si los altos ejecutivos encontraban útiles las encuestas regulares de opiniones de empleados. Queremos usar los resultados de la encuesta para apoyar la aseveración de que más del 90% de los altos ejecutivos encuentran útiles dichas encuestas. Se encontró ( en la encuesta) que el 93% la encontraban útil. Consultoría Virgen del Carmen S.A.

40 Consultoría Virgen del Carmen S.A.

41 ESTIMACION PUNTUAL La muestra proporciona el estimador. Las muestras repetidas proporciona valores alrededor del parámetro . Parámetro Poblacional Estimador Media:  Varianza: 2 Proporción: P

42 ESTIMACION INTERVALICA
Para una estimación interválica, usamos los datos de la muestra para obtener los límites del intervalo de manera que tengamos una probabilidad (1-) de que el intervalo contiene al parámetro poblacional, así por ejemplo Al considerar la distribución de la media muestral 95 % El 95% de todas las muestras tiene en este intervalo

43 ESTIMACION INTERVALICA
Luego para el 95% de las muestras el intervalo obtenido con límites incluirá entre sus valores el valor de la media poblacional

44 Intervalo de confianza para la media poblacional 
A)    Si la varianza poblacional (2) es conocida Para todo tamaño de muestra de población normal o Para muestra grande (n  30) de cualquier población donde Z1- es la cuantila 1- de la normal estándar

45 Intervalo de confianza para la media poblacional 
B) Si la varianza poblacional (2) es desconocida, para muestra grande (n  30)

46 Intervalo de confianza para la media poblacional 
En un experimento diseñado para estimar el número promedio de latidos por minuto del corazón para cierta población, se encontró que el número promedio de latidos por minuto de 49 personas fue de 90 con una desviación estándar de 10. Obtenga un intervalo de 90% de confianza para estimar el número promedio de latidos por minuto.

47 Intervalo de confianza para la media poblacional 
C) Si la varianza poblacional (2) es desconocida, para muestra pequeña de población normal Donde t1- es la cuantila 1- de la distribución t-Student con n-1 grados de libertad (g.l.)

48 Distribución t-Student
Para muestras pequeñas de población normal t1- t(v)  Si v = 15 y  = 0.10, entonces t1-  = t0.95 = 1.753

49 Intervalo de confianza para la diferencia de medias
a) Si las varianzas 12 y 22 son conocidas Para muestras grandes donde

50 Intervalo de confianza para la diferencia de medias
b) Si las varianzas 12 y 22 son desconocidas Para muestras grandes donde

51 Intervalo de confianza para la diferencia de medias
c) Si las varianzas son desconocidas, pero semejantes (12 = 22), entonces para muestras pequeñas de poblaciones normales donde t1- es la cuantila 1- de la distribución t-Student con (n1 + n2 – 2) grados de libertad

52 Ejemplo 1 Los siguientes datos corresponden a los pesos (en kgs) de 15 hombres escogidos al azar y que trabajan en una empresa: , 68, 63, 75, 84, 91, 66, 75, 86, 90, 62, 87, 77, 70, 69. Estime el peso promedio y la desviación estándar. Luego estime el error del peso promedio. Solución: Sea X = peso promedio de los hombres en kgs. x = Σ xi / n = ( )/ 15 = 75.67 S =√ Σ (xi – x)2 / (n-1) = √ [ ( ) ( )2] /(15-1) = 9.77 Sx = error del peso promedio. Sx = S/ √n = 9.77/ √ 15 = 2.52

53 Ejemplo 2 Entre los miembros de una comunidad se escogieron 150 personas al azar y se les preguntó si estaban de acuerdo con los programas que el gobierno estaba desarrollando para prevenir el consumo de drogas. La encuesta dio como resultado que 130 sí estaban de acuerdo. Estime la proporción de los que estaban de acuerdo y el error estándar. Solución: p = (individuos que tienen la característica)/ total p = 130/150 = 0.87. S p = √ p(1-p)/n = √ (0.87)(0.13)/ 150 =

54 Ejemplo 3 Solución: x = Σ xi / n = (24+35+16+30+28)/5 = 26.6
De las 50 aulas que tiene un edificio de la facultad de matemáticas de una Universidad, se escogieron al azar 5 y se determinó el número de alumnos que había en cada una de ellas en la primera hora de clases. Estime el número de alumnos que hay en el edificio si todas las aulas se encuentran ocupadas a esa hora y si el número de alumnos en cada una de las aulas inspeccionadas fue: 24, 35, 16, 30, 28.Luego estime el error del número total de estudiantes. Solución: x = promedio de alumnos en las 5 aulas inspeccionadas. x = Σ xi / n = ( )/5 = 26.6 T = total de alumnos estimados en las 50 aulas. N = número total de aulas = 50. T = Nx = 50x26.6 = 1330 alumnos. S = =√ Σ (xi – x)2 / (n-1) = √ ( ) ( )2/(5-1) = 7.13 SNx = NS / √ n = (50)(7.13)/ √5 =

55


Descargar ppt "UNIVERSIDAD INCA GARCILASO DE LA VEGA"

Presentaciones similares


Anuncios Google