Descargar la presentación
La descarga está en progreso. Por favor, espere
1
ESTADISTICA II 2do. Corte
2
Estimación de la varianza poblacional
la distribución chi cuadrada, se utiliza para calcular un estimado de un intervalo de confianza de σ o de σ 2. Requisitos 1. La muestra es aleatoria simple. 2. La población debe tener valores distribuidos normalmente (aun si la muestra es grande), este requisito es mucho más importante ya que los alejamientos de una distribución normal pueden generar errores muy graves. Cuando se consideran estimados de proporciones y medias, se utilizan las distribuciones normal y t de Student. Cuando se desarrollan estimados de varianzas o desviaciones estándar se utiliza otra distribución, conocida como la distribución chi cuadrada.
3
Distribución chi cuadrada
En una población distribuida normalmente con varianza σ 2, suponga que se selecciona al azar muestras independientes de tamaño n y, para cada muestra, se calcula la varianza muestral s2 (que es el cuadrado de la desviación estándar muestral s). El estadístico muestral x2 =(n -1)s2/ σ 2 tiene una distribución llamada distribución chi cuadrada (X 2 )
4
Distribución chi cuadrada
Para calcular valores críticos de la distribución chi cuadrada, remítase a la tabla A-4. La distribución chi cuadrada se determina por el número de grados de libertad y en este tipo de cálculos se usara n -1 grados de libertad. grados de libertad = n -1
5
Distribución chi cuadrada
Propiedades de la distribución del estadístico chi cuadrada La distribución chi cuadrada no es simétrica, a diferencia de las distribuciones normal y t de Student (véase la figura A). (Conforme el número de grados del ibertad se incrementa, la distribución se vuelve más simétrica, como ilustra la figura B). 2. Los valores de chi cuadrada pueden ser cero o positivos, pero no pueden ser negativos (véase la figura A). Figura B. Distribución chi cuadrada para gl =10 y gl=20 Figura A. Distribución chi cuadrada
6
Distribución chi cuadrada
Propiedades de la distribución del estadístico chi cuadrada 3. La distribución chi cuadrada es diferente para cada número de grados de libertad (figura B), y el número de grados de libertad está dado por gl =n -1. Conforme el número de grados de libertad se incrementa, la distribución chi cuadrada se aproxima a una distribución normal. Puesto que la distribución chi cuadrada es sesgada y no simétrica, se debe hacer cálculos separados para los límites de confianza superior e inferior. Si se utiliza la tabla A-4 para calcular valores críticos, observe su siguiente característica: En la tabla A-4 cada valor crítico de X2 corresponde a una área que se encuentra en el renglón superior de la tabla, y esa área representa la región acumulativa localizada a la derecha del valor crítico.
7
Distribución chi cuadrada
8
x2D = x2α/2 x2I = x21-α/2 Distribución chi cuadrada
Figura C. Valores críticos de la distribución chi cuadrada
9
Distribución chi cuadrada
SOLUCIÓN Vea la figura C y remítase a la tabla A-4. El valor crítico a la derecha (x 2 =19.023) se obtiene de manera directa localizando 9 en la columna de grados de libertad a la izquierda y a lo largo de la parte superior. El valor crítico de x 2 = a la izquierda otra vez corresponde a 9 en la columna de grados de libertad, pero se debe localizar (que se calcula al restar 1 menos 0.025) a lo largo de la parte superior, puesto que los valores en el renglón superior son siempre áreas a la derecha del valor crítico.
10
Distribución chi cuadrada
Estimadores de σ 2 Las varianzas muestrales s2 tienden a coincidir con (o centrarse en) el valor de la varianza poblacional σ 2, por lo que decimos que s2 es un estimador sin sesgo de σ 2. Además, los valores de s2 tienden a producir errores más pequeños por estar más cercanos a σ 2 que otras medidas de variación sin sesgo. Por estas razones, generalmente se utiliza s2 para estimar σ 2. La varianza muestral s2 es el mejor estimado puntual de la varianza poblacional σ 2.
11
Distribución chi cuadrada
Puesto que s2 es un estimador sin sesgo de σ 2, esperaríamos que s fuera un estimador sin sesgo de σ , pero no es así. Sin embargo, si el tamaño muestral es grande, el sesgo es tan pequeño que podemos utilizar s como un estimado de σ razonablemente bueno. Aunque s es un estimado sesgado, se usa con frecuencia como un estimado puntual de σ . La desviación estándar muestral s suele utilizarse como un estimado puntual de σ (aunque es un estimado sesgado).
12
Distribución chi cuadrada
x2D = x2α/2 x2I = x21-α/2
13
Distribución chi cuadrada
14
Distribución chi cuadrada
16
Distribución chi cuadrada
INTERPRETACIÓN Con base en este resultado, tenemos una confianza del 95% de que los límites de g y g contienen el valor real de s. Observe que este intervalo incluye la desviación estándar de g para los pesos de las monedas que se fabrican actualmente. No parece que el nuevo equipo reduzca significativamente la variación. Aun cuando la desviación estándar de la muestra ( g) es menor que la desviación estándar actual de g, no es lo suficientemente baja para ser significativa. Con base en los datos disponibles, parece que el equipo nuevo no es efectivo.
17
Unidad II Prueba de hipótesis
18
Prueba de hipótesis
19
Prueba de hipótesis Definición
En estadística, una hipótesis es una aseveración o afirmación acerca de una propiedad de una población. Una prueba de hipótesis (o prueba de significancia) es un procedimiento estándar para probar una aseveración acerca de una propiedad de una población. Regla del suceso infrecuente para la estadística inferencial Si, bajo un supuesto dado, la probabilidad de un suceso observado particular es excepcionalmente pequeña, concluimos que el supuesto probablemente es incorrecto.
20
EJEMPLO Selección del género ProCare Industries, Ltd., alguna vez
ofreció un producto llamado “Gender Choice”, el cual, según aseveraciones publicitarias, permitía a las parejas “incrementar hasta en un 80% sus posibilidades de tener una niña”. Suponga que se realiza un experimento con 100 parejas que desean tener niñas, y que las 100 parejas siguen el “sistema casero fácil de usar” de Gender Choice, descrito en el paquete rosa diseñado para concebir niñas. Suponiendo que Gender Choice no tiene efecto alguno, y basados en el sentido común, sin un método estadístico formal, ¿qué debemos concluir acerca del supuesto de que Gender Choice no tiene efecto alguno, si 100 parejas lo utilizaron y tuvieron 100 bebés, de los cuales a. 52 fueron niñas? b. 97 fueron niñas?
21
Prueba de hipótesis SOLUCIÓN
a. Generalmente esperamos que nazcan alrededor de 50 niñas por cada 100 nacimientos. El resultado de 52 niñas es cercano a 50, por lo que no debemos concluir que el producto Gender Choice es eficaz. El resultado de 52 niñas podría ocurrir fácilmente por azar, de manera que no existe evidencia suficiente para afirmar que Gender Choice sea eficaz. b. Es extremadamente improbable que el resultado de 97 niñas en 100 nacimientos suceda por azar. Nosotros podríamos explicar el nacimiento de 97 niñas de dos maneras: o se trata de un evento extremadamente infrecuente que ha ocurrido por azar, o Gender Choice es eficaz. La probabilidad extremadamente baja de que resulten 97 niñas sugiere que Gender Choice es eficaz. El aspecto central del ejemplo anterior es que debemos concluir que el producto es eficaz sólo si obtenemos significativamente más niñas de las que esperaríamos normalmente. Aun cuando los resultados de 52 niñas y 97 niñas están “por arriba del promedio”, el resultado de 52 niñas no es significativo, mientras que el de 97 niñas es un resultado significativo.
22
Prueba de hipótesis
23
Prueba de hipótesis
24
Prueba de hipótesis Formulación de sus propias aseveraciones (hipótesis): Si usted está realizando un estudio y desea emplear una prueba de hipótesis para sustentar su aseveración, ésta debe redactarse de tal manera que se convierta en la hipótesis alternativa. Esto quiere decir que su aseveración debe expresarse utilizando sólo estos símbolos: <, >, o bien, . No puede utilizar una prueba de hipótesis para sustentar la aseveración de que algún parámetro es igual a algún valor especificado. Por ejemplo, si usted ha creado un método de selección del género, que aumenta la probabilidad de concebir una niña, redacte su aseveración como p > 0.5, para que ésta pueda ser sustentada. (En el contexto de tratar de sustentar la meta de la investigación, la hipótesis alternativa en ocasiones se conoce como la hipótesis de investigación). Para el propósito de la prueba, usted supondrá que p = 0.5, pero usted esperará que p=0.5 sea rechazada para que p > 0.5 se sustente.
25
Prueba de hipótesis Figura C. Identificación de H0 y H1
26
Prueba de hipótesis EJEMPLO Identificación de las hipótesis nula y alternativa. Remítase a la figura C y utilice las aseveraciones para expresar las hipótesis nula y alternativa de forma simbólica. a. La proporción de empleados que consiguen trabajo por medio de una red de contactos es mayor que 0.5. b. El peso medio de los pasajeros de avión, con su equipaje de mano, es a lo sumo de 195 libras (la cifra que la Federal Aviation Administration difunde actualmente). c. La desviación estándar de las puntuaciones de CI de actores es igual a 15.
27
Prueba de hipótesis SOLUCIÓN Véase la figura C, que muestra el procedimiento de los tres pasos. a. En el paso 1 de la figura, expresamos la aseveración dada como p> 0.5 En el paso 2 observamos que si p> 0.5 es falso, entonces p debe ser verdadero. En el paso 3 vemos que la expresión p > 0.5 no contiene igualdad, por lo que permitimos que la hipótesis alternativa H1 sea p > 0.5, y dejamos que H0 sea p = 0.5.
28
Prueba de hipótesis
29
Prueba de hipótesis
30
Prueba de hipótesis
31
Prueba de hipótesis Región crítica, nivel de significancia, valor crítico y valor P La región crítica (o región de rechazo) es el conjunto de todos los valores del estadístico de prueba que pueden provocar que rechacemos la hipótesis nula. Por ejemplo, observe la región sombreada más oscura en la figura D Figura D. Región crítica, valor crítico y estadístico de prueba
32
Prueba de hipótesis El nivel de significancia (denotado por a) es la probabilidad de que el estadístico de prueba caiga en la región crítica, cuando la hipótesis nula es verdadera. Si el estadístico de prueba cae en la región crítica, rechazamos la hipótesis nula, de manera que α es la probabilidad de cometer el error de rechazar la hipótesis nula cuando es verdadera. Se trata de la misma α donde definimos el nivel de confianza para un intervalo de confianza como la probabilidad 1 - α . Las opciones comunes para a son 0.05, 0.01 y 0.10, aunque la más común es 0.05. Un valor crítico es cualquier valor que separa la región crítica (donde rechazamos la hipótesis nula) de los valores del estadístico de prueba que no conducen al rechazo de la hipótesis nula. Los valores críticos dependen de la naturaleza de la hipótesis nula, de la distribución muestral que se aplique y del nivel de significancia a. Observe la figura D, donde el valor crítico de z = corresponde a un nivel de significancia de α=
33
Prueba de hipótesis EJEMPLO Cálculo de valores críticos Con un nivel de significancia de α = 0.05, calcule los valores z críticos para cada una de las siguientes hipótesis alternativas (suponiendo que la distribución normal puede emplearse como aproximación de la distribución binomial): a. p ,5 (de manera que la región crítica está en ambas colas de la distribución normal) b. p < 0.5 (de manera que la región crítica está en la cola izquierda de la distribución normal) c. p > 0.5 (de manera que la región crítica está en la cola derecha de la distribución normal SOLUCIÓN Observe la figura a). Las colas sombreadas contienen una área total de α = 0.05, por lo que cada cola contiene una área de Usando la tabla se obtiene los valores de z=1.96 y z=-1.96 separan las regiones de la cola izquierda y la cola derecha. Por lo tanto, los valores críticos son z=1.96 y z=-1.96. b. Observe la figura b). Con una hipótesis alternativa de p<0.5, la región crítica se encuentra en la cola izquierda. Con una área de cola izquierda de 0.05, se obtiene que el valor crítico es z=-1.645 c. Observe la figura c). Con una hipótesis alternativa de p > 0.5, la región crítica está en la cola derecha. Con una área de cola derecha de 0.05, se obtiene que el valor crítico es z=
34
Decisiones y conclusiones
El procedimiento convencional de prueba de hipótesis requiere que siempre se pruebe la hipótesis nula, de manera que la conclusión inicial siempre será una de las siguientes: 1. Rechazo de la hipótesis nula. 2. No rechazo de la hipótesis nula. Criterio de decisión La decisión de rechazar o no rechazar la hipótesis nula suele realizarse por medio del método tradicional (o método clásico) de prueba de hipótesis, el método del valor P, o bien, la decisión puede basarse en intervalos de confianza.
35
Prueba de hipótesis Errores tipo I y tipo II
Cuando se prueba una hipótesis nula, se llega a la conclusión de rechazarla o no rechazarla. Tales conclusiones pueden ser correctas o incorrectas (incluso cuando hacemos todo correctamente). La tabla 8-1 resume los dos distintos tipos de errores que pueden cometerse, junto con los dos tipos de decisiones correctas. Distinguimos entre los dos tipos de errores denominándolos errores tipo I y tipo II. Error tipo I: El error de rechazar la hipótesis nula cuando en realidad es verdadera. Se utiliza el símbolo α(alfa) para representar la probabilidad de un error tipo I. Error tipo II: El error de no rechazar la hipótesis nula cuando en realidad es falsa. Se utiliza el símbolo ß(beta) para representar la probabilidad de un error tipo II.
36
Prueba de hipótesis
37
SOLUCIÓN:
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.