ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

ANOVA DE UN FACTOR.
MSP César Eduardo Luna Gurrola
ANALISIS PARAMÉTRICOS
REGRESION LINEAL SIMPLE
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Pronósticos, Series de Tiempo y Regresión
Ingeniería Industrial II CicloEducativo 2011
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Regresión y correlación
بسم الله الرحمن الرحيم.
COEFICIENTE DE CORRELACIÓN PRODUCTO-MOMENTO DE PEARSON
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Regresión Lineal Simple
Curso de Estadística Básica
9 Regresión Lineal Simple
MEDIDAS DE DISPERSIÓN:
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
Facultad: Turismo Y Hotelería
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Clases 4 Pruebas de Hipótesis
REGRESION Y CORRELACION
Prueba para la Bondad de ajuste Validación de Modelo
Diseño Estadístico y Herramientas para la Calidad
ANALISIS DE DATOS CATEGORICOS
UNIVERSIDAD INCA GARCILASO DE LA VEGA
Pronósticos, Series de Tiempo y Regresión
Pronósticos, Series de Tiempo y Regresión
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
ESTADISTICA TEMA 12.
Unidad V: Estimación de
ESTADISTICA TEMA y 223.
Gerenciamiento Técnico de Proyectos
Métodos de calibración: regresión y correlación
Titular: Agustín Salvia
CORRELACION Y REGRESION LINEAL: Introducción
Clase 4a Significancia Estadística y Prueba Z
Inferencia Estadística
Herramientas básicas.
RELACIÓN ENTRE VARIABLES
Pruebas de hipótesis.
coeficientes de correlación de
COMPROBACION DE HIPOTESIS SOBRE DOS PROMEDIOS Mario Briones L. MV, MSc 2005.
Análisis de los Datos Cuantitativos
Regresión Lineal Simple
Aplicaciones Estadísticas a las Finanzas Clase 1
ESTIMACIÓN DE PARÁMETROS
Variables estadísticas bidimensionales
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Construcción de modelos con regresión y correlación
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
Distribuciones de Probabilidad
Regresión lineal simple Nazira Calleja
Unidad 4 Análisis de los Datos.
INFERENCIA ESTADÍSTICA
REGRESIÓN LINEAL SIMPLE
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
CAPACITACIÓN, INVESTIGACIÓN, ESTADÍSTICA Y MERCADEO
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
Estadística Inferencial
Tarea # 4 PRUEBAS DE HIPÓTESIS ESTADÍSTICAS. PRUEBA DE HIPÓTESIS Hipótesis es una aseveración de una población elaborado con el propósito de poner a prueba,
Bioestadística Inferencia estadística y tamaño de muestra
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
PRUEBA DE SIGNIFICANCIA
ANALISIS DE VARIANZA.
Transcripción de la presentación:

ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS

TIPOS DE ANALISIS ESTADISTICOS Anàlisis Paramétricos Anàlisis No paramètricos Cada uno posee caracteristicas que le son propias. Sin embargo puede darse el caso de que se empleen ambos en una misma investigacion, ( hipotesis y variables en uno y en otro caso).

CARACTERISTICAS DEL ANALISIS PARAMETRICO LA DISTRIBUCION POBLACIONAL DE LA VARIABLE DEPENDIENTE ES NORMAL. (DISTRIBUCION NORMAL) EL NIVEL DE MEDICION DE LA VARIABLE DEPENDIENTE ES POR INTERVALO ( Ademas de orden o jerarquia entre categorias se establecen intervalos iguales entre medicion) o DE RAZON (Ademas de lo anterior se incorpora al cero real.) CUANDO DOS O MAS POBLACIONES SON ESTUDIADAS ESTAS TIENEN UNA VARIANZA HOMOGENEA 10 1 2 3 - - - - - - - - - - - - - - - - 4 5

PRUEBAS PARAMETRICAS MAS UTILIZADAS - Coeficiente de Correlacion de Pearson. - La Regresión Lineal. - La prueba de contraste de la diferencia de proporciones. - Análisis de Varianza unidireccional.(ANOVA) - Análisis de Varianza factorial. - Análisis de Covarianza (ANCOVA)

COEFICIENTE DE CORRELACION DE PEARSON ES UNA PRUEBA ESTADISTICA PARA ANALIZAR LA RELACION ENTRE DOS VARIABLES MEDIDAS EN UN NIVEL POR INTERVALO O POR RAZON. SE SIMBOLIZA POR “ r ”

El coeficiente de correlación Es la raíz cuadrada del coeficiente de determinación. Sus valores oscilan entre -1 y 1 Cuando r es positivo, indica que X e Y están directamente relacionados. r2

El coeficiente de correlación Cuando r es negativo, indica que X e Y están inversamente relacionados. El coeficiente r tiene el mismo signo que el coeficiente b1 en la ecuación de regresión

Interpretación del coeficiente de correlación de Pearson Fuerte Negativa Moderada Negativa Débil Negativa Débil Positiva Moderada Positiva Fuerte Positiva -1 -0,9 -0,5 0,5 0,9 1 Perfecta Negativa Perfecta Positiva No existe correlación

r2= 0,707 Ejemplo: r = 0,84 el signo es positivo ya que X e Y están relacionados directamente como lo indica el signo del coeficiente b1 en la ecuación de regresión

Interpretación: El incremento de peso (Y) y el consumo del complemento nutricional (X) se encuentran directamente asociados.

COEFICIENTE DE CORRELACION DE PEARSON LAS HIPOTESIS A COMPROBAR SON DEL TIPO : “A mayor X, mayor Y” o “ A menor X menor Y”. “Altos valores en X están asociados con altos valores en Y. “ Altos valores en X se asocian con bajos valores de Y”

VARIABLES INVOLUCRADAS DOS son las variables involucradas. No interesa el hecho de ser independiente o dependiente. No mide causalidad. El “ r ” se calcula a partir de las puntuaciones obtenidas en una muestra con dos variables. Los puntajes obtenidos se relacionan entre si.

NIVEL DE MEDICION DE VARIABLES INTERVALO O DE RAZON

INTERPRETACION El coeficiente de Pearson “r” puede variar entre +1.00 y -1.00 -1.00 =Correlacion negativa perfecta + 1.00 = Correlacion positiva perfecta En ambos casos y de manera proporcional cada vez que X aumenta una unidad, Y disminuye siempre una cantidad constante. También se aplica a “ a menor X, mayor Y”

EVALUACIONES POR OBSERVACION - 0.90 = Correlacion negativa muy fuerte. - 0.75 = Correlacion negativa considerable. - 0.50 = Correlacion negativa media. - 0.10 = Correlacion negativa débil. 0.00 = NO EXISTE CORRELACION. + 0.10 = Correlacion positiva débil. + 0.50 = Correlacion positiva media. + 0.75 = Correlacion positiva considerable. + 0.90 = Correlacion positiva fuerte. + 1.00 = Correlacion positiva perfecta

CONSIDERACIONES El signo ( +.- )indica la dirección de la correlacion. El valor numérico indica la magnitud de la correlacion. El programa SPSS reporta para el caso : s = 0.001 ……………. Significancia 0.7831 ………………. Valor del Coef. Si “s” es menor que 0.05 se dice que el Coef. es significativo al nivel del 0.05 ( 95% de la correlacion es verdadera con un 5% de probabilidad de error).

CONSIDERACIONES Si “s” es menor que 0.01 se dice que el Coef. es significativo al nivel del 0.01 ( 99% de que la correlacion sea verdadera y 1% de probabilidad de error). Cuando “r” se eleva al cuadrado el resultado indica la varianza de factores comunes, y lo explica en porcentaje.

EJEMPLO 1: Entre la “productividad” y la “asistencia” como variables existe una correlacion de 0.80. Al elevar al cuadrado 0.80 se tiene “r²”= 0.64 Lo que permite interpretar que la productividad contribuye o explica el 64% de la variación de la otra variable “asistencia”.

Esto significa que el coeficiente es significativo al nivel del =.05. EJEMPLO 2: En otros artículos o revistas aparecen informaciones de la siguiente manera: 0.48* p < 0.05 Esto significa que el coeficiente es significativo al nivel del =.05. La probabilidad, de error es menor del 5%. Ahora bien si p < 0.1 el coeficiente es significativo a nivel de 0.01

EJEMPLO 3: En textos especializados y algunas Tesis aparecen informaciones de la siguiente manera: La variable Z tiene un error del orden del 1% con una significancia del orden del. 99% La variable X tiene un error del orden del 5% y una significancia del orden del 95% X Y .11 Z .62** .47* p < 0.05 ** p < 0.01 Siendo Y,Z y X variables.

Hi: “ a mayor motivación intrínseca mayor EJEMPLO 4 Hi: “ a mayor motivación intrínseca mayor puntualidad” Resultados: “r” = .721 s = .0001 Interpretacion: Se acepta la hipótesis a nivel de 0.01 . La correlacion entre la Motivación y la Puntualidad es considerable.

EL DIAGRAMA DE DISPERSIÓN Es un gráfico que permite detectar la existencia de una relación entre dos variables. Visualmente se puede buscar patrones que indiquen el tipo de relación que se da entre las variables.

Relaciones posibles entre X y Y vistos en diagramas de dispersión (a) Lineal directa (b) Lineal inversa (c) Curvilínea directa (d) Curvilinea inversa (e) Lineal inversa con más dispersión (d) Ninguna relación Y X Relaciones posibles entre X y Y vistos en diagramas de dispersión

Presente la información en un diagrama de dispersión Aplicación Los datos siguientes muestran las cantidades consumidas de complemento nutricional (en Kg.) y el aumento de peso de niños con signos de desnutrición. PACIENTE 1 2 3 4 5 6 7 8 9 10 COMPLEMENTO 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 EN Kg: X AUMENTO DE 12 14 13 15 17 PESO : Y Presente la información en un diagrama de dispersión

Procedimiento 1er Paso: Reúna pares de datos (X,Y), cuya relación desea estudiar y organice la información en una tabla. PACIENTE 1 2 3 4 5 6 7 8 9 10 COMPLEMENTO 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 EN Kg.: X AUMENTO DE 12 14 13 15 17 PESO : Y

2do Paso: Encuentre los valores mínimos y máximos para X e Y 2do Paso: Encuentre los valores mínimos y máximos para X e Y. Elija las escalas que se usarán en los ejes horizontal y vertical, de manera que ambas longitudes sean aproximadamente iguales, facilitando la lectura del diagrama.

3er Paso: Registre los datos en el gráfico 3er Paso: Registre los datos en el gráfico. Cuando se obtengan los mismos valores en diferentes observaciones, muestre estos puntos haciendo círculos concéntricos (o), o registre el segundo punto muy cerca del primero.

4to Paso: Agregue toda la información que puede ser de utilidad para entender el diagrama, tal como: título del diagrama, período de tiempo, número de pares de datos, nombre de la variable y unidades de cada eje, entre otros.

LAS ECUACIONES LINEALES SIMPLES Si dos variables, como X e Y, están relacionadas, se puede expresar como una relación, por ejemplo: Y = 3 + 1,5X Al conocer la ecuación se puede: a) Calcular el valor de Y para cualquier valor dado de X b) Conocer el cambio en Y, cuando X varía en 1

Por ejemplo: Y = 3 + 1,5X

El aumento en Y, cuando X varía en una unidad, está dado por el coeficiente de X. Ejemplo: En Y = 10 + 2X cuando X aumenta en 1, Y aumenta en 2 En Y = 5 - 0,8X cuando X aumenta en 1, Y disminuye en 0,8

A) Tipos de Variables En una ecuación como Y = 30 + 3X, el valor de Y depende del valor que toma X, por eso a Y se le llama variable dependiente, y a X se le llama variable independiente. Y = b0 + b1 X Variable Dependiente Variable Independiente

B) Tipo de Relaciones Ejemplo: Y = 30 + 5X Cuando cambios en X provoca cambios en Y en igual sentido (aumentos o disminuciones), las variables están directamente relacionadas. Se observa el signo + Ejemplo: Y = 30 + 5X X o Y

Cuando cambios en X, provoca variaciones en Y en sentido inverso (X aumenta, Y disminuye o viceversa), las variables están inversamente relacionadas. Se observa en la ecuación el signo -. Y Ejemplo: Y = 20 - 3X o X

C) Grado de la ecuación: La ecuación es de primer grado si la variable independiente está elevada al exponente 1. Su gráfica genera una línea recta (por lo que también se le llama ecuación lineal) Ejemplo: Y = 30 + 4 X

Si la variable independiente está elevada a un exponente diferente a 1, la ecuación toma el valor del exponente. Su gráfica no es una línea recta. Ejemplo: Y = 10 + 3 X + 4 X2 : ecuación de segundo grado Y = 3 + 7X + 5 X3 : ecuación de tercer grado

D) Ecuaciones simples y múltiples: Simples: Muestra la relación entre dos variables Y = 30 + 2X Y = 10 - 3X2 Múltiple: Muestra la relación entre tres o más variables Y = 3X + 8 Z Y = 5 + 2X2 + 4W

. D) Gráfica de una ecuación de primer grado: Ejemplo: Y = 3 + 1,5X Los cinco pares de valores se diagraman de la forma siguiente. 12 11 10 9 8 7 6 5 4 3 2 1 1 2 3 4 5 Y . X (1,4.5) (4,9) (3,7.5) (2,6) (5,10.5)

E) Forma general: La ecuación simple de primer grado tiene la siguiente forma general Y = b0 + b1 X Donde: b1: pendiente, o sea, el cambio en Y cuando X = 1. b0: el valor autónomo, es decir, Y = b0 cuando X = 0. En la gráfica es la intersección con el eje Y Ejemplo: Y = 3 + 1.5X . b0 = 3 Y X

REGRESIÓN LINEAL SIMPLE Es una técnica estadística que permite determinar la mejor ecuación que represente la relación entre dos variables relacionadas. Para poder establecer la relación cuantitativa entre X e Y es necesario disponer de pares de observaciones. Cada par ha sido registrado a la misma unidad elemental.

A) Suposiciones de regresión y correlación a) Normalidad: los valores de Y estarán distribuidos normalmente a cada valor de X. b) Homoscedasticidad: la variación alrededor de la línea de regresión sea constante para todos los valores de X. c) Independencia de error: el error (diferencia residual entre un valor observado y uno estimado de Y) sea independientemente de cada valor de X. d) Linealidad: la relación entre las variables es lineal.

B) El método de Mínimos Cuadrados Es el procedimiento matemático utilizado para determinar los valores numéricos de los coeficientes de regresión: b0 y b1 La ecuación general = b0 + b1X se llama ecuación de regresión y permite estimar o predecir los valores de Y.

El método consiste en determinar una ecuación que la suma de los errores al cuadrado sea mínima. X Y Error= 2 2 4 6 8 10 12 14 10 8 6 4 2 Error= -6 Línea de estimación .

El método utiliza un sistema de ecuación llamado ecuaciones normales, que tienen la siguiente forma: X Y X2 XY 1.0 8.0 1.5 10.0 2.3 15.0 2.0 9.0 4.0 18.0 2.5 12.0 6.3 30.0 3.0 14.0 42.0 3.5 13.0 12.3 45.5 16.0 60.0 4.5 17.0 20.3 76.5 5.0 25.0 70.0 5.5 30.3 77.0 32.5 126.0 126.3 442.0   Para aplicar las fórmulas, tenemos que confeccionar un cuadro como el siguiente:

Sustituyendo los valores , n = 5, y ,en las ecuaciones normales, obtenemos el siguiente sistema de ecuaciones. 126 = 10b0 + 32,5b1 442 = 32,5b0 + 126,3b1 Resolviendo el sistema tenemos: b0 = 7,479 b1= 1,576 ,por lo tanto,

c) Interpretación b0 = 7,478 : Es probable que un paciente desnutrido que no sea considerado dentro del Programa de Alimentación Complementaria tenga un peso de 7,478 Kg. b1 = 1,576:Por cada Kg. del alimento complementario, se espera que probablemente el niño aumento su peso en 1,576 Kg.

. D) Valor observado y valor estimado de Y El valor observado (Yi) se refiere al nivel efectivo u observado de la variable Y (peso del niño), mientras que el valor estimado ( ), es el nivel estimado de la variable (peso esperado), obtenido utilizando la ecuación de regresión. X Y   1.0 8.0 9.055 1.5 10.0 9.843 2.0 9.0 10.630 2.5 12.0 11.418 3.0 14.0 12.206 3.5 13.0 12.994 4.0 15.0 13.782 4.5 17.0 14.570 5.0 15.358 5.5 16.146 X Y Valor estimado observado . xo

Síntesis con que se comparan las medias o proporciones de dos muestras probabilísticas independientes Comparación Dos medias Dos proporciones

Dos medias ¿Es cada n> 30? Sí No Se usa Z tomada de la tabla de distribución normal para el nivel de significancia deseado Se usa t tomado de l tabla de distribución t para el nivel de significancia deseado Los valores criticos de son El número de grados de libertad (g.l.) Los valores críticos de son

Dos proporciones Se usa Z tomada de la tabla de distribución normal para el nivel de significancia deseado Los valores críticos de son donde

El Nivel Critico de la prueba estadística (p) El significado de p: Es el valor de la probabilidad de rechazar la hipótesis nula cuando se supone que es verdadera y obtenida con los resultados de la muestra. Si p > α No hay evidencia para rechazar Ho Si p < α Se rechaza Ho.

Nivel crítico de la prueba Nivel crítico p = P[rechazar H0 con los resultados obtenidos en la muestra observada, bajo el supuesto de que H0 es verdadera] Nivel crítico Indica que la diferencia encontrada Conclusión p > 0.05 Es no significativa y puede deberse No rechazar H0 al azar del muestreo 0.01< p 0.05 Es significativa y probablemente ya Rechazar H0 no se deba al azar del muestreo p  0.01 Es muy significativa y probablemente Rechazar H0 se deba a que hay diferencias en la po- blación

Prueba T para la media de las diferencias (datos apareados) El objetivo en las pruebas de comparaciones apareadas es eliminar un número máximo de fuentes de variación externa, haciendo a las parejas semejantes con respecto a las demás variables inherentes a los elementos de estudio, que podrían hacer variar el resultado esperado al margen del efecto del tratamiento. En lugar de llevar a cabo el análisis con observaciones individuales, se utiliza como variable de interés la diferencia entre pares individuales de observaciones. Hipótesis: H0: d = d0 H1: d  d0 H0: d  d0 H1: d > d0 H0: d  d0 H1: d < d0 Estadística de la prueba

Prueba T para la media de las diferencias (datos apareados) Se realizó un experimento para estudiar la efectividad de cierta dieta, combinada con un programa de ejercicio, en la reducción de los niveles de colesterol en suero en al menos 10 unidades. En el experimento participaron 12 personas. A continuación, se muestra los niveles de colesterol en suero, al principio del programa (Antes) y al final del mismo (Después). N° Persona 1 2 3 4 5 6 7 8 9 10 11 12 Colesterol antes 181 210 201 237 207 216 297 214 218 243 258 190 Colesterol después 175 195 211 194 268 176 187 224 235 182 Diferencia di -4 26 13 21 29 38 31 19 23

Prueba T para la media de las diferencias (datos apareados) H0: d  10 H0: d > 10 La dieta es efectiva para reducir los niveles de colesterol en suero en al menos 10 unidades La dieta no es efectiva para reducir los niveles de colesterol en suero en al menos 10 unidades p=0.0234 t(11) 2.24 La dieta combinada con un programa de ejercicios es efectiva para reducir los niveles de colesterol en suero en al menos 10 unidades (p < 0.05)

T<-t1-/2 o T> t1-/2 PRUEBA DE DOS COLAS =o  o T<-t1-/2 o T> t1-/2 Región de rechazo 0.025 Región de rechazo 0.025 Región de aceptación H0 0.95 Escala de t -1.96 Valor crítico -1.96 Valor crítico Cuando n es mayor a 200

Distribución Ji-Cuadrado La Prueba Ji-Cuadrado Distribución Ji-Cuadrado Supóngase que se tiene una serie de variables aleatorias independientes con distribución normal estándar, , entonces la variable aleatoria , sigue una distribución Ji-Cuadrado. FUNCIÓN DE DENSIDAD MEDIA Y VARIANZA.

Procedimientos para usar el análisis de ji cuadrada y probar la independencia de dos variables nominales Hipótesis nula: Las variables son independientes Se construye o se obtiene una tabla de tabulación cruzada para las frecuencias reales observadas (Oij ) Suponiendo que las variables son independientes, se construye una tabla de tabulación cruzada para las frecuencias teóricas ( Eij) Se determina el nivel de significado deseado en la prueba. Se determina el valor calculado del estadístico ji cuadrada

Tabla 4. Distribución de ji-cuadrado Probabilidad de un valor superior   Probabilidad de un valor superior Grados de libertad 0,1 0,05 0,025 0,01 0,005 1 2,71 3,84 5,02 6,63 7,88 2 4,61 5,99 7,38 9,21 10,60 3 6,25 7,81 9,35 11,34 12,84 4 7,78 9,49 11,14 13,28 14,86 5 9,24 11,07 12,83 15,09 16,75 6 10,64 12,59 14,45 16,81 18,55 7 12,02 14,07 16,01 18,48 20,28 8 13,36 15,51 17,53 20,09 21,95 9 14,68 16,92 19,02 21,67 23,59 10 15,99 18,31 20,48 23,21 25,19 Uso de la tabla El área sombreada de naranja representa la probabilidad que se determinada por , donde: es el valor critico del margen superior de la tabla, y son los grados de libertad del margen izquierdo de la tabla.

Tabla 4. Distribución de ji-cuadrado Probabilidad de un valor superior   Probabilidad de un valor superior Grados de libertad 0,1 0,05 0,025 0,01 0,005 1 2,71 3,84 5,02 6,63 7,88 2 4,61 5,99 7,38 9,21 10,60 3 6,25 7,81 9,35 11,34 12,84 4 7,78 9,49 11,14 13,28 14,86 5 9,24 11,07 12,83 15,09 16,75 6 10,64 12,59 14,45 16,81 18,55 7 12,02 14,07 16,01 18,48 20,28 8 13,36 15,51 17,53 20,09 21,95 9 14,68 16,92 19,02 21,67 23,59 10 15,99 18,31 20,48 23,21 25,19 Uso de la tabla Ji-Cuadrado

EJEMPLO Martha Revilla, directora de mantenimiento de la calidad en MEGA, elige 29 bicicletas y halla una varianza en la distancia entre ejes de 32.7 pulgadas cuadradas. Si la señora Revilla tienen que garantizar que la variación no supere 27 pulgadas cuadradas ¿indica esto que se cumplen las normas de producción? (α=0.05) Hipótesis Prueba de una cola a la derecha

0.05 41.337 33.91 Como X2=33.91<41.337 la señora Revilla no rechazará la H0 y confiará al 95% en que se cumplen las normas de producción

Prueba de una cola a la izquierda ¿Que pasaría, si las instrucciones de la señora Revilla fueran que la variación se mantuviera inferior a 27 pulgadas cuadradas? Prueba de una cola a la izquierda 0.05 16.928 33.91 X2 =33.91, la señora Revilla no rechazará la H0 y confiará al 95% en que se cumplen las normas de producción

La señora Revilla, ahora elabora un intervalo de confianza del 90% para la varianza de la distancia entre ejes. 0.90 0.05 0.05 16.928 41.337 0.95 Revilla puede confiar al 90% en que la varianza de la distancia entre ejes se encuentra entre 22.15 y 54.09 pulgadas cuadradas

Prueba Ji-Cuadrado para comparación de proporciones H0: La proporción de elementos en cada categoría es la misma para todos los grupos (los grupos son homogéneos). Grupo Categ. 1 ...... Categ. s Muestra Grupo 1 O11 O1s n1 ......... ....... ..... Grupo r Or1 Ors nr Total C1 Cs n

Prueba Ji-Cuadrado para comparación de proporciones Estadística

Ejemplo de Prueba Ji-Cuadrado para comparación de proporciones Se supone que se tienen datos experimentales correspondientes a 300 individuos de los que se ha recogido el valor que presentan en dos variables cualitativas Var1 (de 2 niveles: Cat1 / Cat2) y Var2 (de 4 niveles: Grupo 1 / Grupo 2 / Grupo 3 / Grupo 4), para comparar la distribución por grupos entre las categorías. Los datos se presentan en la Tabla: Var1 / Var2 Cat1 Cat2 Total Grupo 1 62 88 150 Grupo 2 46 64 110 Grupo 3 12 20 32 Grupo 4 6 2 8 126 174 300

Frecuencias Esperadas: H0: No hay diferencia, en la distribución por grupos, entre las categorías. H1: Hay diferencia, en la distribución por grupos, entre las categorías. Frecuencias Esperadas: Por ejemplo: Var1 / Var2 Cat1 Cat2 Total Grupo 1 63.0 87.0 150 Grupo 2 46.2 63.8 110 Grupo 3 13.4 18.6 32 Grupo 4 3.4 4.6 8 126 174 300

Estadística

Que sigue una distribución Ji-cuadrado con (n-1)*(C-1)=( 4-1)*(2-1)=3 grados de libertad En conclusión, no se ha encontrado diferencia significativa, en la distribución por grupo, para cada categoría (p  0.05)

Prueba Ji-Cuadrado de Independencia H0: Las variables X e Y son independientes H1: Existe asociación entre X e Y Y X Categ. 1 ...... Categ. s Total Cat. 1 O11 O1s R1 ......... ....... ..... Cat. r Or1 Ors Rr C1 Cs n

Prueba Ji-Cuadrado de Independencia Estadística

Ejemplo de Prueba Ji-Cuadrado de independencia Para verificar la suposición de que la fabricación de cierto producto está asociado con enfermedades respiratorias, a 450 trabajadores de una empresa que fabrica el producto se evaluó respecto a la presencia de síntomas de alteraciones respiratorias y se los clasificó a su vez de acuerdo al nivel de exposición al producto. Los resultados se presentan en la tabla siguiente: Presencia de Síntoma Nivel de Exposición Total Alto Medio Bajo Si 175 43 27 245 No 90 60 55 205 265 103 82 450

Frecuencias Esperadas: H0: Las alteraciones respiratorias son independientes de la exposición al producto. H1: Las alteraciones respiratorias están asociadas a la exposición al producto Frecuencias Esperadas: Por ejemplo: Presencia de Síntoma Nivel de Exposición Total Alto Medio Bajo Si 144.3 56.1 44.6 245 No 120.7 46.9 37.4 205 265 103 82 450

Estadística

Que sigue una distribución Ji-cuadrado con (n-1)*(C-1)=( 2-1)*(3-1)=2 grados de libertad En conclusión, se rechaza la H0 (p < 0.05), es decir las alteraciones respiratorias están asociadas a la exposición al producto

Distribución F de Snedecor Si y son variables Ji-cuadrado distribuidas en forma independiente con y grados de libertad, respectivamente, la variable sigue la distribución F con y grados de libertad.

Tabla F de Fisher α=0.05 con letra normal. α=0.01 con letra negrita

Ejemplo de uso de la tabla F de Fisher

Ejemplo de Aplicación Deseamos probar las hipótesis: De dos aulas de 5ª año de secundaria se tomaron muestras de tamaños 10 y 15 de las notas promedios de alumnos para probar si la dispersión de las notas es la misma para las dos aulas. Los resultados obtenidos son los siguientes: Aula 1: 15, 16, 12, 14, 14, 15, 16, 13, 14, 15. Aula 2: 12, 14, 15, 16, 16, 17, 15, 16, 18, 14, 12, 15, 16, 14, 13. Deseamos probar las hipótesis:

Luego Si , entonces para las cuantilas y Luego concluimos que la dispersión de las notas entre los alumnos para las dos aulas de 5ª año son las mismas, pues no se encuentra diferencia significativa.

EJEMPLO La compañía llantera Good Year del Perú, ha efectuado un estudio sobre los hábitos de manejo de varios grupos ocupacionales. En una muestra de 35 profesores universitarios, el número promedio de kilómetros recorridos al año fue de 14,500 con una desviación standart de 3,200 km. En una muestra de 40 dentistas, el kilometraje fue de 13,400, con una desviación standart de 1,950 km. Se tiene

Primero se verificará la condición siguiente: 1  2 Planteamos las Hipótesis:

Se rechaza la H0, es decir que 1  2 Para α=0.05 0.025 0.95 0.025 0.515 1.9 2.693 Se rechaza la H0, es decir que 1  2

Y los valores críticos son: -1,220.3 y +1,220.3 Luego, se prueba la hipótesis: Diferencia de las medias muestrales Valores críticos Y los valores críticos son: -1,220.3 y +1,220.3

+1050 = diferencia observada entre las medias muestrales. Se acepta la hipótesis nula Se Rechaza Se Rechaza Área =0.025 Área =0.025 Z= -1.96 Z= +1.96 -1220.3 Valor critico +1220.3 Valor critico +1050 = diferencia observada entre las medias muestrales.

Ejercicio Como la diferencia entre las medias muestrales es de 1050 millas y se acepta un margen de error de 1220 millas, en consecuencia, no hay diferencias significativas entre los dos grupos

EJEMPLO Freddy Lopez, operador de la cadena de restaurantes “Las Tejas””, ha hecho una encuesta entre los clientes en dos ciudades, pues desea averiguar si les gustaría que en el menú se incluyeran sandwiches de jamón y queso. De las 500 personas encuestadas en la capital, 200 contestaron afirmativamente, mientras que 150 de las 300 encuestadas en una ciudad cercana también contestaron afirmativamente. Freddy quiere saber si, en un nivel de 0.05 esos resultados son significativamente diferente. En resumen

Se tiene Primero se determinará si se cumple lo siguiente: 1 ≠ 2 Planteamos las Hipótesis:

Se rechaza la H0, es decir que 1 ≠ 2 Para α=0.05 0.025 0.95 0.025 0.8184 1.228 0.576 Se rechaza la H0, es decir que 1 ≠ 2

Y los valores críticos son: -0.071 y +0.071 Luego, se prueba la hipótesis: Diferencia de las proporciones muestrales Valores críticos Y los valores críticos son: -0.071 y +0.071

Se acepta la hipótesis nula Se rechaza Se rechaza Área =0.025 Área =0.025 Z= -1.96 Z= +1.96 Diferencia observada entre las proporciones muestrales = (0.40-.050) =-0.10 -0.071 Valor critico +0.071 Valor critico

Ejercicio Como la diferencia entre las proporciones muestrales es de -0.10 y se acepta un margen de error de 0.071, en consecuencia, si hay diferencias significativas entre los dos grupos