LABORATORIO Sesión 3 COMPARACIÓN DE DOS POBLACIONES.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

PRUEBAS DE HIPÓTESIS.
Tema 15. Contraste de hipótesis: Planteamiento de las hipótesis
Tema 19: Contraste no paramétrico de hipótesis: Conceptos básicos
ESTADISTICA INFERENCIAL
Inferencia estadística
Pruebas de hipótesis.
Contraste de Hipótesis
KRUSKAL WALLIS Jorge Iván Betancur Marta Isabel Naranjo García
La prueba U DE MANN-WHITNEY
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
MEDIDAS DE VARIABILIDAD O DISPERSION
Distribuciones muestrales Procedimientos de muestreo
MUESTREO DE ACEPTACIÓN DE LOTES POR VARIABLES
Prueba de hipótesis Equivalencia entre la prueba de hipótesis y los intervalos de confianza Valor de probabilidad Valor de probabilidad unilateral Prueba.
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Inferencia Estadística
Unidad VI: PRUEBAS DE HIPOTESIS
Clases 4 Pruebas de Hipótesis
1 Planteamiento del problema ¿Tenemos los humanos la capacidad de percibir si nos miran desde atrás? O, más exactamente: ¿Es defendible que existen otras.
Diseño Estadístico y Herramientas para la Calidad
HAWKES LEARNING SYSTEMS math courseware specialists Copyright © 2010 by Hawkes Learning Systems/Quant Systems, Inc. All rights reserved. Capítulo 12 Más.
Estadística Administrativa II
UNIVERSIDAD INCA GARCILASO DE LA VEGA
Probabilidad y estadística
Tema 17: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
Distribuciones derivadas del muestreo
LABORATORIO DE ESTADÍSTICA Sesión 4 Contingencia, Anova y correlación.
DISTRIBUCIONES DE MUESTREO
Unidad V: Estimación de
Medidas de Dispersión.
Estimación Sea una característica, un parámetro poblacional cuyo valor se desea conocer a partir de una muestra. Sea un estadístico ( función.
LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.
ESTADÍSTICAS DESCRIPTIVA
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
ESTIMACION POR INTERVALOS
Análisis Cuantitativo de Datos (Básico)
Capacidad de Proceso.
Clase 4a Significancia Estadística y Prueba Z
Inferencia Estadística
Herramientas básicas.
Unidad V: Estimación de
Capítulo 1. Conceptos básicos de la Estadística
Tema 5: Contrastes de Hipótesis no-paramétricos
INFERENCIA ESTADÍSTICA
DISTRIBUCIONES MUESTRALES
Pruebas de hipótesis.
ANÁLISIS E INTREPRETACIÓN DE DATOS
PRUEBAS ESTADISTICAS NO PARAMETRICAS
Métodos Cuantitativos
RIESGO, RENDIMIENTO Y VALOR
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
Medidas de dispersión IIIº Medio 2015.
Estadística para administradores
Aspectos generales de la investigación educativa en el SNIT
Clase N°11 Métodos de reducción de varianza
INFERENCIA ESTADÍSTICA
UNIDAD I.- Analisis 3.4 Prueba de Hipotesis.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
CAPACITACIÓN, INVESTIGACIÓN, ESTADÍSTICA Y MERCADEO
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
Intervalos de Confianza
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
Tarea # 4 PRUEBAS DE HIPÓTESIS ESTADÍSTICAS. PRUEBA DE HIPÓTESIS Hipótesis es una aseveración de una población elaborado con el propósito de poner a prueba,
Estimación estadística
DISTRIBUCIÓN T DE STUDENT
4. Métodos psicofísicos de medida en clínica
Viviana Acosta Estadística II. Que es Es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida.
ANALISIS DE VARIANZA.
Transcripción de la presentación:

LABORATORIO Sesión 3 COMPARACIÓN DE DOS POBLACIONES

Motivación ¿Hombres y mujeres tienen el mismo sueldo para el mismo trabajo? ¿Tienen el mismo rendimiento estos autos? ¿Baja la presión arterial con cierto tratamiento ?

En esta sesión se trabajará con los siguientes datos La empresa blagapar tiene 48 empleados con un trabajo similar y los sueldos son: GeneroSueldoGeneroSueldoGeneroSueldo H343000H315000M H310000H336000M H305000H324000M H308000H290000M H261000H363000M H311000H280000M H325000M242000M H333000M311000M H378000M303000M H306000M247000M H345000M269000M H352000M232000M H358000M192000M H282000M319000M H328000M259000M H330000M293000M289000

¿El tratamiento ACME es más eficaz que el otro tratamiento para disminuir la presión arterial? Presión diastolica Tratamiento Presión diastolica Tratamiento Presión diastolica Tratamiento 10.7acme7.6acme11.3otro 10.5acme9.1acme10.4otro 9.7acme11.7acme9.5otro 10.9acme9.7acme11.5otro 10.5acme9.2acme10.6otro 10.4acme9.4acme8.7otro 8.5acme8.0acme9.8otro 9.7acme10.3acme10.5otro 8.9acme9.0acme11.2otro 9.4acme9.7acme9.6otro 9.4acme10.8acme10.5otro 10.6acme11.1acme8.7otro 9.9acme8.2acme10.0otro 10.6acme9.5otro10.6otro 10.0acme11.5otro10.0otro 9.9acme10.6otro10.1otro

Si los datos se refieren a toda la población ¿qué proponen hacer para comparar los sueldos de los hombres con los sueldos de las mujeres? (1) Calcular las medias (2) Graficar el boxplot según el género y calcular las medias (3) Calcular las varianzas Elige una de las 3 repuestas

¡¡¡REPUESTA INCORRECTA!!! La repuesta es: (2) Graficar el boxplot según el género y calcular las medias. Queremos estudiar las posiciones de las dos distribuciones para poder compararlas

El Boxplot permite comparar las distribuciones de dos poblaciones OBSERVAMOS QUE MUCHOS DE LOS SUELDOS DE LOS HOMBRES ES SUPERIOR A LOS DE LAS MUJERES.

OTRA MANERA CONSISTE EN: DESPUES DE ORDENAR LOS SUELDOS DE MENOR A MAYOR OBSERVE COMO SE DISTRIBUYEN LAS POSICIONES (O RANGOS) DE LOS SUELDOS DE LOS HOMBRES Y LOS DE LAS MUJERES Piense, ¿Cómo deberían encontrarse los rangos de los hombres con respecto a los de las mujeres, si los sueldos de los hombres no fueran mayores que los de las mujeres?

Los rangos deberían (1) Alternarse entre hombres y mujeres (2) Repartirse de manera equilibrada entre hombres y mujeres Elige una de las 2 repuestas

¡¡¡REPUESTA INCORRECTA!!! La repuesta es: (2) Repartirse de manera equilibrada entre hombres y mujeres Ya que, si no hay diferencia notable de sueldos entre hombres y mujeres, en un rango cualquiera se puede encontrar un hombre o bien una mujer.

¿Qué les parece la tabla siguiente?

Para simplificar, si tomamos un ejemplo con solo 7 datos: 3 hombres y 4 mujeres dónde los sueldos y los rangos de cada dato vienen dados a continuación: Hombres Mujeres Rangos Rangos Si los sueldos son similares para los hombres y las mujeres, ¿qué esperarían de los rangos ?

Repuesta: Sacando un rango al azar (entre 1 y 7), tendría la misma probabilidad de encontrar un hombre o una mujer. Para ilustrar esto, vamos a considerar los rangos de los hombres, ya que son 3 solamente. Suponiendo que todo los rangos son igualmente posibles construye manualmente la distribución de todas las sumas de los rangos para los tres hombres usando todas las permutaciones posibles, manualmente o con una planilla excel

rangos Sum arangosSuma NOTAR QUE: Los 3 datos de los hombres pueden caer en los rangos 1, 2, 3, 4, 5, 6 ó 7. Cuando un rango es ocupado por un hombre no puede ser ocupado por otro. En la tabla se observan TODAS las combinaciones posibles para los rangos y se calcula la suma de ellos.

Podemos observar la distribución de las sumas de rangos según la tabla anterior con un histograma

Recordemos el ejemplo que estamos analizando Hombres Rangos ¿Cuál es la suma de los rangos encontrada en el ejemplo y la probabilidad de haber encontrado este valor?

La suma de los rangos aquí es = 17 Hay =35 permutaciones posibles de 3 rangos entre los 7. La probabilidad de obtener un valor al menos igual a 17 ( ) es entonces 2/35 = 5,7% que representa la probabilidad de obtener una suma igual a 17 bajo la hipótesis de que los sueldos son iguales. Piense ¿a qué conclusión lleva este resultado? 17 

Los resultados para estos 7 datos muestran suficiente evidencia para decir que:Los resultados para estos 7 datos muestran suficiente evidencia para decir que: 1. Los sueldos de las mujeres son mayores que los de los hombres. 2. No hay diferencia entre los sueldos de hombres y los de mujeres. 3. Los sueldos de los hombres son mayores que los de las mujeres.

¡¡¡REPUESTA INCORRECTA!!! La repuesta es: 3. Los sueldos de los hombres son mayores que los de las mujeres. Es poco probable (p=0.057) de obtener esta suma de los rangos de los hombres si los sueldos de los hombres y de las mujeres fueran distribuidos al azar y además se observo que los rangos de los hombres se ven mayores que los de las mujeres.

Test de rangos de Wilcoxon En la práctica no se puede usar este procedimiento en forma manual. El test de Wilcoxon nos proporciona esta probabilidad en los programas computacionales.

Hipótesis estadísticas y p-valor El problema de comparación de dos grupos puede formalizarse de la siguiente manera: 1. Se tienen dos hipótesis: Ho : Los dos grupos son iguales H1: Los hombres tienen en general mayor sueldo que las mujeres 2. Se define un estadístico para medir la diferencia entre los dos grupos: aquí la suma de los rangos de un grupo (los hombres, por ejemplo).

Hipótesis estadísticas y p-valor 3. Se calcula la probabilidad de obtener la suma de los rangos de los hombres que se obtuvo (17 aquí) si los dos grupos no fueran diferentes (vale 0,057 aquí). Esta probabilidad se llama p-valor. 4. Se concluye a favor de una hipótesis u otra según el p-valor. –Si el p-valor es pequeño (<5% o 10%) se concluye que la hipótesis H1 es más plausible. –Si el p-valor es elevado se concluye que no hay evidencia para decir que los dos grupos son distintos. 5. Veremos más adelante como influye el tamaño de la muestra sobre este resultado.

Usaremos ahora los 48 datos de los sueldos Tome el archivo “sueldos.wrk” y efectue un test de rangos de Wilcoxon. (1) Los sueldos de los hombres son similares a los de las mujeres (2) Los sueldos de los hombres y los de las mujeres son diferentes (2) Los sueldos de los hombres y los de las mujeres son diferentes

¡¡¡REPUESTA INCORRECTA!!! La repuesta es: LA CONCLUSIÓN ES: La suma de los rangos de los sueldos de los hombres es: T = 768 El p-valor para hipótesis unilateral es Se concluye que hay suficiente evidencia para decir que los hombres tienen, en general, sueldos mayores que las mujeres Se concluye que hay suficiente evidencia para decir que los hombres tienen, en general, sueldos mayores que las mujeres

Trabajamos con los rangos de los sueldos en vez de los valores de los sueldos. Esto presenta inconvenientes y ventajas INCONVENIENTES (1) Se pierde precisión en el valor del dato (2) Se pierde la variabilidad de los datos Elige una de las 2 repuestas

¡¡¡REPUESTA INCORRECTA!!! La repuesta es: (1) Se pierde precisión en el valor del dato Además se pierde la noción de distancia entre dos datos Datos originales H: 265; 310; 330 M: 220; 240; 260; 300 dist(220,240) dist(260,265) dist(220,240) ≠dist(260,265)Rangos H: H: M: dist(1,2)= dist(3,4)=1

VENTAJAS (1) Los rangos se distribuye normalmente (2) Los rangos son menos sensibles a los datos atípicos que los datos originales Elige una de las 2 repuestas

¡¡¡REPUESTA INCORRECTA!!! La repuesta es: (2) Los rangos son menos sensibles a los datos atípicos que los datos originales Por ejemplo, las dos series de datos y producen los mismos rangos

Valores iniciales en vez de los rangos Sean X el sueldo de una mujer e Y el sueldo de un hombre. Supongamos que:

Ahora necesitamos un estadístico para comparar las medias de distribuciones normales ¿Cuál de estos estadísticos nos sirve? (1) (2) (3)

Mide cuanto alejados son los centros de las dos distribuciones NOTA: Proponiendo este estadístico se supone que las varianzas y son iguales ¡¡¡REPUESTA INCORRECTA!!! La repuesta es: (2)

Suponiendo las varianzas iguales

Regla de Decisión Para comparar los sueldos de los hombres y mujeres tomaremos la hipótesis nula H o : μ 1 - μ 2 = 0 ¿cuál es la hipótesis alternativa que conviene? (1) H 1 : μ 1 - μ 2 > 0 (2) H 1 : μ 1 - μ 2  0 (3) H 1 : μ 1 - μ 2 < 0

¡¡¡REPUESTA INCORRECTA!!! La repuesta es: (1) H 1 : μ 1 - μ 2 > 0 Los sueldos de los hombres son mayores que los de las mujeres.

¿Cómo decidir? Si se cumple Ho: μ1- μ2=0, se espera tener pequeño y si H1: μ1- μ2>0, no pequeño El problema es definir cuando podemos decir que la diferencia es pequeña o no

O bien

Utilizando el p-valor Aquí el sueldo promedio de los hombres es y el de las mujeres es La diferencia es El p-valor es la probabilidad que la diferencia de las dos medias sea mayor que si fuera cierto que la diferencia se debe a fluctuaciones muestrales. O sea,

Comandos Statit Test wilcoxon: Statisitics=>one and two sample inference =>rank methods=>wilcoxon test Variable: sueldos Test against: by group, variable:género

Comandos Statit Test t-student: Statisitics=>one and two sample inference =>general=>student’s t Variable: sueldos Test: By group variable, variable:género

Otro experimento... Un laboratorio farmacéutico elige al azar una muestra de pacientes hipertensos. Divide la muestra en dos grupos de manera aleatoria(1 y 2). Al grupo 1 le administra el remedio "acme" y al grupo 2 le administra un remedio tradicional.

La pregunta ¿Es más eficaz el remedio ACME o el remedio tradicional? En los archivos presion50.xls, presion100.xls y presion1000.xls se encuentran los datos de presión diastólica, grupo y código de grupo para muestras de tamaño 50, 100 y 1000 respectivamente.

Dependiendo de la muestra encontrada se tendrán diferentes valores de medias para cada grupo, por lo que la diferencia de medias irá cambiando. Compare con sus compañeros los resultados y responda LA PREGUNTA 2

Envíe su trabajo a : con X 1, 2, 3 ó 4 según sea su módulo No olvide ponerle nombre y guardar su archivo con su login (e.g. ajulio.doc)