La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

LABORATORIO Sesión 3 COMPARACIÓN DE DOS POBLACIONES.

Presentaciones similares


Presentación del tema: "LABORATORIO Sesión 3 COMPARACIÓN DE DOS POBLACIONES."— Transcripción de la presentación:

1 LABORATORIO Sesión 3 COMPARACIÓN DE DOS POBLACIONES

2 Motivación ¿Hombres y mujeres tienen el mismo sueldo para el mismo trabajo? ¿Tienen el mismo rendimiento estos autos? ¿Baja la presión arterial con cierto tratamiento ?

3 En esta sesión se trabajará con los siguientes datos La empresa blagapar tiene 48 empleados con un trabajo similar y los sueldos son: GeneroSueldoGeneroSueldoGeneroSueldo H343000H315000M242000 H310000H336000M265000 H305000H324000M233000 H308000H290000M238000 H261000H363000M339000 H311000H280000M282000 H325000M242000M231000 H333000M311000M278000 H378000M303000M235000 H306000M247000M226000 H345000M269000M255000 H352000M232000M258000 H358000M192000M281000 H282000M319000M240000 H328000M259000M298000 H330000M293000M289000

4 ¿El tratamiento ACME es más eficaz que el otro tratamiento para disminuir la presión arterial? Presión diastolica Tratamiento Presión diastolica Tratamiento Presión diastolica Tratamiento 10.7acme7.6acme11.3otro 10.5acme9.1acme10.4otro 9.7acme11.7acme9.5otro 10.9acme9.7acme11.5otro 10.5acme9.2acme10.6otro 10.4acme9.4acme8.7otro 8.5acme8.0acme9.8otro 9.7acme10.3acme10.5otro 8.9acme9.0acme11.2otro 9.4acme9.7acme9.6otro 9.4acme10.8acme10.5otro 10.6acme11.1acme8.7otro 9.9acme8.2acme10.0otro 10.6acme9.5otro10.6otro 10.0acme11.5otro10.0otro 9.9acme10.6otro10.1otro

5 Si los datos se refieren a toda la población ¿qué proponen hacer para comparar los sueldos de los hombres con los sueldos de las mujeres? (1) Calcular las medias (2) Graficar el boxplot según el género y calcular las medias (3) Calcular las varianzas Elige una de las 3 repuestas

6 ¡¡¡REPUESTA INCORRECTA!!! La repuesta es: (2) Graficar el boxplot según el género y calcular las medias. Queremos estudiar las posiciones de las dos distribuciones para poder compararlas

7 El Boxplot permite comparar las distribuciones de dos poblaciones OBSERVAMOS QUE MUCHOS DE LOS SUELDOS DE LOS HOMBRES ES SUPERIOR A LOS DE LAS MUJERES.

8 OTRA MANERA CONSISTE EN: DESPUES DE ORDENAR LOS SUELDOS DE MENOR A MAYOR OBSERVE COMO SE DISTRIBUYEN LAS POSICIONES (O RANGOS) DE LOS SUELDOS DE LOS HOMBRES Y LOS DE LAS MUJERES Piense, ¿Cómo deberían encontrarse los rangos de los hombres con respecto a los de las mujeres, si los sueldos de los hombres no fueran mayores que los de las mujeres?

9 Los rangos deberían (1) Alternarse entre hombres y mujeres (2) Repartirse de manera equilibrada entre hombres y mujeres Elige una de las 2 repuestas

10 ¡¡¡REPUESTA INCORRECTA!!! La repuesta es: (2) Repartirse de manera equilibrada entre hombres y mujeres Ya que, si no hay diferencia notable de sueldos entre hombres y mujeres, en un rango cualquiera se puede encontrar un hombre o bien una mujer.

11 ¿Qué les parece la tabla siguiente?

12 Para simplificar, si tomamos un ejemplo con solo 7 datos: 3 hombres y 4 mujeres dónde los sueldos y los rangos de cada dato vienen dados a continuación: Hombres 265 265 310 310 330 330Mujeres 220 220 240 240 260 260 300 300Rangos 4 6 7 Rangos 1 2 3 5 Si los sueldos son similares para los hombres y las mujeres, ¿qué esperarían de los rangos ?

13 Repuesta: Sacando un rango al azar (entre 1 y 7), tendría la misma probabilidad de encontrar un hombre o una mujer. Para ilustrar esto, vamos a considerar los rangos de los hombres, ya que son 3 solamente. Suponiendo que todo los rangos son igualmente posibles construye manualmente la distribución de todas las sumas de los rangos para los tres hombres usando todas las permutaciones posibles, manualmente o con una planilla excel

14 rangos Sum arangosSuma 123623712 124724511 125824612 126924713 1271025613 134825714 135926715 1361034512 1371134613 1451034714 1461135614 1471235715 1561236716 1571345615 1671445716 234946717 2351056718 23611 NOTAR QUE: Los 3 datos de los hombres pueden caer en los rangos 1, 2, 3, 4, 5, 6 ó 7. Cuando un rango es ocupado por un hombre no puede ser ocupado por otro. En la tabla se observan TODAS las combinaciones posibles para los rangos y se calcula la suma de ellos.

15 Podemos observar la distribución de las sumas de rangos según la tabla anterior con un histograma

16 Recordemos el ejemplo que estamos analizando Hombres 265 265 310 310 330 330Rangos 4 6 7 ¿Cuál es la suma de los rangos encontrada en el ejemplo y la probabilidad de haber encontrado este valor?

17 La suma de los rangos aquí es 4+6+7 = 17 Hay =35 permutaciones posibles de 3 rangos entre los 7. La probabilidad de obtener un valor al menos igual a 17 ( ) es entonces 2/35 = 5,7% que representa la probabilidad de obtener una suma igual a 17 bajo la hipótesis de que los sueldos son iguales. Piense ¿a qué conclusión lleva este resultado? 17 

18 Los resultados para estos 7 datos muestran suficiente evidencia para decir que:Los resultados para estos 7 datos muestran suficiente evidencia para decir que: 1. Los sueldos de las mujeres son mayores que los de los hombres. 2. No hay diferencia entre los sueldos de hombres y los de mujeres. 3. Los sueldos de los hombres son mayores que los de las mujeres.

19 ¡¡¡REPUESTA INCORRECTA!!! La repuesta es: 3. Los sueldos de los hombres son mayores que los de las mujeres. Es poco probable (p=0.057) de obtener esta suma de los rangos de los hombres si los sueldos de los hombres y de las mujeres fueran distribuidos al azar y además se observo que los rangos de los hombres se ven mayores que los de las mujeres.

20 Test de rangos de Wilcoxon En la práctica no se puede usar este procedimiento en forma manual. El test de Wilcoxon nos proporciona esta probabilidad en los programas computacionales.

21 Hipótesis estadísticas y p-valor El problema de comparación de dos grupos puede formalizarse de la siguiente manera: 1. Se tienen dos hipótesis: Ho : Los dos grupos son iguales H1: Los hombres tienen en general mayor sueldo que las mujeres 2. Se define un estadístico para medir la diferencia entre los dos grupos: aquí la suma de los rangos de un grupo (los hombres, por ejemplo).

22 Hipótesis estadísticas y p-valor 3. Se calcula la probabilidad de obtener la suma de los rangos de los hombres que se obtuvo (17 aquí) si los dos grupos no fueran diferentes (vale 0,057 aquí). Esta probabilidad se llama p-valor. 4. Se concluye a favor de una hipótesis u otra según el p-valor. –Si el p-valor es pequeño (<5% o 10%) se concluye que la hipótesis H1 es más plausible. –Si el p-valor es elevado se concluye que no hay evidencia para decir que los dos grupos son distintos. 5. Veremos más adelante como influye el tamaño de la muestra sobre este resultado.

23 Usaremos ahora los 48 datos de los sueldos Tome el archivo “sueldos.wrk” y efectue un test de rangos de Wilcoxon. (1) Los sueldos de los hombres son similares a los de las mujeres (2) Los sueldos de los hombres y los de las mujeres son diferentes (2) Los sueldos de los hombres y los de las mujeres son diferentes

24 ¡¡¡REPUESTA INCORRECTA!!! La repuesta es: LA CONCLUSIÓN ES: La suma de los rangos de los sueldos de los hombres es: T = 768 El p-valor para hipótesis unilateral es 0.000 Se concluye que hay suficiente evidencia para decir que los hombres tienen, en general, sueldos mayores que las mujeres Se concluye que hay suficiente evidencia para decir que los hombres tienen, en general, sueldos mayores que las mujeres

25 Trabajamos con los rangos de los sueldos en vez de los valores de los sueldos. Esto presenta inconvenientes y ventajas INCONVENIENTES (1) Se pierde precisión en el valor del dato (2) Se pierde la variabilidad de los datos Elige una de las 2 repuestas

26 ¡¡¡REPUESTA INCORRECTA!!! La repuesta es: (1) Se pierde precisión en el valor del dato Además se pierde la noción de distancia entre dos datos Datos originales H: 265; 310; 330 M: 220; 240; 260; 300 dist(220,240) dist(260,265) dist(220,240) ≠dist(260,265)Rangos H: H: 4 6 7 M: 1 2 3 5 dist(1,2)= dist(3,4)=1

27 VENTAJAS (1) Los rangos se distribuye normalmente (2) Los rangos son menos sensibles a los datos atípicos que los datos originales Elige una de las 2 repuestas

28 ¡¡¡REPUESTA INCORRECTA!!! La repuesta es: (2) Los rangos son menos sensibles a los datos atípicos que los datos originales Por ejemplo, las dos series de datos 18 22 24 25 32 36 39 42 y 18 22 24 25 32 36 39 72 producen los mismos rangos

29 Valores iniciales en vez de los rangos Sean X el sueldo de una mujer e Y el sueldo de un hombre. Supongamos que:

30

31 Ahora necesitamos un estadístico para comparar las medias de distribuciones normales ¿Cuál de estos estadísticos nos sirve? (1) (2) (3)

32 Mide cuanto alejados son los centros de las dos distribuciones NOTA: Proponiendo este estadístico se supone que las varianzas y son iguales ¡¡¡REPUESTA INCORRECTA!!! La repuesta es: (2)

33 Suponiendo las varianzas iguales

34 Regla de Decisión Para comparar los sueldos de los hombres y mujeres tomaremos la hipótesis nula H o : μ 1 - μ 2 = 0 ¿cuál es la hipótesis alternativa que conviene? (1) H 1 : μ 1 - μ 2 > 0 (2) H 1 : μ 1 - μ 2  0 (3) H 1 : μ 1 - μ 2 < 0

35 ¡¡¡REPUESTA INCORRECTA!!! La repuesta es: (1) H 1 : μ 1 - μ 2 > 0 Los sueldos de los hombres son mayores que los de las mujeres.

36 ¿Cómo decidir? Si se cumple Ho: μ1- μ2=0, se espera tener pequeño y si H1: μ1- μ2>0, no pequeño El problema es definir cuando podemos decir que la diferencia es pequeña o no

37 O bien

38 Utilizando el p-valor Aquí el sueldo promedio de los hombres es 321954 y el de las mujeres es 263730. La diferencia es 58224 El p-valor es la probabilidad que la diferencia de las dos medias sea mayor que 58224 si fuera cierto que la diferencia se debe a fluctuaciones muestrales. O sea,

39 Comandos Statit Test wilcoxon: Statisitics=>one and two sample inference =>rank methods=>wilcoxon test Variable: sueldos Test against: by group, variable:género

40 Comandos Statit Test t-student: Statisitics=>one and two sample inference =>general=>student’s t Variable: sueldos Test: By group variable, variable:género

41 Otro experimento... Un laboratorio farmacéutico elige al azar una muestra de pacientes hipertensos. Divide la muestra en dos grupos de manera aleatoria(1 y 2). Al grupo 1 le administra el remedio "acme" y al grupo 2 le administra un remedio tradicional.

42 La pregunta ¿Es más eficaz el remedio ACME o el remedio tradicional? En los archivos presion50.xls, presion100.xls y presion1000.xls se encuentran los datos de presión diastólica, grupo y código de grupo para muestras de tamaño 50, 100 y 1000 respectivamente.

43 Dependiendo de la muestra encontrada se tendrán diferentes valores de medias para cada grupo, por lo que la diferencia de medias irá cambiando. Compare con sus compañeros los resultados y responda LA PREGUNTA 2

44 Envíe su trabajo a : ma34b0X@ing.uchile.clma34b0X@ing.uchile.cl, con X 1, 2, 3 ó 4 según sea su módulo No olvide ponerle nombre y guardar su archivo con su login (e.g. ajulio.doc)


Descargar ppt "LABORATORIO Sesión 3 COMPARACIÓN DE DOS POBLACIONES."

Presentaciones similares


Anuncios Google