La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

1 Ejemplo Consideremos los datos de un estudio donde se les mide la talla en centímetros a 20 jugadores del equipo Nacional de Handbol de EE. UU. seleccionados.

Presentaciones similares


Presentación del tema: "1 Ejemplo Consideremos los datos de un estudio donde se les mide la talla en centímetros a 20 jugadores del equipo Nacional de Handbol de EE. UU. seleccionados."— Transcripción de la presentación:

1 1 Ejemplo Consideremos los datos de un estudio donde se les mide la talla en centímetros a 20 jugadores del equipo Nacional de Handbol de EE. UU. seleccionados al azar. La ley que asocia a cada hombre con su talla es una variable aleatoria (continua). 184.2 191.8 188.0 196.2 178.4.... etc A esta función que asocia a cada deportista con su talla la llamaremos variable aleatoria y la denotaremos por X. X: Talla Qué es una Variable Aleatoria??????????

2 2 Ejemplo 184.2191.8188.0196.2178.4 184.2195.4189.2186.0194.3 190.5190.5198.1188.0184.2 176.5184.2193.5195.6 186.3 X: Talla

3 3 Es un arreglo de los distintos valores que toma la variable con sus respectivas frecuencias (nº de veces que aparece cada valor de la variable en la muestra). Cómo ordenamos los datos??????????? En una: Tabla de Distribución de Frecuencia Qué es ?????

4 4 Distribución de frecuencia de ejemplo (TALLA) Talla 173.5-179.5 179.5-185.5 185.5-191.5 191.5-197.5 197.5-203.5 f 2 4 7 6 1 20 F 2 6 13 19 20 = Tabla de frecuencias

5 5 Distribución de frecuencia de ejemplo (TALLA)Histograma

6 6 Medidas de Resumen Los fenómenos biológicos no suelen ser constantes La tendencia central de los datos Necesitamos conocer: La dispersión o variación respecto de este centro Los datos que ocupan ciertas posiciones La simetría de los datos La forma en que los datos se agrupan

7 7 Medidas representativas de un conjunto de datos estadísticos

8 8 Medidas de Tendencia Central Son medidas alrededor de las cuales se concentran los datos Las tres medidas más usuales de tendencia central son: Media MedianaModa

9 9 Es la suma de todos sus posibles valores dividida por el n° total de datos (n) (Ejemplo: TALLA) 1.-Media Aritmética (X) de una variable aleatoria (o Promedio)Datos: 184.2191.8188.0196.2178.4 184.2195.4189.2186.0194.3 190.5190.5198.1188.0184.2 176.5184.2193.5195.6 186.3

10 10 a) n impar: mediana es el único valor central b) n par: mediana es el promedio de los dos valores centrales Primero !!!!! Ordenamos los valores de menor a mayor Si n es el número de observaciones: Es el primer valor de la variable que deja por debajo y por sobre de sí al 50 % de las observaciones. 2.- Mediana(Med) de una variable aleatoria

11 11 Si la variable es la talla

12 12 176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1 (Ejemplo: TALLA) Datos ordenados: n= 20 parMediana Promedio de 2 valores centralesPromedio de 2 valores centrales Dejan aproximadamente 50% de los datos bajo y sobre sí (aprox. 10 datos)Dejan aproximadamente 50% de los datos bajo y sobre sí (aprox. 10 datos) 10 datos

13 13 39, 40, 42, 49, 51, 54, 56, 57, 58, 58, 58, 59, 63, 64, 66, 68, 69, 70, 70, 71,72 (Ejemplo: PESO) Datos ordenados: n= 21 impar Mediana valor central únicovalor central único Deja aproximadamente 50% de los datos bajo y sobre sí (aprox. 10 datos)Deja aproximadamente 50% de los datos bajo y sobre sí (aprox. 10 datos) Med=58

14 14 Mediana= Si cambiamos la última observación por otra extrañamente grande X: 2, 5, 7, 125 Sea X una variable discreta con los siguientes valores: X: 2, 5, 7, 12 Media=(2+5+7+12)/4=6.5 (5+7)/2= 6 Media= (2+5+7+125)/4=34.75 Mediana=(5+7)/2= 6 Conclusión: La Media es afectada por valores extremos, no así, la Mediana

15 15 Cuál de los dos valores es más adecuado para la distribución de los datos, la Media o la Mediana??? Límite real f 0-1060 10-2080 20-3030 30-10020 100-50010 200 c 5 15 25 65 300 F 60 140 170 190 200 Ejercicio

16 16 La medida de tendencia central más adecuada para describir estos datos es la MEDIANA datos es la MEDIANA

17 17 Es aquel valor de la variable con mayor frecuencia absoluta. 3.- Moda de una variable aleatoria Puede no ser única

18 18 (Ejemplo: TALLA) Moda= 184.2 Como conocemos cada uno de los datos, podemos ver el que más se repite:

19 19 Medidas de Posición Dividen el conjunto de datos ordenados en partes iguales Las dos medidas de posición más usuales son: Percentiles Cuartiles

20 20 Es la observación, P k, que deja por debajo de sí el k% de la población. 1.-Percentiles PERCENTIL DE ORDEN k: Deja debajo de sí el 50% de los datos ordenados Deja debajo de sí el 50% de los datos ordenados P 25 Deja debajo de sí el 25% de los datos ordenados P 75 = Deja debajo de sí el 75% de los datos ordenados Son 99 valores que dividen en 100 partes iguales el conjunto de datos ordenados. Ejemplo, el percentil de orden 67 deja por debajo de sí el 67% de las observaciones, y por encima queda el 33% P 50 Mediana

21 21 Si n es el número de observaciones: 1º) Primero ordenamos las observaciones de menor a mayor 2º) Calculamos el k% de n 3º)Contando los datos desde el valor menor al mayor, el percentil de orden k será aquel valor de la variable ubicado en la posición número: orden k será aquel valor de la variable ubicado en la posición número:

22 22 176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1 (Ejemplo: TALLA) Datos ordenados: n= 20 P 67 Deja aproximadamente 67% de los datos bajo de sí (aprox. 13 datos), y el 33% sobre síDeja aproximadamente 67% de los datos bajo de sí (aprox. 13 datos), y el 33% sobre sí Calculemos el percentil de orden 67%

23 23 2.-Cuartiles Segundo cuartil (Q2) P 50 =Mediana Son los 3 valores que dividen al conjunto de datos ordenados en cuatro partes iguales Primer cuartil (Q1) P 25 Tercer cuartil (Q3) P 75

24 24 Medidas de Dispersión Nos dicen hasta qué punto las medidas de tendencia central son representativas como síntesis de la información. Cuantifican la separación o la variabilidad de los valores de la distribución respecto al valor central. Las más usadas son: Rango(Recorrido) Desviación Estándard

25 25 1.-Rango o Recorrido RANGO (RECORRIDO) = Valor Máximo - Valor Mínimo. Inconvenientes del RANGO (RECORRIDO): No utiliza todas las observaciones (sólo dos de ellas). Se puede ver muy afectado por alguna observación extrema. El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier caso, nunca disminuye.

26 26 (Ejemplo: TALLA) Valor Máximo= Valor Mínimo= 176.5 198.1 Rango o Recorrido= 198.1 – 176.5= 21.6 Sólo depende del valor máximo (198.1) y del valor Mínimo (176.5) 176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1

27 27 (Ejercicio: Concentración urinaria de plomo en niños Concentración de plomo (µmol/24hr) 0.2 1.5 0.6 2.0 0.8 2.1 (x-promedio) 0.2 - 1.2= -1 1.5 - 1.2=0.3 0.6 - 1.2= -0.6 2.0 - 1.2=0.8 0.8 - 1.2=-0.4 2.1 - 1.2=0.9 0

28 28 S2S2=S2S2= solución

29 29 Es la media de las diferencias cuadrática de n puntua- ciones con respecto a su media aritmética. Desviación Estándar (S): 2.-Varianza (S 2 ) y desviación estándar(S)

30 30 (Ejemplo: TALLA) Datos: 184.2191.8188.0196.2178.4 184.2195.4189.2186.0194.3 190.5190.5198.1188.0184.2 176.5184.2193.5195.6 186.3

31 31 En SPSS

32 32 Medidas de Forma 1.- Asimetría Coef. de Asimetría <0 Coef. de Asimetría =0 Coef. de Asimetría >0

33 33 Ejemplo Moda <Mediana<Media

34 34 En SPSS Moda <Mediana  Media Si bien se nota una leve cola hacia la izquierda, la asimetría es sutil por ello que izquierda, la asimetría es sutil por ello que los valores son cercanos los valores son cercanos

35 35 2.- Apuntamiento o curtosis Curtosis >0 Curtosis =0 Curtosis <0 Distribución mesocúrtica : presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). Distribución leptocúrtica : presenta un elevado grado de concentración alrededor de los valores centrales de la variable. Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable.

36 36 En SPSS

37 37 En SPSS

38 38 Ejercicio Datos I: 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5 Datos II: 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6 Datos III: 2, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 6 Datos IV: 3, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 5 Promedio=Mediana= Promedio=Mediana= Promedio=Mediana= Promedio=Mediana=

39 39 Datos xx MedModaRangoP 25 P 75 P 75 -P 25 S I44533521 II44333521 III44444401 IV443 y 523521

40 40 Importante para describir los datos!!!!!!!!!!!!...... Medidas de Dispersión Medidas de Tendencia Central Medidas de posición + + Gráficos:Histograma, BoxPlot +

41 41 RESUMEN : Medidas descriptivas  Posición Dividen un conjunto ordenado de datos en grupos con la misma cantidad de datos. Percentiles, cuartiles  Centralización Indican valores respecto alos cuales los datos parecen agrupares. Media, mediana y moda  Dispersión Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. Varianza, desviación estándar, rango o recorrido  Forma Asimetría y apuntamiento Asimetría y apuntamiento

42 42 Elección de medidas de tendencia central y de dispersión Variable Nominal Variable Ordinal Moda Mediana Moda Percentiles Variable Contínua: Con distribución desconocida o asimétricaCon distribución desconocida o asimétrica Con distribución simétrica y unimodal (Ej: Normal)Con distribución simétrica y unimodal (Ej: Normal) Mediana Percentiles Media Desviación estándard


Descargar ppt "1 Ejemplo Consideremos los datos de un estudio donde se les mide la talla en centímetros a 20 jugadores del equipo Nacional de Handbol de EE. UU. seleccionados."

Presentaciones similares


Anuncios Google