La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Qué es una Variable Aleatoria??????????

Presentaciones similares


Presentación del tema: "Qué es una Variable Aleatoria??????????"— Transcripción de la presentación:

1 Qué es una Variable Aleatoria??????????
Ejemplo Consideremos los datos de un estudio donde se les mide la talla en centímetros a 20 jugadores del equipo Nacional de Handbol de EE. UU. seleccionados al azar. La ley que asocia a cada hombre con su talla es una variable aleatoria (continua). A esta función que asocia a cada deportista con su talla la llamaremos variable aleatoria y la denotaremos por X. 184.2 191.8 178.4 .... etc X: Talla

2 Ejemplo X: Talla

3 Cómo ordenamos los datos???????????
En una: Tabla de Distribución de Frecuencia Qué es ????? Es un arreglo de los distintos valores que toma la variable con sus respectivas frecuencias (nº de veces que aparece cada valor de la variable en la muestra).

4 Distribución de frecuencia de ejemplo (TALLA)
Tabla de frecuencias Talla f 2 4 7 6 1 20 F 2 6 13 19 20 =

5 Distribución de frecuencia de ejemplo (TALLA)
Histograma

6 Medidas de Resumen Los fenómenos biológicos no suelen ser constantes
Necesitamos conocer: La tendencia central de los datos La dispersión o variación respecto de este centro Los datos que ocupan ciertas posiciones La simetría de los datos La forma en que los datos se agrupan

7 Medidas representativas de un conjunto de datos estadísticos

8 Medidas de Tendencia Central
Son medidas alrededor de las cuales se concentran los datos Las tres medidas más usuales de tendencia central son: Media Mediana Moda

9 1.-Media Aritmética (X) de una variable aleatoria (o Promedio)
Es la suma de todos sus posibles valores dividida por el n° total de datos (n) (Ejemplo: TALLA) Datos:

10 2.- Mediana(Med) de una variable aleatoria
Es el primer valor de la variable que deja por debajo y por sobre de sí al 50 % de las observaciones. Primero !!!!! Ordenamos los valores de menor a mayor Si n es el número de observaciones: a) n impar: mediana es el único valor central b) n par: mediana es el promedio de los dos valores centrales

11 Si la variable es la talla

12 (Ejemplo: TALLA) Datos ordenados: n= 20 par 10 datos
176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1 10 datos n= 20 par Mediana Promedio de 2 valores centrales Dejan aproximadamente 50% de los datos bajo y sobre sí (aprox. 10 datos)

13 (Ejemplo: PESO) Med=58 Datos ordenados:
39, 40, 42, 49, 51, 54, 56, 57, 58, 58, 58, 59, 63, 64, 66, 68, 69, 70, 70, 71,72 n= 21 impar Med=58 Mediana valor central único Deja aproximadamente 50% de los datos bajo y sobre sí (aprox. 10 datos)

14 Sea X una variable discreta con los siguientes valores:
Mediana= (5+7)/2= 6 Media= ( )/4=6.5 Si cambiamos la última observación por otra extrañamente grande X: 2, 5, 7, 125 ( )/4=34.75 Media= Mediana= (5+7)/2= 6 Conclusión: La Media es afectada por valores extremos, no así, la Mediana

15 Ejercicio Cuál de los dos valores es más adecuado para la distribución de los datos, la Media o la Mediana??? Límite real f 0-10 60 10-20 80 20-30 30 30-100 20 10 200 c 5 15 25 65 300 F 60 140 170 190 200

16 La medida de tendencia central más adecuada para describir estos
datos es la MEDIANA

17 3.- Moda de una variable aleatoria
Es aquel valor de la variable con mayor frecuencia absoluta. Puede no ser única

18 (Ejemplo: TALLA) Como conocemos cada uno de los datos, podemos ver el que más se repite: Moda= 184.2

19 Medidas de Posición Dividen el conjunto de datos ordenados en partes iguales Las dos medidas de posición más usuales son: Percentiles Cuartiles

20 1.-Percentiles Son 99 valores que dividen en 100 partes iguales el conjunto de datos ordenados. Ejemplo, el percentil de orden 67 deja por debajo de sí el 67% de las observaciones, y por encima queda el 33% PERCENTIL DE ORDEN k: Es la observación, Pk, que deja por debajo de sí el k% de la población. P25 Deja debajo de sí el 25% de los datos ordenados P50 Deja debajo de sí el 50% de los datos ordenados Mediana P75= Deja debajo de sí el 75% de los datos ordenados

21 1º) Primero ordenamos las observaciones de menor a mayor
Si n es el número de observaciones: 1º) Primero ordenamos las observaciones de menor a mayor 2º) Calculamos el k% de n 3º)Contando los datos desde el valor menor al mayor, el percentil de orden k será aquel valor de la variable ubicado en la posición número:

22 (Ejemplo: TALLA) Datos ordenados: Calculemos el percentil de orden 67%
176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1 P67 Deja aproximadamente 67% de los datos bajo de sí (aprox. 13 datos), y el 33% sobre sí

23 2.-Cuartiles Son los 3 valores que dividen al conjunto de datos ordenados en cuatro partes iguales P25 Primer cuartil (Q1) Segundo cuartil (Q2) P50=Mediana P75 Tercer cuartil (Q3)

24 Medidas de Dispersión Cuantifican la separación o la variabilidad de los valores de la distribución respecto al valor central. Nos dicen hasta qué punto las medidas de tendencia central son representativas como síntesis de la información. Las más usadas son: Rango(Recorrido) Desviación Estándard

25 1.-Rango o Recorrido RANGO (RECORRIDO) = Valor Máximo - Valor Mínimo.
Inconvenientes del RANGO (RECORRIDO): No utiliza todas las observaciones (sólo dos de ellas). Se puede ver muy afectado por alguna observación extrema. El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier caso, nunca disminuye.

26 (Ejemplo: TALLA) Valor Mínimo= 176.5 Valor Máximo= 198.1
176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1 Valor Mínimo= 176.5 Valor Máximo= 198.1 Rango o Recorrido= 198.1 – 176.5= 21.6 Sólo depende del valor máximo (198.1) y del valor Mínimo (176.5)

27 Concentración de plomo (µmol/24hr) 0.2 1.5 0.6 2.0 0.8 2.1
(Ejercicio: Concentración urinaria de plomo en niños Concentración de plomo (µmol/24hr) 0.2 1.5 0.6 2.0 0.8 2.1 (x-promedio) = -1 =0.3 = -0.6 =0.8 =-0.4 =0.9

28 solución S2=

29 2.-Varianza (S2) y desviación estándar(S)
Es la media de las diferencias cuadrática de n puntua- ciones con respecto a su media aritmética. Desviación Estándar (S):

30 (Ejemplo: TALLA) Datos: 184.2 191.8 188.0 196.2 178.4

31 En SPSS

32 Medidas de Forma 1.- Asimetría Coef. de Coef. de Asimetría =0

33 Ejemplo Moda <Mediana<Media

34 En SPSS Si bien se nota una leve cola hacia la Moda <MedianaMedia
izquierda, la asimetría es sutil por ello que los valores son cercanos Moda <MedianaMedia

35 2.- Apuntamiento o curtosis
Distribución mesocúrtica : presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). Distribución leptocúrtica : presenta un elevado grado de concentración alrededor de los valores centrales de la variable. Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable.

36 En SPSS

37 En SPSS

38 Ejercicio Datos I: Promedio= 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5
Mediana= 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5 Datos II: Promedio= Mediana= 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6 Datos III: Promedio= Mediana= 2, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 6 Datos IV: 3, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 5 Promedio= Mediana=

39 Datos x Med Moda Rango P25 P75 P75-P25 S I 4 5 3 2 1 II III IV 3 y 5

40 + + + Importante para describir los datos!!!!!!!!!!!!......
Medidas de Tendencia Central + Medidas de Dispersión + Medidas de posición + Gráficos:Histograma, BoxPlot

41 RESUMEN : Medidas descriptivas
Posición Dividen un conjunto ordenado de datos en grupos con la misma cantidad de datos . Percentiles, cuartiles Centralización Indican valores respecto alos cuales los datos parecen agrupares . Media, mediana y moda Dispersión Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización . Varianza, desviación estándar, rango o recorrido Forma Asimetría y apuntamiento

42 Elección de medidas de tendencia central y de dispersión
Variable Nominal Moda Moda Variable Ordinal Mediana Percentiles Variable Contínua: Mediana Con distribución desconocida o asimétrica Percentiles Con distribución simétrica y unimodal (Ej: Normal) Media Desviación estándard


Descargar ppt "Qué es una Variable Aleatoria??????????"

Presentaciones similares


Anuncios Google