La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Medidas de centralización:  Media aritmética, mediana y moda para: i) listas de datos ii) datos agrupados en una tabla de frecuencia iii) datos agrupados.

Presentaciones similares


Presentación del tema: "Medidas de centralización:  Media aritmética, mediana y moda para: i) listas de datos ii) datos agrupados en una tabla de frecuencia iii) datos agrupados."— Transcripción de la presentación:

1 Medidas de centralización:  Media aritmética, mediana y moda para: i) listas de datos ii) datos agrupados en una tabla de frecuencia iii) datos agrupados en intervalos de clase.  Cuartiles quintiles y percentiles.  Medidas de dispersión : rango, desviación standard y varianza para listas de datos.  Significados de valores anteriores.

2 Medidas de centralización: Una medida de centralización es un valor típico o representativo de un conjunto de datos. Estos valores tienden a situarse en el centro del conjunto de datos ordenados, razón por la que se conocen como medidas de centralización, siendo las más comunes la media aritmética, la mediana y la moda, donde la aplicación de una o de otra depende de los resultados que se pretende sacar de los datos.

3 1) Media Aritmética: Es el promedio de todos los valores de la variable; se calcula sumando todos los valores y dividiendo por el número de ellos. Ejemplo: i) 3, 5, 2, 4, 3,1, 3 3 + 5 + 2 + 4 + 3 + 1 + 3 7 X = 21 7 X = 3

4 ii) 6, 12, 8, 7, 6, 9 6 + 12 + 8 + 7 + 6 + 9 6 X = 48 6 X = Si los datos están agrupados en una tabla de frecuencias: La media aritmética se obtiene sumando los productos de las variables por las frecuencias respectivas y dividiendo este por la suma de las frecuencias absolutas. Ejemplo: 8

5 En la siguiente tabla de frecuencia se registran las notas de una prueba: Variable Nota frecuencia absoluta Variable por f. absoluta 2 3 4 5 6 7 1 2 7 8 6 3 2 6 28 40 36 21 Suma =133 n = 27 X = 133 27 X = 4,925 El promedio de las 27 notas es 4,925.

6 Si los datos están agrupados en intervalos de clase: La media aritmética se calcula sumando los productos de la frecuencia absoluta por las marcas de clase del intervalo y dividiendo por la suma de las frecuencias absolutas o tamaño de la muestra. Ejemplo: Al calcular la media aritmética para los datos de la siguiente tabla de frecuencias:

7 n = 20 Variable Puntaje frecuencia absoluta f Marca de clase xi f · xi 0 - 10 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 10 - 20 2 2 3 6 4 2 1 5 15 25 35 45 55 65 10 30 75 210 180 110 65  f·xi= 680 X = 680 20 X = 34 El promedio de los 20 puntajes es 34. La media aritmética corresponde al valor promedio de los “n” datos dados o distribuidos en la tabla de frecuencias.

8 b) Mediana: Es el valor que ocupa el lugar central entre todos los datos previamente ordenados; es el valor de la variable que en una distribución de frecuencias, deja igual número de valores antes y después de él. i) Si el número de datos es impar: La mediana coincide con el valor central; es decir es el término medio. ii) Si el número de datos es par: La mediana queda determinada por la semisuma de los valores centrales.

9 Ejemplo: i) 3, 5, 2, 4, 3,1, 3 Ordenando: 1, 2, 3, 3, 3, 4, 5 Md Md = 3 ii) 6, 12, 8, 7, 6, 9 Ordenando: 6, 6, 7, 8, 9, 12 Md Md = 7 + 8 2 Md = 15 2 Md = 7,5

10 Si los datos están agrupados en una tabla de frecuencias: La mediana corresponde al valor de la variable de la frecuencia acumulada que es igual o mayor que la mitad de los datos. Ejemplo: En la siguiente tabla de frecuencia se registran las notas de una prueba:

11 Variable Nota frecuencia absoluta Frecxuencia acumulada 2 3 4 5 6 7 1 3 7 8 6 3 1 4 11 19 25 28 n = 28 Si n =  n2n2 = La frecuencia acumulada que es  que es ; luego: 28 2 = 14 19 Md = 5

12 Si los datos están agrupados en intervalos de clase: La mediana coincide con la marca de clase del intervalo que contiene el valor central es decir el dato n/2 ; intervalo que con la frecuencia acumulada se ubica. Ejemplo: Al calcular la mediana para los datos de la siguiente tabla de frecuencias:

13 Variable Puntaje frecuencia absoluta f Marca de clase xi frecuencia acumulada 0 - 10 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 10 - 20 2 2 3 6 4 2 1 5 15 25 35 45 55 65 2 4 7 13 17 19 20 Si n =  n2n2 = 20 2 = 10 n = 20 30 - 40 está en el intervalo: Luego la mediana es: Md = 35 Md

14 3) Moda: Es el valor de la variable estadística que más se repite en una serie de datos. Ejemplo: i) 3, 5, 2, 4, 3,1, 3 ii) 6, 12, 8, 7, 6, 9 Mo = 3 6 De haber dos cantidades que se repitan mayor e igual número de veces habrá dos modas, siendo bimodal esta distribución. 3 es el valor que más se repite 6 es el valor que más se repite

15 Si los datos están agrupados en una tabla de frecuencias: La moda corresponde al valor de la variable de mayor frecuencia absoluta. En la siguiente tabla de frecuencia se registran las notas de una prueba: Ejemplo:

16 Variable Nota frecuencia absoluta 2 3 4 5 6 7 1 2 7 8 6 3 La mayor frecuencia abso- luta es: 8 luego la moda es: Mo = 5 (variable de mayor frecuencia absoluta)

17 Si los datos están agrupados en intervalos de clase: La moda corresponde a la marca de clase del intervalo de mayor frecuencia absoluta. Ejemplo: Al calcular la moda para los datos de la siguiente tabla de frecuencias:

18 Variable Puntaje frecuencia absoluta f Marca de clase xi 0 - 10 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 10 - 20 2 2 3 6 4 2 1 5 15 25 35 45 55 65 La mayor frecuencia absoluta es: 6 La moda está en el intervalo: 30 - 40 luego la moda es: Mo = 35

19 Ejercitación: 1) Dada la siguiente lista de datos correspondiente a las edades de 8 niños; determine: 6, 7, 8, 9, 9, 10, 11, 12 X = a) 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12 8 72 8 X = 9 = (promedio de las 8 edades) b) 6, 7, 8, 9, 9, 10, 11, 12 Md = 6, 7, 8, 9, 9, 10, 11, 12 c) Mo = (edad que más se repite) 9 Md = 9 + 9 2 18 2 == 9 9 (edad central)

20 2) Dada la siguiente tabla de frecuencias en la que se resumen las edades de un grupo de 20 amigos: Variable Edad frecuencia absoluta Variable por f. absoluta frecuencia acumulada 13 14 15 16 17 4 5 7 3 1 4 9 16 19 20 70 105 48 17 Suma =292 n = 20 X = 292 20 X = 14,6  Media aritmética: 52

21 Si n =  n2n2 = 20 2 = 10 Mediana: La frecuencia acumulada que es  que es ; luego: 10 16 Md = 15 Variable Edad frecuencia absoluta Variable por f. absoluta frecuencia acumulada 13 14 15 16 17 4 5 7 3 1 4 9 16 19 20 52 70 105 48 17 n = 20 (variable de frec. acum mayor o igual a n/2 )

22 Variable Edad frecuencia absoluta Variable por f. absoluta frecuencia acumulada 13 14 15 16 17 4 5 7 3 1 4 9 16 19 20 52 70 105 48 17 Moda: La mayor frecuencia absoluta es: 7 luego la moda es: Mo = 15 (variable de mayor frecuencia absoluta)

23 3) Para los datos agrupados en la siguiente tabla de frecuencia, en la que se distribuyen los pesos de 40 personas; calcular: n = 40  f·xi= 2.210 Variable Peso frec. abs. f Marca de clase xi f · xi frec. acum. fa 30 - 40 50 - 60 60 - 70 70 - 80 80 - 90 40 - 50 4 8 15 10 2 1 4 12 27 37 39 40 35 45 55 65 75 85 140 360 825 650 150 85 X = 2.210 40 X =  55,25 Media aritmética:

24 n = 40 Variable Peso frec. abs. f Marca de clase xi f · xi frec. acum. fa 30 - 40 50 - 60 60 - 70 70 - 80 80 - 90 40 - 50 4 8 15 10 2 1 4 12 27 37 39 40 35 45 55 65 75 85 140 360 825 650 150 85 Si n =  n2n2 = 40 2 = 20 50 - 60 está en el intervalo: Luego la mediana es: Md = 55 (marca de clase del intervalo que contiene el valor central) Mediana:

25 n = 40 Variable Peso frec. abs. f Marca de clase xi f · xi frec. acum. fa 30 - 40 50 - 60 60 - 70 70 - 80 80 - 90 40 - 50 4 8 15 10 2 1 4 12 27 37 39 40 35 45 55 65 75 85 140 360 825 650 150 85 La mayor frecuencia absoluta es: 15 La moda está en el intervalo: 50 - 60 luego la moda es: Mo = 55 Moda: (marca de clase del intervalo de mayor frecuencia absoluta)

26 Relación entre la media aritmética, mediana y moda: En las siguientes figuras, se muestran las posiciones relativas de la media aritmética, mediana y moda para curvas de frecuencias ya sea simétrica o sesgadas a la derecha y a la izquierda respectivamente. curva simétrica curva sesgada a la derecha curva sesgada a la izquierda

27 Cuartiles quintiles y percentiles: Para cualquier colección de datos numéricos ordenada de menor a mayor se define: Cuartiles: se divide el total de datos en cuartos; cada cuartil queda determinado por la semisuma del valor anterior y posterior a cada línea de corte. Ejemplo: Los siguientes datos corresponden a la estatura de 12 alumnos expresada en cm. donde 12:4 = 3 ; luego cada 3 datos se encuentra cada cuartil: 147, 148, 149, 149, 150, 150, 151, 151, 152, 153, 153, 154 149+149 2 150+151 2 152+153 2 C 1 =149 C 2 =150,5 C 3 =152,5

28 El cuartil 1 o inferior: es 149; es decir 1/4 o el 25% de los datos son menores o iguales a 149 y los 3/4 o el 75% iguales o superiores. El cuartil 2: es 150,5 (coincidente con la mediana) significa que los 2/4 es decir la mitad o el 50% de los datos es menor o igual a 150,5 y la otra mitad o 50% iguales o superiores. El cuartil 3 o superior: es 152,5 es decir 3/4 de los datos o 75% son menores o iguales a 152,5 y 1/4 o 25% iguales o superiores. 147, 148, 149, 149, 150, 150, 151, 151, 152, 153, 153, 154 149+149 2 150+151 2 152+153 2 C 1 =149 C 2 =150,5 C 3 =152,5

29 Quintiles: se divide el total de datos en cinco partes iguales ; cada quintil queda determinado por la semisuma del valor anterior y posterior a cada línea de corte. Ejemplo: Los siguientes datos corresponden a la edad de 20 alumnos donde 20:5 = 4 ; luego cada 4 datos se encuentra cada quintil : 8, 8, 9, 9,10,10,11,11,11,11,12,12,13,13,13,14,14,14,14,15 9+10 2 Q 1 =9,5 11+11 2 Q 2 =11 14+14 2 Q 4 =14 12+13 2 Q 3 =12,5

30 8, 8, 9, 9,10,10,11,11,11,11,12,12,13,13,13,14,14,14,14,15 9+10 2 Q 1 =9,5 11+11 2 Q 2 =11 14+14 2 Q 4 =14 12+13 2 Q 3 =12,5 Los quintiles dividen el total de datos en quintos o en 20%; así el significado del: Q 1 es: 1/5 o 20% de los datos son  a 9,5 y los 4/5 o 80% iguales o superiores a este valor. Q 2 es: 2/5 o 40% de los datos son  a 11 y los 3/5 o 60% iguales o superiores a este valor. Q 3 es: 3/5 o 60% de los datos son  a 12,5 y los 2/5 o 40% iguales o superiores a este valor. Q 4 es: 4/5 o 80% de los datos son  a 14 y 1/5 o 20% iguales o superiores a este valor.

31 Percentiles: se divide el total de datos en 100 partes iguales ; cada percentil queda determinado por la semisuma del valor anterior y posterior a cada línea de corte. Al dividirse el total de datos en 100 partes iguales, cada percentil equivale a un 1%. Ejemplo: Dadas las siguientes 30 notas: 1,4 2,4 2,5 2,5 3,3 3,3 3,4 3,6 3,9 3,9 4,1 4,1 4,2 4,2 4,3 4,3 4,4 4,5 4,5 4,8 4,9 5,1 5,3 5,5 5,6 5,8 5,8 6,2 6,7 7,0 a) Determine el percentil 40:

32 1,4 2,4 2,5 2,5 3,3 3,3 3,4 3,6 3,9 3,9 4,1 4,1 4,2 4,2 4,3 4,3 4,4 4,5 4,5 4,8 4,9 5,1 5,3 5,5 5,6 5,8 5,8 6,2 6,7 7,0 a) Determine el percentil 40: El 40% de 30 es: ;luego el percentil 40 esta determinado por la semisuma de los datos y. 12 13 4,1+4,2 2 P 40 =4,15 P 40 = = 8,3 2 2/5 o 40% de los datos son  a 4,15 y los 3/5 o 60% iguales o superiores a este valor. 40 100 = 2 5

33 1,4 2,4 2,5 2,5 3,3 3,3 3,4 3,6 3,9 3,9 4,1 4,1 4,2 4,2 4,3 4,3 4,4 4,5 4,5 4,8 4,9 5,1 5,3 5,5 5,6 5,8 5,8 6,2 6,7 7,0 b) Determine el percentil 80: El 80% de 30 es: ;luego el percentil 40 esta determinado por la semisuma de los datos y. 24 25 5,5+5,6 2 P 80 =5,55 P 80 = = 11,1 2 4/5 o 80% de los datos son  a 5,55 y 1/5 o 20% iguales o superiores a este valor. 80 100 = 4 5

34 Medidas de dispersión: Al grado en que los datos numéricos tienden a extenderse alrededor de un valor medio se le llama variación o dispersión de los datos. Se utilizan distintas medidas de dispersión, siendo las más empleadas el rango, desviación típica o standard y la varianza. a) Rango: Queda determinado por la diferencia entre el dato mayor y menor de todos ellos; también se le llama por recorrido. Ejemplo:

35 Para i) 3, 5, 2, 4, 3, 1, 3 ii) 6, 12, 8, 7, 6, 9 Rango: 5 - 1 = 4 12 - 6 = 6 b) Desviación Tipica o standard: Valor que permite cuantificar la variabilidad de los datos, por consiguiente si estos son homogéneos o heterogéneos, definiéndose por:

36 Para i) 3, 5, 2, 4, 3, 1, 3 con xixi x i -x (x i - x) 2 1 2 3 3 3 4 5 1-3=-2 2-3=-1 3-3= 0 4-3= 1 5-3= 2 4 1 0 0 0 1 4 10 ii) 6, 12, 8, 7, 6, 9 con 6 6 7 8 9 12 6-8=-2 7-8=-1 8-8= 0 9-8= 1 12-8=4 4 4 1 0 1 16 26 xixi x i -x (x i - x) 2

37 Notar que para (ii) S es ______________ que para (i); luego en (ii) hay una mayor variabilidad entre los datos, siendo estos más heterogéneos a diferencia de (i) donde los datos son más homogéneos es decir están mas cerca del promedio X. mayor

38 c) Varianza: La varianza de un conjunto de datos se define como el cuadrado de la desviación típica; es decir viene dada por S 2. Ejemplos: Para i) 3, 5, 2, 4, 3, 1, 3 ii) 6, 12, 8, 7, 6, 9 con S = 1,195 V = (1,195) 2 V = 1,428 con S = 2,08 V = (2,08) 2 V = 4,326

39 Medidas de centralización:  Media aritmética, mediana y moda para: i) listas de datos ii) datos agrupados en una tabla de frecuencia iii) datos agrupados en intervalos de clase.  Cuartiles quintiles y percentiles.  Medidas de dispersión : rango, desviación standard y varianza para listas de datos.  Significados de valores anteriores.


Descargar ppt "Medidas de centralización:  Media aritmética, mediana y moda para: i) listas de datos ii) datos agrupados en una tabla de frecuencia iii) datos agrupados."

Presentaciones similares


Anuncios Google