Cálculo de medidas de posición o centralización para datos a granel Montoya.-
Medidas de centralización Para datos a granel: Considere una muestra de notas de un alumno en la asignatura de matemática: Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 Calculo de la media aritmética: También se puede calcular suponiendo una media y calculando los desvíos respecto de los datos: Ejemplo: supongamos que la media es Xs= 50 Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 Xi-Xs -0.5 -1.5 1.7 -0.4 0.3 -0.2 1.2 1.4 2.0 Suma de desvíos = 3.6 =5.0+
Media geométrica Para el ejemplo: =5.3 Media armónica: : G= Para el ejemplo: H=
Para el ejemplo: RMS=
La moda para datos a granel (Mo): Es el dato que más se repite, puede haber más de una moda o ninguna, siempre es un dato de la muestra. Para el ejemplo: Para el ejemplo: Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 Mo= 4,6
La mediana para datos a granel (Md): Corresponde al valor central de los datos previamente ordenada (n: impar), o al promedio de los dos datos centrales (n: par).No siempre es un dato de la muestra: Para el ejemplo Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 Ordenando los datos: Notas 3.5 4.5 4.6 4.8 5.3 6.2 6.4 6.7 7 Md=
Medidas de dispersión para datos a granel:
El más elemental es el rango de variación: Rg= mayor valor observado o medido- menor valor observado o medido Para el ejemplo: Rg= 7-3.5= 3.5 Desviación media: DM= Para el ejemplo Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 Con: Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 desvíos -0.9 -1.9 1.3 -0.8 -0.1 -0.6 0.8 1.0 1.6 =0 0.9 1.9 0.1 0.6 =17 DM=
Desviación estándar para la población: (es solo un estimativo) para la muestra Para el ejemplo: S= Desviación estándar para la población: (es solo un estimativo) Para el ejemplo: S= Nota: existen otras medidas de dispersión que se estudiaran con datos intervalares.
Ejercicio tipo con datos intervalares.
Cálculo de medidas de centralización para datos cuantitativos intervalares
clases Xi f fr. F% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 585.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 1
Se ordenan los datos de la siguiente forma : clases Xi f Xi*f 485.55 – 535.50 510.53 4 2042.12 535.51 – 585.46 560.49 9 5044.41 585.47 – 635.42 611.45 10 6114.50 635.43 – 685.38 660.41 7 4622.87 685.39 – 735.34 710.37 8 5682.96 735.35 – 785.30 760.33 2 1520.66 40 25027.52
Valor que coincide con el calculado anteriormente. Para el ejemplo: Supongamos como media supuesta la marca de clase de la segunda clase, esto es: 560.49, la tabla con los cálculos correspondientes, se puede ordenar en forma simplificada como se indica: Xi Desviación :Xi - Xs f (Xi-Xs)*f 510.53 510.53-560.49=-49.96 4 -199.84 560.49 560.49-560.49=0 9 611.45 611.45-560.49=50.96 10 509.60 660.41 660.41-560.49=99.92 7 699.44 710.37 710.37-560.49=149.88 8 1199.04 760.33 760.33-560.49=199.84 2 399.68 =2607.92 Valor que coincide con el calculado anteriormente.
clases Xi f fr. F% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 585.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 1
Luego la abscisa que deja la mitad de la superficie total a cada lado es: 586.465+34.965=621.43
CRITERIO TABULAR O INTERVALAR: clases Xi f fr. F% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 585.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 1 Md= 587.465+33.922=621.39
EN GENRAL:
clases Xi f fr. F% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 587.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 1
Medidas de dispersión para datos cuantitativos organizados tabularmente
Desviación media: DM= Para el ejemplo: Se sabe que la media es:
Desviación estándar: para la muestra Desviación estándar: para la población. Para el ejemplo:
Rango intercuartílico: Datos que se ubican entre el 25% y el 75% Para el ejemplo: El 25% de los datos: 25% de 40 = 10 De acuerdo a la tabla: Corresponderían a los 4 datos de la primera clase más los 6 que faltan de la segunda clase: Datos del primer cuartil: 535,505+ Datos del tercer cuartil: 75% de los datos: 75% de 40 = 30 Habrá que tomar los 4 de la primera clase, los 9 de la segunda, los 10 de la tercera y exactamente los 7 de la cuarta clase (suman 30) .En este caso se toma el límite inmediatamente superior de la cuarta clase, esto es: 685.38. Es decir el rango intercuartílico corresponde a todos los puntajes que se encuentran entre 568,81 y 685,38 (este criterio permite eliminar los outlier)
Nota: cualquier otro intercuartílico se calcula de la misma manera: Nota: el segundo intercuartílico corresponde a la mediana: En efecto: el 50% de los dados es 50% de 40 = 20 Habrá que tomar entonces: los 4 datos de la primera clase, los 9 de la segunda y los 7 restante de los 10 de la tercera clase, esto es: 587.465+ (que corresponde al valor calculado anteriormente) Nota: cualquier otro intercuartílico se calcula de la misma manera:
Ejemplo: cual es el rango de puntaje entre el tercer decil y el sexto decil? Tercer decil: 30% de 40 = 12 535.505+ =579.905 Sexto decil: 60% de 40 = 24 635.425+ El rango es entonces: 579.91 y 642.56 También se puede calcular parámetros como porcentajes de alumnos que se ubican en determinado rango de puntajes
Se procede como se indica Ejemplo ¿Qué % de alumnos se ubica entre los 548.34 puntos y los 694.15 puntos? Se procede como se indica (585.46-548.34)+10+7+=6.69+10+7+1.40=25.09=25 alumnos .Que corresponde al 62.5% del total .Es decir el 62.5% de la muestra se ubica en ese rango de notas. (585.46-548.34)+10+7+ =6.69+10+7+1.40=25.09=25 alumnos . decir el Que corresponde al 62.5% del total .Es 62.5% de la muestra se ubica en ese rango de notas.
Muchas gracias … Montoya.-