Medidas de resumen
Medidas de resumen Se utilizan para describir información Medidas de posición Medidas de dispersión Medidas de forma
Medidas d eposición Se utilizan para describir información y se dividen en: Medidas de tendencia central Medidas no centrales
Medidas de tendencia central Son medidas que tienden a ubicarse en el centro de los datos cuando estan ordenados por magnitud. Son medidas de tendencia central: el promedio, la mediana y la moda
Promedio Es una medida de tendencia central que se utiliza para describir información. El promedio se define como la suma de los datos dividido por el número total de datos.
La dos últimas sirven para datos agrupados.
Ejemplo Calificación de 5 alumnos. 1,5-3,4-5-6,1-7,2
El promedio es sensible a los valores extremos El promedio es un buen valor cuando no hay valores extremos. El promedio representa el centro de gravedad de los datos.
Ejemplo Calcule el promedio par el puntaje de una prueba. Interprete
La mediana Es una medida de tendencia central que se usa para describir información. La mediana es el valor de la variable que supera a lo mas al 50% de las observaciones y es superada a lo mas por el otro 50% de las observaciones, cuando los datos están agrupados por magnitud.
Ejemplo1 X= edad en años. 4-6-8-10-12 Med= 8 años El 50% de los alumnos tiene menos de 8 años
Ejemplo 2 X= Edad 4-6-10-8-14-12 Med= 9 años El 50% de los alumnos tiene menos de 9 años.
Formula
Lirj = Limite inferior real del intervalo j que contiene a la mediana. Fj-1= frecuencia acumulada del intervalo mediano Fj= frecuiencia absoluta del intervalo que contiene a la mediana C= amplitud del intervalo
¿Cómo se determina el intervalo j que contiene a la mediana? Calculando el 50% de los datos, este número se busca en la columna de las frecuencias absolutas acumuladas. El primero que lo contenga es el intervalo
La mediana no es sensible para datos extremos.
La moda Es una medida de tendencia central para describir información. Es el valor de la variable que mas se repite. Cuando los datos estan tabulados se va a aproximar por la marca de clase con mayor frecuencia absoluta. Puede existir mas de una moda. La moda es la única medida de tendencia centra que se puede utilizar para variable cualitativas.
X= edad 6-7-5-5-4-3-4-5 Mod = 5 años La edad mas frecuente es 5 años. X= Color favorito Azul-azul- rojo-negro- azul Mod = azul El color que mas prefieren es el azul
Medidas de dispersión SE utiliza para describir la homogeneidad de los datos. Grupo 1 : Edad en años 20-21-22-23-24 Grupo 2 18-20-22-24-26 En ambos grupos las personas tienen en promedio 22 años. ¿Significa que los grupos son iguales en edades?
Rango Es una medida de dispersión que se utiliza para describir información. Se define como la diferencia entre la mayor observación y la menos. R1= 4 años R2=8 años R2/R1= 2 el grupo2 tiene el doble de dispersión que el grupo q
El rango no es una buena medida si se tienen valore extemos
Desviación estandar media DM1=1,2 años DM2=2,4 años Dm2/DM1= 2 El grupo 2 tiene el doble d dispersión que el grupo1
La desviación media es una buena medida de dispersión La dificultad de tratamiento algebraico del valor absoluto hace difícil su uso
Varianza y desviación estandar En general la varianza no se utiliza ya que amplifica la dispersión de los datos Var 1= 2 años² Var 2= 8 años ² La unidad al cuadrado no tiene sentido estadistico
DE1= 1,41 cada dato se desvía del promedio 1,41 años DE2= 2,82 Cada dato se desvía 2,82 años del promedio DE2/DE1= 2 El grupo2 tiene el doble d desviación estandar que el grupo 1
Coeficiente de variación Es una medida de dispersión relativa ( no tiene unidad) indica que porcentaje es la desviación estandar de la media
Ejemplo La siguiente información representa los pesos de las mamas y la de sus bebes recién nacidos Peso mamá (kg) Peso bebe(Kg) 72 2,5 76 3,2 84 3,8 65 4,2 70 4,8
Cv mama= 8,68% CV bebe= 21,48% Por lo tanto el peso de los bebes es mas disperso que el de las mamas. El CV es útil para comparar la dispersión de 2 grupos cuando los promedios son muy diferentes.