La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Estadística Descriptiva: 2. Medidas de Tendencia y Dispersión

Presentaciones similares


Presentación del tema: "Estadística Descriptiva: 2. Medidas de Tendencia y Dispersión"— Transcripción de la presentación:

1 Estadística Descriptiva: 2. Medidas de Tendencia y Dispersión
Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María

2 Estadística Descriptiva Objetivo
Obtener información desde una muestra, que permita entender o formular hipótesis acerca del fenómeno que se estudia. Herramientas básicas: Gráficos: descripciones cualitativas Estadísticas: descripciones cuantitativas de la tendencia y variabilidad presente en una muestra.

3 Estadística Descriptiva Medidas de Tendencia y Dispersión

4 Medidas de Tendencia Si tuvieramos que resumir en un sólo valor representativo todo el conjunto de observaciones, ¿qué valor usamos?.

5 Medidas de Tendencia Moda: Valor o clase de valores que se observa con
mayor frecuencia en la muestra. Puede no existir o no ser único. Funciona para cualquier tipo de dato: categóricos, ordinales ó numéricos.

6 Medidas de Tendencia Promedio o Media Muestral: Centro geométrico del conjunto de valores observados Requiere datos numéricos

7 Medidas de Tendencia Mediana: Se trata del valor que divide el rango de valores observados en dos mitades con el mismo número de observaciones Su cómputo requiere ordenar la muestra Si tenemos un número impar de observaciones la mediana es exactamente el valor del centro: (n+1)/2 Si tenemos un número par de observaciones la mediana se computa “usualmente” como el promedio de las observaciones n/2 y (n/2)+1

8 Medidas de Tendencia Robustez de la Media versus la Mediana
La media es extremadamente sensible a situaciones en que hay valores numéricamente muy distantes del resto (outliers) La mediana en cambio permite obtener valores más representativos en estos casos Ejemplo: (1, 2, 2, 2, 3, 9)

9 Medidas de Tendencia Mediana Moda Media Aritmética Q1 Q2 Q3 Q4 Rango
0,0000 0,0500 0,1000 0,1500 0,2000 0,2500 0,3000 0,3500 0,4000 0,4500 0,5000 4 5 6 7 1 2 3 Q Q Q Q4 Moda Media Aritmética Mediana Rango

10 Medidas de Tendencia Robustez de la Media versus la Mediana

11 Medidas de Tendencia (…) en los 70 (…) la razón de los salarios del percentil noventa y el percentil diez era de 3.4 veces, en 2005 ésta estaba en alrededor de 5 veces

12 Medidas de Tendencia Percentiles: valores que acumulan una cierta frecuencia relativa. El i-ésimo percentil es el primer valor que acumula al menos i/100 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 102,5 110,5 118,5 126,5 134,5 142,5 150,5 158,5 166,5

13 Medidas de Tendencia Percentiles:
Si los datos se ordenan de orden ascendente de magnitud, entonces el percentil Pi para i = 1, 2, … 99 si es entero en otro caso

14 Medidas de Tendencia Cuartiles: valores que acumulan una frecuencias de 1/4 (Q1) , 2/4 (Q2) y 3/4 (Q3) 102,5 110,5 118,5 126,5 134,5 142,5 150,5 158,5 166,5

15 Medidas de Tendencia Cuartiles:
Si los datos se ordenan de orden ascendente de magnitud, entonces el cuartil Qi para i = 1, 2, 3 si es entero en otro caso

16 Medidas de Tendencia Es muchos casos las medidas de tendencia anteriores deben o quieren calcularse sobre datos que ya han sido agrupados Límites 106,5-114,5 114,5-122,5 122,5-130,5 130,5-138,5 138,5-146,5 146,5-154,5 154,5-162,5 Marca 110,5 118,5 126,5 134,5 142,5 150,5 158,5 Frecuencias ABS - REL - REL. AC. , ,125 , ,2 , ,325 , ,525 , ,675 , ,85 ,

17 Medidas de Tendencia La organización en clases permite reducir el efecto del ruido o errores en los datos: se pesa un intervalo y su frecuencia, no la frecuencia de un sólo valor 1 2 3 4 5 6 7 8 9 110,5 118,5 126,5 134,5 142,5 150,5 158,5 Histograma

18 Medidas de Tendencia Promedio o Media Muestral con datos agrupados ni
ni : Frec. relativa Clase i fi : Frec. relativa Clase i Ci : Marca Clase i k : N° de clases C1 C2 C3

19 Medidas de Tendencia Moda con datos agrupados. La clase modal se determina como la clase con mayor frecuencia. D1 nM D2 n1 n2 L : Límite inferior Clase modal aM : Amplitud Clase Modal (CM) D1 : nM - n1 D2 : nM - n2 nM : Frec. absoluta Clase Modal n1 : Frec. absoluta Clase anterior a CM n2 : Frec. absoluta Clase posterior a CM aM L CM

20 Medidas de Tendencia Mediana con datos agrupados Fe-1 fe
ojiva Fe-1 fe L : Límite inferior Clase Mediana (C Me) Fe-1 : Frec. Rel. Acumulada hasta antes (C Me) fe : Frecuencia Rel. (C Me) ae : Amplitud (C Me) ae L

21 Medidas de Tendencia Percentiles con datos agrupados FPi-1 fPi aPi L
L :Límite inferior percentil i-ésimo FPi-1: Frec. Rel. acumulada hasta antes de la clase percentil i-ésimo aPi : Amplitud percentil i-ésimo fPi : Frecuencia Rel. de la clase del percentil i-ésimo ojiva FPi-1 fPi aPi L

22 Medidas de Tendencia Cuartiles con datos agrupados FCi-1 fCi aCi L
L :Límite inferior cuartil i-ésimo FPi-1: Frec. Rel. acumulada hasta antes de la clase del cuartil i-ésimo aPi : Amplitud cuartil i-ésimo fPi : Frecuencia Rel. de la clase del cuartil i-ésimo ojiva FCi-1 fCi aCi L

23 Medidas de Tendencia: Valores representativos de toda la muestra:
Media, Moda, Mediana, Quartiles y Percentiles.

24 Medidas de Dispersión ¿Cómo damos cuenta de la variabilidad del conjunto de observaciones?: podemos medir las diferencias observadas con respecto a nuestras medidas de tendencia

25 Medidas de Dispersión Índice de Variación: Frecuencia con que no se observa la moda o la clase modal en la muestra

26 Medidas de Dispersión Varianza Muestral: promedio de las diferencias al cuadrado con respecto a la media. Datos Agrupados: Datos NO Agrupados: fi : Frec. relativa Clase i xi : Marca Clase i x : Media Aritmética ni : Frec. absoluta Clase i n : Tamaño Muestra k : N° de clases s2 : Variancia Muestral x : Media Aritmética xi : i-ésimo valor observado n : Tamaño Muestra _ _

27 Medidas de Dispersión Desviación Estándar: Raíz cuadrada de la varianza. Tiene las mismas “unidades de medida” que las observaciones de la muestra Datos Agrupados: Datos NO Agrupados:

28 Medidas de Dispersión Desviación Media: Promedio de las diferencias absolutas con respecto a la media. Tiene las mismas “unidades de medida” que las observaciones de la muestra Datos Agrupados: Datos NO Agrupados:

29 Medidas de Dispersión Rango: Diferencia entre el máximo y el mínimo valor observado en la muestra. Rango Percentil: Diferencia entre P90 y P10: aproximación más robusta al rango. Rango InterCuartílico: Distancia promedio de los cuartiles con respecto a la mediana (segundo quartil)

30 Medidas de Dispersión: grado de variabilidad con respecto a las tendencias: Tasa de Variación, Varianza Rango InterQuartílico.

31 BoxPlots Q1 Q2 Q3 Cuartiles 1, 2 y 3 Valores Atípicos Valores Atípicos
3 IRQ 3 IRQ Mediana Media

32 BoxPlots Representación visual para describir, simultáneamente, varias características importantes tales como: Centro Dispersión Asimetría de la distribución Identificación de las observaciones (valores) atípicas Q Q Q3 3 IRQ 3 IRQ

33 BoxPlots en Matlab


Descargar ppt "Estadística Descriptiva: 2. Medidas de Tendencia y Dispersión"

Presentaciones similares


Anuncios Google