2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas: Capítulos 2 a 6 del libro de Peña y Romo (1997) Capítulos 3 a 7 del libro de Portilla (2004)
MEDIDAS DESCRIPTIVAS ¿Para qué nos sirven? Estadística Aplicada a las Ciencias Políticas MEDIDAS DESCRIPTIVAS ¿Para qué nos sirven? ¿Se pueden calcular todas con todo tipo de variables? ¿Cuáles son las más adecuadas en cada caso? ¿De qué forma podemos sacar partido a nuestra calculadora?
Medidas de localización Estadística Aplicada a las Ciencias Políticas Medidas de localización Existen tres medidas comunes: la moda, la mediana y la media. Una muestra del número de años en el ayuntamiento de los últimos 24 alcaldes de Madrid 3 1 1 1 1 1 2 1 7 6 13 8 3 2 1 1 2 1 1 7 3 2 12 6
La moda Estadística Aplicada a las Ciencias Políticas Es el valor más frecuente ¿Podemos calcular la moda con datos cualitativos? ¿Tiene sentido esta definición con datos continuos? Puede haber más de una moda: bimodal-trimodal-plurimodal
Estadística Aplicada a las Ciencias Políticas La moda con datos (continuos) agrupados Ingresos y Derechos liquidados (millones de PTAS) Frecuencia absoluta ≤ 30 (30,45] 2 (45,60] 9 (60,75] (75,90] 10 (90,105] 3 (105,120] > 120 Total 60 Tenemos una clase modal ¿Qué hacemos si las clases son de distintas anchuras?
Un valor exacta para la moda con datos agrupados Estadística Aplicada a las Ciencias Políticas Un valor exacta para la moda con datos agrupados El centro del intervalo modal La moda
Es la observación que ocupa el lugar central. Estadística Aplicada a las Ciencias Políticas La mediana Es la observación que ocupa el lugar central. 5 3 11 21 7 5 2 1 3 ¿Qué valor toma la mediana? Ordenamos los datos de menor a mayor. Tenemos en cuenta también los que se repiten. La mediana, es el “CENTRO FÍSICO” ¿Cómo cambia el cálculo si N es par o impar? ¿Podemos calcular la mediana para datos cualitativos?
Estadística Aplicada a las Ciencias Políticas Los alcaldes 3 1 1 1 1 1 2 1 7 6 13 8 3 2 1 1 2 1 1 7 3 2 12 6 1 1 1 1 1 1 1 1 1 1 2 2 2 2 3 3 3 6 6 7 7 8 12 13 La mediana es ½*(2+2)=2
Estadística Aplicada a las Ciencias Políticas La mediana a través de la tabla de frecuencias (datos discretos) <0,5 >0,5 Mediana
La mediana con datos agrupados Estadística Aplicada a las Ciencias Políticas La mediana con datos agrupados Ingresos ni Ni fi Fi ≤ 30 (30,45] 2 0,05555556 (45,60] 9 11 0,25 0,30555556 (60,75] 20 0,55555556 (75,90] 10 30 0,27777778 0,83333333 (90,105] 3 33 0,08333333 0,91666667 (105,120] 36 1 > 120 Total Intervalo mediano
Un valor exacta para la mediana con datos agrupados Estadística Aplicada a las Ciencias Políticas Un valor exacta para la mediana con datos agrupados 0,5 La mediana
Una fórmula para calcular la mediana con datos agrupados Estadística Aplicada a las Ciencias Políticas Una fórmula para calcular la mediana con datos agrupados donde el intervalo mediano es (ai-1,ai] de tamaño li = ai-ai-1 ¿Cuál es el valor de la mediana de los ingresos de ayuntamientos?
Para los alcaldes, la suma de los datos es: Estadística Aplicada a las Ciencias Políticas La media La media o media aritmética es el promedio de todos los datos de la muestra. Para los alcaldes, la suma de los datos es: 3 + 1 + 1 + 1 + 1 + 1 + 2 + 1 7 + 6 + 13 + 8 + 3 + 2 + 1 + 1 2 + 1 + 1 + 7 + 3 + 2 + 12 + 6 = 86 Luego, la media es 86/24 ≈ 3,583 años. ¿Podemos calcular la media para datos cualitativos?
Estadística Aplicada a las Ciencias Políticas La media a través de la tabla de frecuencias (datos discretos)
Estadística Aplicada a las Ciencias Políticas La fórmula
La media con datos agrupados Estadística Aplicada a las Ciencias Políticas La media con datos agrupados Es la misma fórmula pero usando la marca de clase.
La moda, mediana y media para datos asimétricos Estadística Aplicada a las Ciencias Políticas La moda, mediana y media para datos asimétricos
Otros puntos de la distribución: mínimo, máximo y cuartiles Estadística Aplicada a las Ciencias Políticas Otros puntos de la distribución: mínimo, máximo y cuartiles Ordenando los datos, el mínimo y máximo son fáciles de calcular. 1 1 1 1 1 1 1 1 1 1 2 2 2 2 3 3 3 6 6 7 7 8 12 13 ¿Y los cuartiles? 1er cuartil = (1+1)/2 3er cuartil = (6+6)/2 2º cuartil = mediana = (2+2)/2
Estadística Aplicada a las Ciencias Políticas Cálculo de cuartiles Tenemos el siguiente conjunto de datos: 47 52 52 57 63 64 69 71 72 72 78 81 81 86 91 Ordenamos los datos de menor a mayor. Calculamos c2 , que ocupa la posición correspondiente a la “mitad”, ¿con qué parámetro visto ya coincide este segundo cuartil? Ahora calculamos, la “mitad” de la primera parte: c1 . Y la “mitad” de la segunda parte: c3 .
Estadística Aplicada a las Ciencias Políticas 47 52 57 63 64 69 71 72 78 81 86 91 c1 = 60 c2 = 71 c3 = 79,5
Representación gráfica de los datos con los cuartiles Estadística Aplicada a las Ciencias Políticas Representación gráfica de los datos con los cuartiles Los cálculos: Primer cuartil: 60 Segundo cuartil: 71 Tercer cuartil: 79,5 Media aritmética: 69,07 2. Hay datos que pueden provenir de observaciones “mal tomadas”: datos atípicos. Para detectarlas, calculamos: LI=c1-1,5(c3-c1) LS=c3+1,5(c3-c1)
Estadística Aplicada a las Ciencias Políticas Ejercicio Construir un diagrama de caja para el siguiente conjunto de datos. 35 45 45 55 57 62 64 64 64 65 73 74 74 76 78 80 82 84 86 92 92 92 93 94 97 112 116 116 123 123 124 128 140 143 173 214 255 277