Introducción a la Estadística Descriptiva Juan Moncada Herrera Dpto. de Cs. Matemáticas y Física Universidad Católica de Temuco
Población Problema Conocer Observar Variables EL CONTEXTO: Muestra Individuo Unidad de observación Registro de observación Página 2 2
Variables LOS ELEMENTOS DE BASE: Muestra Individuo Unidad de observación Variables Cualitativas Cuantitativas Página 3 3
Variables LOS ELEMENTOS DE BASE: Cualitativas Cuantitativas Muestra Individuo Unidad de observación Variables Cualitativas Cuantitativas - Nominales - Discretas - Ordinales - Continuas Página 4 4
Variables LOS ELEMENTOS DE BASE: Cualitativas Cuantitativas - Nominales - Discretas - Ordinales - Continuas Indiv. X1 … Xp 1 n Materia prima del análisis estadístico Tabla de datos Página 5 5
RESUMEN O SÍNTESIS SU OBJETIVO: Análisis de la Tabla de Datos Indiv. X1 … Xp 1 n RESUMEN O SÍNTESIS Lo más representativo Lo esencial Lo más típico Lo más relevante La «forma» La «estructura» La «diversidad» RETORNO A LOS DATOS Página 6 6
RESUMEN O SÍNTESIS SU OBJETIVO: Análisis de la Tabla de Datos NUMÉRICO Indiv. X1 … Xp 1 n RESUMEN O SÍNTESIS NUMÉRICO GRÁFICO Página 7 7
RESUMEN O SÍNTESIS ANALIZANDO LA TABLA DE DATOS: NUMÉRICO GRÁFICO FORMA Simetría Curtosis POSICIÓN Valores extremos Cuartiles, quintiles deciles Página 8 8
RESUMEN O SÍNTESIS ANALIZANDO LA TABLA DE DATOS: NUMÉRICO GRÁFICO TENDENCIA CENTRAL Promedio o media Moda, mediana DISPERSIÓN Rango Desviación estándar Página 9 9
RESUMEN O SÍNTESIS ANALIZANDO LA TABLA DE DATOS: Recursos gráficos NUMÉRICO GRÁFICO Vestuario Alimentación Ocio Transporte Gráfico de sectores: Variables cualitativas Frecuencias Informa de: Distribución Página 10 10
RESUMEN O SÍNTESIS ANALIZANDO LA TABLA DE DATOS: Recursos gráficos NUMÉRICO GRÁFICO Vestuario Alimentación Ocio Transporte 5 10 15 20 25 30 35 40 45 Gráfico de barras: Variables cualitativas Frecuencias Informa de: Distribución Página 11 11
RESUMEN O SÍNTESIS ANALIZANDO LA TABLA DE DATOS: Recursos gráficos NUMÉRICO GRÁFICO Histograma: Variables cuantitativas continuas Gran cantidad de observaciones Informa de: Forma, tendencia central Página 12 12
RESUMEN O SÍNTESIS ANALIZANDO LA TABLA DE DATOS: Recursos gráficos NUMÉRICO GRÁFICO Box-Plot: Variables cuantitativas continuas Informa de: Forma, posición Página 13 13
RESUMEN O SÍNTESIS ANALIZANDO LA TABLA DE DATOS: Recursos gráficos NUMÉRICO GRÁFICO 1 2 3 4 5 6 7 8 9 10 11 12 1,0 1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 Variación mensual del IPC Mes del año Lineas: Variables cuantitativas Informa de: Tendencia Página 14 14
MEDIDAS NUMÉRICAS DE RESUMEN ANALIZANDO LA TABLA DE DATOS: Recursos numéricos MEDIDAS NUMÉRICAS DE RESUMEN Tendencia central: Media: Mediana: X0.5 = Valor central (promedio de valores centrales) de la serie ordenada de X Moda: Valor(es) más frecuente(s) de X (datos cuantitativos y cualitativos) Página 15 15
MEDIDAS NUMÉRICAS DE RESUMEN ANALIZANDO LA TABLA DE DATOS: Recursos numéricos MEDIDAS NUMÉRICAS DE RESUMEN Dispersión: Rango: R(X) = Max(X) – min(X) Desviación estándar: Coeficiente de variación: Página 16 16
MEDIDAS NUMÉRICAS DE RESUMEN ANALIZANDO LA TABLA DE DATOS: Recursos numéricos MEDIDAS NUMÉRICAS DE RESUMEN Posición: Cantidad acumulada de información 0% 25% 50% 75% 100% | | | | | min Q1 Q2 Q3 Max Primer cuartil Segundo cuartil - mediana Tercer cuartil Serie creciente de valores observados Página 17 17
ANALIZANDO LA TABLA DE DATOS: Recursos numéricos EL RETORNO A LOS DATOS Regla empírica de Chebyshev: Si la distribución de los datos es simétrica en torno de su media, entonces: Aproximadamente el 67% de los datos se encuentra a una distancia igual a una desviación típica de la media. Aproximadamente el 95% de los datos se encuentra a una distancia de dos desviaciones típicas de la media. Aproximadamente el 99% de los datos se encuentra a tres desviaciones típicas de la media. Página 18 18
RECURSOS INFORMÁTICOS ANALIZANDO LA TABLA DE DATOS: Recursos informáticos RECURSOS INFORMÁTICOS ALTERNATIVAS COMERCIALES ALTERNATIVAS GRATUITAS O LIBRES Programa R Calculadora con modo estadístico Planilla de OpenOffice MS Excel Programa PAST Programa SPSS Página 19 19
TODO Resumen debe INFORMAR de: SINTETIZANDO: TODO Resumen debe INFORMAR de: La FORMA de la distribución Simétrica No simétrica La TENDENCIA CENTRAL de la distribución Media Mediana Moda Página 20 20
TODO Resumen debe INFORMAR de: SINTETIZANDO: TODO Resumen debe INFORMAR de: La DISPERSIÓN de la distribución Desviación estándar (Desviación típica) Coeficiente de variación Rango La POSICIÓN Valores extremos (Mínimo, Máximo) Percentiles (Cuartiles, Quintiles, Deciles) Página 21 21
Información cualitativa o discreta SINTETIZANDO: Para… Información cualitativa o discreta El Resumen puede ser: Numérico Gráfico Tablas de frecuencias Barras Circular - Sectores Moda Pictogramas Página 22 22
Para… Información Continua El Resumen puede ser: Numérico Gráfico SINTETIZANDO: Para… Información Continua El Resumen puede ser: Numérico Gráfico Tendencia central Dispersión Posición Histograma Polígono de frecuencias Media Rango Cuartiles Box-plot (Gráfico de Cajas) Mediana Varianza Quintiles Ojiva Moda D. estándar Deciles C. Variación Percentiles Página 23 23
= 663 estudiantes UN EJEMPLO ESTADÍSTICA DESCRIPTIVA: Mirando un conjunto de datos UN EJEMPLO Rendimiento de alumnos de primero de secundaria según cuatro niveles de autoestima Nivel de autoestima Nivel1 Nivel2 Nivel3 Nivel4 n 56 292 291 24 Min 4,3 3,87 3,67 4,27 Max 5,93 6,13 6,3 6,17 Mean 5,03446 5,0874 5,21608 5,18583 Variance 0,171756 0,207481 0,224896 0,345547 Stand. dev 0,414435 0,455501 0,474232 0,587833 Median 5,015 5,1 5,23 5,15 25 prcntil 4,7 4,77 4,93 4,69 75 prcntil 5,33 5,4225 5,57 5,5825 = 663 estudiantes Rendimiento similar Grupo Nivel 1 menos disperso Mediana similar a media: Simetría Página 24 24
UN EJEMPLO ESTADÍSTICA DESCRIPTIVA: Mirando un conjunto de datos Rendimiento de alumnos de primero de secundaria en Nivel 3 de autoestima Rendimiento ligeramente “cargado” a valores superiores Página 25 25
¿Qué grupo requiere intervención pedagógica? ESTADÍSTICA DESCRIPTIVA: Mirando un conjunto de datos UN EJEMPLO Rendimiento de alumnos de primero de secundaria según cuatro niveles de autoestima Gráficos de caja permitiendo una lectura comparativa del rendimiento, según nivel de autoestima. En Nivel 3 se observan dos “out liers” o valores atípicos. ¿Qué grupo requiere intervención pedagógica? Página 26 26
RECURSOS DE APOYO: SUGERENCIAS BIBLIOGRÁFICAS: Webster A. (2000): Estadística aplicada a los negocios y la economía. McGraw-Hill, Colombia. Lind, Marchal & Wathen (2008): Estadística aplicada a los negocios y la economía. McGraw-Hill, México. Canavos G. (1988): Probabilidad y Estadística. Aplicaciones y métodos. McGraw-Hill, México. Walpole, Myers, Myers & Ye (2007): Probabilidad y estadística para ingeniería y ciencias. Pearson-Prentice Hall, Octava edición, México. SOFTWARE ESTADÍSTICO GRATUÍTO O LIBRE: Programa PAST. Website: http://folk.uio.no./ohammer/past/ Programa R. Website: www.r-project.org Programa OpenOffice. Website: www.openoffice.org Página 27 27
Introducción a la Estadística Descriptiva Juan Moncada Herrera Dpto. de Cs. Matemáticas y Física Universidad Católica de Temuco 28