Introducción a la Estadística Descriptiva Juan Moncada Herrera Dpto. De Cs. Matemáticas y Físicas Universidad Católica de Temuco
Población Problema Conocer Observar Variables EL CONTEXTO: Muestra Individuo Unidad de observación Registro de observación Página 2 2
Variables LOS ELEMENTOS DE BASE: Muestra Individuo Unidad de observación Variables Cualitativas Cuantitativas Página 3 3
Variables LOS ELEMENTOS DE BASE: Cualitativas Cuantitativas Muestra Individuo Unidad de observación Variables Cualitativas Cuantitativas - Nominales - Discretas - Ordinales - Continuas Página 4 4
Variables LOS ELEMENTOS DE BASE: Cualitativas Cuantitativas - Nominales - Discretas - Ordinales - Continuas Indiv. X1 … Xp 1 n Materia prima del análisis estadístico Tabla de datos Página 5 5
RESUMEN O SÍNTESIS SU OBJETIVO: Análisis de la Tabla de Datos Indiv. X1 … Xp 1 n RESUMEN O SÍNTESIS Lo más representativo Lo esencial Lo más típico Lo más relevante La «forma» La «estructura» La «diversidad» RETORNO A LOS DATOS Página 6 6
RESUMEN O SÍNTESIS SU OBJETIVO: Análisis de la Tabla de Datos NUMÉRICO Indiv. X1 … Xp 1 n RESUMEN O SÍNTESIS NUMÉRICO GRÁFICO Página 7 7
RESUMEN O SÍNTESIS ANALIZANDO LA TABLA DE DATOS: NUMÉRICO GRÁFICO TENDENCIA CENTRAL Promedio o media Moda, mediana DISPERSIÓN Rango Desviación estándar Página 8 8
RESUMEN O SÍNTESIS ANALIZANDO LA TABLA DE DATOS: NUMÉRICO GRÁFICO POSICIÓN Valores extremos Cuartiles, quintiles deciles FORMA Simetría Curtosis Página 9 9
RESUMEN O SÍNTESIS ANALIZANDO LA TABLA DE DATOS: Recursos gráficos NUMÉRICO GRÁFICO Vestuario Alimentación Ocio Transporte Gráfico de sectores: Variables cualitativas Frecuencias Informa de: Distribución Página 10 10
RESUMEN O SÍNTESIS ANALIZANDO LA TABLA DE DATOS: Recursos gráficos NUMÉRICO GRÁFICO Vestuario Alimentación Ocio Transporte 5 10 15 20 25 30 35 40 45 Gráfico de barras: Variables cualitativas Frecuencias Informa de: Distribución Página 11 11
RESUMEN O SÍNTESIS ANALIZANDO LA TABLA DE DATOS: Recursos gráficos NUMÉRICO GRÁFICO Histograma: Variables cuantitativas continuas Gran cantidad de observaciones Informa de: Forma, tendencia central Página 12 12
RESUMEN O SÍNTESIS ANALIZANDO LA TABLA DE DATOS: Recursos gráficos NUMÉRICO GRÁFICO Box-Plot: Variables cuantitativas continuas Informa de: Forma, posición Página 13 13
RESUMEN O SÍNTESIS ANALIZANDO LA TABLA DE DATOS: Recursos gráficos NUMÉRICO GRÁFICO 1 2 3 4 5 6 7 8 9 10 11 12 1,0 1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 Variación mensual del IPC Mes del año Lineas: Variables cuantitativas Informa de: Tendencia Página 14 14
MEDIDAS NUMÉRICAS DE RESUMEN ANALIZANDO LA TABLA DE DATOS: Recursos numéricos MEDIDAS NUMÉRICAS DE RESUMEN Tendencia central: Media: Mediana: X0.5 = Valor central (promedio de valores centrales) de la serie ordenada de X Moda: Valor(es) más frecuente(s) de X (datos cuantitativos y cualitativos) Página 15 15
MEDIDAS NUMÉRICAS DE RESUMEN ANALIZANDO LA TABLA DE DATOS: Recursos numéricos MEDIDAS NUMÉRICAS DE RESUMEN Dispersión: Rango: R(X) = Max(X) – min(X) Desviación estándar: Coeficiente de variación: Página 16 16
MEDIDAS NUMÉRICAS DE RESUMEN ANALIZANDO LA TABLA DE DATOS: Recursos numéricos MEDIDAS NUMÉRICAS DE RESUMEN Posición: Cantidad acumulada de información 0% 25% 50% 75% 100% | | | | | min Q1 Q2 Q3 Max Primer cuartil Segundo cuartil - mediana Tercer cuartil Serie creciente de valores observados Página 17 17
ANALIZANDO LA TABLA DE DATOS: Recursos numéricos EL RETORNO A LOS DATOS Regla empírica de Chebyshev: Si la distribución de los datos es simétrica en torno de su media, entonces: Aproximadamente el 67% de los datos se encuentra a una distancia igual a una desviación típica de la media. Aproximadamente el 95% de los datos se encuentra a una distancia de dos desviaciones típicas de la media. Aproximadamente el 99% de los datos se encuentra a tres desviaciones típicas de la media. Página 18 18
RECURSOS INFORMÁTICOS ANALIZANDO LA TABLA DE DATOS: Recursos informáticos RECURSOS INFORMÁTICOS ALTERNATIVAS COMERCIALES ALTERNATIVAS GRATUITAS O LIBRES Programa R Calculadora con modo estadístico Planilla de OpenOffice MS Excel Programa PAST Programa SPSS Página 19 19
Resumiendo … Información cualitativa o discreta El Resumen puede ser: SINTETIZANDO: Resumiendo … Información cualitativa o discreta El Resumen puede ser: Numérico Gráfico Tablas de frecuencias Barras Circular - Sectores Moda Pictogramas Página 20 20
Resumiendo … Información Continua El Resumen puede ser: Numérico SINTETIZANDO: Resumiendo … Información Continua El Resumen puede ser: Numérico Gráfico Tendencia central Dispersión Posición Histograma Polígono de frecuencias Media Rango Cuartiles Box-plot (Gráfico de Cajas) Mediana Varianza Quintiles Ojiva Moda D. estándar Deciles C. Variación Percentiles Página 21 21
= 663 estudiantes UN EJEMPLO ESTADÍSTICA DESCRIPTIVA: Mirando un conjunto de datos UN EJEMPLO Rendimiento de alumnos de primero de secundaria según tres niveles de autoestima Nivel de autoestima Nivel1 Nivel2 Nivel3 Nivel4 n 56 292 291 24 Min 4,3 3,87 3,67 4,27 Max 5,93 6,13 6,3 6,17 Mean 5,03446 5,0874 5,21608 5,18583 Variance 0,171756 0,207481 0,224896 0,345547 Stand. dev 0,414435 0,455501 0,474232 0,587833 Median 5,015 5,1 5,23 5,15 25 prcntil 4,7 4,77 4,93 4,69 75 prcntil 5,33 5,4225 5,57 5,5825 = 663 estudiantes Rendimiento similar Grupo Nivel 1 menos disperso Mediana similar a media: Simetría Página 22 22
UN EJEMPLO ESTADÍSTICA DESCRIPTIVA: Mirando un conjunto de datos Rendimiento de alumnos de primero de secundaria según tres niveles de autoestima Rendimiento ligeramente “cargado” a valores superiores Página 23 23
¿Qué grupo requiere intervención pedagógica? ESTADÍSTICA DESCRIPTIVA: Mirando un conjunto de datos UN EJEMPLO Rendimiento de alumnos de primero de secundaria según tres niveles de autoestima Gráficos de caja permitiendo una lectura comparativa del rendimiento, según nivel de autoestima. En Nivel 3 se observan dos “out liers” o valores atípicos. ¿Qué grupo requiere intervención pedagógica? Página 24 24
RECURSOS DE APOYO: SUGERENCIAS BIBLIOGRÁFICAS: Webster A. (2000): Estadística aplicada a los negocios y la economía. McGraw-Hill, Colombia. Lind, Marchal & Wathen (2008): Estadística aplicada a los negocios y la economía. McGraw-Hill, México. Canavos G. (1988): Probabilidad y Estadística. Aplicaciones y métodos. McGraw-Hill, México. Walpole, Myers, Myers & Ye (2007): Probabilidad y estadística para ingeniería y ciencias. Pearson-Prentice Hall, Octava edición, México. SOFTWARE ESTADÍSTICOS GRATUÍTO O LIBRE: Programa PAST. Website: http://folk.uio.no./ohammer/past/ Programa R. Website: www.r-project.org Programa OpenOffice. Website: www.openoffice.org Página 25 25
Introducción a la Estadística Descriptiva Juan Moncada Herrera Dpto. De Cs. Matemáticas y Físicas Universidad Católica de Temuco 26