Estadística Descriptiva: 2. Medidas de Tendencia y Dispersión

Slides:



Advertisements
Presentaciones similares
Lic. Cristian R. Arroyo López
Advertisements

ESTADÍSTICA DESCRIPTIVA
Descripción de los datos: medidas de dispersión
MÉTODOS ESTADÍSTICOS.
Capítulo 4 Otras medidas descriptivas
FRANCISCO JAVIER RODRÍGUEZ
Rango y Rango intercuartil
Introducción Los fenómenos biológicos no suelen ser constantes, por lo que será necesario que junto a una medida que indique el valor alrededor del cual.
Medidas de Dispersión Estadística E.S.O.
Bioestadística III. Escala cuantitativa. n Cuando la escala de medición es cuantitativa, y el análisis requiere un solo valor numérico que resuma alguna.
MEDIDAS DE TENDENCIA CENTRAL
Medidas de resumen.
REPASO BLOQUE I: TEMAS 1-4
DEPARTAMENTO DE MATEMÁTICA APLICADA
Estadística Descriptiva continuación
ESTADÍSTICA 4° MEDIO
Datos: Estadística.
Bioestadística Tema 2: Estadísticos Bioestadística. U. Málaga.
Medidas de Dispersión.
Tema 2: Parámetros Estadísticos
Medidas de resumen.
ESTADÍSTICAS DESCRIPTIVA
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
Rango = Valor máximo – Valor mínimo
Coeficiente de Variación
Laboratorio de Estadística administrativa
Medidas de Posición y Centralización Estadística E.S.O.
Tratamiento de datos y azar
TABLAS DE FRECUENCIAS Una vez recopilados, tendremos un conjunto de datos que será necesario organizar para extraer información. Lo primero que se hace.
Page 1 ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZO FACULTAD DE INFORMATICA Y ELECTRONICA ESCUELA DE DISEÑO GRAFICO ESTADISTICA TEMA: estadista, entendimiento.
MEDIDAS DE DISPERSIÓN. La dispersión es la variación en un conjunto de datos que proporciona información adicional y permite juzgar la confiabilidad de.
INFERENCIA ESTADISTICA
Analisis exploratorio INGRID TATIANA RODRIGUEZ GUZMAN DIANA COSTANZA BERMUDEZ GORDILLO.
2.2: Resumen numérico Medidas de localización. Medidas de dispersión.
Qué es una Variable Aleatoria??????????
Describir una variable numérica
Bioestadística Tema 2: Estadísticos Bioestadística. U. Málaga.
Descripción de los datos: medidas de dispersión
Historia de la Estadística
ESTADÍSTICA DESCRIPTIVA
PARÁMETROS ESTADÍSTICOS
Medidas de Dispersión.
Tipos de Variables.- Cualitativas. Describen cualidades de los elementos de la muestra. Nominales. Categorías excluyentes y sin orden. (Ej. Sexo) Ordinales.
Medidas De Localización
Estadística Básica Conceptos & Aplicaciones
Métodos Cuantitativos
Sesión 8 Tema: Estadística descriptiva Objetivo:
ANALISIS DE VARIABLES CUANTITATIVAS EN EL PROCESO DE INVESTIGACIÓN
ESTADÍSTICA UNIDIMENSIONAL
MEDIDAS DE TENDENCIA CENTRAL
Medidas de tendencia central
Características de las distribuciones estadísticas
Objetivo: Recordar elementos presentes en el estudio de la estadística
Estadística descriptiva
Gráficos.
@ Angel Prieto BenitoApuntes de Matemáticas 3º ESO1 U.D. 14 * 3º ESO E.AP. MEDIDAS ESTADÍSTICAS.
ESTADÍSTICA DESCRIPTIVA
Coeficiente de variación
Historia de la Estadística
DIPLOMADO DE POSTGRADO
Describiendo los Datos, Usando Medidas Numéricas
Estadística descriptiva
Estadística descriptiva
Estadística y probabilidad aplicada a los negocios
ESTADÍSTICA DOCENTE :JUDITH PATRICIA MARTÍN HERMOSILLO MULTIVERSIDAD LATINOAMERICANA CAMPUS TONALÁ BLOQUE IX. APLICA LA ESTADÍSTICA ELEMENTAL.
PROBABILIDAD Y ESTADISTICA.
LOGO Medidas de posición Pedro Godoy G. Media Aritmética Valor representativo de un conjunto de datos Para datos no agrupados 1, x2, x3, x4,…………………………,
Medidas de tendencia central
Estadística Profesora: Mariela Palma Hernández. Objetivo: Calcular e interpretar las medidas de tendencia central.
Medidas de tendencia central o posición
Transcripción de la presentación:

Estadística Descriptiva: 2. Medidas de Tendencia y Dispersión Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María

Estadística Descriptiva Objetivo Obtener información desde una muestra, que permita entender o formular hipótesis acerca del fenómeno que se estudia. Herramientas básicas: Gráficos: descripciones cualitativas Estadísticas: descripciones cuantitativas de la tendencia y variabilidad presente en una muestra.

Estadística Descriptiva Medidas de Tendencia y Dispersión

Medidas de Tendencia Si tuvieramos que resumir en un sólo valor representativo todo el conjunto de observaciones, ¿qué valor usamos?.

Medidas de Tendencia Moda: Valor o clase de valores que se observa con mayor frecuencia en la muestra. Puede no existir o no ser único. Funciona para cualquier tipo de dato: categóricos, ordinales ó numéricos.

Medidas de Tendencia Promedio o Media Muestral: Centro geométrico del conjunto de valores observados Requiere datos numéricos

Medidas de Tendencia Mediana: Se trata del valor que divide el rango de valores observados en dos mitades con el mismo número de observaciones Su cómputo requiere ordenar la muestra Si tenemos un número impar de observaciones la mediana es exactamente el valor del centro: (n+1)/2 Si tenemos un número par de observaciones la mediana se computa “usualmente” como el promedio de las observaciones n/2 y (n/2)+1

Medidas de Tendencia Robustez de la Media versus la Mediana La media es extremadamente sensible a situaciones en que hay valores numéricamente muy distantes del resto (outliers) La mediana en cambio permite obtener valores más representativos en estos casos Ejemplo: (1, 2, 2, 2, 3, 9)

Medidas de Tendencia Mediana Moda Media Aritmética Q1 Q2 Q3 Q4 Rango 0,0000 0,0500 0,1000 0,1500 0,2000 0,2500 0,3000 0,3500 0,4000 0,4500 0,5000 4 5 6 7 1 2 3 Q1 Q2 Q3 Q4 Moda Media Aritmética Mediana Rango

Medidas de Tendencia Robustez de la Media versus la Mediana

Medidas de Tendencia (…) en los 70 (…) la razón de los salarios del percentil noventa y el percentil diez era de 3.4 veces, en 2005 ésta estaba en alrededor de 5 veces

Medidas de Tendencia Percentiles: valores que acumulan una cierta frecuencia relativa. El i-ésimo percentil es el primer valor que acumula al menos i/100 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 102,5 110,5 118,5 126,5 134,5 142,5 150,5 158,5 166,5

Medidas de Tendencia Percentiles: Si los datos se ordenan de orden ascendente de magnitud, entonces el percentil Pi para i = 1, 2, … 99 si es entero en otro caso

Medidas de Tendencia Cuartiles: valores que acumulan una frecuencias de 1/4 (Q1) , 2/4 (Q2) y 3/4 (Q3) 102,5 110,5 118,5 126,5 134,5 142,5 150,5 158,5 166,5

Medidas de Tendencia Cuartiles: Si los datos se ordenan de orden ascendente de magnitud, entonces el cuartil Qi para i = 1, 2, 3 si es entero en otro caso

Medidas de Tendencia Es muchos casos las medidas de tendencia anteriores deben o quieren calcularse sobre datos que ya han sido agrupados Límites 106,5-114,5 114,5-122,5 122,5-130,5 130,5-138,5 138,5-146,5 146,5-154,5 154,5-162,5 Marca 110,5 118,5 126,5 134,5 142,5 150,5 158,5 Frecuencias ABS - REL - REL. AC. 5 0,125 0,125 3 0,075 0,2 5 0,125 0,325 8 0,2 0,525 6 0,15 0,675 7 0,175 0,85 6 0,15 1

Medidas de Tendencia La organización en clases permite reducir el efecto del ruido o errores en los datos: se pesa un intervalo y su frecuencia, no la frecuencia de un sólo valor 1 2 3 4 5 6 7 8 9 110,5 118,5 126,5 134,5 142,5 150,5 158,5 Histograma

Medidas de Tendencia Promedio o Media Muestral con datos agrupados ni ni : Frec. relativa Clase i fi : Frec. relativa Clase i Ci : Marca Clase i k : N° de clases C1 C2 C3

Medidas de Tendencia Moda con datos agrupados. La clase modal se determina como la clase con mayor frecuencia. D1 nM D2 n1 n2 L : Límite inferior Clase modal aM : Amplitud Clase Modal (CM) D1 : nM - n1 D2 : nM - n2 nM : Frec. absoluta Clase Modal n1 : Frec. absoluta Clase anterior a CM n2 : Frec. absoluta Clase posterior a CM aM L CM

Medidas de Tendencia Mediana con datos agrupados Fe-1 fe ojiva Fe-1 fe L : Límite inferior Clase Mediana (C Me) Fe-1 : Frec. Rel. Acumulada hasta antes (C Me) fe : Frecuencia Rel. (C Me) ae : Amplitud (C Me) ae L

Medidas de Tendencia Percentiles con datos agrupados FPi-1 fPi aPi L L :Límite inferior percentil i-ésimo FPi-1: Frec. Rel. acumulada hasta antes de la clase percentil i-ésimo aPi : Amplitud percentil i-ésimo fPi : Frecuencia Rel. de la clase del percentil i-ésimo ojiva FPi-1 fPi aPi L

Medidas de Tendencia Cuartiles con datos agrupados FCi-1 fCi aCi L L :Límite inferior cuartil i-ésimo FPi-1: Frec. Rel. acumulada hasta antes de la clase del cuartil i-ésimo aPi : Amplitud cuartil i-ésimo fPi : Frecuencia Rel. de la clase del cuartil i-ésimo ojiva FCi-1 fCi aCi L

Medidas de Tendencia: Valores representativos de toda la muestra: Media, Moda, Mediana, Quartiles y Percentiles.

Medidas de Dispersión ¿Cómo damos cuenta de la variabilidad del conjunto de observaciones?: podemos medir las diferencias observadas con respecto a nuestras medidas de tendencia

Medidas de Dispersión Índice de Variación: Frecuencia con que no se observa la moda o la clase modal en la muestra

Medidas de Dispersión Varianza Muestral: promedio de las diferencias al cuadrado con respecto a la media. Datos Agrupados: Datos NO Agrupados: fi : Frec. relativa Clase i xi : Marca Clase i x : Media Aritmética ni : Frec. absoluta Clase i n : Tamaño Muestra k : N° de clases s2 : Variancia Muestral x : Media Aritmética xi : i-ésimo valor observado n : Tamaño Muestra _ _

Medidas de Dispersión Desviación Estándar: Raíz cuadrada de la varianza. Tiene las mismas “unidades de medida” que las observaciones de la muestra Datos Agrupados: Datos NO Agrupados:

Medidas de Dispersión Desviación Media: Promedio de las diferencias absolutas con respecto a la media. Tiene las mismas “unidades de medida” que las observaciones de la muestra Datos Agrupados: Datos NO Agrupados:

Medidas de Dispersión Rango: Diferencia entre el máximo y el mínimo valor observado en la muestra. Rango Percentil: Diferencia entre P90 y P10: aproximación más robusta al rango. Rango InterCuartílico: Distancia promedio de los cuartiles con respecto a la mediana (segundo quartil)

Medidas de Dispersión: grado de variabilidad con respecto a las tendencias: Tasa de Variación, Varianza Rango InterQuartílico.

BoxPlots Q1 Q2 Q3 Cuartiles 1, 2 y 3 Valores Atípicos Valores Atípicos 3 IRQ 3 IRQ Mediana Media

BoxPlots Representación visual para describir, simultáneamente, varias características importantes tales como: Centro Dispersión Asimetría de la distribución Identificación de las observaciones (valores) atípicas Q1 Q2 Q3 3 IRQ 3 IRQ

BoxPlots en Matlab