ANÁLISIS E INTERPRETACIÓN DE DATOS

Slides:



Advertisements
Presentaciones similares
BIOESTADÍSTICA Y ESTADÍSTICA BÁSICA CHILLÁN, SEGUNDO SEMESTRE PROF. SOC. M© KEVIN VILLEGAS.
Advertisements

VALORES AGRUPADOS EN INTERVALOS. El consejo académico del colegio aplicó una prueba de conocimientos, entre 70 estudiantes elegidos al azar. El puntaje.
ESTADÍSTICA ÍNDICE 1.Introducción.Introducción. 2.Población y muestra.Población y muestra. 3.Variables estadísticas:Variables estadísticas: Cualitativas.
Capítulo 1.4: Distribución de frecuencias unidimensionales Introducción Descripción numérica Representación gráfica.
REPASANDO…………… ESTADISTICA APLICADA. ¿Qué hemos visto? Tipos de variables Niveles de medición de las variables Tabulación y representación gráfica de.
TEMA 1: TEMA 1: INTRODUCCIÓN A LA ESTADÍSTICA Por: Denise Muñoz Belmonte Claudia Morales Cerezuela.
Bioestadística Escala Cuantitativa.. Trabajadores en una fábrica. RegistroSexoEdad (años)Talla (m)Peso (kg) 1Fem Masc Masc
Mediana para datos agrupados IIIº Medio Objetivo Determinar e interpretar la mediana para datos agrupados, valorando su utilidad en diversos contextos.
TEMA 2: PARÁMETROS ESTADÍSTICOS. INDICE 1. Parámetros estadísticos: 1.1 Definición 1.2 Medidas de Centralización: Medias, moda y Mediana 1.3 Medidas de.
Medidas de centralización:  Media aritmética, mediana y moda para: i) listas de datos ii) datos agrupados en una tabla de frecuencia iii) datos agrupados.
ESTADÍSTICAS DESCRIPTIVAS REPRESENTACIONES GRÁFICAS Psic. Gerardo A. Valderrama M:
PPTCES046MT22-A16V1 Clase Medidas de tendencia central y posición MT-22.
Tema 2. Parámetros estadísticos. Indice 1. Parámetros estadísticos. Tipos: 1.1 Medidas de centralización(medias y moda) 1.2 Medidas de posición(mediana,
PERCENTILES, CUARTILES Y DECILES. Un percentil es una de las llamadas medidas de posición no central (cuartiles, deciles, percentiles, etc) que se puede.
Carrera de Administración Área Recursos Humanos Diseñó: Arturo Corona PeguerosEne-abr 17 Medidas de Medidas de Tendencia Central Tendencia Central Medidas.
CUANTILES UNIDAD TRABAJEMOS CON MEDIDAS DE POSICIÓN CONTENIDO: MEDIDAS DE POSICIÓN, CUARTILES, DECILES Y PERCENTILES OBJETIVO DE UNIDAD: Aplicar medidas.
DETERMINACION E INTERPRETACION DE LAS MEDIDAS DE TENDENCIA CENTRAL POBLACIONAL Y MUESTRAL. POR: JUDITH MARITZA JUAN CARLOS ANA MARTIN AXEL GILBERTO FÁTIMA.
1.3.1Media aritmética, geométrica y ponderada 1.3.2Mediana 1.3.2Moda Regresar.
Estadística.
 Los datos que a continuación se presentan corresponden al número de llamadas telefónicas que un grupo de personas realiza durante el día. 0, 1, 2, 4,
Medidas de tendencia central
Clase 4: Medidas de Tendencia Central y Medidas de Variación
ESTADÍSTICA UNIDIMENSIONAL
SESION 2: AGRUPACIÓN DE DATOS (TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS)
MEDIDAS DE FORMA ASIMETRIA Y CURTOSIS..
ESTADÍSTICA UNIDIMENSIONAL
UNIDAD 4: ESTADÍSTICA Y PROBABILIDAD
ESTADÍSTICA UNIDIMENSIONAL
Apuntes Matemáticas 2º ESO
Prof. Margarita Farías N. Liceo V.M.A
ESTADÍSTICA UNIDIMENSIONAL
MEDIDAS DE TENDENCIA CENTRAL
ESTADÍSTICA UNIDIMENSIONAL
METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES
Estadística Descriptiva
Clase 2: Organización y Representación de Datos
Clase 5: Medidas de Variación
ESTADÍSTICA UNIDIMENSIONAL
ASIMETRÍA.
Tablas de distribución de frecuencia
MEDIDAS DE POSICION NO CENTRALES
estadistica
Estadística Unidimensional Conceptos básicos.
Estadística Unidimensional Conceptos básicos.
Medidas centrales Por E. Skerrett.
Datos y Azar I medio Verónica Toro y Daniela Riquelme
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS Y PARA TABLAS.
Estadística.
Aplicaciones Estadísticas a las Finanzas
UNIVERSIDAD DE GUAYAQUIL FACULTAD DE CIENCIAS ADMINISTRATIVAS
ESTADÍSTICA BÁSICA.
Cuartiles, deciles, percentiles.
Universidad Peruana de Ciencias Aplicadas Matemática Básica (C.C.) Sesión 13.1 Ciclo
Distribución de frecuencias
PROBABILIDAD Y ESTADISTICA APLICADA A LOS NEGOCIOS
MEDIDAS DE DISPERSIÓN.
estadistica 3 presentacion de datos
ESTADÍSTICA.
Estadística Descriptiva
Calculo de Media Aritmética de datos agrupados
Apuntes de Matemáticas 3º ESO
MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I 1º BTO A
Presentan:. Presentan: Estadística Historia y Conceptos Básicos.
ESTADISTICA DESCRIPTIVA
Estadística Descriptiva
1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad.
Estadística Descriptiva
Estadística Asignatura obligatoria 5 créditos CBU 2015 Sexto semestre Módulo II. Medidas de tendencia central y de posición Universidad Autónoma del.
INTRODUCCIÓN A LA ESTADÍSTICA PARA NO ESPECIALISTAS
Mediana, Moda y Media Aritmética
Transcripción de la presentación:

ANÁLISIS E INTERPRETACIÓN DE DATOS SESIÓN 3: MEDIDAS DE TENDENCIA CENTRAL

INTRODUCCIÓN Hemos visto cómo se pueden resumir los datos obtenidos del estudio de una muestra (o una población) en una tabla estadística o un grafico. No obstante, tras la elaboración de la tabla y su representación gráfica, en la mayoría de las ocasiones resulta más eficaz “condensar” dicha información en algunos números que la expresen de forma clara y concisa.

En este sentido pueden examinarse varias características, siendo las más comunes: La tendencia central de los datos La dispersion o variación con respecto a este centro; Los datos que ocupan ciertas posiciones. La simetría de los datos. La forma en la que los datos se agrupan.

ESTADÍSTICOS DE TENDENCIA CENTRAL Buscamos obtener valores “centrales” en los datos presentados. Las medidas más comunes y relevantes son: Media Aritmética Mediana Moda

MEDIA ARITMÉTICA Representa el valor promedio de un conjunto de observaciones (datos) Se define como la suma de todos sus posibles valores, ponderada por las frecuencias de los mismos Puede presentar inconvenientes o poca representatividad de los datos en las siguientes situaciones: Es muy sensible a valores extremos por lo cuál no es recomendable para distribuciones con alta “asimetría” Si consideramos una variable discreta, por ejemplo, el número de hijos en las familias españolas el valor de la media puede no pertenecer al conjunto de valores de la variable; Por ejemplo x = 1, 2 hijos.

Mediana Llamaremos mediana (Med) al primer valor de la variable que deja por debajo de sí al 50% de las observaciones. Entre las propiedades de la mediana, vamos a destacar las siguientes: Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones extremas, ya que no depende de los valores que toma la variable, sino del orden de las mismas. Por ello es adecuado su uso en distribuciones asimétricas. Es de cálculo rápido y de interpretación sencilla. A diferencia de la media, la mediana de una variable discreta es siempre un valor de la variable que estudiamos (ej. La mediana de una variable número de hijos toma siempre valores enteros).

MODA Llamaremos moda a cualquier máximo relativo de la distribución de frecuencias, es decir, cualquier valor de la variable que posea una frecuencia mayor a las demás o bien el valor más recurrente entre las observaciones De la moda destacamos las siguientes propiedades: Es muy fácil de calcular. Puede no ser única. Existe para variables cualitativas

CÁLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA VARIABLES CUALITATIVAS Para variables cualitativas no es posible calcular aquellas medidas sobre las cuales los valores sean numéricos o dependan de la posición de los datos (debido a que no existen pesos en este tipo de variables) Por lo tanto el único estadígrafo posible de interpretar es la moda, donde simplemente buscaremos la observación (u observaciones) de mayor frecuencia

CÁLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA VARIABLES CUANTITATIVAS Para las variables cuantitativas el cálculo dependerá de dos características básicas: La agrupación de datos El tipo de variable (discreta o contínua)

CÁLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS SIN AGRUPAR Si los datos no están agrupados en una tabla de distribución de frecuencias calcularemos los estadísticos de tendencia central como sigue: - Media Aritmética: Sumaremos todas las observaciones y dividiremos el resultado por el número total de datos. Esto es: Por ejemplo: Si tenemos los datos: 3, 4 , 5 ,6, 3 , 2, 3, 4 ,5 ,6. Calculamos la media aritmética como:

- Mediana: Ordenaremos los datos y tomaremos el dato central (o centrales), por ejemplo si nuestros datos son: 3, 4 , 5 ,6, 3 , 2, 3, 4 ,5 ,6 Ordenamos los datos: 2, 3, 3, 3, 4, 4 ,5 ,5, 6 , 6 Buscamos el valor central Si los datos son diferentes tomamos el mayor de ellos, en este caso: Med= 4

- Moda: Para calcularla simplemente buscaremos el valor o valores que más se repitan. Por ejemplo si nuestros datos son: 3, 4 , 5 ,6, 3 , 2, 3, 4 ,5 ,6 La moda es el dato que más se repita, para este caso: Mo= 3 Nótese que esta medida no necesariamente es central para los datos debido a que no depende del peso de ellos, además note que pueden haber varias modas.

CÁLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS Si bien es cierto que las medidas de tendencia central son supremamente fáciles de calcular para datos sin agrupar también lo es que exigen un trabajo que llega a ser sumamente arduo cuando se trata de muchos datos. Para los datos agrupados es fundamental realizar diferenciación sobre si nuestra variable es discreta o continua y dependiendo de tal naturaleza proceder con el cálculo

CÁLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS: Variable discreta En el caso de la variable discreta calcularemos las medidas de tendencia central así: Media aritmética: Es decir debemos multiplicar cada modalidad de clase por su frecuencia absoluta y sumar dichos resultados, por último dividirlos por el total de observaciones

EJEMPLO xi ni Ni hi Hi xini 1 2 0.1 4 6 0.2 0.3 8 3 12 0.6 18 16 0.8 5 20 TOTAL 49 Es decir que el valor promedio de los datos es de 3.2, nótese que pese a ser una variable discreta el valor de la media aritmética no es entero.

MEDIANA PARA DATOS AGRUPADOS: VARIABLE DISCRETA Dado que definimos la mediana como el primer valor que deja tras de sí al 50% de las observaciones lo primero que debemos saber es cuál es ese 50% para esto dividiremos por 2 al total de datos. Luego buscaremos en la frecuencia absoluta acumulada el primer valor que supere dicho resultado e identificamos su valor de modalidad de clase

EJEMPLO Dividimos el total de datos por 2: N/2= 20/2=10 xi ni Ni hi Hi xini 1 2 0.1 4 6 0.2 0.3 8 3 12 0.6 18 16 0.8 5 20 TOTAL 49 Dividimos el total de datos por 2: N/2= 20/2=10 Buscamos el primer valor que supere a 10 en la frecuencia acumulada (en este caso 12) y procedemos a identificar a que modalidad pertenece ese valor de frecuencia acumulada, para este caso: Med= 3

MODA PARA DATOS AGRUPADOS: VARIABLE DISCRETA Dado que definimos la moda como el valor más recurrente buscaremos en la frecuencia absoluta más alta e identificamos su valor de modalidad de clase

EJEMPLO xi ni Ni hi Hi xini 1 2 0.1 4 6 0.2 0.3 8 3 12 0.6 18 16 0.8 5 20 TOTAL 49 Buscamos la frecuencia absoluta más alta y procedemos a identificar a que modalidad pertenece ese valor de frecuencia acumulada (puede ser más de una modalidad), para este caso: Mo= 3

CÁLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS: Variable continua En el caso de la variable continua calcularemos las medidas de tendencia central así: Media aritmética: Es decir debemos multiplicar cada marca de clase por su frecuencia absoluta y sumar dichos resultados, por último dividirlos por el total de observaciones

EJEMPLO Es decir que el valor promedio de los datos es de 27 Li-1 - Li Xi ni Ni hi Hi xini 0-10 5 2 0.1 10 10-20 15 4 6 0.2 0.3 60 20-30 25 12 0.6 150 30-40 35 16 0.8 140 40-50 45 20 1 180 TOTAL 540 Es decir que el valor promedio de los datos es de 27

MEDIANA PARA DATOS AGRUPADOS: VARIABLE CONTINUA Dado que definimos la mediana como el primer valor que deja tras de sí al 50% de las observaciones lo primero que debemos saber es cuál es ese 50% para esto dividiremos por 2 al total de datos. Luego buscaremos en la frecuencia absoluta acumulada el primer valor que supere dicho resultado, hasta acá es el mismo procedimiento que en variable discreta, sin embargo la mediana es un único valor no un grupo de valores, por lo tanto ese valor está en esa modalidad que supera al 50% de las observaciones; para saber exactamente cuál es el valor procederemos a aplicar la siguiente fórmula:

FÓRMULA PARA CÁLCULO DE LA MEDIANA EN VARIABLE CONTINUA (D.A) Una vez identificamos la modalidad que contiene a la mediana aplicaremos: Donde: Li-1 es el límite inferior de la modalidad que contiene a la mediana N es el total de datos Ni-1 es la frecuencia acumulada de la clase anterior a la que contiene a la mediana ni es la frecuencia de la clase que contiene a la mediana C es el tamaño de clase

EJEMPLO Dividimos el total de datos por 2: N/2= 20/2=10 xi ni Ni hi Hi xini 1 2 0.1 4 6 0.2 0.3 8 3 12 0.6 18 16 0.8 5 20 TOTAL 49 Li-1 - Li Xi ni Ni hi Hi xini 0-10 5 2 0.1 10 10-20 15 4 6 0.2 0.3 60 20-30 25 12 0.6 150 30-40 35 16 0.8 140 40-50 45 20 1 180 TOTAL 540 Dividimos el total de datos por 2: N/2= 20/2=10 Buscamos el primer valor que supere a 10 en la frecuencia acumulada (en este caso 12) y procedemos a identificar a que modalidad pertenece ese valor de frecuencia acumulada, para este caso el intervalo 20-30, identificamos los valores de las variables que nos pide la fórmula: Li-1= 20 , N/2 = 10, Ni-1= 6 , ni = 6, C = 30-20 =10

Ahora aplicámos la fórmula: Li-1= 20 , N/2 = 10, Ni-1= 6 , ni = 6, C = 30-20 =10 Por lo tanto Med = 26.66

MODA PARA DATOS AGRUPADOS: VARIABLE DISCRETA Dado que definimos la moda como el valor más recurrente buscaremos en la frecuencia absoluta más alta e identificamos la modalidad de clase (que llamaremos clase modal), debido a que la moda es uno o más valores exactos y no grupos de valores aplicaremos la siguiente fórmula para calcularla: Donde: Li-1 es el límite superior de la clase modal ni= frecuencia absoluta de la clase modal ni-1= frecuencia absoluta de la clase anterior a la clase modal ni+1= frecuencia absoluta de la clase siguiente a la clase modal C= tamaño de clase

EJEMPLO xi ni Ni hi Hi xini 1 2 0.1 4 6 0.2 0.3 8 3 12 0.6 18 16 0.8 5 20 TOTAL 49 Li-1 - Li Xi ni Ni hi Hi xini 0-10 5 2 0.1 10 10-20 15 4 6 0.2 0.3 60 20-30 25 12 0.6 150 30-40 35 16 0.8 140 40-50 45 20 1 180 TOTAL 540 Buscamos la frecuencia absoluta más alta y procedemos a identificar a que modalidad pertenece ese valor de frecuencia acumulada (puede ser más de una modalidad), para este caso la clase modal es 20-30, identificamos cada variable en la fórmula: Li-1 = 20, ni= 6, ni-1= 4, ni+1= 4, C= 30-20=10

Ahora aplicamos la fórmula: Li-1 = 20, ni= 6, ni-1= 4, ni+1= 4, C= 30- 20=10 Por lo tanto M0 = 25