DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

Slides:



Advertisements
Presentaciones similares
MEDIDAS DE TENDENCIA CENTRAL
Advertisements

UNIVERSIDAD NACIONAL DE EDUCACIÓN
Lic. Cristian R. Arroyo López
Lic. Cristian R. Arroyo López
ESTADÍGRAFOS DE DISPERSIÓN
Medidas de centralización para datos no agrupados
ESTADÍSTICA DESCRIPTIVA
Descripción de los datos: medidas de dispersión
Medidas de Posición Central:
Métodos Cuantitativos Aplicados a Los Negocios.
Ejemplo A continuación aparecen las tasas de retorno de dos fondos de inversión durante los últimos 10 años. 1. ¿Cuál es más riesgoso? 2. ¿En cuál invertiría.
Unidad de competencia II Estadística descriptiva:
Unidad de competencia II Estadística descriptiva:
MÉTODOS ESTADÍSTICOS.
Capítulo 4 Otras medidas descriptivas
Capítulo 3 Descripción de datos, medidas de tendencia central
Capítulo 4: Medidas de dispersión
MEDIDAS DE DISPERSIÓN.
FRANCISCO JAVIER RODRÍGUEZ
Estadística Administrativa I
Rango y Rango intercuartil
ESTADÍSTICA UNIDIMENSIONAL
Curso de Estadística Básica
Medidas de Dispersión Estadística E.S.O.
ESTADIGRAFOS DE DISPERSION
Curso de Estadística Básica
MEDIDAS DE RESUMEN Jorge Galbiati Riesco.
Medidas Descriptivas Numéricas
ESTADÍSTICA DESCRIPTIVA Jaime Alberto Gaviria Cárdenas.
MEDIDAS DE TENDENCIA CENTRAL
Estadística Descriptiva continuación
Medidas de Dispersión.
Tema 2: Parámetros Estadísticos
Medidas de dispersión.
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
Medidas de Variabilidad
Coeficiente de Variación
Laboratorio de Estadística administrativa
Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.
MEDIDAS DE VALOR CENTRAL
Tratamiento de datos y azar
TABLAS DE FRECUENCIAS Una vez recopilados, tendremos un conjunto de datos que será necesario organizar para extraer información. Lo primero que se hace.
MEDIDAS DE DISPERSIÓN. La dispersión es la variación en un conjunto de datos que proporciona información adicional y permite juzgar la confiabilidad de.
MEDIDAS DE DISPERSIÓN O VARIABILIDAD
Medidas de dispersión.
ESTADISTICA PARA RELACIONES LABORALES
Estadística Descriptiva: 2. Medidas de Tendencia y Dispersión
Qué es una Variable Aleatoria??????????
Describir una variable numérica
Bioestadística Tema 2: Estadísticos Bioestadística. U. Málaga.
Descripción de los datos: medidas de dispersión
ANALISIS ,GRAFICOS Y MEDIDAS ESTADISTICAS
ANÁLISIS E INTREPRETACIÓN DE DATOS
ESTADÍSTICA DESCRIPTIVA
PARÁMETROS ESTADÍSTICOS
Medidas de Dispersión.
Tipos de Variables.- Cualitativas. Describen cualidades de los elementos de la muestra. Nominales. Categorías excluyentes y sin orden. (Ej. Sexo) Ordinales.
Estadística Básica Conceptos & Aplicaciones
Métodos Cuantitativos
Sesión 8 Tema: Estadística descriptiva Objetivo:
Probabilidad y Estadística
Fundamentos Aplicaciones Prácticas
Probabilidades y Estadísticas. Conceptos trabajados en años anteriores…  Variable Aleatoria: Es toda magnitud cuyos valores se obtienen en mediciones.
Coeficiente de variación
DIPLOMADO DE POSTGRADO
Estadística descriptiva
Medidas de posición y dispersión IV medio
Estadística y probabilidad aplicada a los negocios
Medidas de tendencia central
Transcripción de la presentación:

DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA Lazarte Víctor Fabio y Naidicz Paula Lorena

MEDIDAS DE POSICIÓN Y DISPERSIÓN Resumen la información referida de la posición de la muestra. Las medidas de posición más utilizadas son: Media, Mediana, Moda y Cuartiles, las tres primeras, media, mediana y moda son medidas de tendencia central. Supongamos que los datos observados son: x1, x2, …, xn. Media: es el promedio de los datos

Ejemplo 1: Las notas de un alumno son: 10, 8, 7, 9, 10, 7, 6. Nota promedio En este caso la media es un buen representante del rendimiento académico del alumno. La media tiene la propiedad de equilibrar los desvíos.

Ejemplo 2: En el ejemplo de la cantidad de miembros de una familia de cierta ciudad. La cantidad promedio de miembros de una familia es

Existen casos en donde la media no es un buen representante del conjunto de datos. Ejemplo 3: Una empresa tiene 5 empleados, sus sueldos en pesos son: 1000, 1000, 1000, 1000, 10000. Entonces la media es : El dueño de la empresa diría orgulloso ¡El sueldo promedio de los empleados mi empresa es de $ 2800 al mes!! Pero claramente, la media no es un buen representante de este conjunto de datos, dado que hay 4 empleados que ganan sólo 1000 y sólo uno que gana 10000.

En general cuando la muestra tenga valores alejados o presente asimetría, la media no será un buen representante del conjunto de datos. Una medida de posición alternativa a la media sería la Mediana. La Mediana: Es el valor central de la muestra ordenada. Si la cantidad de datos es impar, la mediana es el valor central de la muestra ordenada. Si la cantidad de datos es par, la mediana es el promedio de los dos datos centrales de la muestra ordenada.

Ejemplos Para n impar. Notas de un alumno A: 10, 8, 7, 9, 10, 7, 6. Datos ordenados: 6, 7, 7, 8, 9, 10, 10. La mediana de las notas es 8. Notación: Para n par Notas de un alumno B: 10, 8, 7, 9, 10, 7, 6, 9. Datos ordenados: 6, 7, 7, 8, 9, 9, 10, 10. La mediana de las notas es:

En el ejemplo de la empresa con 5 empleados la mediana sería igual a $ 1000, por lo tanto sería un mejor representante del conjunto de datos. La mediana no es afectada por valores alejados ni es afectada por asimetría. Cuartiles: En cierta forma, dividen el lote de datos ordenado en cuatro partes iguales. Para calcular los cuartiles, se toma la primera mitad de la muestra ordenada y se calcula la mediana de este conjunto que será el primer cuartil, para el tercer cuartil se trabaja igual con los datos de la segunda mitad.

Ejemplos Para n impar Datos ordenados: 6, 7, 7, 8, 9, 10, 10. Primer cuartil: Q1 = 7 Tercer cuartil: Q3 = 9,5 Para n par Datos ordenados: 6, 7, 7, 8, 9, 9, 10, 10. Primer cuartil: Q1 = 7 Tercer cuartil: Q3 = 9,5

Moda: Es el dato más frecuente (si es que este existe) En los ejemplos de las notas del alumno no existe la moda por que hay varios datos que se repiten dos veces. 6, 7, 7, 8, 9, 10, 10 En el ejemplo de la empresa con 5 empleados los datos son: 1000, 1000, 1000, 1000, 10000 Así la moda es igual a $ 1000, por lo tanto sería un buen representante del conjunto de datos.

En el ejemplo de la cantidad de miembros de una familia ¿Cuál sería la moda? Cantidad de familias Porcentajes % acumulado 1 2 2,5 % 5 6,3 % 8,8 % 3 9 11,3 % 20,0 % 4 22 27,5 % 47,5 % 20 25,0 % 72,5 % 6 11 13,8 % 86,3 % 7 7,5 % 93,8 % 8 3,8 % 97,5 % 10 100,0 % Total 80 Moda  Mediana 

MEDIDAS DE DISPERSIÓN Ejemplo : Notas del alumno Juan: 6, 6, 8, 10, 10. Notas del alumno Pedro: 8, 8, 8, 8, 8. La nota promedio de los dos alumnos es 8, sin embargo claramente su desempeño no es igual. ¿Cómo los comparo? ¿Cuál es la diferencia? Una medida de dispersión es una medida de cuan alejados están los datos del centro de la distribución, ya sea que se tome como centro a la media o a la mediana de los datos

Varianza muestral: La varianza es el promedio de los desvíos al cuadrado, es decir, se mide la distancia de cada dato a la media, se la eleva al cuadrado y se las promedia. Desviación Estándar: es la raíz cuadrada positiva de la varianza.

Ejemplo: Notas del alumno Juan: 6, 6, 8, 10, 10. La media es 8 por lo tanto los desvíos son: -2, -2, 0, 2, 2, los desvíos al cuadrado son: 4, 4, 0, 4, 4. La varianza será: Desviación Estándar: Para el alumno Pedro naturalmente la varianza y la desviación estándar serán iguales a cero.

Coeficiente de variación El coeficiente de variación es una medida de la magnitud de la dispersión en relación a la media. Estas tres medidas toman como centro a la media, por lo tanto están asociadas a ella. Si el lote de datos es simétrico y no tiene valores alejados, utilizaremos a la media y la desviación estándar para describir el conjunto de datos.

Una medida de dispersión asociada a la mediana es el Rango Intercuartil. El Rango intercuartil es simplemente la diferencia entre el primer y el tercer cuartil: RI = Q3 – Q1 Si el conjunto de datos es simétrico y no tiene valores alejados se recomienda utilizar a la media como medida de posición con la desviación estándar como medida de dispersión. Si el conjunto de datos es asimétrico o tiene valores alejados se recomienda utilizar a la mediana como medida de posición con el rango intercuartil como medida de dispersión.

¿Cómo analizo simetría? Gráficamente Coeficiente de asimetría: Figura 5: Ejemplo de una distribución asimétrica positiva

Valores alejados: Estos son valores observados que se apartan demasiado del resto de la muestra. Para detectarlos se puede utilizar la siguiente regla: Si un valor xi de la muestra es menor que Q1 – 1.5 (Q3 – Q1) , entonces xi es alejado por defecto. Si un valor xi de la muestra es mayor que Q3 + 1.5 (Q3 – Q1) , entonces xi es alejado por exceso. No significa que haya que descartar ese dato, significa que hay que estudiar ese caso y usar medidas que no se vean afectadas por valores alejados.

Diagrama de tipo caja: Se deben calcular mínimo y máximo, mediana, Q1 , Q3 y Detectar valores alejados Figura 5: Peso en gramos de los recién nacidos en un cierto periodo de una cierta ciudad.

Diagrama de tipo caja: Figura 5: Cantidad de miembros de una familia.