Coeficiente de variación

Slides:



Advertisements
Presentaciones similares
MEDIDAS DE TENDENCIA CENTRAL
Advertisements

Instructor: Lic. Cristian R. Arroyo L.
Lic. Cristian R. Arroyo López
Lic. Cristian R. Arroyo López
ESTADÍSTICA DESCRIPTIVA
Descripción de los datos: medidas de dispersión
Capítulo 4 Otras medidas descriptivas
DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA
Medidas de tendencia central y de variabilidad
Medidas de dispersión y variabilidad
TEMA 2.4. MEDIDAS DE VARIABILIDAD
Introducción Los fenómenos biológicos no suelen ser constantes, por lo que será necesario que junto a una medida que indique el valor alrededor del cual.
Curso de Estadística Básica
Medidas de Dispersión Estadística E.S.O.
MEDIDAS DE TENDENCIA CENTRAL
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
Facultad: Turismo Y Hotelería
Estadística Descriptiva
Medidas de resumen.
Estadística Descriptiva continuación
Análisis de Datos.
Datos: Estadística.
Medidas de Dispersión.
Medida de Dispersión Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio.
Tema 2: Parámetros Estadísticos
ESTADÍSTICAS DESCRIPTIVA
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
Rango = Valor máximo – Valor mínimo
Coeficiente de Variación
Laboratorio de Estadística administrativa
SEMINARIO DE INVESTIGACIÓN IV Y TRABAJO DE GRADO
Inferencia Estadística
Tratamiento de datos y azar
TABLAS DE FRECUENCIAS Una vez recopilados, tendremos un conjunto de datos que será necesario organizar para extraer información. Lo primero que se hace.
Page 1 ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZO FACULTAD DE INFORMATICA Y ELECTRONICA ESCUELA DE DISEÑO GRAFICO ESTADISTICA TEMA: estadista, entendimiento.
MEDIDAS DE DISPERSIÓN. La dispersión es la variación en un conjunto de datos que proporciona información adicional y permite juzgar la confiabilidad de.
MEDIDAS DE DISPERSIÓN O VARIABILIDAD
Medidas de dispersión.
Identificar las diferentes medidas de Posición.
Estadística Escuela Secundaria Superior. ¿Qué es? Es el arte de realizar inferencias y sacar conclusiones a partir de datos imperfectos. ¿Por qué estudiar.
Estadística 1. Recuento de datos. Tablas de frecuencias
MEDIDAS DE FORMA DE LA DISTRIBUCION
Qué es una Variable Aleatoria??????????
Describir una variable numérica
Bioestadística Tema 2: Estadísticos Bioestadística. U. Málaga.
Descripción de los datos: medidas de dispersión
LA ESTADÍSTICA.
ANALISIS ,GRAFICOS Y MEDIDAS ESTADISTICAS
ANÁLISIS E INTREPRETACIÓN DE DATOS
Estadísticos Asunto de Estado: Estadísticos. Estadísticos Los parámetros estadísticos nos permiten tener una idea global de la población, compararla con.
Tipos de Variables.- Cualitativas. Describen cualidades de los elementos de la muestra. Nominales. Categorías excluyentes y sin orden. (Ej. Sexo) Ordinales.
Métodos Cuantitativos
ESTADÍSTICA UNIDIMENSIONAL
Probabilidad y Estadística
Fundamentos Aplicaciones Prácticas
Comprensión de la variación o dispersión de los datos.
MEDIDAS DE TENDENCIA CENTRAL
INFERENCIA ESTADÍSTICA
DEFINICIÓN DE NORMALIDAD MEDIDAS DE DESCRIPCIÓN DE DATOS
ESTADÍSTICA DESCRIPTIVA
DIPLOMADO DE POSTGRADO
Describiendo los Datos, Usando Medidas Numéricas
Estadística descriptiva
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
Estadística descriptiva
Medidas de posición y dispersión IV medio
Estadística y probabilidad aplicada a los negocios
Medidas de tendencia central
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, Decana de América) FACULTAD DE MEDICINA - UPG MAESTRÍA EN NEUROCIENCIAS Curso: Bioestadística.
Transcripción de la presentación:

Coeficiente de variación UNIDAD VI. MEDIDAS DE DISPERSION. Rango La varianza Desviación media y desviación estándar Coeficiente de variación

Introducción Objetivos al analizar datos: Establecer un valor típico que describa la concentración de datos ( promedio aritmético) y; Establecer la medida en que los datos se dispersan o concentran alrededor de éste valor típico que caracteriza al grupo. Es evidente que las medidas de tendencia central no son suficientes para caracterizar un conjunto de datos.

Definición: Una propiedad importante para describir un conjunto de datos numéricos es la variación; La variación es la dispersión o separación que presentan los datos.

Dos conjuntos de datos pueden diferir tanto en la tendencia central como en la variación, o bien, como se muestra en la figura, pueden tener las mismas medidas de tendencia central pero diferir en términos de variación.

Formas de medir la dispersión o variabilidad de datos El rango La desviación media La desviación estándar La varianza El coeficiente de variación

Rango: Definición: mide la dispersión total en el conjunto de datos. Ejemplo: Calcule el rango del siguiente conjunto de observaciones o datos: 3, 10, 2, 8, 7 Rango = 10 – 2 = 8 Se utiliza sólo cuando por cuestiones de tiempo no es posible calcular una medida mas completa. Definición: mide la dispersión total en el conjunto de datos. Fórmula: Rango = Xmasgrande - Xmaspequeña Ventajas: fácil de calcular . Desventajas: solo toma en cuenta los valores extremos; en medio puede pasar lo que sea, y depende mucho de la muestra que se tenga. No toma en cuenta cómo se distribuyen o se agrupan las observaciones.

Desviación media: Ejemplo: Calcule la DM del siguiente conjunto de observaciones o datos: 3, 10, 2, 8, 7 1º. Calcule la media aritmética o promedio: = 3 + 10 + 2 + 8 + 7 = 6 5 2º. Elaborar una tabla para los valores absolutos de la desviación media. Definición: se basa en la diferencia de los datos individuales respecto a la media aritmética Fórmula:

Desviación Media Ventajas: toma en cuenta todos los datos. Desventajas: la desviación media de una muestra no es un buen estimador de la desviación media de la población, que es lo que en última instancia nos interesa conocer.  Xi Xi - 6 | Xi – 6 | 3 -3 10 +4 4 2 -4 8 +2 7 +1 1 Sustituyendo en fórmula: Ʃ= 14 DM = 14 = 2.8 5

Varianza Definición: La varianza es una medida de variación de uso común que sí toma en cuenta la distribución de los valores de los datos respecto a la media aritmética Esta medida evalúa la manera en que fluctúan los valores respecto a la media de la muestra. Fórmula: Ejemplo: Calcule la varianza de los siguientes valores: 3, 10, 2, 8, 7 1º. Calcule la media aritmética o promedio: = 3 + 10 + 2 + 8 + 7 = 6 5

Aplicando la fórmula: 𝑺 𝟐 = 3 2 + 4 2 + 4 2 + 2 2 + 1 2 = 46 = 11.5 --------------------------- ---- 5 – 1 4 Ventajas: la varianza de una muestra es un buen estimador de la varianza de la población, permite realizar inferencias a la población a través de la muestra.  Desventajas: como las unidades de la varianza son unidades al cuadrado (personas al cuadrado, carros al cuadrado, casas al cuadrado) es difícil explicar qué representa. 

Desviación estándar La desviación estándar de la muestra es la raíz cuadrada de la varianza. Ventajas: las unidades son las mismas de las observaciones, y como es la raíz cuadrada de la varianza, se pueden hacer inferencias a través de la varianza y dar explicaciones a través de la desviación estándar.  Fórmula: Ejemplo: Calcular S (desviación estándar) del ejemplo anterior: 𝑆 = 11.5 = 3.39

Comprensión de la variación o dispersión de los datos. Cuanto más dispersos estén los datos, mas grande será el valor del rango, varianza y desviación estándar Cuanto mas concentrados, u homogéneos, sean los datos u observaciones, mas pequeño será el rango, la varianza y la desviación estándar. Si las observaciones o datos son todas iguales( de manera que no hay variación de los datos), el rango, la varianza y la desviación estándar serán iguales a cero. Las medidas de rango, varianza y desviación estándar nunca son negativas.

Coeficiente de variación Es una indicación relativa de la variación, se expresa en porcentaje y es útil cuando se requiere comparar la dispersión de dos o más conjuntos de datos. Fórmula: *100

Regla empírica Cuando los datos tienen una distribución en forma de campana: Cerca del 68% de los valores de los datos se encontrarán a no más de una desviación estándar desde la media. Aproximadamente 95% de los valores de los datos se encontrarán a no más de dos desviaciones estándar desde la media. Casi todos los valores de los datos estarán a no mas de tres desviaciones estándar de la media.

Ejemplo: Los envases con detergente líquido en una fábrica se llenan en forma automática en una línea de producción. Los pesos de llenado suelen tener una distribución en forma de campana. Si el peso medio de llenado es de 16 onzas y la desviación estándar de 0.25 onzas, la regla empírica es aplicada para sacar las conclusiones siguientes: Aproximadamente 68% de los envases llenados pesarán entre 15.75 y 16.25 onzas (estará a no más de una desviación estándar de la media). Cerca de 95% de los envases llenados pesarán entre 15.50 y 16.50 onzas (estarán a no mas de dos desviaciones estándar de la media) Casi todos los envases llenados pesarán entre 15.25 y 16.75 onzas (estarán a no más de tres desviaciones estándar de la media).

Diagrama de caja y bigotes Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentación visual que describe varias características importantes, al mismo tiempo, tales como la dispersión y simetría de los datos u observaciones.

Construcción: Una gráfica de este tipo consiste en una caja rectangular dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero. Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente.

Ejemplo: Considere la edad de un colectivo de 20 personas: 36 25 37 24 39 20 36 45 31 31 39 24 29 23 41 40 33 24 34 40 Para calcular los parámetros estadístico, lo primero es ordenar la distribución 20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45 Calcular Q1,Q2 =Mediana,Q3 Dibujar la caja y los bigotes MIN= 20 Q1= 24 Q2= 34 Q3= 39 MAX= 45 MIN=20 Q1=24 Q2=ME=34 Q3= 39 MAX= 45

La parte izquierda de la caja es mayor que la de la derecha; quiere decir que las edades comprendidas entre el 25% y el 50% de la población está más dispersa que entre el 50% y el 75%. El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; significa que el 25% de los más jóvenes están más concentrados que el 25% de los mayores. . Ejercicios: Berenson pag 132. ejercicio 3.18 inciso b).