La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Coeficiente de variación

Presentaciones similares


Presentación del tema: "Coeficiente de variación"— Transcripción de la presentación:

1 Coeficiente de variación
UNIDAD VI. MEDIDAS DE DISPERSION. Rango La varianza Desviación media y desviación estándar Coeficiente de variación

2 Introducción Objetivos al analizar datos:
Establecer un valor típico que describa la concentración de datos ( promedio aritmético) y; Establecer la medida en que los datos se dispersan o concentran alrededor de éste valor típico que caracteriza al grupo. Es evidente que las medidas de tendencia central no son suficientes para caracterizar un conjunto de datos.

3 Definición: Una propiedad importante para describir un conjunto de datos numéricos es la variación; La variación es la dispersión o separación que presentan los datos.

4 Dos conjuntos de datos pueden diferir tanto en la tendencia central como en la variación, o bien, como se muestra en la figura, pueden tener las mismas medidas de tendencia central pero diferir en términos de variación.

5 Formas de medir la dispersión o variabilidad de datos
El rango La desviación media La desviación estándar La varianza El coeficiente de variación

6 Rango: Definición: mide la dispersión total en el conjunto de datos.
Ejemplo: Calcule el rango del siguiente conjunto de observaciones o datos: 3, 10, 2, 8, 7 Rango = 10 – 2 = 8 Se utiliza sólo cuando por cuestiones de tiempo no es posible calcular una medida mas completa. Definición: mide la dispersión total en el conjunto de datos. Fórmula: Rango = Xmasgrande - Xmaspequeña Ventajas: fácil de calcular . Desventajas: solo toma en cuenta los valores extremos; en medio puede pasar lo que sea, y depende mucho de la muestra que se tenga. No toma en cuenta cómo se distribuyen o se agrupan las observaciones.

7 Desviación media: Ejemplo: Calcule la DM del siguiente conjunto de observaciones o datos: 3, 10, 2, 8, 7 1º. Calcule la media aritmética o promedio: = = 6 5 2º. Elaborar una tabla para los valores absolutos de la desviación media. Definición: se basa en la diferencia de los datos individuales respecto a la media aritmética Fórmula:

8 Desviación Media Ventajas: toma en cuenta todos los datos.
Desventajas: la desviación media de una muestra no es un buen estimador de la desviación media de la población, que es lo que en última instancia nos interesa conocer.  Xi Xi - 6 | Xi – 6 | 3 -3 10 +4 4 2 -4 8 +2 7 +1 1 Sustituyendo en fórmula: Ʃ= 14 DM = 14 = 2.8 5

9 Varianza Definición: La varianza es una medida de variación de uso común que sí toma en cuenta la distribución de los valores de los datos respecto a la media aritmética Esta medida evalúa la manera en que fluctúan los valores respecto a la media de la muestra. Fórmula: Ejemplo: Calcule la varianza de los siguientes valores: 3, 10, 2, 8, 7 1º. Calcule la media aritmética o promedio: = = 6 5

10 Aplicando la fórmula: 𝑺 𝟐 = = 46 = 11.5 5 – Ventajas: la varianza de una muestra es un buen estimador de la varianza de la población, permite realizar inferencias a la población a través de la muestra.  Desventajas: como las unidades de la varianza son unidades al cuadrado (personas al cuadrado, carros al cuadrado, casas al cuadrado) es difícil explicar qué representa. 

11 Desviación estándar La desviación estándar de la muestra es la raíz cuadrada de la varianza. Ventajas: las unidades son las mismas de las observaciones, y como es la raíz cuadrada de la varianza, se pueden hacer inferencias a través de la varianza y dar explicaciones a través de la desviación estándar.  Fórmula: Ejemplo: Calcular S (desviación estándar) del ejemplo anterior: 𝑆 = = 3.39

12 Comprensión de la variación o dispersión de los datos.
Cuanto más dispersos estén los datos, mas grande será el valor del rango, varianza y desviación estándar Cuanto mas concentrados, u homogéneos, sean los datos u observaciones, mas pequeño será el rango, la varianza y la desviación estándar. Si las observaciones o datos son todas iguales( de manera que no hay variación de los datos), el rango, la varianza y la desviación estándar serán iguales a cero. Las medidas de rango, varianza y desviación estándar nunca son negativas.

13 Coeficiente de variación
Es una indicación relativa de la variación, se expresa en porcentaje y es útil cuando se requiere comparar la dispersión de dos o más conjuntos de datos. Fórmula: *100

14 Regla empírica Cuando los datos tienen una distribución en forma de campana: Cerca del 68% de los valores de los datos se encontrarán a no más de una desviación estándar desde la media. Aproximadamente 95% de los valores de los datos se encontrarán a no más de dos desviaciones estándar desde la media. Casi todos los valores de los datos estarán a no mas de tres desviaciones estándar de la media.

15 Ejemplo: Los envases con detergente líquido en una fábrica se llenan en forma automática en una línea de producción. Los pesos de llenado suelen tener una distribución en forma de campana. Si el peso medio de llenado es de 16 onzas y la desviación estándar de 0.25 onzas, la regla empírica es aplicada para sacar las conclusiones siguientes: Aproximadamente 68% de los envases llenados pesarán entre y onzas (estará a no más de una desviación estándar de la media). Cerca de 95% de los envases llenados pesarán entre y onzas (estarán a no mas de dos desviaciones estándar de la media) Casi todos los envases llenados pesarán entre y onzas (estarán a no más de tres desviaciones estándar de la media).

16 Diagrama de caja y bigotes
Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentación visual que describe varias características importantes, al mismo tiempo, tales como la dispersión y simetría de los datos u observaciones.

17 Construcción: Una gráfica de este tipo consiste en una caja rectangular dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero. Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente.

18 Ejemplo: Considere la edad de un colectivo de 20 personas:
Para calcular los parámetros estadístico, lo primero es ordenar la distribución Calcular Q1,Q2 =Mediana,Q3 Dibujar la caja y los bigotes MIN= 20 Q1= 24 Q2= 34 Q3= 39 MAX= 45 MIN=20 Q1=24 Q2=ME=34 Q3= 39 MAX= 45

19 La parte izquierda de la caja es mayor que la de la derecha; quiere decir que las edades comprendidas entre el 25% y el 50% de la población está más dispersa que entre el 50% y el 75%. El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; significa que el 25% de los más jóvenes están más concentrados que el 25% de los mayores. . Ejercicios: Berenson pag 132. ejercicio 3.18 inciso b).


Descargar ppt "Coeficiente de variación"

Presentaciones similares


Anuncios Google