Descargar la presentación
La descarga está en progreso. Por favor, espere
1
ESTADÍSTICA DESCRPTIVA
CLASE N°3 Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia
2
Tabla de frecuencia Variable Continua
Si la variable que se esta midiendo es de tipo continuo (puede tomar cualquier intervalo determinado por los números reales), no tiene sentido el tabularla para cada una de las observaciones dado que es muy improbable que variable bajo estudio tome el mismo valor durante el experimento. Recorrido: Es el campo de variación de la variable. Recorrido = X máx – X mín
3
Tabla de frecuencia Variable Continua
El número y tamaño de los intervalos, dependen de la cantidad de datos de la muestra y de su recorrido. El número de intervalos debe cumplir con dos condiciones: resumir la información y conservar el detalle de la muestra. Los intervalos puede ser cerrado- cerrado, cerrado- abierto
4
Tabla de frecuencia Variable Continua
Definiciones: Clases: Consisten en intervalos de valores ordenados en forma accedente y descendente y que cubren todos los valores disponibles. El número de clases se denota K Limites de clases: Son los extremos de las clases. El valor menos se denomina limite inferior (Li) y le valor mayor limite superior (Ls). Puede ser abierto ( ) o cerrado [ ]. Amplitud de clase: Se obtiene hallando la diferencia entre los limites de clases. Se denota C.
5
Tabla de frecuencia Variable Continua
Marca de clase: Es el punto medio de las clases, es decir, la semisuma del Ls y Li. Las clases deben tener el misma Amplitud. Amplitud = C = (Máx. - VMín) / K Donde K es el número de clases En caso de no saber cuantas clases se deben tener (K) ni la amplitud de estas, se utiliza la Regla de Sturgen. K = (1 + 3,322 Log n)
6
Ejemplo Los siguientes datos indican el número de minutos que ocuparon sus asientos 20 clientes de una cafetería. Construir tabla de distribución de frecuencias, utilizando intervalo cerrado – abierto. Calcular el número de intervalos utilizando la expresión [1+ 3,3log n] ¿Qué tanto por ciento de clientes ocuparon sus asientos 32 minutos o más? ¿Qué tanto por ciento de los clientes ocuparon sus asientos entre 28 y menos de 36 minutos?
7
Solución 45% 60%
8
Representación Gráfica
Histograma Consiste en un conjunto de rectángulos con: bases en el eje x, centros en las marcas de clases y longitudes iguales a los tamaños de los intervalos de clases. Si los intervalos de clases tienen todos la misma amplitud, las alturas de los rectángulos son proporcionales a las frecuencias de clase.
9
Representación Gráfica
10
Ejemplo Dada la siguiente tabla de distribución, graficar histograma.
11
Representación Gráfica
Polígono de Frecuencia Es un gráfico de trazos de la frecuencia de clase con relación a la marca de clase. Puede obtenerse conectando los puntos medios de las partes superiores de los rectángulos del histograma. Ejemplo: Realizar el polígono de frecuencia de la tabla anterior.
12
Representación Gráfica
13
Representación Gráfica
Ojiva: Al igual que el histograma y el polígono de frecuencias es representar distribuciones de frecuencias de variables cuantitativas continuas, pero sólo para frecuencias acumuladas. En el eje horizontal se considera los limites de clase. Limites inferiores Ojiva mayor Limites superiores Ojiva menor
14
Representación Gráfica
Ojiva Mayor Ojiva Menor
15
Representaciones Gráficas
Variables Cualitativas Gráfico Circular Gráfico de Barras Pictograma Variables Discretas Diagrama de Tallo y Hoja Gráfico de Segmento Ojiva Variables Continuas Histograma Polígono de Frecuencias
16
Tabla de Contingencia 2 x 2
Sirve para analizar la relación de dependencia o independencia entre dos variables cualitativas o una cualitativa y otra cuantitativa, es necesario estudiar su distribución conjunta o tabla de contingencia. Permite organizar la información contenida en un experimento cuando ésta es de carácter bidimensional, es decir, cuando está referida a dos factores. A partir de la tabla de contingencia se puede además analizar si existe alguna relación de dependencia o independencia entre los niveles de las variables objeto de estudio.
17
Tabla de Contingencia 2 x 2
Para identificar relaciones de dependencia entre variables cualitativas se utiliza un contraste estadístico basado en el estadístico X2 (Chi-cuadrado), cuyo cálculo nos permitirá afirmar con un nivel de confianza estadístico determinado si los niveles de una variable cualitativa influyen en los niveles de la otra variable nominal analizada.
18
Tabla de Contingencia 2 x 2
Considerando un grado de confianza del 95%, esto implica un a = 0,05. Ho: El sexo de la persona no es un facto determinante en que la persona fume. Son independientes. H1: El sexo de la persona es un facto determinante en que la persona fume. Son dependientes. Obtención del grado de libertad para X2 (Chi-cuadrado): Grados de libertad: (r-1)*(c-1), r: filas; c: columnas Grados de libertad: (2-1)*(2-1)=1 Valor tabla = 3,84
19
Tabla de Contingencia 2 x 2
Si el resultado es menor a 3,84 no se rechaza Ho Si el resultado es mayor a 3,84 se rechaza Ho
20
ESTADÍSTICA DESCRIPTIVA
UNIDAD N°2 CLASE N°4 Estadígrafos Básicos: Moda, Mediana, Media en Datos no Agrupados
21
Estadígrafos Básicos Estadígrafo o estadístico: Es un valor que, calculado sobre la base de los datos observados, sirve para caracterizar la muestra que originó los datos. Ejemplos: El promedio común y corriente, un tanto por ciento, el rango, el IPC, etc. Todos ellos responden a la idea general de estadígrafo. Es un número real Se calculan con los datos observados Caracterizan la muestra en estudio Permiten condensar ,el volumen de información, a unos pocos valores que sean indicativos de todo el conjunto.
22
Coeficiente de Variación
Tipos de Estadígrafos Posición Tendencia central Media aritmética Mediana Localización Moda Cuartiles Deciles Percentiles Dispersión Varianza Desviación Típica Coeficiente de Variación
23
Tipos de Estadígrafos Estadígrafos de posición: Son aquellos que describen la posición que ocupa la distribución de frecuencias respecto a un valor de variable. Indican alrededor de cuál valor se agrupan los datos obtenidos. Estadígrafos de dispersión: Cuantifican la variabilidad o dispersión de los datos. Indican qué tan esparcidos están los datos obtenidos
24
Moda en datos no agrupados
La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo. Se puede hallar la moda para variables cualitativas y cuantitativas. Ejemplo: Hallar la moda de la distribución: 2, 3, 3, 4, 4, 4, 5, 5 R: Mo = 4 En caso de: Si en un grupo hay dos o varias variables con la misma frecuencia y Esa frecuencia es la máxima Entonces la distribución es bimodal o multimodal, es decir, tiene varias modas.
25
Moda en datos no agrupados
Ejemplo: Hallar la moda de la distribución: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 R: Mo = 1, 5, 9 Cuando todos los valores de un grupo tienen la misma frecuencia, no hay moda Ejemplo: Hallar la moda de la distribución: 2, 2, 3, 3, 6, 6, 9, 9 R: Mo = No hay moda
26
Ejercicios Calcule la moda para n° de personas ocupantes por automóvil en un control policial fronterizo: 4 – 4 – 1 – 2 – 4 – 5 – 3 – 3 – 4 – 3 Calcule la moda para el tiempo de espera de un bus del Transantiago en horas peek en una muestra de usuarios. (Minutos) 25 – 35 – 12 – 40 – 25 – 32 – 18 – 10 – 15 – 25 – 30 – 5 Calcule la moda para el peso de una muestra de 10 recién nacidos en un hospital público (Kg.): 3,250 – 4,360 – 2,310 – 3,400 – 1,850 – 2,880– 4,260 – 4,500 – 3,640 – 3,140
27
Ejercicios Calcule la moda de la siguiente serie de números: 5 – 4 – 6 – 5 – 4 – – 5 – 4 – 5 – 4 – 2 – 4 – 2 – 5 - 4 Respuestas: M0 = 4 personas M0 = 25 minutos M0 = La moda no existe M0 = 4 y 5
28
Media aritmética en datos no agrupados
La media aritmética o el promedio es igual a la suma de todos los valores observados, dividida por el número de datos. Desventaja de la media aritmética: Es altamente influenciable por valores extremos, por lo que la media es recomendable cuando la variable tiene una distribución de valores homogéneos.
29
Media aritmética en datos no agrupados
Ejemplo: Calcular la media aritmética de la edad de 5 personas: 23 – 21 – 11 – 8 – 34 R: = ( ) / 5 = 19,4 años. Ejemplo: Una persona que trabaja en forma independiente gana un mes $ , otro mes $ y otro $ ¿Cuanto gana en promedio mensual? Interprete el resultado. R: = ( ) / 3 = $ Interpretación: La persona debe esperar ganar cada mes $ , por supuesto que abra meses que ganará más y otros menos.
30
Ejercicios Calcule la media aritmética para n° de personas ocupantes por automóvil en un control policial fronterizo: 4 – 4 – 1 – 2 – 4 – 5 – 3 – 3 – 4 – 3 Calcule la media aritmética para el tiempo de espera de un bus del Transantiago en horas peek en una muestra de usuarios. (Minutos) 25 – 35 – 12 – 40 – 25 – 32 – 18 – 10 – 15 – 25 – 30 – 5 Calcule la media aritmética para el peso de una muestra de 10 recién nacidos en un hospital público (Kg.): 3,250 – 4,360 – 2,310 – 3,400 – 1,850 – 2,880– 4,260 – 4,500 – 3,640 – 3,140
31
Ejercicios Calcule la media aritmética de la siguiente serie de números: 5 – 4 – 6 – 5 – 4 – – 5 – 4 – 5 – 4 – 2 – 4 – 2 – 5 - 4 Respuestas: = 3,3 personas = 22,67 minutos = 3,359 Kg = 4,375
32
Mediana en datos no agrupados
La Mediana de una serie de datos, es el valor de la variable que, una vez ordenadas las observaciones de menor a mayor, divide la distribución en dos segmentos tales que: A lo menos, el 50% de las observaciones son iguales o menores que la mediana A lo menos, el 50% de las observaciones son iguales o mayores que la mediana.
33
Mediana en datos no agrupados
Ordenar los datos de menor a mayor (recomendado) o de mayor a menor Encontrar la ubicación de la mediana Determinar el valor que se encuentra en el lugar señalado. Caso en que “n” es impar. Ejemplo: Los siguientes son el número de menores de edad por familia: 3, 2, 0, 0, 1, 2, 0. Calcular la mediana. Ordenados: 0, 0, 0, 1, 2, 2, 3 En este caso n = 7
34
Mediana en datos no agrupados
Caso en que “n” es par. Ejemplo: Los siguientes son el número de menores de edad por familia: 3, 2, 0, 0, 1, 2, 0, 4 Calcular la mediana. Ordenados: 0, 0, 0, 1, 2, 2, 3, 4 En este caso n = 8 Ubicación: = (7+1)/2 Es la 4º observación o valor. La 4º observación es el valor . La Me = 1
35
Mediana en datos no agrupados
Ubicación: = (8+1)/2 resultado 4,5 La mediana esta entre el 4º y 5º valor. Es decir entre: 1 y 2 La mediana es ( 1 + 2) / 2 Me = 1,5
36
Ejercicios Calcule la mediana para n° de personas ocupantes por automóvil en un control policial fronterizo: 4 – 4 – 1 – 2 – 4 – 5 – 3 – 3 – 4 – 3 Calcule la mediana para el tiempo de espera de un bus del Transantiago en horas peek en una muestra de usuarios. (Minutos) 25 – 35 – 12 – 40 – 25 – 32 – 18 – 10 – 15 – 25 – 30 – 5 Calcule la mediana para el peso de una muestra de 10 recién nacidos en un hospital público (Kg.): 3,250 – 4,360 – 2,310 – 3,400 – 1,850 – 2,880– 4,260 – 4,500 – 3,640 – 3,140
37
Ejercicios Calcule la mediana de la siguiente serie de números: 5 – 4 – 6 – 5 – 4 – – 5 – 4 – 5 – 4 – 2 – 4 – 2 – 5 - 4 Respuestas: Me = 3,5 personas Me = 25 minutos Me = 3,325 Kg Me= 4,5
38
ESTADÍSTICA DESCRIPTIVA
CLASE N°5 Estadígrafos Básicos: Moda, Mediana, Media en Datos Agrupados
39
Moda en datos agrupados
La moda se obtiene por interpolación, mediante la siguiente formula: Ejemplo: Calcular la moda para los siguientes datos: Li: limite inferior de la clase. C: amplitud del intervalo Nk-1: Frecuencia absoluta del intervalo anterior al modal. Nk+1: Frecuencia absoluta del intervalo posterior al modal.
40
Moda en datos agrupados
Intervalo modal: [2 – 4), posee la mayor frecuencia absoluta. Li: Limite inferior del intervalo = 2 C: amplitud del intervalo modal =2 Nk-1: Frecuencia absoluta del intervalo anterior = 6 Nk+1: Frecuencia absoluta del intervalo posterior = 5 Formula: M0 = 2,9 Horas
41
Ejercicios Calcule la moda para los siguientes datos, los cuales reflejan el gasto mensual, de combustible para calefacción, expresado en miles de pesos. Interprete la moda obtenida en el ejercicio anterior
42
Ejercicios Intervalo modal: [6 – 8), posee la mayor frecuencia absoluta. Li: Limite inferior del intervalo = 6 C: amplitud del intervalo modal =2 Nk-1: Frecuencia absoluta del intervalo anterior = 17 Nk+1: Frecuencia absoluta del intervalo posterior = 14 Formula: M0= ( 14 / ( )) M0 = 6,9 $ Miles Interpretación: Lo más frecuente es que haya un gasto de $ pesos mensualmente en combustible para la calefacción.
43
Media aritmética en datos agrupados
La media aritmética se obtiene de la siguiente formula: Ejemplo: Calcular la media aritmética de: Xi Xmi: El valor de la variable o la marca de clase. Fi: Frecuencia de absoluta.
44
Media aritmética en datos agrupados
Xi Xi Luego la media aritmética es: = ( / 30) = 35,6
45
Ejercicios Calcule la media aritmética de los datos que representan las horas que transcurren hasta que un trabajador sufre un accidente. Interprete la media aritmética obtenida en el ejercicio anterior
46
Ejercicios Interpretación: En promedio cada 3,9 horas un trabajador sufre un accidente.
47
Mediana en datos agrupados
La mediana se obtiene por interpolación, mediante la siguiente formula: Ejemplo: Calcular la mediana para los siguientes datos: Li: limite inferior de la clase medial. C: amplitud del intervalo medial Nk-1: Frecuencia absoluta acumulada del intervalo anterior al medial. nk: Frecuencia absoluta del intervalo medial
48
Mediana en datos agrupados
Condición a considera : El intervalo medial es [2 – 4)
49
Ejercicios Calcule la mediana para los siguientes datos, los cuales reflejan el gasto mensual, de combustible para calefacción, expresado en miles de pesos. Interprete la moda obtenida en el ejercicio anterior
50
Ejercicios Nk > n/2 Nk-1 n/2 Nk > 77/2 = 38,5 Nk-1 77/2= 38,5
El intervalo medial es: [6 – 8) Me = x (38,5 – 17) / 26 Me = 7,65 Ù Ù Interpretación: El 50% de los casos de consumo mensual destinado a calefacción se encuentra antes de 7,65 $miles y el 50% restante de los consumos mensuales esta sobre los 7,65 $miles.
51
Media aritmética ponderada en datos agrupados
: Media aritmética ponderada en datos agrupados La media aritmética ponderada, se obtiene de la siguiente formula: Ejemplo: Calcular la media aritmética ponderada de: Wi: La ponderación de la variable xi
52
Media aritmética ponderada en datos agrupados
Luego la media aritmética PONDERADA es: = ( 42 / 6) = 7
53
ESTADÍSTICA DESCRIPTIVA
CLASE N°6 Estadígrafos de Localización: Cuartil, Decir y Percentil
54
Cuartiles Ejemplo: Calcular el cuartil 1, 2 y 3 de la siguiente tabla de horas asociadas hasta que ocurre un trabajo Los cuartiles son puntos o medidas que dividen a la muestra ordenada en cuatro grupos de igual tamaño. Se denota Qi el cuartil i- ésimo con 3,2,1=i
55
Cuartiles Calculo del 1º cuartil.
Se construye la tabla de distribución de frecuencias acumuladas. Se identifica la clase que contiene a Q1 determinando la menor de las frecuencias absolutas acumuladas Nk que supere el valor de n/4 La frecuencia absoluta acumulada que supera a 6,75 pertenece al 2º intervalo [2- 4) Con n= 27 n/4 = 27/4 = 6,75
56
Cuartiles Calculo del 1º cuartil.
Se utiliza la siguiente formula de interpolación: Li: limite inferior de la clase del cuartil C: amplitud del intervalo del cuartil Nk-1: Frecuencia absoluta acumulada del intervalo anterior al del cuartil nk: Frecuencia absoluta del intervalo del cuartil.
57
Cuartiles Interpretación: El 25% de los accidentes ocurren antes que el trabajador cumpla 2,14 horas de trabajo y el 75% restante de los accidentes ocurren sobre las 2,14 horas de trabajo. Calculo del 2º cuartil. El 2º cuartil el cual comprende el 50% de los datos es equivalente a la mediana. Q2 = Me
58
Cuartiles Calculo del 3º cuartil.
Se construye la tabla de distribución de frecuencias acumuladas. Se identifica la clase que contiene a Q3 determinando la menor de las frecuencias absolutas acumuladas Nk que supere el valor de 3n/4 La frecuencia absoluta acumulada que supera a 20,25 pertenece al 3º intervalo [4-6) Con n= 27 3n/4 = (3 x 27)/4 = 20,25
59
Cuartiles Calculo del 3º cuartil.
Se utiliza la siguiente formula de interpolación: Li: limite inferior de la clase del cuartil. C: amplitud del intervalo del cuartil. Nk-1: Frecuencia absoluta acumulada del intervalo anterior al del cuartil. nk: Frecuencia absoluta del intervalo del cuartil.
60
Cuartiles Interpretación:
El 75% de los accidentes ocurren antes que el trabajador cumpla 5,3 horas de trabajo y el 25% restante de los accidentes ocurren sobre las 5,3 horas de trabajo.
61
Ejercicio Propuesto La siguiente información corresponde al consumo mensual en combustible destinado a calefacción, expresado en miles de $, en una muestra aleatoria de hogares de un barrio de Santiago en los meses de invierno: Calcule cada uno de los cuartiles e interprete su significado, en relación a la tabla de distribución
62
Diagrama de Caja Se dibuja un rectángulo cuyos extremos son Q1 y Q3 e indicar la posición de la mediana, mediante un segmento de recta vertical. Así, dentro de la caja queda representado el 50% central de la información contenida en los datos. Es una representación semigráfica de una distribución constante. Se utiliza cuando la muestra no es muy grande. Construcción de una diagrama de caja: Se ordenan los datos de la muestra, identificando el valor mínimo y el máximo, luego se obtiene el recorrido y los tres cuartiles.
63
Diagrama de Caja La tabla de distribución de frecuencias adjunta indica el número de años de experiencia de una muestra de expertos en el área de administración de empresas. Con esta información construya un diagrama de cajas
64
Diagrama de Caja SOLUCIÓN: Xmin = 0 años. Xmáx = 15 años.
Q1 = 3,7 años Q2 = Me = 5,4 años Q3 = 7,9 años.
65
Ejercicio Observe el siguiente diagrama de caja, el cual representa la Deuda morosa de clientes de la empresa CONAFE residentes en la comuna de Viña del Mar (Miles de $) Realice 5 afirmaciones
66
Ejercicio El 25% de los deudores, deben entre 10 y 20 mil pesos.
De los deudores, el 50% adeuda, cuando más, $ El 75% de los deudores, deben más de 20 mil pesos. El 25% de los deudores, deben a lo menos $40 mil a CONAFE. El 50% de los deudores, deben entre 20 y 40 mil pesos.
67
Deciles Ejemplo: Calcular el decil 3 y 7 de la siguiente tabla de horas asociadas hasta que ocurre un trabajo Los deciles son puntos o medidas que dividen a la muestra ordenada en diez grupos de igual tamaño. Se denota Di el decil i- ésimo con i = 1,2,3,...,9
68
Deciles Calculo del 3º decil.
Se construye la tabla de distribución de frecuencias acumuladas. Se identifica la clase que contiene a D3 determinando la menor de las frecuencias absolutas acumuladas Nk que supere el valor de (3n)/10 La frecuencia absoluta acumulada que supera a 8,1 pertenece al 2º intervalo [2-4) Con n= 27 3n/10 = 3x27/10 = 8,1
69
Deciles Calculo del 3º decil.
Se utiliza la siguiente formula de interpolación: Li: limite inferior de la clase del decil C: amplitud del intervalo del decil. Nk-1: Frecuencia absoluta acumulada del intervalo anterior al del decil. nk: Frecuencia absoluta del intervalo del decil. Di: Número del decil.
70
Deciles Interpretación:
El 30% de los accidentes ocurren antes que el trabajador cumpla 2,38 horas de trabajo y el 70% restante de los accidentes ocurren sobre las 2,38 horas de trabajo.
71
Deciles Calculo del 7º decil. Con n= 27 7n/10 = 7x27/10 = 18,9 El intervalo del 7º decil es [4 – 6) Reemplazando: D7 = x [ (18,9 – 17)/5 ] D7 = 4,76 Horas Interpretación: El 70% de los accidentes ocurren antes que el trabajador cumpla 4,76 horas de trabajo y el 30% restante de los accidentes ocurren sobre las 4,76 horas de trabajo.
72
Ejercicio Propuesto La siguiente información corresponde al consumo mensual en combustible destinado a calefacción, expresado en miles de $, en una muestra aleatoria de hogares de un barrio de Santiago en los meses de invierno: Calcule el 4º decil e interprete
73
Percentiles Ejemplo: Calcular el percentil 10 y 95 de la siguiente tabla de horas asociadas hasta que ocurre un trabajo Los percentiles son puntos o medidas que dividen a la muestra ordenada en cien grupos de igual tamaño. Se denota Pi el perceptili- ésimo con i = 1,2,3,...,99
74
Percentiles Calculo del 10º percentil.
Se construye la tabla de distribución de frecuencias acumuladas. Se identifica la clase que contiene a P10 determinando la menor de las frecuencias absolutas acumuladas Nk que supere el valor de (10n)/100 La frecuencia absoluta acumulada que supera a 2,7 pertenece al 1º intervalo [0- 2) Con n= 27 10n/100 = 10x27/100 = 2,7
75
Percentiles Calculo del 10º percentil.
Se utiliza la siguiente formula de interpolación: Li: limite inferior de la clase del percentil. C: amplitud del intervalo del percentil. Nk-1: Frecuencia absoluta acumulada del intervalo anterior al del percentil. nk: Frecuencia absoluta del intervalo del percentil. Pi: Número del percentil.
76
Percentiles Interpretación:
El 10% de los accidentes ocurren antes que el trabajador cumpla 0,9 horas de trabajo y el 90% restante de los accidentes ocurren sobre las 0,9 horas de trabajo.
77
Percentiles Calculo del percentil 95 Con n= 27 95n/100 = 95x27/100 = 25,65 El intervalo del percentil 95 es [8 – 10] Reemplazando: P95 = x [ (25,65 – 24)/3 ] P95 = 9,65 Horas Interpretación: El 95% de los accidentes ocurren antes que el trabajador cumpla 9,65 horas de trabajo y el 5% restante de los accidentes ocurren sobre las 9,65 horas de trabajo.
78
Ejercicio Propuesto La siguiente información corresponde al consumo mensual en combustible destinado a calefacción, expresado en miles de $, en una muestra aleatoria de hogares de un barrio de Santiago en los meses de invierno: Calcule el percentil 75 e interprete
79
ESTADÍSTICA DESCRIPTIVA
CLASE N°7 Estadígrafos de Dispersión: Varianza, desviación Estándar y Coeficiente de Variación
80
Estadígrafos de dispersión
La dispersión se relaciona con la mayor o menor concentración de datos en torno a un valor central generalmente el promedio o media. Por si solas las Medidas de Posición no permiten caracterizar de cómo es una distribución. Las Medidas de Dispersión, indican como se distribuyen las observaciones, generalmente con respecto a la media.
81
Varianza y Desviación Estándar
La varianza se define, en datos agrupados, como: Ambos estadígrafos están relacionados. La varianza se define, en datos no agrupados, como: n: Números de elementos de la muestra. : Media aritmética o promedio. Xi: Valor de la variable. ni: Frecuencia absoluta de la variable. También se le define como:
82
Varianza y Desviación Estándar
La Desviación Estándar o Desviación Típica es la raíz cuadrada de la varianza. Para los datos no agrupados. Para los datos agrupados.
83
Ejercicio Se dispone de la siguiente información sobre el consumo de un producto envasado en latas. Se encuestó a un grupo de 20 familias y se interrogó: ¿cuántas unidades de este producto, mensualmente consume su grupo familiar? Calcule: Media Aritmética, Varianza y Desviación Estándar
84
Ejercicio RESULTADO: Media Aritmética: 2,3 unidades.
Varianza: 2,61 unidades Desviación Estándar: 1,62 unidades. Se clasifican los ingresos mensuales de los trabajadores, de una empresa (en miles de pesos), obteniéndose los siguientes resultados. Calcule: Varianza y Desviación Estándar
85
Ejercicio RESULTADO: Media Aritmética: 675,93 pesos.
Varianza: 7150,62 pesos Desviación Estándar: 84,30 pesos
86
Coeficiente de Variación
El coeficiente de variación permite comparar la dispersión entre dos poblaciones distintas e incluso, comparar la variación producto de dos variables diferentes (que pueden provenir de una misma población). Formula:
87
Ejercicio La siguiente tabla muestra las horas de trabajo transcurridas hasta que un trabajador sufre un accidente de trabajo, investigación realizada a una muestra de 27 accidentes de trabajo. Calcule el coeficiente de variación e interprete.
88
Ejercicio La media aritmética y la desviación estándar es:
El cálculo de coeficiente de variación: Esto significa que existe una dispersión de un 62,98% en relación a la media.
89
Ejercicio Se conoce la información respecto de los ingresos de los trabajadores de dos secciones de una empresa, A y B. El ingreso promedio de los trabajadores de la sección A es de $ con una desviación típica de $ Los trabajadores de la sección B tienen un ingreso promedio de $ con una desviación típica de $ ¿En cual de las dos secciones existe una dispersión relativa mayor? Justifique su respuesta.
90
Ejercicio Dispersión relativa mayor en la sección B.
91
Asimetría Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmética). La asimetría presenta tres estados diferentes Se dice que la asimetría es positiva cuando la mayoría de los datos se encuentran por encima del valor de la media aritmética, La curva es Simétrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la curva.
92
Asimetría La asimetría negativa es cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.
93
Asimetría (g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difícil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos (± 0.5). (g1 > 0): La curva es asimétricamente positiva por lo que los valores se tienden a reunir más en la parte izquierda que en la derecha de la media.
94
Asimetría (g1 < 0): La curva es asimétricamente negativa por lo que los valores se tienden a reunir más en la parte derecha de la media. Entre mayor sea el número (Positivo o Negativo), mayor será la distancia que separa la aglomeración de los valores con respecto a la media.
95
Curtosis Esta medida determina el grado de concentración que presentan los valores en la región central de la distribución. Por medio del Coeficiente de Curtosis, se puede identificar si existe una gran concentración de valores (Leptocúrtica), una concentración normal (Mesocúrtica) ó una baja concentración (Platicúrtica).
96
Curtosis (g2 = 0): la distribución es Mesocúrtica: Al igual que en la asimetría es bastante difícil encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos (± 0.5 aprox.). (g2 > 0): la distribución es Leptocúrtica (g2 < 0): la distribución es Platicúrtica
97
ESTADÍSTICA DESCRIPTIVA
FIN DE CURSO
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.