Estadística y probabilidad aplicada a los negocios Prof. Víctor Manuel Romero Medina DCB e I Enero de 2010
Unidad 3. Estadística descriptiva: Métodos numéricos Hay varias medidas numéricas de localización, dispersión y asociación; si se calculan a partir de una muestra se llaman estadísticos de la muestra, si se calculan a partir de datos de una población se denominan parámetros poblacionales.
3.1 .- Medidas de localización Media o promedio. Es una medida de la localización central. Media de la muestra: Media de la población:
3.1 .- Medidas de localización Mediana. Es el valor intermedio cuando los valores se ordenan de forma ascendente. Depende de la cantidad de observaciones: Impar: La mediana es el valor intermedio. Par: Promedio de los dos valores intermedios.
3.1 .- Medidas de localización Moda. Es el valor de los datos que se presentan con más frecuencia. Bimodal: Si los datos tienen exactamente dos modas. Multimodal: Si los datos tienen más de dos modas.
3.1 .- Medidas de localización Percentil. El p-ésimo percentil es un valor tal que por lo menos p por ciento de las observaciones son menores o iguales que p y por lo menos (100 – p) por ciento de las observaciones son mayores o iguales que p
3.1 .- Medidas de localización Cálculo del p-ésimo Percentil. Ordenar los datos de forma ascendente. Calcular el índice i para el p de interés Si i no es entero, se determina el máximo entero; si i es entero, p es el promedio de los valores ubicados en las posiciones i e i + 1.
3.1 .- Medidas de localización Cuartiles. Son percentiles específicos que dividen a los datos en cuatro partes en intervalos de 25%. Q1 = primer cuartil, o percentil 25. Q2 = segundo cuartil, o percentil 50. Mediana. Q3 = tercer cuartil, o percentil 75. 25% 25% 25% 25% Q1 Q2 Q3
3.2 .- Medidas de variabilidad Rango. Es la diferencia entre los valores máximo y mínimo. Rango intercuartil. Es una medida de la dispersión que elimina la influencia de los valores extremos de los datos.
3.2 .- Medidas de variabilidad Varianza. Es una medida de la dispersión que emplea todos los datos. Se basa en la diferencia entre cada observación (xi) y la media. Varianza de la muestra: Varianza de la población:
3.2 .- Medidas de variabilidad Desviación estándar. Varianza de la muestra: Varianza de la población:
3.2 .- Medidas de variabilidad Coeficiente de variación. Es una medida estadística descriptiva que indica lo grande que es la desviación estándar en comparación con la media.
3.3 .- Medidas de localización relativa y detección de valores atípicos Valor z. Se interpreta como el número de desviaciones estándar que dista un dato con respecto a la media.
3.3 .- Medidas de localización relativa y detección de valores atípicos Teorema de Chebyshev. Cuando menos de los datos debe estar a menos de z desviaciones estandar de separación respecto de la media, siendo z cualquier valor mayor a 1.
3.4 .- Análisis exploratorio de datos Trabajo en equipo. Investigar el método DIAGRAMA DE CAJA y presentar tres ejemplos de aplicación.
3.5 .- Medidas de asociación entre dos variables Covarianza. Muestra: Población:
3.5 .- Medidas de asociación entre dos variables Coeficiente de correlación. Muestra: Población:
3.5 .- Medidas de asociación entre dos variables Trabajo en equipo. Investigar el tema MEDIA PONDERADA Y MANEJO DE DATOS AGRUPADOS y presentar tres ejemplos de aplicación.
Ejercicios (Anderson Cap. 3) 3, 8, 17, 18, 27, 40, 43, 47, 55, 56
Cantidad de comerciales x Volumen de ventas (cientos de pesos) y Ejemplo Semana Cantidad de comerciales x Volumen de ventas (cientos de pesos) y 1 2 50 5 57 3 41 4 54 6 38 7 63 8 48 9 59 10 46