MAESTRÍA EN ADMINISTRACIÓN DE NEGOCIOS Curso: Estadística para la Administración Catedrático: Ing. Carlos Alberto Carrera Leal Correo Electrónico: ccarreraleal@yahoo.com Requerimientos académicos: calculadora, formulario, hojas cuadrícula.
Evaluación del curso: Ejercicios en clase Tareas para casa 30 puntos Examen parcial 30 puntos Proyecto Final 10 puntos Zona total 70 puntos Examen final 30 puntos Nota total 100 puntos
Sugerencias: En un curso práctico la asistencia al mismo es parte fundamental del correcto aprendizaje en cadena que conllevan los temas, es importante su disciplina en asistir al mismo, toda tarea entregada en forma tardía se recibe en la siguiente sesión sin embargo no se pondera con el mismo punteo.
División de la Estadística Distribución de Frecuencias. Sesión # 1 División de la Estadística Distribución de Frecuencias.
Definiciones de Estadística: Rama de la matemática que se ocupa de reunir, organizar y analizar datos numéricos y que ayuda a resolver problemas como el diseño de experimentos y la toma de decisiones. Es un conjunto de métodos, normas, reglas y de principios para observar, agrupar, describir, cuantificar y analizar el comportamiento de un grupo.
División de la Estadística: 1 División de la Estadística: 1. Estadística descriptiva: Indica los procedimientos para transformar los datos del análisis de un fenómeno colectivo, es decir al calcular las medidas de tendencia central, medidas de dispersión, etc., estas medidas describirán el fenómeno completamente y para esto se vale de la recolección, presentación, tabulación y análisis de esos datos.
2. Estadística inferencial: Es la parte de los métodos estadísticos que ayuda a conocer algún aspecto de la población mediante el conocimiento de ciertos aspectos de la muestra. Los aspectos que se desea conocer de la población son un promedio, prueba de hipótesis, intervalos de confianza, etc.
Aplicaciones de la Estadística Descriptiva: Censos poblacionales (recolección de datos) Control de calidad (gráficos) Control de producción (unidades por día) Medidas de tendencia económicas Procesos históricos de precios
Distribuciones estadísticas: Cronológica: tiempo vs. Cantidad Ejemplo: La población por décadas. 2. Cualitativa: Atributo vs. Cantidad Ejemplo: Estado civil de un grupo de mujeres 3. Geográfica: País vs. Porcentaje Ejemplo: porcentaje de población pobre 4. Cuantitativa: Intervalos vs. Cantidad Ejemplo: cantidad de empleados por salario.
DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS AGRUPADOS Y NO AGRUPADOS
Distribución de frecuencias: Es una representación de la relación entre un conjunto de medidas y la frecuencia de cada una de ellas. También nos indica la frecuencia con que aparecen los números desde el menor del conjunto de los datos hasta el mayor de ese conjunto.
Ejemplo # 1: Organizar en una distribución de frecuencias los punteos obtenidos en un examen de estadística por 30 alumnos. 60 79 55 65 80 57 72 82 50 60 78 76 88 45 58 76 48 60 78 58 75 82 68 82 53 60 80 Solución: se procede a encontrar el dato menor y el dato mayor, se ordenan ascendentemente y luego se tabulan.
Distribución de frecuencia de valores agrupados: Cuando los datos estadísticos que se disponen son numerosos se pueden organizar y clasificar en una distribución de frecuencias de valores agrupados en intervalos de amplitud constante y variable.
Fórmulas a utilizar: Rango= Dato mayor – Dato Menor Número de Intervalo de Clase: Este será entre 5 y 10. Amplitud de Intervalo = Rango / Número de Intervalos Marca de clase(Xi)=(Límite mayor+ Límite menor) / 2.
Ejercicio#1: Construya una distribución de frecuencia de datos agrupados para los punteos obtenidos por 30 alumnos de estadística, colocando las columnas de límites aparentes, límites reales, marca de clase, frecuencia y frecuencia acumulada, con 5 intervalos. 89 76 86 75 67 88 87 89 90 74 84 77 80 96 78 76 80 75 78 85 65 68 80 88 79 85 83 69
GRÁFICOS ESTADÍSTICOS Sesión # 2: GRÁFICOS ESTADÍSTICOS
Diagrama de barras Un diagrama de barras se utiliza para representar datos cualitativos o datos cuantitativos de tipo discreto. Se representan sobre unos ejes de coordenadas, en el eje de abscisas (x) se colocan los valores de la variable, y sobre el eje de ordenadas (Y) las frecuencias absolutas o relativas o acumuladas. Los datos se representan mediante de una altura proporcional a la frecuencia.
Año Remesas 1978 Q396,149.00 1980 Q1,224,602.00 1983 Q1,364,678.00 1991 Q2,004,900.00 1995 Q2,400,000.00 1998 Q2,790,868.00 2000 Q4,287,997.00 2002 Q5,160,221.00 2005 Q6,054,227.00 2007 Q8,331,874.00 2009 Q11,237,196.00 2012 Q14,361,666.00
Diagrama de sectores: Se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas. Los datos se representan en un círculo, de modo que el ángulo de cada sector es proporcional a la frecuencia absoluta correspondiente. El diagrama circular se construye con la ayuda del plano cartesiano y sus cuadrantes.
Ejemplo # 1: En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natación, 4 juegan al fútbol y el resto no practica ningún deporte. Realizar un diagrama de barras y un diagrama de sectores que represente cada uno de los deportes.
Diagrama de Barras Pareadas: Realiza el comparativo de dos o mas variables dentro de una misma gráfica, esto permite observar el crecimiento, decrecimiento o continuidad de los datos, no se necesita contar con una tabla de datos agrupados, sino más bien una tabla de valores puntuales.
Ejemplo # 2: A continuación se detallan los datos de las ventas por año de dos productos dentro de la compañía, es necesario realizar un diagrama de barras pareadas y establecer el avance en las ventas de dichos productos. Año Producto X Producto Y 2010 45,000 48,000 2011 54,000 61,000 59,000 43,000 63,000 59,000 65,000 72,000
Histograma Un histograma es una representación gráfica de una variable en forma de barras. Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y que se han agrupado en clases. En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia de cada intervalo. La superficie de cada barra es proporcional a la frecuencia de los valores representados.
Polígono de Frecuencia: Es un gráfico de líneas trazado sobre las marcas de clase. Para construirlo se marca cada clase de frecuencia correspondiente en el punto medio de su clase. Los puntos marcados se unen después por una serie de segmentos rectilíneos. Existe la variante de Polígono de frecuencia acumulada, que toma los límites reales vs. la frecuencia acumulada.
EJEMPLO 3 Listado de notas de los estudiantes del curso de Estadística I 96 80 75 68 72 78 84 92 94 70 82 86 90 85 98 69 93 95 Realizar la Distribución de frecuencias para datos agrupados Graficar un Histograma y un polígono de frecuencia en el mismo plano Graficar un Polígono de frecuencias acumuladas
Pictograma: Son representaciones en las que se emplean símbolos o dibujos con el valor determinado y uniforme, que son representativos del fenómeno que se quiere dar a conocer. Para hacerlo debe tenerse cuidado que el dibujo o figura utilizada, reproduzca con claridad lo que se desea representar.
REALIZAR UN PICTOGRAMA DE DICHA TABLA. Ejemplo # 4 La tabla siguiente representa la venta de vehículos en una agencia particular, por marca MARCA CANTIDAD Renault 80 Toyota 250 Kia 105 Chevrolet 200 Ford 210 Mitsubishi 100 REALIZAR UN PICTOGRAMA DE DICHA TABLA.
MEDIDAS DE TENDENCIA CENTRAL Sesión # 3 MEDIDAS DE TENDENCIA CENTRAL
¿Qué es una medida de tendencia central ¿Qué es una medida de tendencia central? Debido a que la mayor cantidad de datos se encuentran ubicados en la parte central de las gráficas, se busca mediante un dato específico representar el total de los mismos, la condición es que exista en dichos datos una tendencia a reunirse en torno a un valor central.
MEDIA ARITMÉTICA La media aritmética es el valor obtenido después de sumar todos los datos y de dividir el total entre el número de datos que haya. Puede calcularse para datos agrupados y no agrupados y se representa por
Para datos no agrupados, es más sencillo calcular el valor de la media aritmética, pues se deben sumar los valores y dividirlos dentro del número de datos posibles, esto mediante la siguiente fórmula:
Para datos agrupados, es necesario crear una tabla de distribución de frecuencias, la cuál permite desarrollar y encontrar el valor central de la media o promedio, la fórmula para el cálculo de dicho valor es la siguiente:
EJEMPLO # 1: Calcular la media aritmética en la tabla siguiente. Número de asentamientos por zonas en el departamento de Guatemala y la población de los mismos ZONA NÚMERO POBLACIÓN 3 28 9,213 5 12 12,301 6 40 20,197 7 70 23,596 18 80 29,710 21 14 14,181
MEDIANA Con esta medida podemos identificar el valor que se encuentra en el centro de los datos. Es decir que nos permite conocer el valor que se encuentra en la mitad del conjunto de datos, el número que hace de valor central de todo el rango de los datos se denomina Mediana.
La mediana en una serie de datos simple se calcula así: Se ordenan las mediciones de menor a mayor Se determina si el número total de las mediciones es impar o par. Si el número de mediciones es impar la mediana es el número de en medio, si es par el lugar de la mediana se obtiene (N+1)/2.
Ejemplo # 1: Determinar la mediana del conjunto: 3, 5, 8, 7, 4, 8 ,10 Ejemplo # 1: Determinar la mediana del conjunto: 3, 5, 8, 7, 4, 8 ,10. Ejemplo # 2: Determinar la mediana del conjunto: 2, 5, 7, 4, 6, 8, 3, 9.
La mediana para datos agrupados se calcula así: Se determina el intervalo que contiene N/2. Se determina la frecuencia acumulada que corresponde al intervalo inmediato inferior al intervalo de la mediana. Se determina la frecuencia del intervalo en donde se encuentra la mediana. Se determina la amplitud del intervalo. Se determina el límite real del intervalo donde está la mediana.
La fórmula para el cálculo de la mediana es: Donde: Lri = Límite real inferior del intervalo Fa= Frecuencia acumulada anterior de la mediana. fm=frecuencia del intervalo donde esta la mediana. i= amplitud del intervalo
MODA Es aquel valor que tiene la frecuencia mayor o es el valor particular que ocurre más frecuentemente que cualquier otro. Una distribución con una sola moda se llama unimodal. Si dos valores tienen la misma frecuencia se dice que el conjunto es bimodal.
Para datos no agrupados se ubica el dato que más frecuentemente se repite y esa es la moda. Ejemplo: Calcule la moda, media y mediana del conjunto de datos: 24, 25, 23, 21, 26, 25, 27, 28, 23, 26, 25, 23, 22, 23, 24, 23, 24, 25.
Para datos agrupados, se utiliza la siguiente fórmula: Lri = Límite real inferior donde más datos hay. = frecuencia de la moda – frecuencia anterior = frecuencia de la moda – frecuencia posterior I = amplitud del intervalo.
Ejemplo: Creek Ratz es un restaurante muy popular en el sur de Florida, la gerencia está interesada en conocer el tiempo que un cliente tiene que esperar antes de pasar a la mesa, a continuación aparece la lista de tiempos de espera en minutos de las 25 mesas que se ocuparon la noche del sábado anterior.
TAREA # 3 1. Calcular la moda, mediana y media aritmética del conjunto de datos: 9, 12, 15, 17, 18, 18, 19, 20, 20, 20, 23, 25, 30. 2 .Calcular la moda, mediana y media aritmética Límite f 50 - 59 1 60 - 69 5 70 - 79 18 80- 89 15 90 - 99 14
Sesión # 4 MEDIDAS DE POSICIÓN
Estos valores son de la misma familia de la mediana, por lo que para calcularlos en las distribuciones de datos agrupados en intervalos, se pude utilizar la fórmula de la mediana, solo que el total de los datos en lugar de dividirlos entre dos, se dividen entre 4 para los cuartiles, entre 10 para los deciles y entre 100 para los percentiles.
Cálculo de los Cuartiles Son los valores que dividen los datos en cuatro partes iguales. Estos valores representados por Q1, Q2, Q3, se llaman primero, segundo y tercer cuartil. Esto quiere decir que se calcula el 25%, 50% y 75% de los datos.
Las fórmulas para el cálculo de los cuartiles son las siguientes:
Donde: Lri = Límite real inferior en donde se encuentra el cuartil buscado. N = Número total de datos Fa = Frecuencia acumulada anterior el intervalo donde se encuentra el cuartil. fQ = Frecuencia del intervalo donde se encuentra el cuartil. I = Amplitud del intervalo.
Cálculo de los Deciles Si en lugar de dividir la distribución de frecuencias en 4 partes iguales se divide en 10 partes iguales, se tiene 9 puntos de división correspondiendo cada uno a un decil, así el primer decil corresponde al valor del 10% de los datos, para el segundo decil el 20% y así sucesivamente.
La fórmula para el cálculo de los deciles es la siguiente:
Donde: Lri = Límite real inferior en donde se encuentra el decil buscado. N = Número total de datos X = Número del decil. Fa = Frecuencia acumulada anterior el intervalo donde se encuentra el decil. fD = Frecuencia del intervalo donde se encuentra el decil. I = Amplitud del intervalo.
Cálculo de los Percentiles: Si se divide el número total de los casos de una distribución de frecuencias en cien partes iguales, se obtienen noventa y nueve puntos llamados percentiles. Por Ejemplo el percentil 80 coincide con el decil 8, o sea con el 80% de los datos.
La fórmula para el cálculo de los percentiles es la siguiente:
Donde: Lri = Límite real inferior en donde se encuentra el percentil buscado. N = Número total de datos X = Número del percentil. Fa = Frecuencia acumulada anterior el intervalo donde se encuentra el percentil. fP = Frecuencia del intervalo donde se encuentra el percentil. I = Amplitud del intervalo.
Ejemplo: La división de servicios alimentarios de Cedar River Park Inc Ejemplo: La división de servicios alimentarios de Cedar River Park Inc., estudia la cantidad que gastan al día en alimento y bebida las familias que visitan el parque de diversiones. Una muestra de 40 familias que visitó el parque el dia anterior revela que estas gastaron las siguientes cantidades (en dólares), calcular el Cuartil 3, Decil 6, Percentil 33 y colocar los valores en un Histograma.
Tarea # 4 Calcular el Cuartil 2 y 3, Decil 3 y 8, Percentil 43 y percentil 88, Media Aritmética, Mediana y Moda, graficarlos en un Histograma de la tabla de las notas del curso Física I. Límite f 53 - 60 1 61 - 68 2 69 - 76 10 77 - 84 23 85 - 92 11 93 - 100 13