Estadística Básica: Conceptos y Aplicaciones Presentación de Datos en Tablas y Gráficas Capítulo 2
Objetivos de Aprendizaje 1. Organizar Datos Numéricos 2. Tablas y Gráficas para Variables Numéricas Graficar Datos Numéricos Bivariados 4. Tabular y Graficar Datos Categóricos 5. Diferenciar entre una Buena y Mala Presentación de Datos As a result of this class, you will be able to...
Tabulando y Graficando Datos Categóricos Datos Univariados : Tabular utilizando una Tabla de Resumen. Graficar utilizando: Gráfica de Barras, o, Gráfica de Pastel o Diagrama de Pareto. Datos Bivariados : Tabular utilizando una Tabla de Contingencia. Graficar utilizando un Gráfica de Barras Pareada.
Tabla de Resumen Indica la frecuencia, cantidad, o porcentaje de objetos en un conjunto de categorías para observar las diferencias que hay entre ellas. Lista las categorías en una columna(s) independiente(s).
Tabla de Resumen Ejemplo Se lleva a cabo una encuesta en el campus seleccionando 200 estudiantes al azar para determinar su(s) área de concentración (Major). Se obtienen los resultados y se tabulan utilizando una Tabla de Resumen.
Tabla de Resumen 1. Lista Categorías y No. Elementos por Categoría Se cuentan las respuestas obtenidas por categoría 3. Puede mostrar Frecuencias (Cuentas), % or ambos Renglón es la Categoría Major Cuenta “Tally”: |||| |||| |||| |||| Contabilidad 130 Economía 20 Gerencia 50 Total 200
Diagrama de Pareto pasos 1. Establecer tabla de resumen confrecuencias en orden descendentes 2. Añadir columnas con frecuencias relativas y acumuladas ne base porcentual (%) 3. Graficar barras contiguas en orden descendentes. Alturas proporcionales a las frecuencias de la(s) categoría Categoría frq. frq. rel % freq. acum. % Contabilidad 130 65 Gerencia 50 25 90 Economía 20 10 100 Total 200
Diagrama de Pareto Porciento Major 100% 67% 33% 0% Gerencia Economía Polígono Cumulativo (Ojiva) Punto Medio de la Barra Porciento Siempre % 100% Flags the ‘vital few’ from the ‘trivial many’. 67% Orden Descendente 33% 0% Gerencia Ancho de Barras Iguales Economía Contabilidad Major
Gráfica de Pastel (“Pie Chart”) 1. Muestra Distribución del Total en Categorías 2.Útil para mostrar Diferencias Relativas 3.Tamaño del Ángulo (360°)(Porciento) Majors Geren. Econ. 25% 10% 36° Cont. 65% (360°) (10%) = 36°
Gráfica de Barras Major Frecuencia Geren. Econ. Cont. 50 100 150 Barras Horizontales para Variables Categóricas Major Longitud de Barra muestra Frecuencia o % Geren. Horizontal bars are used for categorical variables. Vertical bars are used for numerical variables. Still, some variation exists on this point in the literature. Also, there are many variations on the bar (e.g., stacked bar) Ancho de Barra Iguales Econ. 1/2 a 1 Ancho de Barra Cont. 50 100 150 Origen = Cero Frecuencia Perciento Usado También
Graficando Datos Numéricos Bivariados 1. Diagrama de Dispersión resultados de dos variables numéricas aleatorias, estudiadas simultaneamente, gráfica de todos los pares (Xi, Yi) 2. Gráfica de Series de Tiempo ilustra cómo una serie de datos numéricos cambian con el tiempo
Gráfica de Serie de Tiempo Ventas 8 6 4 2 91 92 93 94 95 96 Año
Componentes de la Serie de Tiempo Tendencias Ciclos Temporadas Aleatorios 25
Componente Ciclico Movimientos repetitivos ascendentes o descendentes Debido a la interación de factores que influencian la economía Usualmente 2-10 años de duración Mo., Qtr., Yr. Respuesta Ciclo 27
Componente de Temporada Patrón regular de fluctuaciones ascendentes o descendentes Debido al tiempo, costumbres etc. Occuren dentro de 1 año Mo., Qtr. Response Verano 28
Componente Aleatorio Fluctuaciones erráticas, no sistemático, residuales Debido a variaciones o eventos imprevistos Huelga Tormenta Corta duración y no se repiten 29
Componente de Tendencia Patrón persistente, ascendente o descendente Debido a población, tecnología etc. Varios años de duración Mo., Qtr., Yr. Respuesta 26
Diagrama de Dispersión Gráfica (“Plot”) de Todos los Pares (Xi, Yi) Y 60 40 20 X 20 40 60
Gráfica de Barras Pareada Residencia En Campus M F Fuera del Campus M F 0 1 2 3 4 5 6 Frecuencia
Organizción de Datos Numéricos Arreglo Distribución Ordenado Frecuencia Diagrama Histo- Polígono Ojiva Tallo-&-Hoja grama
Diagrama Tallo-Hoja 1. Organiza los Datos Enfocando Características Importantes 2. Datos se Colocan en Orden Ascendente Menor a Mayor Datos Crudos (según Colectados) 24, 26, 24, 21, 27, 27, 30, 41, 32, 38 Datos en Orden 21, 24, 24, 26, 27, 27, 30, 32, 38, 41
Diagrama Tallo-Hoja Xi Divida Cada Observación un Valor Tallo y un Valor Hoja Valor Tallo Define la Clase Valor Hoja Define la Frecuencia (Cuenta o “Tally”) Xi
Diagrama Tallo-Hoja 2 1 4 4 6 7 7 3 0 2 8 4 1
Organizar Datos Numéricos Arreglo Distribución Ordenado Frecuencia Diagrama Histo- Polígono Ojiva Tallo-&-Hoja grama
Pasos para la Distribución de Frecuencias Ordene los datos Seleccione el Numero de Clases k Determine el Rango R 3. Compute el Ancho de Clase w Determine las Fronteras de Clases 5. Compute el Punto Medio de la Clase Xi 6. Cuente las Observaciones y Asignelas a las Clases
Número de Clases k Regla de Sturges K= 1+3.322(log n) k= 1+3.322(log10) log10 = 1 k =1+3.322 (1) k= 1 + 3.322 = 4.3 ≈ 4 K = 4 Datos Crudos: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38 n = 10
El Rango (Recorrido) R R = Xmax – Xmin R = 41 – 21= 20 R = 20 Datos Crudos: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38
El Ancho de la Clase w w = R/k w = 20/4 = 5 w = 5 Datos Crudos: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38
La(s) Frontera(s) o Límites de las Clases Li = Límite inferior de la clase. Este será el límite superior de la clase que la antecede. La primera clase tendrá como límite inferior al valor más bajo en el conjunto de datos a ser agrupados. En nuestro ejemplo este # es 21. Ls = Límite superior de la clase:se obtiene sumando el ancho de la clase al límite inferior de la clase: Ls = Li + w En nuestro ejemplo será: 21 + 5 = 26 Las clases subsiguientes tendran como limite inferior el límite superior de la clase que le antecede. En nuestro ejemplo la segunda clase tendrá como límite inferior a 26, el cual es el límite superior de la clase que le antecede la cual es la primera.
El Punto Medio de la Clase Xi Por ejemplo, el punto medio de la primera clase sería
Distribución Frecuencia Ejemplo Datos Crudos: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38 Punto Medio Frecuencia Abs Rel % Clase x Li ≤ < Ls 21 26 23.5 3 .3 30% 26 31 4 .4 40% 28.5 31 36 33.5 1 .1 10% 36 41 38.5 2 .2 20% Fronteras (Fronteras Superior + Inferior) / 2
Histograma 5 Frecuencia Absoluta 4 Relativa o 3 Porciento Barras se Tocan 2 1 0 21 26 31 36 41 Clases
Polígono de Frecuencias 5 4 Frecuencia Absoluta Relativa o Porciento 3 2 1 0 23.5 28.5 33.5 38.5 Punto Medio