2.- Organización de los Datos ESTADISTICA A UNMSM - FQIQ 2.- Organización de los Datos ING.JOSE MANUEL GARCIA PANTIGOZO
Tablas de Distribución ESTADISTICA A UNMSM - FQIQ Tablas de Distribución de Frecuencias ING.JOSE MANUEL GARCIA PANTIGOZO
ORGANIZACION Y PRESENTACION DE DATOS UNIDIMENSIONALES ESTADISTICA A ORGANIZACION Y PRESENTACION DE DATOS UNIDIMENSIONALES UNMSM - FQIQ Frecuencia Absoluta (fi) Es el número de veces que se presenta un valor o categoría de una variable. Se representa por fi. f1 + f2 + f3 + …………….……fk = n b) Frecuencia Absoluta Acumulada (Fi) Es el número de datos igual o inferior (“menor o igual que”) al valor considerado de la variable o la suma de las frecuiencias absolutas menor o igual que el valor considerado de la variable. Es decir: F1 = f1 F2 = f1 + f2 ----------------------------- Fk = f1 + f2 + ……….+ fk ING.JOSE MANUEL GARCIA PANTIGOZO
ORGANIZACION Y PRESENTACION DE DATOS UNIDIMENSIONALES ESTADISTICA A ORGANIZACION Y PRESENTACION DE DATOS UNIDIMENSIONALES UNMSM - FQIQ c) Frecuencia Relativa (hi) Es igual a la frecuencia absoluta sobre el numero de observaciones. h1 =f1/n b) Frecuencia Relativa Acumulada (Hi) Es el resultado de cada frecuencia absoluta acumulada dividida entre el numero total de observaciones. H1 = F1/n H2 = F2/n ----------------------------- Hk = Fk/n ING.JOSE MANUEL GARCIA PANTIGOZO
Consideremos el siguiente ejemplo ESTADISTICA A 1-9 UNMSM - FQIQ Consideremos el siguiente ejemplo Se quiere saber el número de hijos por matrimonio en Guayaquil. Para este propósito se elige una muestra representativa de 50 matrimonios de ella. Se obtienen los siguientes datos: 2 , 2 , 4 , 1 , 3 , 5 , 3 , 2 , 1 , 6 , 3 , 4 , 1 , 2 , 0 , 2 , 3 , 1 , 7 , 4 , 2, , 3 , 0 , 5 , 1 , 4 , 3 , 2 , 4 , 1 , 5 , 2 , 1 , 2 , 4 , 0 , 3 , 3 , 2 , 6 , 1 , 5 , 4 , 2 , 0 , 3 , 2 , 4 , 3 , 1 . El número total de datos se representa con la letra n. En nuestro ejemplo n = 50. ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA ABSOLUTA ( fi ) ESTADISTICA A FRECUENCIA ABSOLUTA ( fi ) UNMSM - FQIQ TABLA x i f i 4 1 9 2 12 3 10 8 5 6 7 La frecuencia absoluta es el número de veces que aparece un valor (x i) en los datos obtenidos. En nuestro ejemplo, la frecuencia absoluta indica el número de familias que tienen esa cantidad de hijos: ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA ABSOLUTA ( fi ) ESTADISTICA A UNMSM - FQIQ FRECUENCIA ABSOLUTA ( fi ) GRAFICOS ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA ABSOLUTA ( fi ) ESTADISTICA A UNMSM - FQIQ FRECUENCIA ABSOLUTA ( fi ) GRAFICOS ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA ABSOLUTA ( fi ) ESTADISTICA A 1-9 UNMSM - FQIQ FRECUENCIA ABSOLUTA ( fi ) GRAFICOS ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA ABSOLUTA ACUMULADA ( Fi ) ESTADISTICA A 1-9 UNMSM - FQIQ FRECUENCIA ABSOLUTA ACUMULADA ( Fi ) La frecuencia absoluta acumulada indica cuantos elementos de la lista de datos son menores o iguales a un valor dado. Es la suma de las frecuencias absolutas desde la primera fila hasta la fila elegida. Por ejemplo, sabemos que hay 25 matrimonios de la muestra que tienen a lo más 2 hijos: ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA ABSOLUTA ACUMULADA ( Fi ) ESTADISTICA A UNMSM - FQIQ FRECUENCIA ABSOLUTA ACUMULADA ( Fi ) TABLA x i f i F i 4 1 9 13 2 12 25 3 10 35 8 43 5 47 6 49 7 50 ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA ABSOLUTA ACUMULADA ( Fi ) ESTADISTICA A UNMSM - FQIQ FRECUENCIA ABSOLUTA ACUMULADA ( Fi ) GRAFICA ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA ABSOLUTA ACUMULADA ( Fi ) ESTADISTICA A UNMSM - FQIQ FRECUENCIA ABSOLUTA ACUMULADA ( Fi ) GRAFICA ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA RELATIVA ( hi ) ESTADISTICA A 1-9 UNMSM - FQIQ FRECUENCIA RELATIVA ( hi ) La frecuencia relativa es el cuociente entre la frecuencia absoluta (f i) y el número total de datos (n). En nuestro ejemplo n = 50: TABLA x i f i F i h i H i 4 0,08 1 9 13 0,18 0,26 2 12 25 0,24 0,50 3 10 35 0,20 0,70 8 43 0,16 0,86 5 47 0,94 6 49 0,04 0,98 7 50 0,02 1,00 ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA RELATIVA ( hi ) ESTADISTICA A 1-9 UNMSM - FQIQ FRECUENCIA RELATIVA ( hi ) GRAFICA ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA RELATIVA ( hi ) ESTADISTICA A UNMSM - FQIQ FRECUENCIA RELATIVA ( hi ) GRAFICA ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA RELATIVA ACUMULADA (Hi) ESTADISTICA A FRECUENCIA RELATIVA ACUMULADA (Hi) UNMSM - FQIQ La frecuencia relativa acumulada es el cuociente entre la frecuencia absoluta acumulada (F i) y el número total de datos (n). En nuestro ejemplo, n = 50: TABLA: TABLA x i f i F i h i H i 4 0,08 1 9 13 0,18 0,26 2 12 25 0,24 0,50 3 10 35 0,20 0,70 8 43 0,16 0,86 5 47 0,94 6 49 0,04 0,98 7 50 0,02 1,00 ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA RELATIVA ACUMULADA (Hi) ESTADISTICA A FRECUENCIA RELATIVA ACUMULADA (Hi) UNMSM - FQIQ GRAFICA ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA RELATIVA ACUMULADA (Hi) ESTADISTICA A FRECUENCIA RELATIVA ACUMULADA (Hi) UNMSM - FQIQ GRAFICA ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA PORCENTUAL (fi %) ESTADISTICA A FRECUENCIA PORCENTUAL (fi %) UNMSM - FQIQ La frecuencia porcentual es la frecuencia relativa (hi) expresada en forma porcentual. En otras palabras, es la frecuencia relativa (hi) multiplicada por 100. En nuestro ejemplo TABLA x i f i F i h i H i f i % 4 0,08 8 % 1 9 13 0,18 0,26 18 % 2 12 25 0,24 0,50 24 % 3 10 35 0,20 0,70 20 % 8 43 0,16 0,86 16 % 5 47 0,94 6 49 0,04 0,98 4 % 7 50 0,02 1,00 2 % ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA PORCENTUAL (fi %) ESTADISTICA A FRECUENCIA PORCENTUAL (fi %) UNMSM - FQIQ GRAFICA ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA PORCENTUAL (fi %) ESTADISTICA A FRECUENCIA PORCENTUAL (fi %) UNMSM - FQIQ GRAFICA ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA PORCENTUAL ACUMULADO (Fi %) ESTADISTICA A UNMSM - FQIQ FRECUENCIA PORCENTUAL ACUMULADO (Fi %) La frecuencia porcentual acumulada es la frecuencia relativa acumulada (Hi) multiplicada por 100. En nuestro ejemplo: TABLA x i f i F i h i H i f i % F i % 4 0,08 8 % 1 9 13 0,18 0,26 18 % 26 % 2 12 25 0,24 0,50 24 % 50 % 3 10 35 0,20 0,70 20 % 70 % 8 43 0,16 0,86 16 % 86 % 5 47 0,94 94 % 6 49 0,04 0,98 4 % 98 % 7 50 0,02 1,00 2 % 100 % ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA PORCENTUAL ACUMULADO (Fi %) ESTADISTICA A UNMSM - FQIQ FRECUENCIA PORCENTUAL ACUMULADO (Fi %) GRAFICA ING.JOSE MANUEL GARCIA PANTIGOZO
FRECUENCIA PORCENTUAL ACUMULADO (Fi %) ESTADISTICA A UNMSM - FQIQ FRECUENCIA PORCENTUAL ACUMULADO (Fi %) GRAFICA ING.JOSE MANUEL GARCIA PANTIGOZO
2. DESCRIPCION DE DATOS ESTADISTICA A UNMSM - FQIQ ING.JOSE MANUEL GARCIA PANTIGOZO
DISTRIBUCION DE FRECUENCIAS PARA VARIABLES CUANTITATIVA ESTADISTICA A UNMSM - FQIQ DISTRIBUCION DE FRECUENCIAS PARA VARIABLES CUANTITATIVA Identificar el tipo de variable cuantitativo discreto o continuo. Determinar el mayor (Xmax) y el menor (Xmin). Calcular R donde R = Xmax – Xmin. Si la variable es cuantitativa discreta El rango es pequeño, entonces trabajar con los valores originales ordenados de las variables. Si el rango es grande entonces trabajar con los datos ordenados agrupados en intervalo de clase (ver Sturges). ING.JOSE MANUEL GARCIA PANTIGOZO
DISTRIBUCION DE FRECUENCIAS PARA VARIABLES CUANTITATIVA ESTADISTICA A DISTRIBUCION DE FRECUENCIAS PARA VARIABLES CUANTITATIVA UNMSM - FQIQ Si la variable es cuantitativa continua: Determinar el numero de intervalos (entre 5 y 20). Utilizar la regla de Sturge: m = 1 + 3,322log n Si n = 50 m = 1 + 3,322log(50) = 6,6439 Se redondea a m = 7 intervalos de clase. Intervalo cerrado por la izquierda y abierto por la derecha. El menor del intervalo izquierdo =X`min =(Xmin) – menor unidad/2. Marca de clase= (xmax 1er intervalo - X`min )/2 ING.JOSE MANUEL GARCIA PANTIGOZO
ESTADISTICA A UNMSM - FQIQ PROBLEMAS ING.JOSE MANUEL GARCIA PANTIGOZO
Polígonos de Frecuencia (tarea para el alumno). 1-9 ESTADISTICA A UNMSM - FQIQ Problema Nº 01: El Area de Control de Calidad de la empresa FUNDIDOS S. A. esta llevando a cabo un seguimiento a un lote de piezas mecanizadas en su taller de metalmecánica, para esto ha tomado una muestra aleatoria y se necesita obtener el siguiente análisis estadístico descriptivo: Tabla de Frecuencias. Histogramas. Polígonos de Frecuencia (tarea para el alumno). Ojivas (tarea para el alumno). ING.JOSE MANUEL GARCIA PANTIGOZO
ESTADISTICA A UNMSM - FQIQ 1279,5 1285,0 1280,0 1273,0 1284,0 1280,5 1275,5 1278,0 1275,0 1267,0 1272,0 1282,0 1276,0 1269,5 1266,0 1273,5 1285,5 1283,5 1277,5 1286,0 1281,0 1278,5 1276,5 1271,5 1284,5 1268,5 1272,5 1271,0 1265,5 1283,0 1282,5 1279,0 1287,5 1281,5 1277,0 1274,5 1268,0 1269,0 1266,5 1287,0 ING.JOSE MANUEL GARCIA PANTIGOZO
DISTRIBUCION DE FRECUENCIAS PARA VARIABLES CUANTITATIVA ESTADISTICA A 1-9 UNMSM - FQIQ DISTRIBUCION DE FRECUENCIAS PARA VARIABLES CUANTITATIVA Se identificó que la variable es cuantitativa continua. Se tiene que (Xmax) = 1287.5 y (Xmin)= 1265.5 R =(Xmax) - (Xmin)= 1287.5 – 1265.5 = 22 Como el rango es grande entonces trabajamos con los datos ordenados agrupados en intervalo de clase (ver Sturges). Si la variable es cuantitativa continua: Determinar el numero de intervalos Utilizar la regla de Sturge: m = 1 + 3,322log n Si n = 110 m = 1 + 3,322log(110) = 7.78 ING.JOSE MANUEL GARCIA PANTIGOZO
DISTRIBUCION DE FRECUENCIAS PARA VARIABLES CUANTITATIVA ESTADISTICA A DISTRIBUCION DE FRECUENCIAS PARA VARIABLES CUANTITATIVA UNMSM - FQIQ Se redondea a m = 8 intervalos de clase. Intervalo cerrado por la izq. y abierto por la der. El menor del 1er intervalo izquierdo =X`min =(Xmin) – menor unidad/2. X`min = 1265.5 – 0.1/2 = 1265.45 Amplitud de Clase= a = R/m = 22/8 = 2.75 = 2.8 Marca de clase= MC=(xmax 1er intervalo - X`min )/2 MC1 = 1265.45 + 2.8 = 1268.25 Y se empieza la tabla ING.JOSE MANUEL GARCIA PANTIGOZO
INTERVALOS MC fi Fi hi [1265.45 - 1268.25 ) 1266.85 8 0.07 [1268.25 - 1271.05 ) 1269.65 9 17 0.08 0.15 [1271.05 - 1273.85 ) 1272.45 16 33 0.30 [1273.65 - 1276.65 ) 1275.25 23 56 0.21 0.51 [1276.65 - 1279.45 ) 1278.05 12 68 0.11 0.62 [1279.45 - 1282.25 ) 1280.85 21 89 0.19 0.81 [1282.25 - 1285.05 ) 1283.65 13 102 0.12 0.93 [1285.05 - 1287.85 ] 1286.45 110 1.00 ESTADISTICA A UNMSM - FQIQ ING.JOSE MANUEL GARCIA PANTIGOZO
Histograma fi ESTADISTICA A UNMSM - FQIQ ING.JOSE MANUEL GARCIA PANTIGOZO
Histograma Fi ESTADISTICA A UNMSM - FQIQ ING.JOSE MANUEL GARCIA PANTIGOZO
Histograma hi ESTADISTICA A UNMSM - FQIQ ING.JOSE MANUEL GARCIA PANTIGOZO
Histograma Hi ESTADISTICA A UNMSM - FQIQ ING.JOSE MANUEL GARCIA PANTIGOZO
ESTADISTICA A 1-9 UNMSM - FQIQ Problema Nº 02: Las estaturas en centímetros de 50 estudiantes mujeres un grupo se registraron. Los datos son: 157 155 171 150 163 172 161 154 174 148 152 149 158 176 164 153 169 160 162 151 167 170 175 156 165 Agrupe adecuadamente los datos y elabore la respectiva tabla de frecuencias y el histograma de frecuencias relativas. ING.JOSE MANUEL GARCIA PANTIGOZO
DISTRIBUCION DE FRECUENCIAS PARA VARIABLES CUANTITATIVA 1-9 ESTADISTICA A DISTRIBUCION DE FRECUENCIAS PARA VARIABLES CUANTITATIVA UNMSM - FQIQ Se identificó que la variable es cuantitativa continua. Se tiene que (Xmax) = 176 y (Xmin)= 148 R =(Xmax) - (Xmin)= 28 Como el rango es grande entonces trabajamos con los datos ordenados agrupados en intervalo de clase (ver Sturges). Si la variable es cuantitativa continua: Determinar el numero de intervalos Utilizar la regla de Sturge: m = 1 + 3,322log n Si n = 50 m = 1 + 3,322log(50) = 6,470678 ING.JOSE MANUEL GARCIA PANTIGOZO
DISTRIBUCION DE FRECUENCIAS PARA VARIABLES CUANTITATIVA 1-9 ESTADISTICA A DISTRIBUCION DE FRECUENCIAS PARA VARIABLES CUANTITATIVA UNMSM - FQIQ Se redondea a m = 7 intervalos de clase (se reajustará según se hagan los cálculos). Intervalo cerrado por la izq. y abierto por la derecha. El menor del 1er intervalo izquierdo =X`min =(Xmin) – menor unidad/2. X`min = 148 – 1/2 = 147.5 Amplitud de Clase = a = R/m = 28/6.4706 = 4.327 Marca de clase = MC=(xmax 1er intervalo - X`min )/2 MC1 = 147.5 + 2.163 = 149.66 Y se empieza la tabla ING.JOSE MANUEL GARCIA PANTIGOZO
INTERVALOS MC fi Fi hi Hi [147.50 – 151.83 ) 149.66 8 0.16 [151.83 – 156.15) 153.99 9 17 0.18 0.34 [156.15– 160.48 ) 158.31 7 24 0.14 0.48 [160.48 – 164.81 ) 162.64 10 34 0.20 0.68 [164.81 – 169.14 ) 166.97 41 0.82 [169.14 – 173.46 ) 171.30 5 46 0.10 0.92 [173.46 – 177.79 ] 175.62 4 50 0.08 1.00 ESTADISTICA A UNMSM - FQIQ ING.JOSE MANUEL GARCIA PANTIGOZO
1-9 ESTADISTICA A PROBLEMA UNMSM - FQIQ Problema Nº 03: En un estudio de dos semanas sobre la productividad de los trabajadores de una fundición, se obtuvieron los siguientes datos sobre el número total de piezas aceptables que produjeron los trabajadores: Elaborar la Tabla de Distribución de Frecuencias. Dibujar el Histograma y Polígono de Frecuencia. ING.JOSE MANUEL GARCIA PANTIGOZO
ESTADISTICA A UNMSM - FQIQ 65 36 49 84 79 56 28 43 67 78 37 40 68 72 55 62 22 82 88 50 60 57 46 39 73 59 48 76 74 70 80 75 45 63 32 64 53 34 51 54 44 35 21 61 33 85 77 42 69 52 47 41 26 38 ING.JOSE MANUEL GARCIA PANTIGOZO
DISTRIBUCION DE FRECUENCIAS PARA VARIABLES CUANTITATIVA 1-9 ESTADISTICA A DISTRIBUCION DE FRECUENCIAS PARA VARIABLES CUANTITATIVA UNMSM - FQIQ Se identificó que la variable es cuantitativa discreta. Se tiene que (Xmax) = 21 y (Xmin)= 88 R =(Xmax) - (Xmin)= 21 – 88 = 67 Como el rango es grande entonces trabajamos con los datos ordenados agrupados en intervalo de clase (ver Sturges). Si la variable es cuantitativa continua: Determinar el numero de intervalos Utilizar la regla de Sturge: m = 1 + 3,322log n Si n = 97 m = 1 + 3,322log(97) = 7.60 = 8 ING.JOSE MANUEL GARCIA PANTIGOZO
DISTRIBUCION DE FRECUENCIAS PARA VARIABLES CUANTITATIVA 1-9 ESTADISTICA A DISTRIBUCION DE FRECUENCIAS PARA VARIABLES CUANTITATIVA UNMSM - FQIQ Se redondea a m = 8 intervalos de clase. Intervalo cerrado por la izq. y abierto por la der. El menor del 1er intervalo izquierdo =X`min =(Xmin) – menor unidad/2. X`min = 21 – 1/2 = 20.5 Amplitud de Clase= a = R/m = 67/8 = 8.375 = 9 Marca de clase= MC=(xmax 1er intervalo - X`min )/2 MC1 = 20.5 + 4.5 = 25 Y se empieza la tabla ING.JOSE MANUEL GARCIA PANTIGOZO