La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Estadística I.

Presentaciones similares


Presentación del tema: "Estadística I."— Transcripción de la presentación:

1 Estadística I

2 ORGANIZACIÓN U ORDENACIÓN DE DATOS:
Una ordenación datos es un conjunto de datos numéricos en orden creciente o decreciente y a la diferencia que existen entre el dato mayor y menor se le llama rango,

3 Tablas de Frecuencias: Los datos cuantitativos discretos se organizan en tablas, llamadas Tablas de Distribución de frecuencias. Tipos de frecuencias: Frecuencia absoluta: Indica el número de veces que se repite un valor de la variable. Frecuencia relativa: Indica la proporción con que se repite un valor. Se obtiene dividiendo la frecuencia absoluta entre el tamaño de la muestra. Para una mejor interpretación es más conveniente multiplicarla por 100 para trabajar con una Frecuencia relativa porcentual.

4 Frecuencia absoluta acumulada: Indica el número de valores que son menores o iguales que el valor dado. Frecuencia relativa porcentual acumulada: Indica el porcentaje de datos que son menores o iguales que el valor dado.

5 Nº de calzado Recuento Nº de alumnos
El número de calzado de los alumnos y alumnas de una clase es: 36, 34, 35, 40, 36, 37, 40, 41, 35, 37, 37, 38, 37, 39, 37, 38, 42, 37, 35, 34, 35, 39, 36, 41, 37, 35, 39, 34, 36, 37 Para efectuar el recuento formamos la siguiente tabla Nº de calzado Recuento Nº de alumnos 34 /// 3 35 //// 5 36 //// 4 37 8 //// /// 3 alumnos usan el número 34. 38 39 40 41 42 2 3 1 // /// / Se dice que la frecuencia absoluta del dato 34 es 3. La frecuencia absoluta del dato 35 es 5. La suma de las frecuencias absolutas debe ser 30, que es e1 número total de alumnos. 30

6 Ejemplo El número de hermanos de 30 alumnos es: 1, 2, 2, 1, 8, 5, 1, 0, 1, 2, 3, 2, 1, 2, 1, 3, 1, 2, 2, 4, 2, 2, 0, 2, 2, 1, 2, 1, 2, 0 El dato 0 está 3 veces. Su frecuencia absoluta es 3. El dato 1 está 9 veces. Su frecuencia absoluta es 9. Frecuencia absoluta de un dato estadístico es el número de veces que se repite dicho dato. La suma de las frecuencias absolutas es el número total de datos.

7 En los 30 datos siguientes:
1, 2, 2, 1, 8, 5, 1, 0, 1, 2, 3, 2, 1, 2, 1, 3, 1, 2, 2, 4, 2, 2, 0, 2, 2, 1, 2, 1, 2, 0 Su frecuencia relativa es El dato 2 está 13 veces. Su frecuencia relativa es El dato 8 está 1 vez. Frecuencia relativa de un dato estadístico es el cociente entre la frecuencia absoluta y el número total de datos. La suma de las frecuencias relativas es siempre igual a 1.

8 El dato 0 está 3 veces. El dato 1 está 9 veces.
A partir de los datos se puede hacer una tabla estadística. Tabla Datos del número de hermanos de 30 alumnos: 1, 2, 2, 1, 8, 5, 1, 0, 1, 2, 3, 2, 1, 2, 1, 3, 1, 2, 2, 4, 2, 2, 0, 2, 2, 1, 2, 1, 2, 0 El dato 0 está 3 veces. El dato 1 está 9 veces.

9 Definiciones 1. Distribución de frecuencias: Agrupamiento de datos en categorías que muestren el número de observaciones de cada categoría mutuamente excluyente. Amplitud, rango o recorrido de los datos, es la diferencia entre el mayor valor y el menor valor se representa por la letra R.  3. Frecuencia Absoluta: Número de casos que se ubican dentro de cada intervalo de clase. Se representa por f. 4. Marca de clase: Es el punto medio del intervalo de clase o el centro de cada clase. Se denota por Xi

10 Definiciones 4. Límites reales de intervalos de clases: Los límites reales de una variable continua se pueden asumir como su valor aparente más la unidad de medida. Una capacidad intelectual de 115 puntos, decimos que se encuentra entra y Este razonamiento es válido también para los intervalos de clases, donde por ejemplo: el intervalo será sólo aparente, mientras que los limites verdaderos (reales) del mismo serán 84.5 – 89.5, No obstante, las tablas de D.F, las representaremos a partir de los limites aparentes.

11 Pasos a seguir para Construir una Tabla de Distribución de Frecuencia agrupada
Ordenar los datos de menor a mayor. Determinar el Rango o Recorrido. Dividir el Rango por el No. de intervalos para estimar la amplitud ó el ancho aproximada del intervalo (c). Se recomienda que c sea entero impar para que las marcas de clases resulten ser # enteros. Se divide a continuación R en intervalos del mismo tamaño,

12 El tamaño del intervalo c se obtiene mediante la fórmula:
Identificamos la unidad de nuestros datos Si mis datos son de la forma 53, 15, 9...(entera) la unidad es 1 Si mis datos son de la forma 5.8, 15.2, (1 # después del punto decimal) La unidad es 0.1 Si mis datos son de la forma O.75, 1,25, (2 # después del punto decimal) la unidad es O.O1.

13 Pasos a seguir para Construir una Tabla de Distribución de Frecuencia agrupada
Respecto al número de intervalos (k) a construir no existe regla fija, se recomienda construir entre 5 y 15 intervalos. Podría utilizar “la regla de 2 a la k, (2k)” seleccionando el entero k más pequeño tal que 2 elevado a la k es mayor o igual que n, (2k ≥ n). También se puede calcular k: el número de intervalos a construir con la siguiente fórmula k = 1 + (3.322)(logn).

14 Luego se construyen los intervalos.
4. Escribir los intervalos empezando por el inferior. Se recomienda que el intervalo comience con un número que sea múltiplo de C o se toma el menor valor como límite inferior (L.I) y el L.S = L.I +C-1 (si son # enteros.) 5. Hallar el recuento de frecuencias. 6. Escribir las frecuencias en una columna encabezada por la letra f. 7. Sumar la columna f de las frecuencias y anotar el # total de casos (F = N).

15 8. Seguir completando la tabla de distribución de frecuencia (T.D.F)
Una vez conocida la marca de clase correspondiente al intervalo inferior, se le suma C a esta para obtener la siguiente marca de clase del otro intervalo y así sucesivamente.

16 6. Frecuencia Relativa (fr): Expresa los datos en porcentajes
6. Frecuencia Relativa (fr): Expresa los datos en porcentajes. Se calcula mediante la fórmula: fr = F/n, donde F es el recuento de frecuencia para cada clase y n = tamaño de la muestra o total de datos. 7. Frecuencia Acumulada (fa): Es la suma de frecuencias absolutas en cada intervalo. Para construir la T.F.A. se agrega una columna a la tabla de D.F. encabezada por fa que indica las frecuencias acumuladas. La última fa debe coincidir con n (tamaño de la muestra ó total de datos). 8. Frecuencia relativa acumulada también conocida como Porcentaje acumulado se denota por fra= (f/n) ×100, también se puede calcular como sumatoria de la frecuencia relativa anteriores.

17 EJEMPLO 2: Se tienen los siguientes datos de número de galones de agua consumidos por una familia en un año (miles de galones). Se pide construir la T.D.F, se tomó una muestra de 30 familias. 15 23 22 18 24 14 21 13 20 17 19 30 8 26 16 34 27

18 Paso No.1. Se ordenan los datos de menor a mayor.
8 13 14 15 16 17 18 19 20 21 22 23 24 26 27 30 34

19 Paso No.2. Se encuentra el Rango = XM – Xm =
= 26 Paso No.3. Se encuentra k para calcular C = R/ k, si se aplica la regla k = 1 + (3.322)(logn) se tiene K = 1+(3.322)(log30) = 5.91, entonces el No. de intervalos a construir es de 6 intervalos porque se redondea. Ahora se calcula C = 26/6 = 4.33 ≈ 5 ,entonces el ancho del intervalo es igual C=5.

20 Paso No. 4. Se construyen los intervalos comenzando por el No. menor
Paso No.4. Se construyen los intervalos comenzando por el No. menor. El límite aparente superior se calcula por la siguiente fórmula: LS= Li + C – 1 = =12 y los demás intervalos de clases se construyen sumándole a cada límite inferior y superior el valor de C que en este caso es 5. Los pasos No. 5, 6,7 y 8 están en la T.D.F.

21 Nº de intervalos Intervalos de Clases f fa fr fra Xi

22 CONSUMO DE AGUA (MILES DE GALONES)
Intervalos de clases f fa fr fra Xi 8-12 1 0.033 10 13-17 12 13 0.400 0.433 15 18-22 23 0.333 0.766 20 23-27 5 28 0.167 0.933 25 28-32 29 .967 30 33-37 35

23 Con la siguiente tabla se puede interpretar contestando las siguientes preguntas
¿Cuántas familias consumen entre 12,500 y 17,500 galones de agua? b) ¿Qué porcentaje de familias consumen entre 17,500 y 22,500 galones de agua? c) ¿Cuántas familias consumen a lo sumo 27,500 galones de agua? d) ¿Qué porcentaje de familias consumen un máximo de 32,500 galones de agua?

24 Con la siguiente tabla se puede interpretar contestando las siguientes preguntas
¿Cuántas familias consumen entre 12,500 y 17,500 galones de agua? R=12 familias. b) ¿Qué porcentaje de familias consumen entre 17,500 y 22,500 galones de agua? R = ×100 = 33.3%. c) ¿Cuántas familias consumen a lo sumo 27,500 galones de agua? R = 28 familias. d) ¿Qué porcentaje de familias consumen un máximo de 32,500 galones de agua? R = ×100 = 96.6%.

25 Se llama tabla o distribución de frecuencias al conjunto de valores que toma la variable acompañados de sus respectivas frecuencias.

26

27 Estas tablas son útiles para resumir la información de una variable cuando:
El estudio está basado en pocas observaciones, a lo sumo 20 El estudio está basado en muchas observaciones de una variable que toma pocos valores distintos, a lo sumo 20.

28 Si el número de valores distintos que toma la variable es grande (mayor que 20), se agrupan los datos en intervalos para construir la tabla de frecuencias. Llamaremos a estas variables VARIABLES AGRUPADAS. Al resto nos referiremos como VARIABLES NO AGRUPADAS o sin agrupar.

29 Preguntas ?


Descargar ppt "Estadística I."

Presentaciones similares


Anuncios Google