Profesora: Daniela Gaete Pino UNIDAD VII DATOS Y AZAR Profesora: Daniela Gaete Pino
CLASE 1: CONCEPTOS BÁSICOS DE ESTADISTICA
Encuestas Presidenciales 2013 36% 22% 16% 8%
Estadística Es una rama de la matemática que comprende Métodos y Técnicas que se emplean en la recolección, ordenamiento, resumen, análisis, interpretación y comunicación de conjuntos de datos
Población Conjunto cuyos elementos poseen una característica en común que se quiere estudiar, ya sea de individuos, de animales, de objetos, de medidas, de producciones, de acontecimientos o de sucesos. Las poblaciones pueden ser finitas o infinita. es un subconjunto de la población, que debe ser representativa y aleatorias. Muestra
Población
Muestra:
Variables Variable Cualitativa: Son aquellas cuando las observaciones realizadas se refieren a un atributo (no son numéricas), por ejemplo: sexo, nacionalidad, profesión, etc. Variable Cuantitativa: Son aquellas en que cada observación tiene un valor expresado por un número real, por ejemplo: peso, temperatura, salario, etc.
Las variables cuantitativas pueden ser de dos tipos: DISCRETAS: Toman solo valores enteros, por ejemplo: números de hijos, número de departamentos en un edificio, etc. CONTINUAS: Susceptibles de tomar cualquier valor, por ejemplo: el peso la estatura, etc.
Ejemplo: El peso de los pacientes de un consultorio médico es una variable del tipo: Cuantitativa Discreta Continua A) Sólo I B) Sólo II C) Sólo III D) Sólo I y II E) Sólo I y III
CLASE N°2: ANÁLISIS E INTERPRETACIÓN DE GRÁFICOS Profesora: Daniela Gaete Pino
Frecuencia Absoluta(fi) Número de veces que se presenta un cierto dato. Ejemplo: Se pregunta a un grupo de personas la cantidad de veces que visita al dentista durante el año. Número de visitas al dentista Frecuencia Absoluta (fi) 14 1 4 2 Total 20
Frecuencia absoluta Acumulada (Fi) Es la que se obtiene sumando ordenadamente la frecuencia absoluta hasta que ocupa la última posición. Número de visitas al dentista Frecuencia Absoluta (fi) Frecuencia absoluta acumulada (Fi) 14 Fi=14 1 4 Fi=14+4=18 2 Fi=18+2=20 Total 20 -------------
Número de visitas al dentista Frecuencia Relativa Es el cuociente entre la frecuencia absoluta de uno de los valores de la variable y el total de datos. ℎ 𝑖 = 𝑓 𝑖 𝑁 N=tamaño de la muestra. Número de visitas al dentista Frecuencia Absoluta (fi) Frecuencia absoluta acumulada (Fi) Frecuencia Relativa(hi) 14 Fi=14 14 20 =0,7 1 4 Fi=14+4=18 4 20 =0,2 2 Fi=18+2=20 2 20 =0,1 Total 20 ------------- 1,00
Frecuencia Relativa Acumulada(Hi) Es la que se obtiene sumando ordenadamente la frecuencia relativa hasta que ocupa la última posición. Número de visitas al dentista Frecuencia Absoluta (fi) Frecuencia absoluta acumulada (Fi) Frecuencia Relativa (hi) Frecuencia Relativa Acumulada 14 Fi=14 14 20 =0,7 0,7 1 4 Fi=14+4=18 4 20 =0,2 0,7+0,2=0,9 2 Fi=18+2=20 2 20 =0,1 0,9+0,1=1 Total 20 ------------- 1,00 -----------
Diagrama de Barras Cada valor de las variables se representa mediante una barra proporcional a la frecuencia que se presenta
Diagrama de Barras Comparado Permite la comparación de dos o más variables.
Histogramas: 1,20-1,29 1,30-1,39 1,40-1,49 1,50-159 1,60-1,69 1,70-179
Polígonos de Frecuencias Edad (años)
Gráficos Circulares o de Torta
Pictogramas
CLASE N°3: MEDIDAS DE TENDENCIA CENTRAL Profesora: Daniela Gaete Pino
Medidas de Tendencia Central Moda Mediana Media aritmética
Edad de los visitantes al parque Ejemplo: La edad de los visitantes a un parque viene dado en la siguiente tabla En el intervalo[10-20[ 10 es el Límite inferior y 19 es el Límite superior. Marca de Clase: Es el punto medio de un intervalo. En el intervalo [20- 29[, la marca de clase es 20+29 2 =24,5 Amplitud: Es la diferencia entre el límite superior e inferior. En el intervalo [30-39[. La amplitud será 39-30= 9 Rango: Es la diferencia entre el valor máximo y mínimo de los datos. En el ejemplo será 49-10= 39 Edad de los visitantes al parque Frecuencia Absoluta (fi) [ 10 - 19 ] 30 [ 20 – 29 [ 22 [ 30 - 39 [ 16 [ 40 – 49 [ 12 Total 80
Medidas de Tendencia Central Son indicadores que representan valores numéricos en torno a los cuales tienden a agruparse los valores de una variable estadística. Media Aritmética ó Promedio Mediana Moda
MEDIA ARITMÉTICA ( 𝑥 ) Es el valor que se obtiene al dividir la suma de todos los valores de la variable entre el número total de éstos. Es decir: 𝑥 = 𝑥 1 + 𝑥 2 + 𝑥 3 +…+ 𝑥 𝑛 𝑛
Ejemplo: Las notas obtenidas por los alumnos, son las siguientes: 5, 6.5 , 7 , 6.8 , 4.5 , 5.7 , 6.2 , 5.4 , 7 𝑥 = 5+6,5+7+6,8+4,5+ 5,7+6,2+5,4+7 9 𝑥 = 54 9 𝑥 =6
Si los datos están agrupados en una tabla de frecuencia, entonces se define: 𝑥 = 𝑥 1 ∙ 𝑓 1 + 𝑥 2 ∙ 𝑓 2 + 𝑥 3 ∙ 𝑓 3 +…+ 𝑥 𝑛 ∙ 𝑓 𝑛 𝑓 1 + 𝑓 2 + 𝑓 3 +…+ 𝑓 𝑛
Ejemplo 1: El puntaje obtenido en un ensayo de PSU de dos cursos fueron los siguientes 𝑥 = 400∙4+500∙15+600∙36+700∙34+800∙3 92 Puntaje Frecuencia 400 4 500 15 600 36 700 34 800 3 Total 92 𝑥 = 1600+7500+21600+23800+2400 92 𝑥 = 56900 92 𝑥 =618,48
EJEMPLO: Las edades de la familia Soto, están agrupadas en la siguiente tabla. Calcular el promedio de edades Edad Frecuencia Absoluta (fi) [0- 12[ 5 [12- 24[ 4 [24- 36[ 3 [36- 48[ Total 15 𝑥 = 6∙5+18∙4+30∙3+42∙3 15 𝑥 = 30+72+90+126 15 𝑥 = 318 15 𝑥 =21,2 [𝑎ñ𝑜𝑠]
Media= 21,2 (años)
MEDIANA (Me) Es el dato que ocupa la posición central de la muestra cuando se encuentran ordenados en forma creciente o decreciente. Si la muestra tiene un número par de datos, la mediana es la media aritmética de los dos términos centrales. Para datos no agrupados: 2 , 3 , 5 , 5 , 7 2, 3 , 5 , 5 𝑀𝑒=5 𝑀𝑒= 3+5 2 =4
MEDIANA (Me) Para datos agrupados: Se puede obtener mediante la expresión: 𝑀 𝑒 = 𝐿 𝑖 +𝑎∙ 𝑛 2 − 𝐹 𝑖−1 𝑓𝑖
Frecuencia Acumulada (Fi) Ejemplo: Las edades de familia López se agrupan en la siguiente tabla. Calcular la mediana: Edad Frecuencia Absoluta (fi) Frecuencia Acumulada (Fi) [0 – 10[ 1 [10 – 20[ 4 5 [20 - 30[ 9 14 [30 - 40[ 2 16 Total n=16 - Pasos: 𝑛 2 = 16 2 =8 Ubicar entre la frecuencia acumulada el lugar 50, que está entre [20-30[. El límite inferior del intervalo es 20, por lo que la edad de la persona en el lugar 50 tiene entre 20 y 30 años. Calculamos la amplitud del intervalo.
Calcular la mediana: 𝑀 𝑒 = 𝐿 𝑖 +𝑎∙ 𝑛 2 − 𝐹 𝑖−1 𝑓𝑖 𝑀 𝑒 = 𝐿 𝑖 +𝑎∙ 𝑛 2 − 𝐹 𝑖−1 𝑓𝑖 𝑀 𝑒 =20+10 16 2 − 5 9 𝑀 𝑒 =20+10 8 − 5 9 𝑀 𝑒 =20+10 3 9 𝑀 𝑒 =20+ 30 9 𝑀 𝑒 = 210 9 𝑀 𝑒 =23,33
Me= 23,33(años) [0-10[ [10-20[ [20-30[ [30-40[ Edad (años)
MODA (Mo) Es el dato que aparece con mayor frecuencia, es decir, el que más se repite. La moda es un conjuntos de valores no necesariamente única. Existen distribuciones: Unimodales: 1, 2, 3, 4, 4, 5, 6 Mo=4 Bimodales: 1, 1, 1, ,2, 3, 4,4,4,5 Mo=1, Mo=4 Trimodales: 1,2,2,3, 4,4,5,5,6,7 Mo=2, Mo=4, Mo=5 Sin moda: 1,2,3,4,5,6,7,8,9,
MODA (Mo) Para datos agrupados: la moda es la que tiene mayor frecuencia y se denomina frecuencia modal y se puede calcular mediante: 𝑀𝑜= 𝐿 𝐼 +𝑎 𝐷 1 𝐷 1 + 𝐷 2 𝐿𝑖: Limite inferior del intervalo 𝑎: amplitud del intervalo 𝐷 1 : frecuencia absoluta del intervalo modal menos la del intervalo anterior 𝐷 2 : frecuencia absoluta del intervalo modal menos la del intervalo siguiente
Frecuencia Acumulada (Fi) Ejemplo: Las edades de familia Pérez se agrupan en la siguiente tabla. Calcular la moda: Edad Frecuencia Absoluta (fi) Frecuencia Acumulada (Fi) [0 – 10[ 2 [10 – 20[ 4 6 [20 - 30[ 7 13 [30 - 40[ 5 18 Total n=18 - Pasos: Ubicar el intervalo de mayor frecuencia en este ejemplo es [20-30[. El límite inferior es 20 La frecuencia modal es 7 D 1 = frecuencia absoluta del intervalo modal menos la del intervalo anterior = 7- 4=3 D 2 : frecuencia absoluta del intervalo modal menos la del intervalo siguiente= 7- 5=2 La amplitud del intervalo es 10
Frecuencia Acumulada (Fi) Calcular la moda: 𝑀𝑜= 𝐿 𝐼 +𝑎 𝐷 1 𝐷 1 + 𝐷 2 𝑀𝑜=20+10 3 3+2 Edad Frecuencia Absoluta (fi) Frecuencia Acumulada (Fi) [0 – 10[ 2 [10 – 20[ 4 6 [20 - 30[ 7 13 [30 - 40[ 5 18 Total n=18 - 𝑀𝑜=20+10 3 5 𝑀𝑜=20+6 𝑀𝑜=26 (años)
Mo= 26 (años)