La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Resultado de aprendizaje. 1.1 Agrupa y grafica conjuntos de datos cualitativos y cuantitativos con base en la distribución de frecuencias.

Presentaciones similares


Presentación del tema: "Resultado de aprendizaje. 1.1 Agrupa y grafica conjuntos de datos cualitativos y cuantitativos con base en la distribución de frecuencias."— Transcripción de la presentación:

1 Resultado de aprendizaje. 1.1 Agrupa y grafica conjuntos de datos cualitativos y cuantitativos con base en la distribución de frecuencias.

2 Contenido A) Descripción e interpretación de la estadística. descriptiva Naturaleza de la estadística. Distribución de frecuencias con datos no agrupados. Distribución de frecuencias con datos agrupados. Ejemplos B) Construcción e interpretación de graficas.Construcción e interpretación de graficas. Gráfica de circular. Diagrama de Barras. Histograma. Polígono de frecuencias. Ojivas. Gráfica de tallo y hojas. C) Ejercicios Ejercicios para datos No agrupados Ejercicios para datos Agrupados Soluciones D) Autoevaluación

3 La estadística descriptiva La estadística inferencial La estadística se divide dos grandes áreas Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada. Naturaleza de la estadística

4 La estadística descriptiva, se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. La estadística se divide en dos grandes áreas:

5 Etapas de la investigación estadística Selección y determinación de la población o muestra y las características contenidas que se desean estudiar. En el caso de que se desee tomar una muestra, es necesario determinar el tamaño de la misma y el tipo de muestreo a realizar (probabilístico o no probabilístico). Obtención de los datos. Esta puede ser realizada mediante la observación directa de los elementos, la aplicación de encuestas y entrevistas, y la realización de experimentos. Clasificación, tabulación y organización de los datos. La clasificación incluye el tratamiento de los datos considerados anómalos que pueden en un momento dado, falsear un análisis de los indicadores estadísticos. La tabulación implica el resumen de los datos en tablas y gráficos estadísticos. Análisis descriptivo de los datos. El análisis se complementa con la obtención de indicadores estadísticos como las medidas: de tendencia central, dispersión, posición y forma. Análisis inferencial de los datos. Se aplican técnicas de tratamiento de datos que involucran elementos probabilísticos que permiten inferir conclusiones de una muestra hacia la población (opcional). Elaboración de conclusiones. Se construye el informe final.

6 Parámetros estadísticos Población estadística, en estadística, también llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan unas de las observaciones. Población (population) es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia). Normalmente es demasiado grande para poder abarcarlo. El número de elementos o sujetos que componen una población estadística es igual o mayor que el número de elementos que se obtienen de ella en una muestra (n).

7 Parámetros estadísticos Muestra estadística (también llamada muestra aleatoria o simplemente muestra) es un subconjunto de casos o individuos de una población estadística. Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo. En tales casos, puede obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor coste (véanse las ventajas de la elección de una muestra, más abajo). Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio de toda la población porque el manejo de un menor número de datos provoca también menos errores en su manipulación. En cualquier caso, el conjunto de individuos de la muestra son los sujetos realmente estudiados. El número de sujetos que componen la muestra suele ser inferior que el de la población, pero suficiente para que la estimación de los parámetros determinados tenga un nivel de confianza adecuado. Para que el tamaño de la muestra sea idóneo es preciso recurrir a su cálculo.

8 Parámetros estadísticos Tamaño de la muestra es el número de sujetos que componen la muestra extraída de una población, necesarios para que los datos obtenidos sean representativos de la población. Objetivos de la determinación del tamaño adecuado de una muestra Estimar un parámetro determinado con el nivel de confianza deseado. Detectar una determinada diferencia, si realmente existe, entre los grupos de estudio con un mínimo de garantía. Reducir costes o aumentar la rapidez del estudio.

9 Parámetros estadísticos Por ejemplo, en un estudio de investigación epidemiológico la determinación de un tamaño adecuado de la muestra tendría como objetivo su factibilidad. Así: Si el número de sujetos es insuficiente habría que modificar los criterios de selección, solicitar la colaboración de otros centros o ampliar el período de reclutamiento. Los estudios con tamaños muestrales insuficientes, no son capaces de detectar diferencias entre grupos, llegando a la conclusión errónea de que no existe tal diferencia. Si el número de sujetos es excesivo, el estudio se encarece desde el punto de vista económico y humano. Además es poco ético al someter a más individuos a una intervención que puede ser menos eficaz o incluso perjudicial. El tamaño de una muestra es el número de individuos que contiene. Una fórmula muy extendida que orienta sobre el cálculo del tamaño de la muestra para datos globales es la siguiente : N: es el tamaño de la población o universo (número total de posibles encuestados). k: es una constante que depende del nivel de confianza que asignemos. El nivel de confianza indica la probabilidad de que los resultados de nuestra investigación sean ciertos: un 95,5 % de confianza es lo mismo que decir que nos podemos equivocar con una probabilidad del 4,5%. Los valores de k se obtienen de la tabla de la distribución normal estándar N(0,1).

10 Muestreo aleatorio Es la extracción de una muestra de una población finita, en el que el proceso de extracción es tal que garantiza a cada uno de los elementos de la población la misma oportunidad de ser incluidos en dicha muestra. Esta condición garantiza la representatividad de la muestra porque si en la población un determinado porcentaje de individuos presenta la característica A, la extracción aleatoria garantiza matemáticamente que por término medio se obtendrá el mismo porcentaje de datos muestrales con esa característica. El muestreo aleatorio puede ser de dos tipos: Sin reposición de los elementos: los elementos extraídos se descartan para la siguiente extracción. Por ejemplo, si se extrae una muestra de bombillas para inferir su vida media, no es posible la reposición. Con reposición de los elementos (Muestreo Aleatorio Simple o m.a.s.): las observaciones se realizan con reemplazamiento de los individuos, de forma que la población es idéntica en todas las extracciones y, por tanto, cada observación es independiente de la anterior. En poblaciones muy grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo puede considerarse con reposición aunque, realmente, no lo sea. Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la extracción de números aleatorios mediante ordenadores, calculadoras o tablas construidas al efecto. Parámetros estadísticos

11 Variable estadística Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población. Se pueden agrupar principalmente en: Variable cualitativa Variable cuantitativa Tipos de variables

12 Variable estadística cualitativa Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos: Variable cualitativa nominal Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de orden. Ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo. Variable cualitativa ordinal o variable cuasicuantitativa Una variable cualitativa ordinal presenta modalidades no númericas, en las que existe un orden. Ejemplos: La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una prueba deportiva: 1º, 2º, 3º,... Medallas de una prueba deportiva: oro, plata, bronce.

13 Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos: Variable estadística cuantitativa Variable discreta Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos. Ejemplo: El número de hermanos de 5 amigos: 2, 1, 0, 1, 3. Variable continua Una variable continua es aquella que puede tomar valores comprendidos entre dos números. Ejemplos: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. En la práctica medimos la altura con dos decimales, pero también se podría dar con tres decimales.

14 DATOS ESTADISTICOS Son números que pueden ser comparados, analizados e interpretados. El campo del cual son tomados los datos estadísticos se identifican como población o universo. En un estudio estadístico los métodos que se aplican son: A) RECOPILACION: De acuerdo con la localización de la información los datos estadísticos pueden ser internos y externos. Los internos son los registros obtenidos dentro de la organización que hace un estudio estadístico, Los externos se obtienen de datos publicados y encuestas. B) ORGANIZACIÓN: En la organización de los datos recopilados, el primer paso es corregir cada uno de los elementos recopilados. C) REPRESENTACION: Hay 3 maneras de presentar un conjunto de datos mediante enunciados, tablas estadísticas y gráficas estadísticas. D) ANALISIS: Después de los datos anteriores los datos estadísticos están listos para hacer analizados, para lo cual frecuentemente se emplean operaciones matemáticas durante el proceso de análisis.

15 Experimento estadístico Un experimento que tiene las siguientes características es llamado experimento aleatorio o estadístico. Todos los posibles resultados del experimento son conocidos antes de hacer una realización del experimento. El resultado exacto en cualquier ejecución del experimento no es predecible (aleatoriedad) El experimento puede ser repetido bajo (más o menos) idénticas condiciones. Existe un patrón predictible a lo largo de muchas ejecuciones (regularidad estadística)

16 Ejemplos de Experimentos estadísticos 1. Algunos ejemplos de típicos experimentos aleatorios son: Lanzar una moneda y observar la cara Una bombilla manufacturada en una planta es expuesta a una prueba de vida y el tiempo de duración de una bombilla es registrado.. En este caso no se conoce cual será el tiempo de duración de la bombilla seleccionada, pero claramente se puede conocer de antemano que será un valor entre y horas Un lote de items que contiene defectuosos es muestreado. Un item muestreado no se reemplaza, y se registra si el item muestreado es o no defectuoso. El proceso continua hasta que todos los items defectuosos sean encontrados. Una manufacturera de refrigeradores inspecciona sus refrigeradores para tipos de defectos. El número de defectos encontrado en cada refrigerador inspeccionado es registrado. Seleccionar una planta de una parcela y observar si padece alguna enfermedad, es decir es sana o enferma Seleccionar una planta y medir su altura 2. Algunos ejemplos de experimentos no estadísticos son: Seleccionar al azar un autobús de ruta de transmilenio y observar el color. Aquí no se cumple la condición, ya que se puede predecir una ejecución del experimento, el color del autobús. Seleccionar al azar un estudiante de un colegio masculino y observar su género. Aquí no se cumple la condición, ya que se puede predecir una ejecución del experimento, el género del alumno Ejercicio Describa un experimento estadístico y otro no estadístico y explique porque lo es o no.

17 Ejemplos de Experimentos estadísticos 1. Algunos ejemplos de típicos experimentos aleatorios son: 1.-Lanzar un dado ALEATORIO 2. Lanzar una moneda ALEATORIO 3. Lanzar una nuez a una ardilla ALEATORIO 4. Presentar un examen ALEATORIO 2. Algunos ejemplos de experimentos no estadísticos (Determinísticos) son: 1. Tomar un taxi a la Universidad DETERMINISTICO 2. Pintarse las uñas DETERMINISTICO 3. Encender una vela DETERMINISTICO 4. Marcar el 82-10-55 DETERMINISTICO Ejercicio Describa un experimento estadístico y otro no estadístico y explique porque lo es o no.

18 Definición de parámetro estadístico Tipos de parámetros estadísticos Un parámetro estadístico es un número que se obtiene a partir de los datos de una distribución estadística. Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por una gráfica. De centralización. De posición De dispersión. Hay tres tipos parámetros estadísticos:

19 La distribución de frecuencias existe para datos agrupados y datos no agrupados Distribución de frecuencias con datos. Datos agrupados Datos no agrupados

20 Distribución de frecuencia para datos no Agrupados (n<20): Es aquella distribución que indica las frecuencias con que aparecen los datos estadísticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificación al tamaño de las unidades originales. En estas distribuciones cada dato mantiene su propia identidad después que la distribución de frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo un orden lógico con sus respectivas frecuencias. Distribución de frecuencias con datos no agrupados.

21 Distribución de frecuencia de clase o de datos Agrupados (n>20): Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. Distribución de frecuencias con datos agrupados.

22 Distribución de frecuencias para datos. No existen normas establecidas para determinar cuándo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el número total de datos (N) es igual o superior 20, se utilizará la distribución de frecuencia para datos agrupados, también se utilizará este tipo de distribución cuando se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia o la ojiva. La razón fundamental para utilizar la distribución de frecuencia de clases es proporcionar mejor comunicación acerca del patrón establecido en los datos y facilitar la manipulación de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la información obtenida de una investigación sea manejable con mayor facilidad. Las medidas de tendencia central (media, moda y mediana) y las Medidas de dispersión (desviación estándar, varianza, cuartiles, percentiles, entre otros se CALCULAN DIFERENTE cuando se trata de datos agrupados y de datos no agrupados.

23 Tabla de Frecuencias La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numérico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el número de veces que aparece, es decir, su Frecuencia. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la frecuencia simple y la frecuencia acumulada. La tabla de frecuencias puede representar gráficamente en un histograma(Diagrama De Barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal los intervalos de valores. La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

24 Frecuencia absoluta La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico. Se representa por f i. La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.

25 Frecuencia absoluta Ejemplo Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la primera columna de la tabla colocamos la variable ordenada de menor a mayor y en la segunda anotamos la frecuencia absoluta. Datos sin ordenar 132 231 328 429 533 632 731 830 931 1031 1127 1228 1329 1430 1532 1631 1731 1830 1930 2029 2129 2230 2330 2431 2530 2631 2734 2833 2933 3029 3129

26 Procedimiento Para mayor facilidad se ordenan de mayor a menor los datos del problema. (color morado) Una vez ordenados se cuentan cuantos corresponden al mismo valor. (color rojo). Se forma la tabla de datos con su frecuencia. Xifi 27*1 28**2 29*****,*6 30*****,**7 31*****,***8 32***3 33***3 34*1 31 Datos sin ordenarDato ordenado 132271 23128 3 2 429 53329 63229 73129 83029 931296 103130 112730 122830 132930 1430 153230 1631307 1731 183031 193031 202931 212931 223031 233031 2431 8 253032 263132 2734323 2833 2933 3029333 3129341

27 Frecuencia relativa La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos. La frecuencia relativa se puede expresar en tantos por ciento y se representa por n i. La suma de las frecuencias relativas es igual a 1.

28 Frecuencia relativa Ejemplo Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la cuarta primera columna de la tabla colocamos la variable ordenada de menor a mayor y en la segunda anotamos la frecuencia absoluta. Xifi ni 27*1 1/31= 0.032 28**2 2/31= 0.065 29*****,*6 6/31= 0.194 30*****,**7 7/31= 0.226 31*****,***8 8/31= 0.258 32***3 3/31= 0.097 33***3 3/31= 0.097 34*1 1/31= 0.032 31 1.000

29 Frecuencia absoluta acumulada La frecuencia absoluta acumulada es el valor acumulado del número de veces que aparece un determinado valor en un estudio estadístico. Xifi 27*11 28**23 29*****,*69 30*****,**716 31*****,***824 32***327 33***330 34*131

30 Frecuencia relativa acumulada La frecuencia relativa acumulada es el valor acumulado del valor relativo que aparece un determinado valor en un estudio estadístico. Xifi fi/N ni 27*1 1/31= 0.032 28**2 2/31= 0.0650.097 29*****,*6 6/31= 0.1940.290 30*****,**7 7/31= 0.2260.516 31*****,***8 8/31= 0.2580.774 32***3 3/31= 0.0970.871 33***3 3/31= 0.0970.968 34*1 1/31= 0.0321.000 31 1.000

31 Distribución de frecuencias agrupadas La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. http://www.uv.es/webgid/Descript iva/3_distribucin_de_frecuencias. html http://estadistica- vane.blogspot.mx/

32 Números de clase El número de clase es el número de grupos en los que se van agrupar los datos en una tabla de distribución de frecuencias, a estos se les llama también intervalos de clase ¿Cómo de hace esto? Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Para obtener el número de clase o intervalo de clase se ocupa la siguiente formula: K=1+3.322(log 10 n) En las reglas empíricas para la construcción de intervalos veremos cómo se aplica esta fórmula. Ya que tenemos claro qué es el número de clases debemos saber la amplitud de clase par poder seguir trabajando nuestra tabla.

33 Amplitud de clase

34 Marcas de clase o punto medio La marca de clase es el punto medio de cada intervalo. La marca de clase es el valor que representa a todo el intervalo para el cálculo de algunos parámetros como la media aritmética o la desviación típica. Se representa por c i o x i. xixi fifi x i · f i x i 2 · f i [10, 20)151 225 [20, 30)2582005000 [30,40)351035012 250 [40, 50)45940518 225 [50, 60)55844024 200 [60,70)65426016 900 [70, 80)75215011 250 421 82088 050

35 Límites reales o fronteras reales Los límites reales son valores que unen a las clases y se forman únicamente de números enteros, estos se obtienen al restar 0.5 a los limites de la izquierda y sumar 0.5 a los limites de la derecha; cuando las clases tengan un decimal, habrá que restar 0.05 a los limites de la izquierda y sumar 0.05 limites de la derecha y así sucesivamente. A la gráfica de límites reales contra frecuencia se les llama histograma.

36

37 Ejemplo 1 ( Para datos NO Agrupados ) En una escuela se tienen los siguientes datos en donde se asientan el número de alumnos que tienen reprobada por lo menos una materia. Grupo Alumnos reprobados 101 13 102 6 103 13 104 12 105 8 106 13 107 6 108 13 109 10 110 10 111 10 112 11 113 6 114 15 115 12 116 14 117 6 118 8 Al graficar en el eje horizontal de ponen los grupos y en el eje vertical la cantidad de alumnos reprobados por grupo. Como se muestra a continuación. Tabla 1

38 Ejemplo 1 ( Para datos NO Agrupados ) Se procede a ordenar de menor a mayor con respecto a la columna de Alumnos reprobados Como se muestra a continuación. Grupo Alumnos reprobados Frecue ncia 102 6 107 6 113 6 117 64 105 8 118 82 109 10 110 10 111 103 112 111 104 12 115 122 101 13 103 13 106 13 108 134 116 141 114 151 Total18 Tabla 2 De la tabla 2 se toman los datos de la 2da columna para generar las clases. La frecuencia es la cantidad de veces que se repiten el mismo valor de la clase. Como se muestra a continuación. Cantidad N reprobadas Frecue ncia 64 82 103 111 122 134 141 151 Total18 Tabla 3

39 Ejemplo 1 ( Para datos NO Agrupados ) Cantidad N reprobadas Frecue ncia 64 82 103 111 122 134 141 151 Total18 Tabla 3 Al graficar en el eje horizontal se ponen la Cantidad N reprobadas y en el eje vertical la frecuencia correspondiente. Como se muestra a continuación.

40 Ejemplo 1 ( Para datos NO Agrupados ) Tabla 4 Alumnos con N reprobadas Frecuencia (fa) Frec. Acumulada (FA) 64 4 82 6 103 9 111 10 122 134 16 141 17 151 18 Total18 La frecuencia acumulada se origina de la suma acumulativa de la frecuencia absoluta con la siguiente frecuencia absoluta según corresponda. Como se muestra a continuación.

41 Ejemplo 1 ( Para datos NO Agrupados ) Tabla 5 Alumnos con N reprobadas Frecuencia (fa) Frec. Acumulad a (FA) Frecuenci a Relativa (fr) 64 4 0.22 82 6 0.11 103 9 0.17 111 10 0.06 122 0.11 134 16 0.22 141 17 0.06 151 18 0.06 Total18 La frecuencia relativa se calcula al dividir la frecuencia absoluta entre el número de datos para cada frecuencia absoluta según corresponda. En este caso n=18. Como se muestra a continuación. 4/18=0.22.....

42 Ejemplo 1 ( Para datos NO Agrupados ) Tabla 6 Alumnos con N reprobad as Frecuenci a (fa) Frec. Acumula da (FA) Frec. Relativa (fr) Frec. Relativa Acumul ada (fra) 64 4 0.22 82 6 0.11 0.33 103 9 0.17 0.50 111 10 0.06 0.56 122 0.11 0.67 134 16 0.22 0.89 141 17 0.06 0.94 151 18 0.06 1.00 Total18 La frecuencia acumulada relativa se origina de la suma acumulativa de la frecuencia relativa con la siguiente frecuencia relativa según corresponda. Como se muestra a continuación. 4/18=0.22.....

43 Ejemplo 1 ( Para datos Agrupados ) No. Esta- tura No. Esta- tura No. Esta- tura No. Esta- tura No. Esta- tura No. Esta- tura No. Esta- tura No. Esta- tura No. Esta- tura No. Esta- tura 1 175 11 165 21 177 31 163 41 178 51 171 61 172 71 162 81 153 91 161 2 173 12 157 22 156 32 147 42 147 52 157 62 136 72 145 82 153 92 178 3 171 13 157 23 161 33 164 43 161 53 144 63 174 73 165 83 181 93 152 4 154 14 171 24 162 34 155 44 158 54 154 64 162 74 171 84 190 94 160 5 177 15 165 25 158 35 157 45 183 55 161 65 174 75 150 85 157 95 165 6 134 16 160 26 161 36 171 46 176 56 148 66 153 76 148 86 162 96 157 7 171 17 166 27 153 37 157 47 161 57 170 67 160 77 161 87 165 97 164 8 169 18 151 28 142 38 155 48 157 58 163 68 122 78 145 88 163 98 148 9 159 19 149 29 172 39 135 49 166 59 170 69 177 79 170 89 160 99 164 10 153 20 146 30 161 40 157 50 165 60 166 70 165 80 143 90 164 100 160 De un grupo de alumnos se toma la estatura de 100 de ellos, como se muestra en la tabla a continuación.

44 Ordenando los datos se obtienen la siguiente tabla de datos Estatura 122147153157159161163165171175 134147153157160161164165171176 135148153157160161164166171177 136148153157160161164166171177 142148154157160162164166171177 143149154157160162165169172178 144150155157161162165170172178 145151155157161162165170173181 145152156158161163165170174183 146153157158161163165171174190 N=10 renglones x 10 columnas; 10X10= 100; n=100 122 es el Limite mínimo; L min =122 190 es el Limite Máximo; L max =122

45 Límites reales o fronteras reales Cantidad de datos n= 100 Valor Máximo 190 Valor mínimo 122 Rango: R= Valor Máximo - Valor Mínimo 68 Numero de intervalos o CLASES (K): K=1+3.322(log 10 n ) 7.64 redondeando K:= 8 Amplitud de clase (A):= R/K 8.50 redondeando A:= 9 Limite inferior 122 R= 190-122= 68; R=68 K =1+3.322(log 10 (100)) K=1+3.322(2); 1+6.644= 7.64; K=7.64 Realizando las operaciones correspondientes se encuentran los siguientes valores, como esta indicado en los siguientes cuadros A = 68/8; A=8.50

46 Cálculo de limites inferiores y superiores de los intervalos Recordando que el limite inferior es 122 y la Amplitud es 9, se proceden a calcular el limite superior, así como los subsecuentes limites de l resto de intervalos N° Clase L i (nferior) L s (uperior) 1 122 131 2 140 3 149 4 158 5 167 6 176 7 185 8 194 122+9=131 131+9=140 140+9=149 149+9=158 158+9=167 167+9=176 176+9=185 185+9=194

47 Cálculo de Límites reales o fronteras reales de los intervalos Para el calculo de las clases se recorren ½ unidad a la izquierda es decir se le resta 0.5 a cada limite inferior y superior. Como se muestra a continuación. N° Clase L i (nferior) L s (uperior) 1 122 131 2 140 3 149 4 158 5 167 6 176 7 185 8 194 122-0.5=121.5 131-0.5=130.5 140-0.5=139.5 149-0.5=148.5 158-0.5=157.5 167-0.5=166.5 176-0.5=175.5 185-0.5=184.5 194-0.5=193.5 N° Clase L i (inferior) o Clase real Inferior L s (superior) o Clase Real Superior 1 121.5 130.5 2 139.5 3 148.5 4 157.5 5 166.5 6 175.5 7 184.5 8 193.5

48 Cálculo de Límites reales o fronteras reales de los intervalos Por lo tanto los limites reales de cada clase quedan de la siguiente manera. N° ClaseRango de la clase 1121.5 - 130.5 2130.5 - 139.5 3139.5 - 148.5 4148.5 - 157.5 5157.5 - 166.5 6166.5 - 175.5 7175.5 - 184.5 8184.5 - 193.5

49 Conteo y clasificación de los datos N° ClaseRango de la claseConteo Frecuencia Absoluta (fa) 1121.5 - 130.5|1 2130.5 - 139.5|||3 3139.5 - 148.5|||||-|||||-|11 4148.5 - 157.5|||||-|||||-|||||-|||||-|||23 5157.5 - 166.5|||||-|||||-|||||-|||||-|||||-|||||-|||||-||37 6166.5 - 175.5|||||-|||||-|||||-|16 7175.5 - 184.5|||||-|||8 8184.5 - 193.5|1 De la tabla de datos se van clasificando los valores existentes agregándole una marca en la columna de CONTEO, según corresponda. Como se muestra a continuación.

50 Cálculo de Marcas de clase para cada intervalo Para el calculo de las marcas de clases se promedia el valor de limite inferior con el limite superior como se muestra a continuación. (121.5 + 130.5)/2=126 (130.5 +139.5)/2=135 (139.5 + 148.5)/2=144 (148.5 + 157.5)/2=153 (157.5 + 166.5)/2=162 (166.5 + 175.5)/2=171 (175.5 + 184.5)/2=180 (184.5 + 193.5)/2=189 N° Clase L i (inferior) o Clase real Inferior L s (superior) o Clase Real Superior 1 121.5 130.5 2 139.5 3 148.5 4 157.5 5 166.5 6 175.5 7 184.5 8 193.5 N° Clase Marca de Clase 1 126.0 2 135.0 3 144.0 4 153.0 5 162.0 6 171.0 7 180.0 8 189.0

51 Creación de la tabla de datos para la elaboración de la grafica: N° ClaseRango de la clase Marca de Clase Frecuencia Absoluta (fa) 1121.5 - 130.5126.01 2130.5 - 139.5135.03 3139.5 - 148.5144.011 4148.5 - 157.5153.023 5157.5 - 166.5162.037 6166.5 - 175.5171.016 7175.5 - 184.5180.08 8184.5 - 193.5189.01 XY Agregando la ultima columna a la tabla anterior se procede a la elaboración de la grafica correspondiente fijando en el eje de las X las marcas de clase y en las Y la frecuencia obtenida para cada clase.

52 Construcción de la gráfica correspondiente. De la tabla de datos se toman los valores existentes generando la siguiente gráfica.

53 Frecuencia absoluta y Frecuencia acumulada N° ClaseRango de la clase Frecuencia Absoluta (fa) Frecuencia Acumulada (FA) 1121.5 - 130.511 2130.5 - 139.534 3139.5 - 148.51115 4148.5 - 157.52338 5157.5 - 166.53775 6166.5 - 175.51691 7175.5 - 184.5899 8184.5 - 193.51100 1+3=4 4+11=15 15+23=38 38+37=75 75+16=91 91+8=99 99+1=100 Una vez que se registraron las marcas en la columna de CONTEO, se procede a contar las marcas y asentar su valor en la columna de frecuencia absoluta, según corresponda. La frecuencia acumulada se origina de la suma acumulativa de la frecuencia absoluta con la siguiente frecuencia absoluta según corresponda. Como se muestra a continuación.

54 Frecuencia relativa y Frecuencia relativa acumulada N° Clase Rango de la clase Frecuencia Absoluta (fa) Frecuencia relativa (fr)Frecuencia relativa Acumulada (fra) 1121.5 - 130.510.01 2130.5 - 139.530.030.04 3139.5 - 148.5110.110.15 4148.5 - 157.5230.230.38 5157.5 - 166.5370.370.75 6166.5 - 175.5160.160.91 7175.5 - 184.580.080.99 8184.5 - 193.510.011.00 0.01+0.03=0.04 0.04+0.11=0.15 0.15+0.23=0.38 0.38+0.37=0.75 0.75+0.16=0.91 0.91+0.8=0.99 0.99+0.01=1.00 La frecuencia relativa (fr) se obtiene al realizar la división de la frecuencia acumulada de cada clase entre el numero (n) de datos. Se procede asentar su valor en la columna de frecuencia relativa, según corresponda. La frecuencia relativa acumulada se origina de la suma acumulativa de la frecuencia relativa con la siguiente frecuencia relativa según corresponda. Como se muestra a continuación. 1/100=0.01 3/100=0.03 11/100=0.11 23/100=0.23 37/100=0.37 16/100=0.16 8/100=0.08 1/100=0.01

55 Construcción e interpretación de gráficas

56 Una gráfica o diagrama es un dibujo complementario a una tabla o cuadro, que permite observar las tendencias de un fenómeno en estudio y facilita el análisis estadístico de las variables allí relacionadas. Construcción e interpretación de gráficas

57 Una gráfica, al igual que un cuadro o una tabla, debe constar de: Titulo adecuado: El cual debe ser claro y conciso, que responda a las preguntas: ¿Qué relaciona?, ¿Cuándo y dónde se hicieron las observaciones? El cuerpo: o gráfico en si cuya elección debe considerar el o los tipos de variables a relacionar, el público a quién va dirigido y el diseño artístico del gráfico. Notas de pie de gráfico: Donde se presentan aclaraciones respecto al gráfico, las escalas de los ejes o se otorgan los créditos a las fuentes respectivas. Por medio de gráficos tendenciosos se pueden deformar o resaltar situaciones o estados, que presentados en un gráfico apropiado, mostrarían un comportamiento normal. Generalmente una información es distorsionada por algunas de las siguientes causas: La relación entre los ejes no es la apropiada. Gráficos con escalas desproporcionados, o una mala elección del punto de origen. Componentes de una gráfica.

58 Construcción e interpretación de gráficas Existe una gran cantidad de gráficas para la representación de datos estadísticos, ya que ellas y de la creatividad depende el diseño, al combinar varios tipos como forma de presentar una información. Entre las gráficas más comunes tenemos: Grafica de líneas. Gráfica de líneas compuesto. Grafica de barras. Gráfica de barras compuesto. Gráfica de sectores circular. Histograma. Polígono de frecuencia. Ojiva. Para datos cuantitativos comúnmente se utilizan dos tipos de gráficas: histogramas y polígonos. Para datos cualitativos con frecuencia se utilizan gráficas de sectores, o circular y diagramas de barras. Principales tipos de gráficas.

59 Gráfica circular Usualmente llamada gráfica de pastel, debido a su forma característica de circunferencia dividida en cascos por medio de radios, que van la sensación de un pastel cortado en porciones Se usa para representar variables cualitativas en porcentajes o cifras absolutas cuando el número de elementos no es superior a cinco y se requiere resaltar uno de ellos. Para su construcción se procede de la siguiente manera: 1. 1.- se dibuja un circulo. 2. La circunferencia tiene en su interior 360°, los cuales hacemos corresponder al total de la información, es decir al 100%; luego para determinar el número de grados correspondiente a cada componente se multiplica la frecuencia relativa con respecto a los 360° y se divide entre 100% 3. Se dibuja un radio en el circulo exactamente del centro hacia arriba, con la ayuda de un transportador se marcan los grados correspondientes a cada sector, en el sentido contrario a las manecillas del reloj, para formar casquetes de los diferentes elementos.

60 Ejemplo de gráfica circular. Se tiene un grupo de 18 alumnos los cuales dan su preferencia por los siguientes colores. Azul=4, Rojo=2, Verde=3, Morado=4, Cian=2 No° Clase Frecuencia (fa)Frecuencia en % (fr°)Frecuencia acumulativa (fa%) 1427% 2213%40% 3320%60% 4427%87% 5213%100% 27%+13%=40% 40%+20%=60% 60%+27%=87% 87%+13%=100% De la tabla de datos se toman los valores existentes, se procede a hacer las operaciones de la formula indicada como se muestra a continuación.

61 Ejemplo de gráfica circular. No° Clase Frecuencia (fr)Frecuencia x sector (fr°) Frecuencia acumulativa (fra°) 1496° 2248°144° 3372°216° 4496°312° 5248°360° 96°+48°=144° 144°+72°=216° 216°+96°=312° 312°+48°=360° Para el calculo de los sectores que representan cada valor se procede a hacer las operaciones de la formula indicada como se muestra a continuación. Con estos valores se forma la gráfica de pastel

62 Trazado de una gráfica circular. 1. Traza un circulo 2. Toma de referencia el radio vertical que va del centro a la parte alta del circulo. 3. Se toma como referencia el radio indicado y de ahí en adelante con ayuda de un transportador se van marcando los valores correspondientes a cada sector. 96° Para el calculo de los sectores que representan cada valor, se procede a hacer marcar los arcos correspondientes como se muestra a continuación. 1 23

63 Trazado de una gráfica circular. Después de señalar el primer sector se van señalando los sectores siguientes según corresponda los valores, como se muestra a continuación. 96° 48° 96° 48° 72° 4 5 6

64 Trazado de una gráfica circular. 96° 72° 7 48° 96° 72° 8 48° 96° 48° Después de señalar todos los sectores se pueden señalar sus valores según corresponda, como se muestra a continuación.

65 Trazado de una gráfica circular. Se puede representar tomando como referencia la frecuencia quedando la gráfica como se muestra a continuación. Se puede representar tomando como referencia los porcentajes de a frecuencia quedando la gráfica como se muestra a continuación. Después de señalar el todos los sectores se pueden señalar con colores diferentes según corresponda, como se muestra a continuación.

66 Diagrama de barras Se utiliza para representar los caracteres cualitativos y cuantitativos discretos. En el eje horizontal, o eje de abscisas, se representan los datos o modalidades; en el eje vertical o de ordenadas, se representan las frecuencias de cada dato o modalidad. Sobre el eje horizontal se levantan barras o rectángulos de igual base (que no se superpongan) cuya altura debe ser proporcional a la frecuencia que representan. La parte mas alta de la gráfica debe ser aproximadamente las tres cuartas partes del eje horizontal (regla de los tres cuartos) Evitar que las barras resulten muy anchas o excesivamente altas. Las barras deben quedar separadas y no en contacto para evitar cualquier implicación de continuidad. La separación entre barra y barra no será inferior a la mitad del ancho de ellas, ni superior al ancho de las barras. Para no influir en actitudes personales ni reflejar preferencias individuales, las barras deben ser todas del mismo ancho Grafiquemos el ejemplo anterior:

67 Diagrama de barras N° Clase ColorFrecuencia (fa) 1Azul4 2Rojo2 3Verde3 4Morado4 5Cyan2 En este caso en el eje horizontal se ponen la variable color y en el eje vertical los valores de la frecuencia según corresponda, como se muestra a continuación.

68 Histograma (¿Que es?) Un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos. Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son cualitativos (no-numéricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores. Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso. Un histograma es diferente de una gráfica de barras porque las columnas no van separadas sino unidas, lo que les da continuidad.

69 Histograma. (Como se hace) El procedimiento que se sigue para la construcción del histograma es el siguiente: 1.- Márquese los intervalos de clase en el eje de las abscisas del plano cartesiano. 2.- Para que la grafica quede completa, se agregan dos intervalos de clase más, uno antes del primer intervalo y otro después del último. 3.- En cada límite inferior del intervalo se traza una línea vertical sutilmente punteada, con las alturas que correspondan a las frecuencias absolutas o relativas, de tal manera que a cada punto se le asigne una frecuencia. Por último se dibujan las barras, con alturas correspondientes a las frecuencias.

70 Histograma (Ejemplo 1) N° Clase ColorFrecuencia (fa) 1Azul4 2Rojo2 3Verde3 4Morado4 5Cyan2 En este caso en el eje horizontal se ponen la variable color y en el eje vertical los valores de la frecuencia según corresponda, como se muestra a continuación.

71 Histograma (Ejemplo 2) Puntajes X F. Absoluta (fa) Limites reales Valor medio o marca de clase 11-17610.5-17.514 18-24417.5-24.521 25-311524.5-31.528 32-381331.5-38.535 39-45138.5-45.542 46-52145.5-52.549 Totales40 En este caso en el eje horizontal se ponen la variable puntaje (tomando los valores de la marca de clase) y en el eje vertical los valores de la frecuencia según corresponda, como se muestra a continuación. En la realización de una prueba se obtuvieron los siguientes puntajes en un grupo de 40 alumnos. Marca de clase o valor medio Se determina calculando el promedio entre los límites inferior y superior. La marca de clase representa a todos los datos pertenecientes al intervalo de clase correspondiente. Marca de clase Número de alumnos Puntajes obtenidos en una prueba

72 Histograma de frecuencias acumuladas Histograma de frecuencias acumulada: Se obtiene a partir de una distribución de frecuencias, tomando en el eje horizontal las clases de la variable y en el eje vertical las frecuencias acumuladas correspondientes a cada intervalo. Ejemplo 1 N° Clas e ColorFrecuenci a (fa) Frecuenci a acumulad a 1Azul4 4 2Rojo2 6 3Verde3 9 4Morad o 4 13 5Cyan2 15 En este caso se en el eje horizontal se ponen los valores del numero de clase y en el eje vertical los valores de la frecuencia acumula según corresponda, como se muestra a continuación.

73 Histograma de frecuencias acumuladas Ejemplo 2 En este caso se en el eje horizontal se ponen los valores del numero de clase y en el eje vertical los valores de la frecuencia acumula según corresponda, como se muestra a continuación. N° Clase Punt ajes X F. Abso luta (fa) Limites reales Valor medio o marca de clase Frecuen cia acumula da 111- 17 610.5- 17.5 14 6 218- 24 417.5- 24.5 21 10 325- 31 1524.5- 31.5 28 25 432- 38 1331.5- 38.5 35 38 539- 45 138.5- 45.5 42 39 646- 52 145.5- 52.5 49 40 Totale s 40

74 Polígono de frecuencias Polígono de frecuencias: Es un gráfico lineal que se utiliza en el caso de una variable cuantitativa. Para realizar el polígono unimos los puntos medios de las bases superiores del diagrama de barras o del histograma.

75 Polígono de frecuencias: Ejemplo 1 N° Clas e ColorFrecuenci a (fa) 1Azul4 2Rojo2 3Verde3 4Morad o 4 5Cyan2 Para realizar el polígono unimos los puntos medios de las bases superiores del diagrama de barras o del histograma. como se muestra a continuación.

76 Polígono de frecuencias: Ejemplo 2 Para realizar el polígono unimos los puntos medios de las bases superiores del diagrama de barras o del histograma. como se muestra a continuación. N° Clase Punt ajes X F. Abso luta (fa) Limites reales Valor medio o marca de clase 111- 17 610.5- 17.5 14 218- 24 417.5- 24.5 21 325- 31 1524.5- 31.5 28 432- 38 1331.5- 38.5 35 539- 45 138.5- 45.5 42 646- 52 145.5- 52.5 49 Totale s 40

77 Ojivas. Son otra forma de representación gráfica que puede ser utilizada como técnica para representar una distribución acumulativa, en donde los valores son de menos de o más de; donde las frecuencias acumulativas se trazan en las fronteras de clase. Una distribución de frecuencia acumulativa nos permite ver cuantas observaciones se hallan por arriba o por debajo de ciertos valores, en lugar de limitarnos a anotar los números de elementos dentro de los intervalos

78 N° Clase ColorFrecuen cia (fa) Frecue ncia acumul ada 1Azul4 4 2Rojo2 6 3Verde3 9 4Morado4 13 5Cyan2 15 En este caso se en el eje horizontal se ponen los valores del numero de clase y en el eje vertical los valores de la frecuencia acumula según corresponda, uniéndose con líneas como se muestra a continuación. Ojivas. Ejemplo 1

79 En este caso se en el eje horizontal se ponen los valores del numero de clase y en el eje vertical los valores de la frecuencia acumula según corresponda, uniéndose con líneas como se muestra a continuación. Ojivas. Ejemplo 2 N° Clase Pun taje s X F. Abso luta (fa) Limites reales Valor medio o marca de clase F. Abs. Acumul ada 111- 17 610.5- 17.5 14 6 218- 24 417.5- 24.5 21 10 325- 31 1524.5- 31.5 28 25 432- 38 1331.5- 38.5 35 38 539- 45 138.5- 45.5 42 39 646- 52 145.5- 52.5 49 40 Total es 40

80 Gráfica de tallo y hojas. También conocido como Stem and leaf diagram permite obtener simultáneamente una distribución de frecuencias de la variable y su representación gráfica. Para la construcción basta separar en cada datos el último digito de la derecha (que constituye la hoja) del bloque de cifras restantes (que forma el tallo) Esta representación de datos es semejante a la de un histograma pero además de ser fáciles de elaborar, presentan más información. Ejemplo: Supongamos la siguiente distribución de frecuencias. Que representa la edad de un grupo de personas N=20. 362537243920364531 39242923414033243440 202324 252931 33 3436 3739 40 4145 Se procede a ordenar de forma ascendente los datos, como se presenta a continuación.

81 Una vez ordenados comenzamos seleccionando los tallas que en nuestro caso corresponde a las decenas, es decir 2,3 y 4. Como se presenta a continuación. Gráfica de tallo y hojas. TallosHojas 25404934 3679611934 45100 Por último reordenemos las hojas y hemos terminado el diagrama, Como se presenta a continuación. TallosHojas 20344459 3113466799 40015

82 Bibliografía Básica: INITE Probabilidad y Estadística. Ediciones Instituto Internacional de Investigación de Tecnología Educativa S. C., Edición México, 2010. Murray Spiegel Probabilidad y Estadística. Tercera Edición, México, Mcgraw-Hill Interamericana, 2010. Wealpole, M. Probabilidad y Estadística para Ingeniería, Octava edición, México, Prentice hall hispanoamericana, 2007. Complementaria: Gamiz Casarrubias, Beatriz E. Gamiz Casarrubias, Oscar T. Probabilidad y Estadística con Prácticas en Excel. Segunda edición, México, Justin time press, S.A. de C.V., 2008. Jonshon, Robert. Kuby, Patricia. Estadística elemental. Décima edición, México, Cengage learning editores S.A de C.V., 2008. Páginas Web: Distribución de probabilidades, Disponible en: http://www.scribd.com/doc/2249724/DISTRIBUCION-DE-PROBABILIDADES (21-12-11) Distribución normal, Disponible en: http://descartes.cnice.mec.es/materiales_didacticos/distribuciones_probabilidad/dis_normal.htm (21-12-11) Matemáticas V: Probabilidad y estadística. Disponible en: Biblioteca Digital de la Red Académica del Conalep http://redacademica.conalep.edu.mx (20-12-11) Medidas de dispersión, Disponible en: http://colposfesz.galeon.com/est501/distfrec/meddisp/meddisp.htm (21-12-11) Medidas de dispersión, Disponible en: http://www.hiru.com/es/matematika/matematika_06000.html (21-12-11) Medidas de dispersión, Disponible en: www.sectormatematica.cl/media/NM4/NM4_medidas_de_dispersion.doc (21-12-11) Probabilidad condicional, Disponible en: http://www.itch.edu.mx/academic/industrial/sabaticorita/_private/05Probabilidad%20condicional.htm (2112-11) Técnicas de conteo y distribuciones discretas Disponible en: http://www.itch.edu.mx/academic/industrial/sabaticorita/amarillo.htm (21-12-11) http://www.cyta.com.ar/biblioteca/bddoc/bdlibros/herramientas_calidad/histograma.htm http://www.virtual.unal.edu.co/cursos/ciencias/2001065/html/un1/cont_115_15.html http://www.ceibal.edu.uy/contenidos/areas_conocimiento/mat/estadistica/histograma.html

83 Ejercicios para datos No agrupados En una empresa se tiene 18 empleados y se quiere hacer un estudio con respecto a sus edades por lo que se tiene la siguiente información. Aplicando las técnicas anteriores determine: La frecuencia absoluta. La frecuencia relativa. La frecuencia absoluta acumulada. La frecuencia relativa acumulada. Construcción de gráficas. Gráfica de frecuencias absolutas. Gráfica de frecuencias relativa. Gráfica de frecuencia relativa. Gráfica de frecuencia relativa acumulada. Ejercicio A)

84 Ejercicios para datos No agrupados En una empresa para verificar la máquina llenadora, se toman 20 frascos que al descartar el peso del envase sus pesos varían y se registran en la siguiente tabla. Aplicando las técnicas anteriores determine: La frecuencia absoluta. La frecuencia relativa. La frecuencia absoluta acumulada. La frecuencia relativa acumulada. Construcción de gráficas. Gráfica de frecuencias absolutas. Gráfica de frecuencias relativa. Gráfica de frecuencia relativa. Gráfica de frecuencia relativa acumulada. Ejercicio A)

85 Ejercicios para datos agrupados Se tiene una caja que contiene 60 probetas con los siguientes pesos. Aplicando las técnicas anteriores determine: Número de clase. Amplitud de clase. Marcas de clase o punto Medio. Los límites reales o fronteras reales. Construcción de gráficas. Gráfica circular. Diagrama de barras. Histograma. Polígono de frecuencias. Ojiva. Gráfica de tallo y hojas. Ejercicio A)

86 Soluciones


Descargar ppt "Resultado de aprendizaje. 1.1 Agrupa y grafica conjuntos de datos cualitativos y cuantitativos con base en la distribución de frecuencias."

Presentaciones similares


Anuncios Google