La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Tratamiento de datos y azar

Presentaciones similares


Presentación del tema: "Tratamiento de datos y azar"— Transcripción de la presentación:

1 Tratamiento de datos y azar
Resultado de aprendizaje. 1.1 Agrupa y grafica conjuntos de datos cualitativos y cuantitativos con base en la distribución de frecuencias.

2 Contenido A) Descripción e interpretación de la estadística. descriptiva Naturaleza de la estadística. Distribución de frecuencias con datos no agrupados. Distribución de frecuencias con datos agrupados. Ejemplos B) Construcción e interpretación de graficas. Gráfica de circular. Diagrama de Barras. Histograma. Polígono de frecuencias. Ojivas. Gráfica de tallo y hojas. C) Ejercicios Ejercicios para datos No agrupados Ejercicios para datos Agrupados Soluciones D) Autoevaluación

3 Naturaleza de la estadística
La estadística descriptiva La estadística inferencial La estadística se divide dos grandes áreas Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada.

4 La estadística se divide en dos grandes áreas:
La estadística descriptiva, se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente.

5 Etapas de la investigación estadística
Selección y determinación de la población o muestra y las características contenidas que se desean estudiar. En el caso de que se desee tomar una muestra, es necesario determinar el tamaño de la misma y el tipo de muestreo a realizar (probabilístico o no probabilístico). Obtención de los datos. Esta puede ser realizada mediante la observación directa de los elementos, la aplicación de encuestas y entrevistas, y la realización de experimentos. Clasificación, tabulación y organización de los datos. La clasificación incluye el tratamiento de los datos considerados anómalos que pueden en un momento dado, falsear un análisis de los indicadores estadísticos. La tabulación implica el resumen de los datos en tablas y gráficos estadísticos. Análisis descriptivo de los datos. El análisis se complementa con la obtención de indicadores estadísticos como las medidas: de tendencia central, dispersión, posición y forma. Análisis inferencial de los datos. Se aplican técnicas de tratamiento de datos que involucran elementos probabilísticos que permiten inferir conclusiones de una muestra hacia la población (opcional). Elaboración de conclusiones. Se construye el informe final.

6 Parámetros estadísticos
Población estadística, en estadística, también llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan unas de las observaciones. Población (‘population’) es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia). Normalmente es demasiado grande para poder abarcarlo. El número de elementos o sujetos que componen una población estadística es igual o mayor que el número de elementos que se obtienen de ella en una muestra (n).

7 Parámetros estadísticos
Muestra estadística (también llamada muestra aleatoria o simplemente muestra) es un subconjunto de casos o individuos de una población estadística. Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo. En tales casos, puede obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor coste (véanse las ventajas de la elección de una muestra, más abajo). Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio de toda la población porque el manejo de un menor número de datos provoca también menos errores en su manipulación. En cualquier caso, el conjunto de individuos de la muestra son los sujetos realmente estudiados. El número de sujetos que componen la muestra suele ser inferior que el de la población, pero suficiente para que la estimación de los parámetros determinados tenga un nivel de confianza adecuado. Para que el tamaño de la muestra sea idóneo es preciso recurrir a su cálculo.

8 Parámetros estadísticos
Tamaño de la muestra es el número de sujetos que componen la muestra extraída de una población, necesarios para que los datos obtenidos sean representativos de la población. Objetivos de la determinación del tamaño adecuado de una muestra Estimar un parámetro determinado con el nivel de confianza deseado. Detectar una determinada diferencia, si realmente existe, entre los grupos de estudio con un mínimo de garantía. Reducir costes o aumentar la rapidez del estudio.

9 Parámetros estadísticos
Por ejemplo, en un estudio de investigación epidemiológico la determinación de un tamaño adecuado de la muestra tendría como objetivo su factibilidad. Así: Si el número de sujetos es insuficiente habría que modificar los criterios de selección, solicitar la colaboración de otros centros o ampliar el período de reclutamiento. Los estudios con tamaños muestrales insuficientes, no son capaces de detectar diferencias entre grupos, llegando a la conclusión errónea de que no existe tal diferencia. Si el número de sujetos es excesivo, el estudio se encarece desde el punto de vista económico y humano. Además es poco ético al someter a más individuos a una intervención que puede ser menos eficaz o incluso perjudicial. El tamaño de una muestra es el número de individuos que contiene. Una fórmula muy extendida que orienta sobre el cálculo del tamaño de la muestra para datos globales es la siguiente : N: es el tamaño de la población o universo (número total de posibles encuestados). k: es una constante que depende del nivel de confianza que asignemos. El nivel de confianza indica la probabilidad de que los resultados de nuestra investigación sean ciertos: un 95,5 % de confianza es lo mismo que decir que nos podemos equivocar con una probabilidad del 4,5%. Los valores de k se obtienen de la tabla de la distribución normal estándar N(0,1).

10 Parámetros estadísticos
Muestreo aleatorio Es la extracción de una muestra de una población finita, en el que el proceso de extracción es tal que garantiza a cada uno de los elementos de la población la misma oportunidad de ser incluidos en dicha muestra. Esta condición garantiza la representatividad de la muestra porque si en la población un determinado porcentaje de individuos presenta la característica A, la extracción aleatoria garantiza matemáticamente que por término medio se obtendrá el mismo porcentaje de datos muestrales con esa característica. El muestreo aleatorio puede ser de dos tipos: Sin reposición de los elementos: los elementos extraídos se descartan para la siguiente extracción. Por ejemplo, si se extrae una muestra de bombillas para inferir su vida media, no es posible la reposición. Con reposición de los elementos (Muestreo Aleatorio Simple o m.a.s.): las observaciones se realizan con reemplazamiento de los individuos, de forma que la población es idéntica en todas las extracciones y, por tanto, cada observación es independiente de la anterior. En poblaciones muy grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo puede considerarse con reposición aunque, realmente, no lo sea. Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la extracción de números aleatorios mediante ordenadores, calculadoras o tablas construidas al efecto.

11 Variable estadística Variable cualitativa Variable cuantitativa
Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población. Se pueden agrupar principalmente en: Variable cualitativa Variable cuantitativa Tipos de variables

12 Variable estadística cualitativa
Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos: Variable cualitativa nominal Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de orden. Ejemplo:  El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo. Variable cualitativa ordinal o variable cuasicuantitativa Una variable cualitativa ordinal presenta modalidades no númericas, en las que existe un orden. Ejemplos:  La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ... Medallas de una prueba deportiva: oro, plata, bronce.

13 Variable estadística cuantitativa
Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos: Variable discreta Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos. Ejemplo:  El número de hermanos de 5 amigos: 2, 1, 0, 1, 3. Variable continua Una variable continua es aquella que puede tomar valores comprendidos entre dos números. Ejemplos:  La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. En la práctica medimos la altura con dos decimales, pero también se podría dar con tres decimales.

14 DATOS ESTADISTICOS Son números que pueden ser comparados, analizados e interpretados. El campo del cual son tomados los datos estadísticos se identifican como población o universo. A) RECOPILACION: De acuerdo con la localización de la información los datos estadísticos pueden ser internos y externos. Los internos son los registros obtenidos dentro de la organización que hace un estudio estadístico, Los externos se obtienen de datos publicados y encuestas. B) ORGANIZACIÓN: En la organización de los datos recopilados, el primer paso es corregir cada uno de los elementos recopilados. C) REPRESENTACION: Hay 3 maneras de presentar un conjunto de datos mediante enunciados, tablas estadísticas y gráficas estadísticas. D) ANALISIS: Después de los datos anteriores los datos estadísticos están listos para hacer analizados, para lo cual frecuentemente se emplean operaciones matemáticas durante el proceso de análisis. En un estudio estadístico los métodos que se aplican son:

15 Experimento estadístico
Un experimento que tiene las siguientes características es llamado experimento aleatorio o estadístico. Todos los posibles resultados del experimento son conocidos antes de hacer una realización del experimento. El resultado exacto en cualquier ejecución del experimento no es predecible (aleatoriedad) El experimento puede ser repetido bajo (más o menos) idénticas condiciones. Existe un patrón predictible a lo largo de muchas ejecuciones (regularidad estadística)

16 Ejemplos de Experimentos estadísticos
1. Algunos ejemplos de típicos experimentos aleatorios son: Lanzar una moneda y observar la cara Una bombilla manufacturada en una planta es expuesta a una prueba de vida y el tiempo de duración de una bombilla es registrado.. En este caso no se conoce cual será el tiempo de duración de la bombilla seleccionada, pero claramente se puede conocer de antemano que será un valor entre y horas Un lote de items que contiene defectuosos es muestreado. Un item muestreado no se reemplaza, y se registra si el item muestreado es o no defectuoso. El proceso continua hasta que todos los items defectuosos sean encontrados. Una manufacturera de refrigeradores inspecciona sus refrigeradores para tipos de defectos. El número de defectos encontrado en cada refrigerador inspeccionado es registrado. Seleccionar una planta de una parcela y observar si padece alguna enfermedad, es decir es sana o enferma Seleccionar una planta y medir su altura 2. Algunos ejemplos de experimentos no estadísticos son: Seleccionar al azar un autobús de ruta de transmilenio y observar el color. Aquí no se cumple la condición, ya que se puede predecir una ejecución del experimento, el color del autobús. Seleccionar al azar un estudiante de un colegio masculino y observar su género. Aquí no se cumple la condición, ya que se puede predecir una ejecución del experimento, el género del alumno Ejercicio Describa un experimento estadístico y otro no estadístico y explique porque lo es o no.

17 Ejemplos de Experimentos estadísticos
1. Algunos ejemplos de típicos experimentos aleatorios son: 1.-Lanzar un dado ALEATORIO 2. Lanzar una moneda ALEATORIO 3. Lanzar una nuez a una ardilla ALEATORIO 4. Presentar un examen ALEATORIO 2. Algunos ejemplos de experimentos no estadísticos (Determinísticos) son: 1. Tomar un taxi a la Universidad DETERMINISTICO 2. Pintarse las uñas DETERMINISTICO 3. Encender una vela DETERMINISTICO 4. Marcar el DETERMINISTICO Ejercicio Describa un experimento estadístico y otro no estadístico y explique porque lo es o no.

18 Definición de parámetro estadístico
Un parámetro estadístico es un número que se obtiene a partir de los datos de una distribución estadística. Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por una gráfica. Tipos de parámetros estadísticos De centralización. De posición De dispersión. Hay tres tipos parámetros estadísticos:

19 Distribución de frecuencias con datos.
La distribución de frecuencias existe para datos agrupados y datos no agrupados Datos agrupados Datos no agrupados

20 Distribución de frecuencias con datos no agrupados.
Distribución de frecuencia para datos no Agrupados (n<20): Es aquella distribución que indica las frecuencias con que aparecen los datos estadísticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificación al tamaño de las unidades originales. En estas distribuciones cada dato mantiene su propia identidad después que la distribución de frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo un orden lógico con sus respectivas frecuencias.

21 Distribución de frecuencias con datos agrupados.
Distribución de frecuencia de clase o de datos Agrupados (n>20): Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase.

22 Distribución de frecuencias para datos.
No existen normas establecidas para determinar cuándo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el número total de datos (N) es igual o superior 20, se utilizará la distribución de frecuencia para datos agrupados, también se utilizará este tipo de distribución cuando se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia o la ojiva. La razón fundamental para utilizar la distribución de frecuencia de clases es proporcionar mejor comunicación acerca del patrón establecido en los datos y facilitar la manipulación de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la información obtenida de una investigación sea manejable con mayor facilidad. Las medidas de tendencia central (media, moda y mediana) y las Medidas de dispersión (desviación estándar, varianza, cuartiles, percentiles, entre otros se CALCULAN DIFERENTE cuando se trata de datos agrupados y de datos no agrupados.

23 Tabla de Frecuencias La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numérico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el número de veces que aparece, es decir, su Frecuencia. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la frecuencia simple y la frecuencia acumulada. La tabla de frecuencias puede representar gráficamente en un histograma(Diagrama De Barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal los intervalos de valores. La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

24 Frecuencia absoluta La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico. Se representa por fi. La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.

25 Frecuencia absoluta Ejemplo
Datos sin ordenar 1 32 2 31 3 28 4 29 5 33 6 7 8 30 9 10 11 27 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 34 Frecuencia absoluta Ejemplo Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la primera columna de la tabla colocamos la variable ordenada de menor a mayor y en la segunda anotamos la frecuencia absoluta.

26 Se forma la tabla de datos con su frecuencia.
Datos sin ordenar Dato ordenado 1 32 27 2 31 28 3 4 29 5 33 6 7 8 30 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 34 Xi fi 27 * 1 28 ** 2 29 *****,* 6 30 *****,** 7 31 *****,*** 8 32 *** 3 33 34 Procedimiento Para mayor facilidad se ordenan de mayor a menor los datos del problema. (color morado) Una vez ordenados se cuentan cuantos corresponden al mismo valor. (color rojo). Se forma la tabla de datos con su frecuencia.

27 Frecuencia relativa La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos. La frecuencia relativa se puede expresar en tantos por ciento y se representa por ni. La suma de las frecuencias relativas es igual a 1.

28 Frecuencia relativa Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la cuarta primera columna de la tabla colocamos la variable ordenada de menor a mayor y en la segunda anotamos la frecuencia absoluta. Xi fi ni 27 * 1 1/31= 0.032 28 ** 2 2/31= 0.065 29 *****,* 6 6/31= 0.194 30 *****,** 7 7/31= 0.226 31 *****,*** 8 8/31= 0.258 32 *** 3 3/31= 0.097 33 34 1.000

29 Frecuencia absoluta acumulada
Xi fi ∑fi 27 * 1 28 ** 2 3 29 *****,* 6 9 30 *****,** 7 16 31 *****,*** 8 24 32 *** 33 34 La frecuencia absoluta acumulada es el valor acumulado del número de veces que aparece un determinado valor en un estudio estadístico.

30 Frecuencia relativa acumulada
La frecuencia relativa acumulada es el valor acumulado del valor relativo que aparece un determinado valor en un estudio estadístico. Xi fi fi/N ni ∑ni 27 * 1 1/31= 0.032 28 ** 2 2/31= 0.065 0.097 29 *****,* 6 6/31= 0.194 0.290 30 *****,** 7 7/31= 0.226 0.516 31 *****,*** 8 8/31= 0.258 0.774 32 *** 3 3/31= 0.871 33 0.968 34 1.000

31 Distribución de frecuencias agrupadas
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.

32 Números de clase El número de clase es el número de grupos en los que se van agrupar los datos en una tabla de distribución de frecuencias, a estos se les llama también intervalos de clase ¿Cómo de hace esto? Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Para obtener el número de clase o intervalo de clase se ocupa la siguiente formula: K= (log10n) En las reglas empíricas para la construcción de intervalos veremos cómo se aplica esta fórmula. Ya que tenemos claro qué es el número de clases debemos saber la amplitud de clase par poder seguir trabajando nuestra tabla.

33 Amplitud de clase Una vez que tenemos el número de intervalos debemos saber cuántos números deben de ir en cada intervalo, para eso se calcula la amplitud de clase, por ejemplo, si tengo 100 datos y tengo 5 intervalos en cada intervalo deben ir 20 números, claro esto no se calcula al azar lo debemos hacer siguiendo las formulas para cada paso: Amplitud de clase: 𝐴= 𝑅 𝐾 Donde R es el rango y K es el número de intervalos. Para tener un mejor manejo de estas formulas se presentaran mas ejemplos a continuación.

34 Marcas de clase o punto medio
xi fi xi · fi xi2 · fi [10, 20) 15 1 225 [20, 30) 25 8 200 5000 [30,40) 35 10 350 12 250 [40, 50) 45 9 405 18 225 [50, 60) 55 440 24 200 [60,70) 65 4 260 16 900 [70, 80) 75 2 150 11 250 42 1 820 88 050 La marca de clase es el punto medio de cada intervalo. La marca de clase es el valor que representa a todo el intervalo para el cálculo de algunos parámetros como la media aritmética o la desviación típica. Se representa por ci o xi.

35 Límites reales o fronteras reales
Los límites reales son valores que unen a las clases y se forman únicamente de números enteros, estos se obtienen al restar 0.5 a los limites de la izquierda y sumar 0.5 a los limites de la derecha; cuando las clases tengan un decimal, habrá que restar 0.05 a los limites de la izquierda y sumar 0.05 limites de la derecha y así sucesivamente. A la gráfica de límites reales contra frecuencia se les llama histograma.

36 Ejemplos

37 Ejemplo 1 (Para datos NO Agrupados)
En una escuela se tienen los siguientes datos en donde se asientan el número de alumnos que tienen reprobada por lo menos una materia. Grupo Alumnos reprobados 101 13 102 6 103 104 12 105 8 106 107 108 109 10 110 111 112 11 113 114 15 115 116 14 117 118 Al graficar en el eje horizontal de ponen los grupos y en el eje vertical la cantidad de alumnos reprobados por grupo. Como se muestra a continuación. Tabla 1

38 Ejemplo 1 (Para datos NO Agrupados)
Grupo Alumnos reprobados Frecuencia 102 6 107 113 117 4 105 8 118 2 109 10 110 111 3 112 11 1 104 12 115 101 13 103 106 108 116 14 114 15 Total 18 Cantidad N reprobadas Frecuencia 6 4 8 2 10 3 11 1 12 13 14 15 Total 18 De la tabla 2 se toman los datos de la 2da columna para generar las clases. La frecuencia es la cantidad de veces que se repiten el mismo valor de la clase. Como se muestra a continuación. Se procede a ordenar de menor a mayor con respecto a la columna de Alumnos reprobados Como se muestra a continuación. Tabla 3 Tabla 2

39 Ejemplo 1 (Para datos NO Agrupados)
Al graficar en el eje horizontal se ponen la “Cantidad N reprobadas” y en el eje vertical la frecuencia correspondiente. Como se muestra a continuación. Cantidad N reprobadas Frecuencia 6 4 8 2 10 3 11 1 12 13 14 15 Total 18 Tabla 3

40 Ejemplo 1 (Para datos NO Agrupados)
La frecuencia acumulada se origina de la suma acumulativa de la frecuencia absoluta con la siguiente frecuencia absoluta según corresponda. Como se muestra a continuación. Alumnos con N reprobadas Frecuencia (fa) Frec. Acumulada (FA) 6 4 8 2 10 3 9 11 1 12 13 16 14 17 15 18 Total Tabla 4

41 Ejemplo 1 (Para datos NO Agrupados)
La frecuencia relativa se calcula al dividir la frecuencia absoluta entre el número de datos para cada frecuencia absoluta según corresponda. En este caso n=18. Como se muestra a continuación. 4/18=0.22 Alumnos con N reprobadas Frecuencia (fa) Frec. Acumulada (FA) Relativa (fr) 6 4 0.22 8 2 0.11 10 3 9 0.17 11 1 0.06 12 13 16 14 17 15 18 Total Tabla 5

42 Ejemplo 1 (Para datos NO Agrupados)
La frecuencia acumulada relativa se origina de la suma acumulativa de la frecuencia relativa con la siguiente frecuencia relativa según corresponda. Como se muestra a continuación. 4/18=0.22 Alumnos con N reprobadas Frecuencia (fa) Frec. Acumulada (FA) Frec. Relativa (fr) Acumulada (fra) 6 4 0.22 8 2 0.11 0.33 10 3 9 0.17 0.50 11 1 0.06 0.56 12 0.67 13 16 0.89 14 17 0.94 15 18 1.00 Total Tabla 6

43 Ejemplo 1 (Para datos Agrupados)
De un grupo de alumnos se toma la estatura de 100 de ellos, como se muestra en la tabla a continuación. No. Esta-tura 1 175 11 165 21 177 31 163 41 178 51 171 61 172 71 162 81 153 91 161 2 173 12 157 22 156 32 147 42 52 62 136 72 145 82 92 3 13 23 33 164 43 53 144 63 174 73 83 181 93 152 4 154 14 24 34 155 44 158 54 64 74 84 190 94 160 5 15 25 35 45 183 55 65 75 150 85 95 6 134 16 26 36 46 176 56 148 66 76 86 96 7 17 166 27 37 47 57 170 67 77 87 97 8 169 18 151 28 142 38 48 58 68 122 78 88 98 9 159 19 149 29 39 135 49 59 69 79 89 99 10 20 146 30 40 50 60 70 80 143 90 100

44 Ordenando los datos se obtienen la siguiente tabla de datos
Estatura 122 147 153 157 159 161 163 165 171 175 134 160 164 176 135 148 166 177 136 142 154 162 143 149 169 172 178 144 150 155 170 145 151 173 181 152 156 158 174 183 146 190 122 es el Limite mínimo; Lmin=122 190 es el Limite Máximo; Lmax=122 N=10 renglones x 10 columnas; 10X10= 100; n=100

45 Límites reales o fronteras reales
Realizando las operaciones correspondientes se encuentran los siguientes valores, como esta indicado en los siguientes cuadros Cantidad de datos n= 100 Valor Máximo 190 Valor mínimo 122 Rango: R= Valor Máximo - Valor Mínimo 68 Numero de intervalos o CLASES (K): K= (log10n) 7.64 redondeando K:= 8 Amplitud de clase (A):= R/K 8.50 redondeando A:= 9 Limite inferior R= = 68; R=68 K= (log10(100)) K= (2); = 7.64; K=7.64 A= 68/8; A=8.50

46 Cálculo de limites inferiores y superiores de los intervalos
N° Clase Li (nferior) Ls (uperior) 1 122 131 2 140 3 149 4 158 5 167 6 176 7 185 8 194 122+9=131 131+9=140 140+9=149 149+9=158 158+9=167 167+9=176 176+9=185 185+9=194 Recordando que el limite inferior es 122 y la Amplitud es 9, se proceden a calcular el limite superior, así como los subsecuentes limites de l resto de intervalos

47 Cálculo de Límites reales o fronteras reales de los intervalos
Para el calculo de las clases se recorren ½ unidad a la izquierda es decir se le resta 0.5 a cada limite inferior y superior. Como se muestra a continuación. N° Clase Li (inferior) o Clase real Inferior Ls (superior) o Clase Real Superior 1 121.5 130.5 2 139.5 3 148.5 4 157.5 5 166.5 6 175.5 7 184.5 8 193.5 N° Clase Li (nferior) Ls (uperior) 1 122 131 2 140 3 149 4 158 5 167 6 176 7 185 8 194 =121.5 =130.5 =139.5 =148.5 =157.5 =166.5 =175.5 =184.5 =193.5

48 Cálculo de Límites reales o fronteras reales de los intervalos
Por lo tanto los limites reales de cada clase quedan de la siguiente manera. N° Clase Rango de la clase 1 2 3 4 5 6 7 8

49 Conteo y clasificación de los datos
De la tabla de datos se van clasificando los valores existentes agregándole una marca en la columna de CONTEO, según corresponda. Como se muestra a continuación. N° Clase Rango de la clase Conteo Frecuencia Absoluta (fa) 1 | 2 ||| 3 |||||-|||||-| 11 4 |||||-|||||-|||||-|||||-||| 23 5 |||||-|||||-|||||-|||||-|||||-|||||-|||||-|| 37 6 |||||-|||||-|||||-| 16 7 |||||-||| 8

50 Cálculo de Marcas de clase para cada intervalo
Para el calculo de las marcas de clases se promedia el valor de limite inferior con el limite superior como se muestra a continuación. N° Clase Li (inferior) o Clase real Inferior Ls (superior) o Clase Real Superior 1 121.5 130.5 2 139.5 3 148.5 4 157.5 5 166.5 6 175.5 7 184.5 8 193.5 N° Clase Marca de Clase 1 126.0 2 135.0 3 144.0 4 153.0 5 162.0 6 171.0 7 180.0 8 189.0 ( )/2=126 ( )/2=135 ( )/2=144 ( )/2=153 ( )/2=162 ( )/2=171 ( )/2=180 ( )/2=189

51 Creación de la tabla de datos para la elaboración de la grafica:
Agregando la ultima columna a la tabla anterior se procede a la elaboración de la grafica correspondiente fijando en el eje de las X las marcas de clase y en las Y la frecuencia obtenida para cada clase. N° Clase Rango de la clase Marca de Clase Frecuencia Absoluta (fa) 1 126.0 2 135.0 3 144.0 11 4 153.0 23 5 162.0 37 6 171.0 16 7 180.0 8 189.0

52 Construcción de la gráfica correspondiente.
De la tabla de datos se toman los valores existentes generando la siguiente gráfica.

53 Frecuencia absoluta y Frecuencia acumulada
Una vez que se registraron las marcas en la columna de CONTEO, se procede a contar las marcas y asentar su valor en la columna de frecuencia absoluta, según corresponda. La frecuencia acumulada se origina de la suma acumulativa de la frecuencia absoluta con la siguiente frecuencia absoluta según corresponda. Como se muestra a continuación. N° Clase Rango de la clase Frecuencia Absoluta (fa) Frecuencia Acumulada (FA) 1 2 3 4 11 15 23 38 5 37 75 6 16 91 7 8 99 100 1+3=4 4+11=15 15+23=38 38+37=75 75+16=91 91+8=99 99+1=100

54 Frecuencia relativa y Frecuencia relativa acumulada
La frecuencia relativa (fr) se obtiene al realizar la división de la frecuencia acumulada de cada clase entre el numero (n) de datos. Se procede asentar su valor en la columna de frecuencia relativa, según corresponda. La frecuencia relativa acumulada se origina de la suma acumulativa de la frecuencia relativa con la siguiente frecuencia relativa según corresponda. Como se muestra a continuación. N° Clase Rango de la clase Frecuencia Absoluta (fa) Frecuencia relativa (fr) Frecuencia relativa Acumulada (fra) 1 0.01 2 3 0.03 0.04 11 0.11 0.15 4 23 0.23 0.38 5 37 0.37 0.75 6 16 0.16 0.91 7 8 0.08 0.99 1.00 1/100=0.01 3/100=0.03 11/100=0.11 23/100=0.23 37/100=0.37 16/100=0.16 8/100=0.08 =0.04 =0.15 =0.38 =0.75 =0.91 =0.99 =1.00

55 Construcción e interpretación de gráficas

56 Construcción e interpretación de gráficas
Una gráfica o diagrama es un dibujo complementario a una tabla o cuadro, que permite observar las tendencias de un fenómeno en estudio y facilita el análisis estadístico de las variables allí relacionadas.

57 Construcción e interpretación de gráficas
Componentes de una gráfica. Una gráfica, al igual que un cuadro o una tabla, debe constar de: Titulo adecuado: El cual debe ser claro y conciso, que responda a las preguntas: ¿Qué relaciona?, ¿Cuándo y dónde se hicieron las observaciones? El cuerpo: o gráfico en si cuya elección debe considerar el o los tipos de variables a relacionar, el público a quién va dirigido y el diseño artístico del gráfico. Notas de pie de gráfico: Donde se presentan aclaraciones respecto al gráfico, las escalas de los ejes o se otorgan los créditos a las fuentes respectivas. Por medio de gráficos tendenciosos se pueden deformar o resaltar situaciones o estados, que presentados en un gráfico apropiado, mostrarían un comportamiento normal. Generalmente una información es distorsionada por algunas de las siguientes causas: La relación entre los ejes no es la apropiada. Gráficos con escalas desproporcionados, o una mala elección del punto de origen.

58 Construcción e interpretación de gráficas
Principales tipos de gráficas. Existe una gran cantidad de gráficas para la representación de datos estadísticos, ya que ellas y de la creatividad depende el diseño, al combinar varios tipos como forma de presentar una información. Entre las gráficas más comunes tenemos: Grafica de líneas. Gráfica de líneas compuesto. Grafica de barras. Gráfica de barras compuesto. Gráfica de sectores circular. Histograma. Polígono de frecuencia. Ojiva. Para datos cuantitativos comúnmente se utilizan dos tipos de gráficas: histogramas y polígonos. Para datos cualitativos con frecuencia se utilizan gráficas de sectores, o circular y diagramas de barras.

59 Gráfica circular Usualmente llamada gráfica de pastel, debido a su forma característica de circunferencia dividida en cascos por medio de radios, que van la sensación de un pastel cortado en porciones Se usa para representar variables cualitativas en porcentajes o cifras absolutas cuando el número de elementos no es superior a cinco y se requiere resaltar uno de ellos. Para su construcción se procede de la siguiente manera: 1.- se dibuja un circulo. La circunferencia tiene en su interior 360° , los cuales hacemos corresponder al total de la información, es decir al 100%; luego para determinar el número de grados correspondiente a cada componente se multiplica la frecuencia relativa con respecto a los 360° y se divide entre 100% Se dibuja un radio en el circulo exactamente del centro hacia arriba, con la ayuda de un transportador se marcan los grados correspondientes a cada sector, en el sentido contrario a las manecillas del reloj, para formar casquetes de los diferentes elementos.

60 Ejemplo de gráfica circular.
Se tiene un grupo de 18 alumnos los cuales dan su preferencia por los siguientes colores. Azul=4, Rojo=2, Verde=3, Morado=4, Cian=2 De la tabla de datos se toman los valores existentes, se procede a hacer las operaciones de la formula indicada como se muestra a continuación. 𝑆𝑒𝑐= 𝑓𝑟 𝑥100% 𝑛 No° Clase Frecuencia (fa) Frecuencia en % (fr°) Frecuencia acumulativa (fa%) 1 4 27% 2 13% 40% 3 20% 60% 87% 5 100% 𝑆𝑒𝑐= 4 𝑥 =27% 𝑆𝑒𝑐= 2 𝑥 =13% 27%+13%=40% 40%+20%=60% 60%+27%=87% 87%+13%=100% 𝑆𝑒𝑐= 3 𝑥 =20% 𝑆𝑒𝑐= 4 𝑥 =27% 𝑆𝑒𝑐= 2 𝑥 =13%

61 Ejemplo de gráfica circular.
Para el calculo de los sectores que representan cada valor se procede a hacer las operaciones de la formula indicada como se muestra a continuación. 𝑆𝑒𝑐= 𝑓𝑟 𝑥360° 𝑛 Con estos valores se forma la gráfica de pastel No° Clase Frecuencia (fr) Frecuencia x sector (fr°) Frecuencia acumulativa (fra°) 1 4 96° 2 48° 144° 3 72° 216° 312° 5 360° 𝑆𝑒𝑐= 4 𝑥360° 15 =96° 𝑆𝑒𝑐= 2 𝑥360° 15 =48° 96°+48°=144° 144°+72°=216° 216°+96°=312° 312°+48°=360° 𝑆𝑒𝑐= 3 𝑥360° 15 =72° 𝑆𝑒𝑐= 4 𝑥360° 15 =96° 𝑆𝑒𝑐= 2 𝑥360° 15 =48°

62 Trazado de una gráfica circular.
Para el calculo de los sectores que representan cada valor, se procede a hacer marcar los arcos correspondientes como se muestra a continuación. 1. Traza un circulo 2. Toma de referencia el radio vertical que va del centro a la parte alta del circulo. 3. Se toma como referencia el radio indicado y de ahí en adelante con ayuda de un transportador se van marcando los valores correspondientes a cada sector. 96° 1 2 3

63 Trazado de una gráfica circular.
Después de señalar el primer sector se van señalando los sectores siguientes según corresponda los valores, como se muestra a continuación. 96° 96° 96° 48° 48° 4 72° 6 5

64 Trazado de una gráfica circular.
Después de señalar todos los sectores se pueden señalar sus valores según corresponda, como se muestra a continuación. 96° 72° 7 48° 96° 72° 8 48°

65 Trazado de una gráfica circular.
Después de señalar el todos los sectores se pueden señalar con colores diferentes según corresponda, como se muestra a continuación. Se puede representar tomando como referencia la frecuencia quedando la gráfica como se muestra a continuación. Se puede representar tomando como referencia los porcentajes de a frecuencia quedando la gráfica como se muestra a continuación.

66 Diagrama de barras Se utiliza para representar los caracteres cualitativos y cuantitativos discretos. En el eje horizontal, o eje de abscisas, se representan los datos o modalidades; en el eje vertical o de ordenadas, se representan las frecuencias de cada dato o modalidad. Sobre el eje horizontal se levantan barras o rectángulos de igual base (que no se superpongan) cuya altura debe ser proporcional a la frecuencia que representan. La parte mas alta de la gráfica debe ser aproximadamente las tres cuartas partes del eje horizontal (regla de los tres cuartos) Evitar que las barras resulten muy anchas o excesivamente altas. Las barras deben quedar separadas y no en contacto para evitar cualquier implicación de continuidad. La separación entre barra y barra no será inferior a la mitad del ancho de ellas, ni superior al ancho de las barras. Para no influir en actitudes personales ni reflejar preferencias individuales, las barras deben ser todas del mismo ancho Grafiquemos el ejemplo anterior:

67 Diagrama de barras 1 Azul 4 2 Rojo 3 Verde Morado 5 Cyan
En este caso en el eje horizontal se ponen la variable color y en el eje vertical los valores de la frecuencia según corresponda, como se muestra a continuación. N° Clase Color Frecuencia (fa) 1 Azul 4 2 Rojo 3 Verde Morado 5 Cyan

68 Histograma (¿Que es?) Un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos. Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son cualitativos (no-numéricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores. Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso. Un histograma es diferente de una gráfica de barras porque las columnas no van separadas sino unidas, lo que les da continuidad.

69 Histograma. (Como se hace)
El procedimiento que se sigue para la construcción del histograma es el siguiente: 1.- Márquese los intervalos de clase en el eje de las abscisas del plano cartesiano. 2.- Para que la grafica quede completa, se agregan dos intervalos de clase más, uno antes del primer intervalo y otro después del último. 3.- En cada límite inferior del intervalo se traza una línea vertical sutilmente punteada, con las alturas que correspondan a las frecuencias absolutas o relativas, de tal manera que a cada punto se le asigne una frecuencia. Por último se dibujan las barras, con alturas correspondientes a las frecuencias.

70 Histograma (Ejemplo 1) 1 Azul 4 2 Rojo 3 Verde Morado 5 Cyan
En este caso en el eje horizontal se ponen la variable color y en el eje vertical los valores de la frecuencia según corresponda, como se muestra a continuación. N° Clase Color Frecuencia (fa) 1 Azul 4 2 Rojo 3 Verde Morado 5 Cyan

71 Puntajes obtenidos en una prueba Valor medio o marca de clase
Histograma (Ejemplo 2) En la realización de una prueba se obtuvieron los siguientes puntajes en un grupo de 40 alumnos. En este caso en el eje horizontal se ponen la variable puntaje (tomando los valores de la marca de clase) y en el eje vertical los valores de la frecuencia según corresponda, como se muestra a continuación. Puntajes obtenidos en una prueba Puntajes X F. Absoluta (fa) Limites reales Valor medio o marca de clase 11-17 6 14 18-24 4 21 25-31 15 28 32-38 13 35 39-45 1 42 46-52 49 Totales 40 Número de alumnos Marca de clase o valor medio  Se determina calculando el promedio entre los límites inferior y superior. La marca de clase representa a todos los datos pertenecientes al intervalo de clase correspondiente. Marca de clase

72 Histograma de frecuencias acumuladas
Histograma de frecuencias acumulada: Se obtiene a partir de una distribución de frecuencias, tomando en el eje horizontal las clases de la variable y en el eje vertical las frecuencias acumuladas correspondientes a cada intervalo. Ejemplo 1 En este caso se en el eje horizontal se ponen los valores del numero de clase y en el eje vertical los valores de la frecuencia acumula según corresponda, como se muestra a continuación. N° Clase Color Frecuencia (fa) Frecuencia acumulada 1 Azul 4 2 Rojo 6 3 Verde 9 Morado 13 5 Cyan 15

73 Histograma de frecuencias acumuladas
Ejemplo 2 En este caso se en el eje horizontal se ponen los valores del numero de clase y en el eje vertical los valores de la frecuencia acumula según corresponda, como se muestra a continuación. N° Clase Puntajes X F. Absoluta (fa) Limites reales Valor medio o marca de clase Frecuencia acumulada 1 11-17 6 14 2 18-24 4 21 10 3 25-31 15 28 25 32-38 13 35 38 5 39-45 42 39 46-52 49 40 Totales

74 Polígono de frecuencias
Polígono de frecuencias: Es un gráfico lineal que se utiliza en el caso de una variable cuantitativa. Para realizar el polígono unimos los puntos medios de las bases superiores del diagrama de barras o del histograma.

75 Polígono de frecuencias: Ejemplo 1
Para realizar el polígono unimos los puntos medios de las bases superiores del diagrama de barras o del histograma. como se muestra a continuación. N° Clase Color Frecuencia (fa) 1 Azul 4 2 Rojo 3 Verde Morado 5 Cyan

76 Polígono de frecuencias: Ejemplo 2
Para realizar el polígono unimos los puntos medios de las bases superiores del diagrama de barras o del histograma. como se muestra a continuación. N° Clase Puntajes X F. Absoluta (fa) Limites reales Valor medio o marca de clase 1 11-17 6 14 2 18-24 4 21 3 25-31 15 28 32-38 13 35 5 39-45 42 46-52 49 Totales 40

77 Ojivas. Son otra forma de representación gráfica que puede ser utilizada como técnica para representar una distribución acumulativa, en donde los valores son de menos de o más de; donde las frecuencias acumulativas se trazan en las fronteras de clase. Una distribución de frecuencia acumulativa nos permite ver cuantas observaciones se hallan por arriba o por debajo de ciertos valores, en lugar de limitarnos a anotar los números de elementos dentro de los intervalos

78 Ojivas. Ejemplo 1 1 Azul 4 2 Rojo 6 3 Verde 9 Morado 13 5 Cyan 15
En este caso se en el eje horizontal se ponen los valores del numero de clase y en el eje vertical los valores de la frecuencia acumula según corresponda, uniéndose con líneas como se muestra a continuación. N° Clase Color Frecuencia (fa) Frecuencia acumulada 1 Azul 4 2 Rojo 6 3 Verde 9 Morado 13 5 Cyan 15

79 Valor medio o marca de clase
Ojivas. Ejemplo 2 En este caso se en el eje horizontal se ponen los valores del numero de clase y en el eje vertical los valores de la frecuencia acumula según corresponda, uniéndose con líneas como se muestra a continuación. N° Clase Puntajes X F. Absoluta (fa) Limites reales Valor medio o marca de clase F. Abs. Acumulada 1 11-17 6 14 2 18-24 4 21 10 3 25-31 15 28 25 32-38 13 35 38 5 39-45 42 39 46-52 49 40 Totales

80 Gráfica de tallo y hojas.
También conocido como Stem and leaf diagram permite obtener simultáneamente una distribución de frecuencias de la variable y su representación gráfica. Para la construcción basta separar en cada datos el último digito de la derecha (que constituye la hoja) del bloque de cifras restantes (que forma el tallo) Esta representación de datos es semejante a la de un histograma pero además de ser fáciles de elaborar, presentan más información. Ejemplo: Supongamos la siguiente distribución de frecuencias. Que representa la edad de un grupo de personas N=20. 36 25 37 24 39 20 45 31 29 23 41 40 33 34 Se procede a ordenar de forma ascendente los datos, como se presenta a continuación. 20 23 24 25 29 31 33 34 36 37 39 40 41 45

81 Gráfica de tallo y hojas.
Una vez ordenados comenzamos seleccionando los tallas que en nuestro caso corresponde a las decenas, es decir 2,3 y 4. Como se presenta a continuación. Tallos Hojas 2 5 4 9 3 6 7 1 Por último reordenemos las hojas y hemos terminado el diagrama, Como se presenta a continuación. Tallos Hojas 2 3 4 5 9 1 6 7

82 Bibliografía Básica:  INITE Probabilidad y Estadística. Ediciones Instituto Internacional de Investigación de Tecnología Educativa S. C. , Edición México, 2010.  Murray Spiegel Probabilidad y Estadística. Tercera Edición, México, Mcgraw-Hill Interamericana, 2010.  Wealpole, M. Probabilidad y Estadística para Ingeniería, Octava edición, México, Prentice hall hispanoamericana, 2007. Complementaria:  Gamiz Casarrubias, Beatriz E. Gamiz Casarrubias, Oscar T. Probabilidad y Estadística con Prácticas en Excel. Segunda edición, México, Justin time press, S.A. de C .V., 2008.  Jonshon, Robert. Kuby, Patricia. Estadística elemental. Décima edición, México, Cengage learning editores S.A de C.V., 2008. Páginas Web:  Distribución de probabilidades, Disponible en: ( )  Distribución normal, Disponible en: ( )  Matemáticas V: Probabilidad y estadística. Disponible en: Biblioteca Digital de la Red Académica del Conalep ( )  Medidas de dispersión, Disponible en: ( )  Medidas de dispersión, Disponible en: ( )  Medidas de dispersión, Disponible en: ( )  Probabilidad condicional, Disponible en: ( )  Técnicas de conteo y distribuciones discretas Disponible en: ( )

83 Ejercicios para datos No agrupados
Ejercicio A) Aplicando las técnicas anteriores determine: La frecuencia absoluta. La frecuencia relativa. La frecuencia absoluta acumulada. La frecuencia relativa acumulada. Construcción de gráficas. Gráfica de frecuencias absolutas. Gráfica de frecuencias relativa. Gráfica de frecuencia relativa. Gráfica de frecuencia relativa acumulada. En una empresa se tiene 18 empleados y se quiere hacer un estudio con respecto a sus edades por lo que se tiene la siguiente información.

84 Ejercicios para datos No agrupados
Ejercicio A) Aplicando las técnicas anteriores determine: La frecuencia absoluta. La frecuencia relativa. La frecuencia absoluta acumulada. La frecuencia relativa acumulada. Construcción de gráficas. Gráfica de frecuencias absolutas. Gráfica de frecuencias relativa. Gráfica de frecuencia relativa. Gráfica de frecuencia relativa acumulada. En una empresa para verificar la máquina llenadora, se toman 20 frascos que al descartar el peso del envase sus pesos varían y se registran en la siguiente tabla.

85 Ejercicios para datos agrupados
Ejercicio A) Aplicando las técnicas anteriores determine: Número de clase. Amplitud de clase. Marcas de clase o punto Medio. Los límites reales o fronteras reales. Construcción de gráficas. Gráfica circular. Diagrama de barras. Histograma. Polígono de frecuencias. Ojiva. Gráfica de tallo y hojas. Se tiene una caja que contiene 60 probetas con los siguientes pesos.

86 Soluciones


Descargar ppt "Tratamiento de datos y azar"

Presentaciones similares


Anuncios Google